1、中国电信研究院AI研发中心马娜 GPU加速中国电信Spark大数据处理 文档版本:v9.1 -0708 从Hadoop到Spark 2 从Hadoop到Spark 3 Spark 虽缓解了 Hadoop 中存在的 I/O 问题,但现在瓶颈问题已从 I/O 转变为针对日益增多的 应用的计算问 题。随着GPU加速计算的出现,此性能瓶颈问题有了一个新的解决途径。 Hadoop 性能却因其往磁盘上写检查点结果的模式而遭遇瓶颈。同时,MapReduce 的 低级编程模型也限制 了 Hadoop 的采用。数据流程和迭代算法需要将多个MapReduce作业 链接在一起,此操作很难通过编程实 现,并且会导致大
2、量磁盘读写。 大数据处理在中国电信的使用广泛 4 省端数据接入 Flume Kafka Mysql FTP API 实时处理: Flink Streaming 离线处理: Hive Spark 调度及存储: yarn hdfs Redis 集团侧数据处理集团侧输出服务 模型预测 API 报表 集团侧监测运营 API服务监控 任务监控 租户资源监控 系统监控 采集任务监控 GPU + Spark 3 (三个GPU相关的feature) 5 Spark 3.0对GPU的支持 6 开源项目:https:/ 项目介绍: The RAPIDS Accelerator for Apache Spark p
3、rovides a set of plugins for Apache Spark thatleverage GPUs to accelerate processingvia the RAPIDS libraries and UCX. 解读: GPU对Spark的加速服务,是作为一个Plugin提供的; 这个Plugin里面用到了另外两个开源项目: RAPIDS UCX RAPIDS 7 开源项目:https:/ GPU上的Pandas + Sklearn RAPIDS - example 8 UCX 9 另一个开源软件:https:/www.openucx.org/ 用来解决Spark shuffle的性能问题 简洁的传输协议 在终端间(TCP, RDMA, Shared Memory, GPU)选择最优路径 通过RDMA实现GPU 显存传输时Zero-Copy 支持RDMA 需要的网络
1、下载报告失败解决办法 2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。 3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。 4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
GPU 加速的数据处理在推荐系统中的应用.pdf
天翼大数据:2017中国电信大数据普惠金融应用实例(39页).pdf
天翼大数据:2016年中国电信互联网金融大数据报告(12页).pdf
中国旅游研究院&中国电信:2018中国滨海旅游客流大数据报告(25页).pdf
中国电信:合规视角下的数据安全风险管控(2022)(22页).pdf
中国电信自研数据库TeleDB在系统上云中的规模应用——张明.pdf
中国电信-C端业务全面向好云改数转推动B端加速成长-211027(28页).pdf
中国电信:2023基于云网融合的工业数据采集和云化控制白皮书(20页).pdf
中国电信-2C、天翼云加速发展打开未来十年成长空间-221023(23页).pdf
中国电信-深度研究报告:5G渗透加速+云改数转战略推进运营商实现全面升级-210825(29页).pdf
三个皮匠报告专业的行业报告下载站,每日更新,欢迎大家关注!
copyright@2008-2013 长沙景略智创信息技术有限公司版权所有 网站备案/许可证号:湘B2-20190120
专属顾问
机构入驻、侵权投诉、商务合作
三个皮匠报告官方公众号
验证即登录,未注册将自动创建三个皮匠报告账号
使用 微信 扫一扫登陆