1、Alessandro Bellina and Jason Lowe, 10/6/2020 Allen Xu and Liangcai Li, 12/15/2020 !RAPIDS #$#$APACHE SPARK 3.0 2 用于 Apache Spark 的 RAPIDS 加速器 工作原理 加速 Shuffle 0.2 版本中的亮点 0.3 版本中的计划 AGENDA 3 RAPIDS ACCELERATOR FOR APACHE SPARK 3.0 4 #$% ETL? https:/ GPU 可以让大象跑得更快吗? 5 ! % Workers: 8 x m5dn.2xlarge On-d
2、emand cluster cost (US West): $4.488/hr GPU Cluster: Driver: 1 x m5dn.large, Worker: 8 x g4dn.2xlarge On-demand cluster cost (US West): $6.152/hr 163.0 53.2 0.0 40.0 80.0 120.0 160.0 200.0 CPU: 8 x m5dn.large (64-core 512GB) GPU: 8 x g4dn.12xlarge (8-core 32GB 1xT4 GPU) Time (secs) Query Time TPC-DS
3、 QUERY 38 RESULTS 整个查询都被GPU支持 $0.20 $0.09 $0.00 $0.05 $0.10 $0.15 $0.20 $0.25 CPU: 8 x m5dn.large (64-core 512GB) GPU: 8 x g4dn.12xlarge (8-core 32GB 1xT4 GPU) Total Costs 3X Speed-up55% Cost Savings 21 即使只支持部分算子,也能看见费用的节省! $0.20 $0.15 $0.00 $0.05 $0.10 $0.15 $0.20 $0.25 CPU: 8 x m5dn.large (64-core 512GB) GPU: 8 x g4dn.12xlarge (8-core 32GB 1xT4 GPU) Total Costs 160.0 90.2 0.0 40.0 80.0 120.0 160
1、下载报告失败解决办法 2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。 3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。 4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
随时随地使用 Apache Spark:使用 Spark™ Connect 进行远程连接.pdf
使用网络 RDMA 技术为 SPARK 架构加速.pdf
5.李呈祥 -Apache Spark最新技术进展和3.0+展望(21页).pdf
Apache Spark™ 流式处理和增量实时表加速毕马威客户实时物联网洞察.pdf
使用Apache Spark™和H3地理空间索引系统的卫星图像数据处理.pdf
使用 GPU 加速 XGBOOST 在 SPARK 集群上的分布式训练.pdf
三个皮匠报告专业的行业报告下载站,每日更新,欢迎大家关注!
copyright@2008-2013 长沙景略智创信息技术有限公司版权所有 网站备案/许可证号:湘B2-20190120
专属顾问
机构入驻、侵权投诉、商务合作
三个皮匠报告官方公众号
验证即登录,未注册将自动创建三个皮匠报告账号
使用 微信 扫一扫登陆