上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

使用 GPU 加速 XGBOOST 在 SPARK 集群上的分布式训练.pdf

编号:29490 PDF 40页 24.95MB 下载积分:VIP专享
下载报告请您先登录!

使用 GPU 加速 XGBOOST 在 SPARK 集群上的分布式训练.pdf

1、Jiaming Yuan Bobby Wang 使用GPU加速XGBOOST在 SPARK集群上的分布式训练 2 Jiaming Yuan 介绍 XGBoost 高性能算法的实现 Bobby Wang 介绍在 Spark 3.0+ 集群上利用GPU对XGBoost进行加速 AGENDA 3 BACKGROUND 4 XGBOOST 梯度提升树模型训练 支持 regression, classification, ranking, survival 以及用户自定义模 型 大量实际应用 4 5 XGBOOST 5 From: https:/xgboost.readthedocs.io/en/lat

2、est/tutorials/model.html 随机森林梯度提升 树 Ranking Regression Classification Survival Coming 6 为什么需要高性能 GPU 运算 Biasvariance tradeoff 使用 更多的树 和 较小的 learning rate 有助于降低 bias 和 variance 使用随机森林可以通过 树 的深度和数量降低 bias 和 variance, 但随机森林可能需要训练更深的树。 增大数据量有助于降低 bias 和 variance。 The backbone of machine learning. 6 无论通过

3、哪一种方案来降低 bias 和 variance, 强大的计算能力都是 必须 的。 而 NVIDIA GPU 则为 XGBoost 提供了所 需要的计算能力。 Source: https:/ 7 XGBOOST 7 外存训练支持 Spark Dask Flink Kubernete 强大的拓展能力 支持直接读取 cuDF 数据 完整的 GPU 运算 pipeline 通过不同分布式框架下进行多点多 GPU 分布式运算 GPU SHAP 完整的 GPU 运算流程支持 数据量很大? 要快速调参? 8 XGBOOST 技术栈 Spark cuDF Thrust Cub NCCL NCCL Scala CUDA Libraries CUDA XGBoost 9 TRAINING 10 向上拓展 10 梯度提升不是一个 stochastic 算法, 在确保准确度的前提下难以直接 通过 batch

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(使用 GPU 加速 XGBOOST 在 SPARK 集群上的分布式训练.pdf)为本站 (X-iao) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部