1、Jiaming Yuan Bobby Wang 使用GPU加速XGBOOST在 SPARK集群上的分布式训练 2 Jiaming Yuan 介绍 XGBoost 高性能算法的实现 Bobby Wang 介绍在 Spark 3.0+ 集群上利用GPU对XGBoost进行加速 AGENDA 3 BACKGROUND 4 XGBOOST 梯度提升树模型训练 支持 regression, classification, ranking, survival 以及用户自定义模 型 大量实际应用 4 5 XGBOOST 5 From: https:/xgboost.readthedocs.io/en/lat
2、est/tutorials/model.html 随机森林梯度提升 树 Ranking Regression Classification Survival Coming 6 为什么需要高性能 GPU 运算 Biasvariance tradeoff 使用 更多的树 和 较小的 learning rate 有助于降低 bias 和 variance 使用随机森林可以通过 树 的深度和数量降低 bias 和 variance, 但随机森林可能需要训练更深的树。 增大数据量有助于降低 bias 和 variance。 The backbone of machine learning. 6 无论通过
3、哪一种方案来降低 bias 和 variance, 强大的计算能力都是 必须 的。 而 NVIDIA GPU 则为 XGBoost 提供了所 需要的计算能力。 Source: https:/ 7 XGBOOST 7 外存训练支持 Spark Dask Flink Kubernete 强大的拓展能力 支持直接读取 cuDF 数据 完整的 GPU 运算 pipeline 通过不同分布式框架下进行多点多 GPU 分布式运算 GPU SHAP 完整的 GPU 运算流程支持 数据量很大? 要快速调参? 8 XGBOOST 技术栈 Spark cuDF Thrust Cub NCCL NCCL Scala CUDA Libraries CUDA XGBoost 9 TRAINING 10 向上拓展 10 梯度提升不是一个 stochastic 算法, 在确保准确度的前提下难以直接 通过 batch
1、下载报告失败解决办法 2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。 3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。 4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
大规模分布式 GPU 图嵌入在腾讯的实践之路.pdf
三个皮匠报告专业的行业报告下载站,每日更新,欢迎大家关注!
copyright@2008-2013 长沙景略智创信息技术有限公司版权所有 网站备案/许可证号:湘B2-20190120
专属顾问
机构入驻、侵权投诉、商务合作
三个皮匠报告官方公众号
验证即登录,未注册将自动创建三个皮匠报告账号
使用 微信 扫一扫登陆