1、Data Provider Solution for DLT on Brain+ 旷视科技杨阳 背景 瓶颈分析 解决方案 未来和展望 分享大纲 背景 Deep Learning training (DLT): an important workload on clusters 应用广泛: Image Classification Object Detection Natural Language Processing Recommender Systems 视觉领域数据密集 ImageNet-1K: 1.28 million images Open Image: 9 million image
2、s 成本昂贵, i.e., GPUs Training the well-known ResNet-50 model on the ImageNet-1K dataset takes more than 30 hours in a cluster Brain+: DLT 的生产力平台 抽象基础设施 CPU/GPU/Memory/Storage 研究员友好 而不是工程师友好 工程化 DLT 流程上尽可能节省研究员时间 提供易用而高效的定制基础设施 核心目标:解放研究员的生产力 问题聚焦 数据供给问题:又快又好的让模型可以吃到数据 问题特征: 大规模数据集 复杂的 CPU 上数据增广策略 数据复用
3、明显 瓶颈分析 ExampleExample WorkloadWorkload Resnet50Resnet50 is a popular vision model Process 10,500 images/sec on 8 Nvidia V100s Goal: Keep GPUs busy and utilize them efficientlyGoal: Keep GPUs busy and utilize them efficiently Remote Remote store store with with several several TBs of TBs of training training datadata 2GB/s ExampleExample WorkloadWorkload Resnet50Resnet50 is a popular vision model
1、下载报告失败解决办法 2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。 3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。 4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
2020年终大会-机器学习平台:13-5.pdf
2020年终大会-机器学习平台:13-1.pdf
2020年终大会-推荐算法:3-3.pdf
2020年终大会-推荐算法:3-7.pdf
2020年终大会-推荐算法:3-1.pdf
2020年终大会-数据治理:15-3.pdf
2020年终大会-推荐算法:3-5.pdf
2020年终大会-数据产品:8-3.pdf
2020年终大会-推荐算法:3-4.pdf
2020年终大会-推荐算法:3-2.pdf
三个皮匠报告专业的行业报告下载站,每日更新,欢迎大家关注!
copyright@2008-2013 长沙景略智创信息技术有限公司版权所有 网站备案/许可证号:湘B2-20190120
专属顾问
机构入驻、侵权投诉、商务合作
三个皮匠报告官方公众号
验证即登录,未注册将自动创建三个皮匠报告账号
使用 微信 扫一扫登陆