上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

大规模稀疏化模型技术介绍及实践-AI工程化技术峰会(16页).pdf

编号:84483 PDF 16页 101.94MB 下载积分:VIP专享
下载报告请您先登录!

大规模稀疏化模型技术介绍及实践-AI工程化技术峰会(16页).pdf

1、大规模稀疏化模型技术介绍及实践郭一小红书技术平台负责人小红书上海品茶推荐模型演进 国内领先的生活分享社区月活超过1亿每天百亿次笔记曝光Inspire Lives 分享和发现世界的精彩2016年之前 人工精选2018/07 SparkML GBDT(小几万参数)2018/12 GBDT+LR(大几万参数)2019/02 GBDT+Deep&Wide(几百万参数)2019/12 Sparse D&W(十几亿级参数)2020/08 Sparse D&W(近千亿级参数,小时级别更新)2021/04 千亿级模型+分钟级更新2021/09 GPU推理加速03.5710.51417.501E+112E+113E

2、+114E+112018/072018/122019/022019/122020/082021/042021/10模型更新时间模型参数量模型结构及上线时间模型迭代及参数变化模型参数量模型更新时间千亿百亿百万万周天小时分钟10MB20MB100MB 8台32张A10 的良好扩展性计算吞吐(单机8卡)相比 CPU(1800c)集群提升至 2.6x12.600.651.31.952.63.25CPU 集群GPU 集群Speedup成本相比(单机8卡)CPU(1800c)集群降低至 74%100%74%0%25%50%75%100%125%CPU 集群GPU 集群稀疏特征模型多种硬件与基础设施训练瓶颈数据加载嵌入表查找兴趣提取梯度计算参数更新通过软硬件结合的优化,充分挖掘 GPU 高算力、高访存、高并发的特点,极致提升性能HybridBackend访存网络数据流水线存储容量算力稀疏算子训练策略数据读取适合 GPU适合 CPU网络访存HybridBackend ParquetDataset:极致优化海量稀疏数据访问支持云原生的存储、计算、训练混合架构LastN 模型线上数据(N=2.5k)读取性能相比线上基准有 2.4x 提升线上数据 Parquet(zstd)相比线上基准减少了 50%的存储空间

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(大规模稀疏化模型技术介绍及实践-AI工程化技术峰会(16页).pdf)为本站 (云闲) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部