1、GTC China , Oct 2020 HIGH PERFORMANCE E2E ETHERNET SOLUTION ACCELERATE RECOMMENDER SYSTEM 2 3 4 Speed , Feed and Latency - Fast interconnect - Fast access dataset RDMA and RoCE - Low latency access GPU memory - Low latency access external dataset Monitoring and Management - Nvidia Ethernet Switch ad
2、dress the challenges 5 SPEED AND FEED THE NEED OF BANDWIDTH Data parallel Communication speedup must match math speedup, otherwise we achieve little E2E speedup Allreduce spans both NVLink and networking domains: bandwidth must be available in each Intra-layer model parallel Intra-layer model parall
3、el leaves collectives exposed Accelerating math without acceleration communication suffers from basic Amadahls law problem Typically collectives span NVLink domain only 6 GPU Direct Over RoCE or IB Nodes NVLINK Switch GPUs NVLINK GPUs NVIDIAS MULTI-GPU, MULTI-NODE NETWORKING AND STORAGE IO OPTIMIZATION STACK Build larger & lower latency resource pool XBAR On Chip 7NVIDIA CONFIDENTIAL. DO NOT DISTR
1、下载报告失败解决办法 2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。 3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。 4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
性能提升 7 倍 + 的高性能 GPU 广告推荐加速系统的落地实现.pdf
海纳-高性能网络协议栈.pdf
2-王青-高性能制品库系统的设计.pdf
中国计算机学会:2022高性能计算系统性能评价白皮书(33页).pdf
Merlin : GPU 加速的推荐系统框架.pdf
推荐系统推理性能优化在“双十一”中的应用.pdf
通信行业专题研究:腾讯发布HCC升级高性能网络架构-230416(16页).pdf
张智博-实现基于Macvlan的高性能容器网络(GOTC深圳会场)(19页).pdf
移动云:2023开放云网络之高性能网关技术白皮书(43页).pdf
ODCC:2023数据中心高性能网络拥塞检测技术白皮书(65页).pdf
三个皮匠报告专业的行业报告下载站,每日更新,欢迎大家关注!
copyright@2008-2013 长沙景略智创信息技术有限公司版权所有 网站备案/许可证号:湘B2-20190120
专属顾问
机构入驻、侵权投诉、商务合作
三个皮匠报告官方公众号
验证即登录,未注册将自动创建三个皮匠报告账号
使用 微信 扫一扫登陆