上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

2020年终大会-机器学习平台:13-1.pdf

编号:29905 PDF 15页 1.54MB 下载积分:VIP专享
下载报告请您先登录!

2020年终大会-机器学习平台:13-1.pdf

1、CPU Node GPU Node GPU Node CPU Node XIAOMI CloudMl Model Trainnig Model Inference Thetis MIG Grid MPS cGPU vCuda Orion/vir taitech 减少资源浪费 提高集群的GPU任务量吞吐 减少任务排队时间 实现方式不同 vGPU实现的层次不同 适用场景不同 优点: 上手容易,实现简单 缺点: 没有算力以及显存隔离 适用场景: 测试集群,模拟GPU资源 https:/ 优点: 共用Cuda Context,减少切换时间 实现空间上的并行处理 缺点: 同一个Cuda Context中

2、的任务出现错误会互相影响,没有强隔离 场景:MPI 类任务,小模型任务。 https:/ 优点: 适用于虚拟机,强隔离 缺点: 不适用容器 试用场景: 虚拟化平台 https:/ 优点: 强隔离,软硬件支持 缺点: 昂贵、无法兼容老机型、显存和算力 大小无法定制 试用场景: 新集群、小模型 https:/ 优点: 实现了显存和算力隔离,可以任意划分 支持软隔离 缺点: 影响应用运行时环境 试用场景: 容器平台 https:/ 优点: 实现算力及显存的隔离 不侵入应用运行时环境 缺点: 影响Nvidia Driver,维护困难 试用场景: 阿里云 https:/ GPU Node GPU Nod

3、e GPU Node GPU Node GPU Node GPU Node Kubelet GPU Node K8S Master Scheduler GPU 0 Idle GPU 2 Idle GPU 1 Idle GPU n Pod CPUMemory https:/ K8S Master Scheduler GPU Node CPU Node Orion Controller Scheduler GPUvGPU GPU Node GPUvGPU GPU Node GPUvGPU GPU Node GPUvGPU CPU Node CPU Node CPU Node apiVersionapiVersion: v1 kindkind: Pod specspec: Resource: requests: CPU、Mem、 GPU vGPU Pod 1. 应用的服务质量保证 2. 不侵入用

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(2020年终大会-机器学习平台:13-1.pdf)为本站 (X-iao) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部