英伟达GraceHopper与x86+Hopper的最终用户应用程序性能模拟 原图定位 以 Grace Hopper 为例,可以具体观察 CPU+GPU 异构的优势所在。英伟达通过NVLink-C2C 技术使 CPU+GPU 构成一个完整的系统,并实现内存相互访问,无需沿循“CPU-内存-主板-显存-GPU”基于主板 PCIe 的迂回路线,从而减少 CPU 计算损耗,并大幅提升功耗、延时和带宽。GPU 在视频处理、图像渲染等方面的优势毋庸置疑,但并非所有工作负载都是单纯的 GPU-bound,因此我们认为,其 CPU 部分或主要用于发出指令,以及在推理阶段处理,尤其是文本、音频等信息。