《电子行业: 英伟达GH200 vs AMD MI(17页).pdf》由会员分享,可在线阅读,更多相关《电子行业: 英伟达GH200 vs AMD MI(17页).pdf(17页珍藏版)》请在三个皮匠报告上搜索。
1、 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。1 证券研究报告 电子电子 英伟达英伟达 GH200 vs AMD MI300 华泰研究华泰研究海外科技海外科技 电子电子 增持增持 (维持维持)研究员 何翩翩何翩翩 SAC No.S0570523020002 SFC No.ASI353 +(852)3658 6000 华泰证券华泰证券 2023 年中期投资峰会年中期投资峰会 2023 年 5 月 30 日美国 动态点评动态点评 千呼万唤始出来,千呼万唤始出来,DGX GH200 超级计算系统超级计算系统助力助力新一代大新一代大 AI 模型模型 英伟达在 2023 COMPUTEX
2、 大会上更新了多款 AI 算力产品。当中焦点落在DGX GH200 超级计算系统上。该系统是通过 NVLink 互连技术及 NVLink Switch System,串联 32 台由 8 块 GH200 超级芯片(总计 256 块)合并而成的单一超级计算系统,存储器容量高达 144 TB,大规模的共享内存能解决 AI 大模型训练的关键瓶颈,将为生成式 AI 语言应用、推荐系统和数据分析工作负载的大模型增添动力。英伟达宣布 Google Cloud、Meta 与微软将是其首批用户。先进的加速计算先进的加速计算+网络技术,为吞吐量网络技术,为吞吐量和可扩展性迎来新突破和可扩展性迎来新突破 DGX
3、GH200 集成了英伟达最先进的加速计算和网络技术,为提供最大的吞吐量和可扩展性而设计。NVIDIA NVLink-C2C 将 CPU 与 GPU 相连组成GH200 超级芯片,它们再通过 NVLink Switch System 组成高带宽的多 GPU系统,每个 Grace Hopper 超级芯片还配有一个 NVIDIA ConnectX-7 网络适配器和一个 NVIDIA BlueField-3 NIC。从具体参数上看 DGX GH200 性能优异,DGX GH200 可提供高达 1 exaFLOPS=1000 petaFLOPS 的算力。在 2023年底,结合 Quantum-2 Inf
4、iniBand技术与 4台DGX GH200的 AI 超级计算机 NVIDIA Helios(含 1024=4*256 个 GH200 超级芯片)将会推出,或标志英伟达在 AI 和数据分析工作负载加速计算的又一突破。英伟达英伟达 GH200 vs AMD MI300,互联和生态圈或是,互联和生态圈或是 AMD 破局破局的的主要主要障碍障碍 英伟达的 Grace Hopper 与 AMD 的 MI300 同为 CPU+GPU 架构。我们认为,该架构已成为 AI 芯片的趋势,鉴于 AI 的最终目标是模仿人类大脑的操作,AI 芯片也应仿生人脑结构,并顺应多模态模型的发展。CPU 更像左脑,负责对信息
5、的逻辑处理,如串行运算、数字和算术、分析思维、理解、整理等,而 GPU 更像右脑,负责并行计算、创造性思维和想象等。在面对不同模态的推理时,CPU 与 GPU 的分工也各有不同。例如,在处理语音、语言和文本时,计算有序,因此或更适合使用 CPU;但在处理图像、视频等推理时,需要大规模并行运算,或更适宜 GPU。此前,英特尔也曾准备发布同类产品 Falcon Shores。AI 训练多方入局苗头初生,训练多方入局苗头初生,AI 推理百花齐放推理百花齐放难决胜负难决胜负 英伟达的高算力 GPU 一直是 AI 训练的首选,但随着谷歌 TPU、AMD MI300 及云厂商自研芯片等的强势涌入,AI 训
6、练的市场格局变化苗头渐生。谷歌的 TPU 是少数能与英伟 GPU 匹敌的芯片,但面临着通用性的局限;AMD MI300 在制程、架构及算力等多方面虽向英伟达 GPU 看齐,但仍存在软件生态和互联的突围障碍。在 TCO、研发可控性及集成生态圈等因素下,微软、谷歌及亚马逊等头部云厂商推进自研芯片乃大势所趋。在算力要求比训练低的推理端,各类芯片百花齐放,主要根据不同 AI 工作负载来选择,或不会演变出像训练端一家独大的竞争局面。总体而言,AI 训练和推理的 TAM虽在不断变大,但英伟达在当中的增速能否跟上是支撑公司发展的关键。从从 Spectrum-X 网络平台到超算系统,英伟达为网络平台到超算系统
7、,英伟达为 AI 计算全面加速计算全面加速 除了 GH200 芯片及 DGX GH200 超算系统的重磅发布,CEO 黄仁勋在本次2023 COMPUTEX 还宣布了多款新品全面加速 AI 计算:专门用于提高以太网 AI 云性能和效率的网络平台 Spectrum-X 及用于创建加速服务器的模块化参考架构 NVIDIA MGX,为 AI 及 HPC 的客户提供多元化选择。风险提示:AI 技术落地和推进不及预期、竞争格局越演越烈、中美关系升级。相关信息数据来自于相关公司的公开的客观信息,不代表对相关公司的研究覆盖和推荐。免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。2 电子电子 正文
8、目录正文目录 DGX GH200 超级计算系统为新一代大超级计算系统为新一代大 AI 模型而设模型而设.3 英伟达英伟达 GH200 vs AMD MI300.7 从从 Spectrum-X 网络平台到超算系统,英伟达全面加速网络平台到超算系统,英伟达全面加速 AI 计算计算.12 风险提示风险提示.14 图表目录图表目录 图表 1:Grace Hopper Superchip 在首次发布的 14 个月后终于宣布投产.3 图表 2:英伟达 Grace Hopper 架构示意图.4 图表 3:英伟达 Grace Hopper 与 x86+Hopper 的最终用户应用程序性能模拟.4 图表 4:N
9、VIDIA DGX GH200 整合了 256 个 GPU.5 图表 5:NVIDIA DGX GH200 的内存容量较上一代 DGX H100 大幅增长.5 图表 6:在巨大内存 AI 工作负载下,DGX GH200 的性能突出.6 图表 7:英伟达 DGX H100 VS DGX GH200.6 图表 8:AMD MI300 使用 3D Chiplet 结构.7 图表 9:MI300 产品示意图.7 图表 10:英伟达 Grace Hopper 架构示意图.8 图表 11:AMD 宣称 MI300 AI 性能将是 MI250X 的 8 倍,能耗性能将为 MI250X 的 5 倍.8 图表
10、12:英伟达及 AMD 主要 GPU 相关产品参数对比.9 图表 13:MI300 向第三代统一内存架构转换实现了 CPU 和 GPU 的内存共享.9 图表 14:英伟达 Grace Hopper 通过 NVLink-C2C 和 NVLink Switch 实现 CPU-GPU 和 GPU-GPU 互连.10 图表 15:2011 年 AMD 已提出 APU 概念,将结合 CPU 与 GPU 在左右脑层面的分工区别和组合构想.11 图表 16:NVIDIA Spectrum-X 产品图.12 图表 17:MGX 的适用领域.13 图表 18:NVIDIA Quantum-2 在网络通信领域中的
11、性能突出.13 SUfWrZkZkWtRnPrM6MaObRpNpPpNnOfQmMnQjMtQrQ8OqRpPuOpPrPvPpOmP 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。3 电子电子 DGX GH200 超级计算系统为新一代大超级计算系统为新一代大 AI 模型而模型而设设 Grace Hopper 超级芯片宣布全面投产超级芯片宣布全面投产。严格意义上来说,GH200 并不是一款“全新”的芯片,因为早在 2022 年的 GTC 大会,英伟达就已经公布了由首款数据中心 CPU Grace+新一代高性能计算 GPU Hopper 打造而成的 Grace Hopper Su
12、perchip 并透露其使用了 NVLink-C2C 技术,具有高达 900 GB/s 的一致性接口速率;在 2023 年的 GTC 大会上,英伟达 CEO 黄仁勋先生也曾手持这款超级芯片进行首次实物展示。距离 Grace Hopper 首次发布 14 个月后的 COMPUTEX 2023 上,GH200 Grace Hopper 超级芯片被正式宣布已经全面投产,将为大规模 HPC 和 AI 应用带来突破性的加速计算。图表图表1:Grace Hopper Superchip 在首次发布的在首次发布的 14 个月后终于宣布投产个月后终于宣布投产 资料来源:英伟达官网、华泰研究 Grace Hop
13、per 超级芯片:超级芯片:NVLink-C2C 技术赋能芯粒互联技术赋能芯粒互联。NVIDIA NVLink-C2C 是一种超快速的芯片到芯片、裸片到裸片的互连技术,它从 PCB 级集成、多芯片模块(MCM)、硅中介层或晶圆级连接实现扩展,是 Grace Hopper 超级芯片异构集成的关键。通过NVLink-C2C 技术,Grace CPU 与 Hopper H100 GPU 构成一个完整的系统,并实现内存相互访问,从而无需沿循“CPU-内存-主板-显存-GPU”基于主板 PCIe 的迂回路线,减少了 CPU 计算损耗,并大幅提升功耗效率、延时和带宽。值得注意的是,NVLink-C2C 技
14、术不仅止于 CPU+GPU,而是支持定制裸片与 NVIDIA GPU、CPU、DPU、NIC 和 SoC 等多种芯片之间的一致互连,将为数据中心带来全新的系统级集成芯产品。免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。4 电子电子 图表图表2:英伟达英伟达 Grace Hopper 架构示意图架构示意图 资料来源:英伟达官网、华泰研究 图表图表3:英伟达英伟达 Grace Hopper 与与 x86+Hopper 的最终用户应用程序性能模拟的最终用户应用程序性能模拟 资料来源:英伟达官网、华泰研究 DGX GH200 超级计算机超级计算机:Grace Hopper 超级芯片超级芯
15、片+NVIDIA NVLink Switch System,专,专为为新一代新一代大规模大规模 AI 模型模型而而设设。DGX GH200 超算是第一款将 Grace Hopper 超级芯片与NVIDIA NVLink Switch System 配对使用的超级计算机,它通过 NVLink 互连技术及 NVLink Switch System 串联 32 台由 8 块 GH200 超级芯片组成的系统,将总计 256 块 GH200 Superchip 合并成单一超级计算机,提供了 1 exaFLOPS=1000 petaFLOPS 算力与 144 TB 的内存。这种大规模共享内存解决了大规模
16、AI 的关键瓶颈,将为生成式 AI 语言应用、推荐系统和数据分析工作负载的巨型模型增添动力。Google Cloud、Meta 与微软将是 DGX GH200 的首批用户。免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。5 电子电子 图表图表4:NVIDIA DGX GH200 整合了整合了 256 个个 GPU 资料来源:英伟达官网、华泰研究 图表图表5:NVIDIA DGX GH200 的内存容量较上一代的内存容量较上一代 DGX H100 大幅增长大幅增长 资料来源:英伟达官网、华泰研究 先进的加速计算先进的加速计算+网络技术,为吞吐量和可扩展性迎来新突破。网络技术,为吞吐量
17、和可扩展性迎来新突破。DGX GH200 集成了英伟达最先进的加速计算和网络技术,为提供最大的吞吐量和可扩展性而设计。NVIDIA NVLink-C2C 将 CPU 与 GPU 相连组成 GH200 超级芯片,它们再通过 NVLink Switch System 组成高带宽的多 GPU 系统,每个 Grace Hopper 超级芯片还配有一个 NVIDIA ConnectX-7 网络适配器和一个 NVIDIA BlueField-3 NIC。从具体参数上看 DGX GH200性能优异,DGX GH200 可提供高达 1 exaFLOPS 的算力,标志着 GPU 在 AI 和数据分析工作负载加速
18、计算的又一突破。免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。6 电子电子 图表图表6:在巨在巨大内存大内存 AI 工作负载工作负载下,下,DGX GH200 的性能的性能突出突出 资料来源:英伟达官网、华泰研究 图表图表7:英伟达英伟达 DGX H100 VS DGX GH200 DGX H100 DGX GH200 GPU and CPU 8x NVIDIA H100 Tensor Core GPUs+Dual Intel Xeon Platinum 8480C Processors 256x NVIDIA Grace Hopper Superchips(each Grace
19、 Hopper Superchip includes Grace Arm CPU+H100 Tensor Core GPU)MI250X CPU Cores 112 Cores total,2.00 GHz(Base),3.80 GHz(Max Boost)18,432 Arm Neoverse V2 Cores with SVE2 4X 128b GPU memory 640GB 144TB Performance(FP8)32 petaFLOPS 1 exaFLOPS NVIDIA NVSwitch 4x 96x L1 NVIDIA NVLink Switches 36x L2 NVIDI
20、A NVLink Switches Networking 4x OSFP ports serving 8x single-port NVIDIA ConnectX-7 VPI Up to 400Gb/s InfiniBand/Ethernet 2x dual-port QSFP112 NVIDIA ConnectX-7 VPI Up to 400Gb/s InfiniBand/Ethernet 256x OSFP single-port NVIDIA ConnectX-7 VPI with 400Gb/s InfiniBand 256x dual-port NVIDIA BlueField-3
21、 VPI with 200Gb/s InfiniBand and Ethernet 24x NVIDIA Quantum-2 QM9700 InfiniBand Switches 20 x NVIDIA Spectrum SN2201 Ethernet Switches 22x NVIDIA Spectrum SN3700 Ethernet Switches Management network 10Gb/s onboard NIC with RJ45 100Gb/s Ethernet NIC Host baseboard management controller(BMC)with RJ45
22、 Host baseboard management controller(BMC)with RJ45 Software NVIDIA AI Enterprise(optimized AI software)NVIDIA Base Command(orchestration,scheduling,and cluster management)DGX OS/Ubuntu/Red Hat Enterprise Linux/Rocky(operating system)Support Comes with 3-year business-standard hardware and software
23、support 资料来源:英伟达官网、华泰研究 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。7 电子电子 英伟达英伟达 GH200 vs AMD MI300 与英伟达与英伟达 GH200 超级芯片类似,超级芯片类似,AMD 在在 2023 下半年即将推出的的 MI300 也将采用也将采用 CPU+GPU 架构架构,同样发力于同样发力于 AI 训练市场训练市场。AMD 于 CES 2023 介绍了新一代 Instinct MI300 加速器,结合 CPU 与 GPU,重点发力数据中心的 HPC 及 AI 领域,对标英伟达 Grace Hopper(Grace CPU+Hopper
24、 H100 GPU),一改过去 AMD 的 GPU 产品主要应用在图像处理及AI 推理领域的局限。公司早前在 22Q4 财报电话会里提及,MI300 已开始送样给重要客户,而正式推出将会在下半年,2024 年将看到明显贡献。我们认为,MI300 虽然目前虽然目前可能在可能在网网络互联技术和生态圈络互联技术和生态圈较为受限较为受限,但在突出的性能和高性价比下,但在突出的性能和高性价比下或或将成为将成为 AMD 在在 AI 竞争的竞争的关键关键拐点?拐点?我们将从芯片架构和制程、我们将从芯片架构和制程、算力算力、内存带宽、内存带宽、价格价格和和软件生态软件生态对对 AMD MI300 和英伟达和英
25、伟达GH200 两者竞争优势展开对比两者竞争优势展开对比:1)芯片架构:芯片架构:CPU+GPU 仿生人脑结构,制程看齐仿生人脑结构,制程看齐英伟达英伟达。MI300 是 AMD 首款结合了 Zen 4 CPU 与 CNDA 3 GPU 的产品,也是市场上首款“CPU+GPU+内存”一体化产品。MI300采用 3D 堆叠技术和 Chiplet 设计,配备了 9 个基于 5nm 制程的芯片组(据 PCgamers 推测,包括 3 个 CPU 和 6 个 GPU),置于 4 个基于 6nm 制程的芯片组之上。因此在制程上,MI300 属台积电 5nm,相较 MI200 系列的 6nm 实现了跃迁,
26、并与英伟达 Grace Hopper的 4nm 制程(属台积电 5nm 体系)看齐。MI300 晶体管数量达到 1460 亿,多于英伟达H100 的 800 亿,以及前代 MI250X 的 582 亿晶体管数量。CDNA 3 架构是 MI300 的核心DNA,MI300 配备了 24 个 Zen 4 数据中心 CPU 核心和 128 GB HBM3 内存,并以 8192位宽总线配置运行。图表图表8:AMD MI300 使用使用 3D Chiplet 结构结构 图表图表9:MI300 产品示意图产品示意图 资料来源:AMD 官网、华泰研究 资料来源:CES 2023、华泰研究 免责声明和披露以及
27、分析师声明是报告的一部分,请务必一起阅读。8 电子电子 图表图表10:英伟达英伟达 Grace Hopper 架构示意图架构示意图 资料来源:英伟达官网、华泰研究 2)算力:算力:MI300 的性能逼近的性能逼近英伟达英伟达 Grace Hopper。AMD 上代 MI250X(发布于 2021 年11 月)FP32 算力达 47.9 TFLOPS,虽已超越英伟达 A100 的 19.5TFLOPS(发布于 2020年 6 月),但其发布时间在英伟达之后。AMD 暂时未公布 MI300 与英伟达 Grace Hopper在算力上的对比,但相较上一代的 MI250X,MI300 在 AI 上的算
28、力(TFLOPS)预计能提升 8 倍,能耗性能(TFLOPS/watt)将优化 5 倍。因此,此次 MI300 的性能提升后有望逼近 Grace Hopper 水平。另外,Grace Hopper 支持 8 位浮点精度,而 MI250X 仅支持 16位及以上,但 MI300 或将在 AI 训练中支持 4 位和 8 位浮点精度,可进一步节省算力。图表图表11:AMD 宣称宣称 MI300 AI 性能将是性能将是 MI250X 的的 8 倍,倍,能耗性能将为能耗性能将为 MI250X 的的 5 倍倍 资料来源:CES 2023、华泰研究 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。
29、9 电子电子 图表图表12:英伟达及英伟达及 AMD 主要主要 GPU 相关相关产品参数对比产品参数对比 英伟达英伟达 AMD 产品名称产品名称 A100 PCIeSXM H100 PCIeSXMNVL MI250X MI300 发布时间发布时间 2020.6 2022.3 2021.11 2023.1 峰值峰值算力(算力(TFLOPS)FP16:312624 FP32:19.5 FP64:19.5 FP8:3,0263,9587,916 FP16:1,5131,9793,958 FP32:5167134 FP64:5164134 FP16:383 FP32/64:47.9 FP32/64 M
30、atrix:95.7 NA 工艺制程及芯片面积工艺制程及芯片面积 7nm,826mm2 4nm,814 mm2 6nm,724 mm2 5nm,1017 mm2 晶体管数量晶体管数量(亿)(亿)540 800 582 1460 内存容量内存容量 80 GB HBM2e 8080188 GB HBM3 128 GB HBM2e 128 GB HBM3 内存带宽内存带宽 1,9352,039 GB/s 23.35 TB/s7.8TB/s3 高达 3.2 TB/s2 NA Interconnect 600 GB/s NVLink for 2 GPUs 64 GB/s PCIe Gen4 600900
31、600 GB/s NVLink 125 GB/s PCIe Gen5 PCIe Gen4 PCIe 热设计功耗热设计功耗 TDP(W)300400 x350-400 500 600 资料来源:AMD 官网、英伟达官网、华泰研究 3)内存带宽:内存带宽:MI300 通过“通过“统一内存架构统一内存架构”(”(Unified Memory)便利)便利 GPU-CPU 间数据传间数据传输,效果类比输,效果类比英伟达英伟达 NVLink C2C 技术技术。MI300 的 3D Chiplet 架构使其内部 CPU 和 GPU可共享同一内存空间,针对相同数据同时展开计算,实现“ze
32、ro-copy”(即 CPU 执行计算时无需先将数据从某处内存复制到另一个特定内存区域),便利单节点内 GPU-CPU 之间的数据传输,减少内存带宽的占用。而英伟达 Grace Hopper 则通过 NVLink-C2C 实现 GPU-CPU高速互联,双方作为内存共享对等体可以直接访问对方的对应内存空间,支持 900GB/s 的互联速度。尽管 AMD 暂未公布 MI300 的传输带宽,但其创新的统一内存架构实现了GPU-CPU 在物理意义上真正的内存统一。AMD 虽未公布 MI300 HBM 的更多信息,但最新代 HBM3 内存带宽约为 819GB/s,与英伟达 NVLink C2C 900G
33、B/s 带宽相差不大。因此MI300 内 GPU-CPU 的统一架构可绕过传统连接协议速度的障碍,突破 GPU-CPU 之间的数据传输速度限制,满足未来 AI 训练和推理中由模型大小和参数提升带来的海量数据计算和传输需要。但值得一提的是,英伟达还可以通过 NVLink Switch、Quantum-2 InfiniBand等技术实现更多层次的互联,实现带宽内存几个数量级的提升,有效解决 GPU 大规模并行运算中“单节点本地内存不足”的痛点,MI300 的相关技术信息尚未发布。图表图表13:MI300 向第三代统一内存架构向第三代统一内存架构转换转换实现了实现了 CPU 和和 GPU 的内存共享
34、的内存共享 资料来源:CES2023、华泰研究 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。10 电子电子 图表图表14:英伟达英伟达 Grace Hopper 通过通过 NVLink-C2C 和和 NVLink Switch 实现实现 CPU-GPU 和和 GPU-GPU 互连互连 资料来源:英伟达官网、华泰研究 4)价格:高性价比策略或为)价格:高性价比策略或为 AMD 在与英伟达的竞争中再添一码。在与英伟达的竞争中再添一码。尽管 AMD 尚未公布 MI300定价,管理层在 FY23Q1 财报电话会中表示数据中心产品将延续往日的高性价比定价风格,重点关注先把市场打开。成本效
35、益乃云厂商的重中之重,加上单一依赖一个厂商也并非他们所愿。公司预计 MI300 将于今年底前推出,并将搭载于劳伦斯利弗莫尔国家实验室的百亿级超级计算机EI Capitan及其他大型云端客户AI模型中。公司预计MI300营收将在23Q4开始放量,24 年持续爬升。5)软件生态:软件生态:对比英伟达的对比英伟达的 CUDA(Compute Unified Device Architecture)生态圈,生态圈,AMD 的的 ROCm(Radeon Open Compute Ecosystem)或是其打破英伟达独大局势的一或是其打破英伟达独大局势的一大大障碍。障碍。英伟达于 2007 年发布 CUD
36、A 生态系统,开发人员可以通过 CUDA 部署 GPU 进行通用计算(GPGPU)。通过先发优势和长期耕耘,CUDA 生态圈已较为成熟,为英伟达GPU 开发、优化和部署多种行业应用提供了独特的护城河。AMD 的 ROCm 发展目标是去建立可替代 CUDA 的生态。而 ROCm 于 2016 年 4 月发布,相比 2007 年发布的 CUDA 起步较晚。全球 CUDA 开发者 2020 年达 200 万,2023 年已达 400 万,包括 Adobe 等大型企业客户,而 ROCm 的客户主要为研究机构,多应用于 HPC。对任何一种计算平台和编程模型来说,软件开发人员、学术机构和其他开发者与其学习
37、、磨合和建立生态圈都需要时间,更多的开发者意味着不断迭代的工具和更广泛的多行业应用,进一步为选择 CUDA 提供了更为充分的理由,正向循环、不断完善的生态也将进一步提高其用户粘性。针针对这样的现状,对这样的现状,AMD 在丰富其软件生态也持续有积极动作。在丰富其软件生态也持续有积极动作。虽然目前仅有部分 SKU 支持 Windows 系统,但主流 Radeon 显卡用户可以开始试用过去仅专业显卡才能使用的 AMD ROCm(5.6.0 Alpha)。23Q1 公司宣布其 ROCm 系统融入 PyTorch 2.0 框架,目前TensorFlow 和 Caffe 深度学习框架也已加入第五代 RO
38、Cm。ROCm 也能对应到 CUDA 的部分内容,例如 ROCm 的 HIP 对应 CUDA API,只需要替换源码中的 CUDA 为 HPI 就可以完全移植。人脑神经网络的运作模式始终是人工智能追求的终极形态人脑神经网络的运作模式始终是人工智能追求的终极形态,CPU+GPU 类比类比人类左右脑协人类左右脑协同工作同工作,或将成为或将成为 AI 芯片的主流技术方向。芯片的主流技术方向。早在 2011 年,AMD 产品构想中就以 CPU 和GPU 分别类比人类左右脑,并基于此提出了 CPU+GPU 的异构产品策略。类比人脑,AMD认为左脑更像 CPU,负责对信息的逻辑处理,如串行运算、数字和算术
39、、分析思维、理解、分类、整理等,而右脑更像 GPU,负责并行计算、多模态、创造性思维和想象等。GPU 的算力高,并针对并行计算,但须由 CPU 进行控制调用,发布指令。在 AI 训练端,CPU 可负责控制及发出指令,指示 GPU 处理数据和完成复杂的浮点运算(如矩阵运算)。900 GB/s900 GB/s900 GB/s 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。11 电子电子 图表图表15:2011 年年 AMD 已提出已提出 APU 概念,将结合概念,将结合 CPU 与与 GPU 在左右脑层面的分工区别和组合构想在左右脑层面的分工区别和组合构想 资料来源:AMD 推特官方
40、、华泰研究 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。12 电子电子 从从 Spectrum-X 网络平台到超算系统,英伟达网络平台到超算系统,英伟达全面加速全面加速 AI 计算计算 除了 GH200 超级芯片及 DGX GH200 超算系统的重磅发布,黄仁勋在本次 2023 COMPUTEX 大会还宣布了多款新品全面加速 AI 计算:NVIDIA Spectrum-X 是全球首个面向是全球首个面向 AI 的以太网网络平台的以太网网络平台。Spectrum-X 基于网络创新,将英伟达 Spectrum-4 以太网交换机与英伟达 BlueField-3 DPU 紧密耦合,实现了
41、相比传统以太网结构 1.7 倍的整体 AI 性能和能效提升,并通过性能隔离增强了多租户功能,在多租户环境中保持一致、可预测的性能。Spectrum-X 具有高度通用性,可为人工智能、机器学习和自然语言处理等多元应用提升云端效能。它使用完全基于标准的以太网,并可与基于以太网的堆栈互操作。目前,全球领先的云计算提供商正在采用 Spectrum-X 平台扩展生成式 AI 服务。Spectrum-X、Spectrum-4 交换机、BlueField-3 DPU 等现已在戴尔、联想、超微等系统制造商处提供。图表图表16:NVIDIA Spectrum-X 产品图产品图 资料来源:英伟达官网、华泰研究 N
42、VIDIA MGX 是是提供提供加速服务器的模块化架构,满足全球数据中心多样化的加速运算需求。加速服务器的模块化架构,满足全球数据中心多样化的加速运算需求。NVIDIA MGX 是介于 DGX 和 HGX 之间的模块化灵活组合,它为系统制造商提供了一个模块化参考架构,以快速、经济高效地制造 100 多种服务器机型,适用于广泛的 AI、高性能计算和元宇宙应用。英伟达表示,ASRock Rack、ASUS、GIGABYTE、Pegatron、QCT 和 Supermicro 将采用 MGX,它可将开发成本削减四分之三,并将开发时间缩短三分之二至仅 6 个月。免责声明和披露以及分析师声明是报告的一部
43、分,请务必一起阅读。13 电子电子 图表图表17:MGX 的适用领域的适用领域 资料来源:英伟达官网、华泰研究 AI 超级计算机超级计算机 NVIDIA Helios:DGX GH200+Quantum-2 InfiniBand,将于将于 2023 年底推年底推出。出。NVIDIA 还将进一步升级网络技术,推出通过 NVIDIA Quantum-2 InfiniBand 串连 4 台DGX GH200 系统而成的超级计算机,并将其命名为 Helios。该超级计算机内含 1024(4*256)个 GH200 超级芯片,内存进一步升级为 576TB HBM 内存,用于提高训练大型 AI 模型的数据
44、吞吐量,预计将在今年底上线。图表图表18:NVIDIA Quantum-2 在在网络通信领域中网络通信领域中的的性能性能突出突出 资料来源:英伟达官网、华泰研究 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。14 电子电子 风险提示风险提示 AI 技术落地和推进不及预期:技术落地和推进不及预期:AI 技术的落地实施和拓展可能达不到预期,或影响行业利润。竞争格局越演越烈:竞争格局越演越烈:科技行业的激烈竞争可能对行业的利润产生影响,导致盈利能力降低。中美关系升级:中美关系升级:中国是美国半导体产业的重要市场之一,如果中美关系再次升级,将对宏观因素和板块产品销售产生影响。相关信息数据
45、来自于相关公司的公开的客观信息,不代表对相关公司的研究覆盖和推荐。免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。15 电子电子 免责免责声明声明 分析师声明分析师声明 本人,何翩翩,兹证明本报告所表达的观点准确地反映了分析师对标的证券或发行人的个人意见;彼以往、现在或未来并无就其研究报告所提供的具体建议或所表迖的意见直接或间接收取任何报酬。一般声明及披露一般声明及披露 本报告由华泰证券股份有限公司(已具备中国证监会批准的证券投资咨询业务资格,以下简称“本公司”)制作。本报告所载资料是仅供接收人的严格保密资料。本报告仅供本公司及其客户和其关联机构使用。本公司不因接收人收到本报告而视
46、其为客户。本报告基于本公司认为可靠的、已公开的信息编制,但本公司及其关联机构(以下统称为“华泰”)对该等信息的准确性及完整性不作任何保证。本报告所载的意见、评估及预测仅反映报告发布当日的观点和判断。在不同时期,华泰可能会发出与本报告所载意见、评估及预测不一致的研究报告。同时,本报告所指的证券或投资标的的价格、价值及投资收入可能会波动。以往表现并不能指引未来,未来回报并不能得到保证,并存在损失本金的可能。华泰不保证本报告所含信息保持在最新状态。华泰对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。本公司不是 FINRA 的注册会员,其研究分析师亦没有注册为 FI
47、NRA 的研究分析师/不具有 FINRA 分析师的注册资格。华泰力求报告内容客观、公正,但本报告所载的观点、结论和建议仅供参考,不构成购买或出售所述证券的要约或招揽。该等观点、建议并未考虑到个别投资者的具体投资目的、财务状况以及特定需求,在任何时候均不构成对客户私人投资建议。投资者应当充分考虑自身特定状况,并完整理解和使用本报告内容,不应视本报告为做出投资决策的唯一因素。对依据或者使用本报告所造成的一切后果,华泰及作者均不承担任何法律责任。任何形式的分享证券投资收益或者分担证券投资损失的书面或口头承诺均为无效。除非另行说明,本报告中所引用的关于业绩的数据代表过往表现,过往的业绩表现不应作为日后
48、回报的预示。华泰不承诺也不保证任何预示的回报会得以实现,分析中所做的预测可能是基于相应的假设,任何假设的变化可能会显著影响所预测的回报。华泰及作者在自身所知情的范围内,与本报告所指的证券或投资标的不存在法律禁止的利害关系。在法律许可的情况下,华泰可能会持有报告中提到的公司所发行的证券头寸并进行交易,为该公司提供投资银行、财务顾问或者金融产品等相关服务或向该公司招揽业务。华泰的销售人员、交易人员或其他专业人士可能会依据不同假设和标准、采用不同的分析方法而口头或书面发表与本报告意见及建议不一致的市场评论和/或交易观点。华泰没有将此意见及建议向报告所有接收者进行更新的义务。华泰的资产管理部门、自营部
49、门以及其他投资业务部门可能独立做出与本报告中的意见或建议不一致的投资决策。投资者应当考虑到华泰及/或其相关人员可能存在影响本报告观点客观性的潜在利益冲突。投资者请勿将本报告视为投资或其他决定的唯一信赖依据。有关该方面的具体披露请参照本报告尾部。本报告并非意图发送、发布给在当地法律或监管规则下不允许向其发送、发布的机构或人员,也并非意图发送、发布给因可得到、使用本报告的行为而使华泰违反或受制于当地法律或监管规则的机构或人员。本报告版权仅为本公司所有。未经本公司书面许可,任何机构或个人不得以翻版、复制、发表、引用或再次分发他人(无论整份或部分)等任何形式侵犯本公司版权。如征得本公司同意进行引用、刊
50、发的,需在允许的范围内使用,并需在使用前获取独立的法律意见,以确定该引用、刊发符合当地适用法规的要求,同时注明出处为“华泰证券研究所”,且不得对本报告进行任何有悖原意的引用、删节和修改。本公司保留追究相关责任的权利。所有本报告中使用的商标、服务标记及标记均为本公司的商标、服务标记及标记。中国香港中国香港 本报告由华泰证券股份有限公司制作,在香港由华泰金融控股(香港)有限公司向符合证券及期货条例及其附属法律规定的机构投资者和专业投资者的客户进行分发。华泰金融控股(香港)有限公司受香港证券及期货事务监察委员会监管,是华泰国际金融控股有限公司的全资子公司,后者为华泰证券股份有限公司的全资子公司。在香
51、港获得本报告的人员若有任何有关本报告的问题,请与华泰金融控股(香港)有限公司联系。免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。16 电子电子 香港香港-重要监管披露重要监管披露 华泰金融控股(香港)有限公司的雇员或其关联人士没有担任本报告中提及的公司或发行人的高级人员。有关重要的披露信息,请参华泰金融控股(香港)有限公司的网页 https:/.hk/stock_disclosure 其他信息请参见下方“美国“美国-重要监管披露”重要监管披露”。美国美国 在美国本报告由华泰证券(美国)有限公司向符合美国监管规定的机构投资者进行发表与分发。华泰证券(美国)有限公司是美国注册经纪商和
52、美国金融业监管局(FINRA)的注册会员。对于其在美国分发的研究报告,华泰证券(美国)有限公司根据1934 年证券交易法(修订版)第 15a-6 条规定以及美国证券交易委员会人员解释,对本研究报告内容负责。华泰证券(美国)有限公司联营公司的分析师不具有美国金融监管(FINRA)分析师的注册资格,可能不属于华泰证券(美国)有限公司的关联人员,因此可能不受 FINRA 关于分析师与标的公司沟通、公开露面和所持交易证券的限制。华泰证券(美国)有限公司是华泰国际金融控股有限公司的全资子公司,后者为华泰证券股份有限公司的全资子公司。任何直接从华泰证券(美国)有限公司收到此报告并希望就本报告所述任何证券进
53、行交易的人士,应通过华泰证券(美国)有限公司进行交易。美国美国-重要监管披露重要监管披露 分析师何翩翩本人及相关人士并不担任本报告所提及的标的证券或发行人的高级人员、董事或顾问。分析师及相关人士与本报告所提及的标的证券或发行人并无任何相关财务利益。本披露中所提及的“相关人士”包括 FINRA 定义下分析师的家庭成员。分析师根据华泰证券的整体收入和盈利能力获得薪酬,包括源自公司投资银行业务的收入。华泰证券股份有限公司、其子公司和/或其联营公司,及/或不时会以自身或代理形式向客户出售及购买华泰证券研究所覆盖公司的证券/衍生工具,包括股票及债券(包括衍生品)华泰证券研究所覆盖公司的证券/衍生工具,包
54、括股票及债券(包括衍生品)。华泰证券股份有限公司、其子公司和/或其联营公司,及/或其高级管理层、董事和雇员可能会持有本报告中所提到的任何证券(或任何相关投资)头寸,并可能不时进行增持或减持该证券(或投资)。因此,投资者应该意识到可能存在利益冲突。评级说明评级说明 投资评级基于分析师对报告发布日后 6 至 12 个月内行业或公司回报潜力(含此期间的股息回报)相对基准表现的预期(A 股市场基准为沪深 300 指数,香港市场基准为恒生指数,美国市场基准为标普 500 指数),具体如下:行业评级行业评级 增持:增持:预计行业股票指数超越基准 中性:中性:预计行业股票指数基本与基准持平 减持:减持:预计
55、行业股票指数明显弱于基准 公司评级公司评级 买入:买入:预计股价超越基准 15%以上 增持:增持:预计股价超越基准 5%15%持有:持有:预计股价相对基准波动在-15%5%之间 卖出:卖出:预计股价弱于基准 15%以上 暂停评级:暂停评级:已暂停评级、目标价及预测,以遵守适用法规及/或公司政策 无评级:无评级:股票不在常规研究覆盖范围内。投资者不应期待华泰提供该等证券及/或公司相关的持续或补充信息 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。17 电子电子 法律实体法律实体披露披露 中国中国:华泰证券股份有限公司具有中国证监会核准的“证券投资咨询”业务资格,经营许可证编号为:9
56、41011J 香港香港:华泰金融控股(香港)有限公司具有香港证监会核准的“就证券提供意见”业务资格,经营许可证编号为:AOK809 美国美国:华泰证券(美国)有限公司为美国金融业监管局(FINRA)成员,具有在美国开展经纪交易商业务的资格,经营业务许可编号为:CRD#:298809/SEC#:8-70231 华泰证券股份有限公司华泰证券股份有限公司 南京南京 北京北京 南京市建邺区江东中路228号华泰证券广场1号楼/邮政编码:210019 北京市西城区太平桥大街丰盛胡同28号太平洋保险大厦A座18层/邮政编码:100032 电话:86 25 83389999/传真:86
57、25 83387521 电话:86 10 63211166/传真:86 10 63211275 电子邮件:ht- 电子邮件:ht- 深圳深圳 上海上海 深圳市福田区益田路5999号基金大厦10楼/邮政编码:518017 上海市浦东新区东方路18号保利广场E栋23楼/邮政编码:200120 电话:86 755 82493932/传真:86 755 82492062 电话:86 21 28972098/传真:86 21 28972068 电子邮件:ht- 电子邮件:ht- 华泰金融控股(香港)有限公司华泰金融控股(香港)有限公司 香港中环皇后大道中 99 号中环中心 58 楼 5808-12 室 电话:+852-3658-6000/传真:+852-2169-0770 电子邮件: http:/.hk 华泰证券华泰证券(美国美国)有限公司有限公司 美国纽约公园大道 280 号 21 楼东(纽约 10017)电话:+212-763-8160/传真:+917-725-9702 电子邮件:Huataihtsc- http:/www.htsc- 版权所有2023年华泰证券股份有限公司