上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

通信行业英伟达GTC专题:新一代GPU、具身智能与AI应用-240318(20页).pdf

编号:157286 PDF  PPTX  20页 1.69MB 下载积分:VIP专享
下载报告请您先登录!

通信行业英伟达GTC专题:新一代GPU、具身智能与AI应用-240318(20页).pdf

1、证券研究报告证券研究报告 20242024年年3 3月月1818日日 英伟达英伟达GTC专题:新一代专题:新一代GPU、具身智能与、具身智能与AI应用应用1中泰通信中泰通信首席分析师:陈宁玉(S0740517020004)Email:研究助理:佘雨晴 Email:研究助理:杨雷Email:核心观点核心观点GTC2024召开在即,关注新一代召开在即,关注新一代GPU、具身智能、具身智能、AI应用三大方向。应用三大方向。GTC 2024将于当地时间3月18-21日在美国加州圣何塞会议中心及线上举行,预计发布加速计算、生成式AI以及机器人领域突破性成果。建议关注三大方向:1)B100及后续芯片路线。

2、B100预计采用BlackWell全新架构,与H200系列相比性能有望翻倍提升,GB200或于2024-2025年推出,芯片迭代周期缩短至1年,带动配套工艺及组件加速升级。2)具身智能:AgilityRobotics、波士顿动力公司、迪士尼和Google DeepMind等公司将参加GTC机器人相关会议,现场将展出25款机器人。黄仁勋曾表示具身智能是AI下一个浪潮,2024年初英伟达投资人形机器人公司FigureAI并成立通用具身智能体研究实验室GEAR,大会或将更新相关成果。3)AI应用。本次GTC共有亚马逊、Anthropic、Runway等1000多家参会企业,300多家参展商将展示英伟

3、达平台在农业、汽车、云服务等行业的应用。多模态大模型助力AI赋能下游行业,提升推理侧算力与带宽要求,数据中心、CDN等或将受益AI应用带来的新一轮流量增长。B100性能预计大幅提升,性能预计大幅提升,GB200有望超预期。有望超预期。英伟达将推出全新芯片架构BlackWell,或为英伟达首次采用多chiplet设计的架构。B100成为首款基于BlackWell架构的芯片,预计为MCM多芯片封装,台积电N3或N4P制程工艺,可能使用CoWoS-L,性能预计至少为H200的2倍,H100的4倍;首发内存或为200G HBM3e,约为H200的140%;或采用224Serdes。为了更快推向市场,B

4、100前期版本或使用PCIe5.0和C2C式链接,功耗700W,方便直接沿用H100的现有HGX服务器,后续将推出1000W版本,转向液冷,并将通过ConnectX8实现每GPU网络的完整800G。根据英伟达芯片路线图,GB200将于2024-2025年推出,由CPU和GPU通过NVLinkC2C连接构成,或采用NVLink5.0及192GB HBM3e内存,性能有望超预期提升。聚焦光通信与液冷产业链,关注新技术变革方向。聚焦光通信与液冷产业链,关注新技术变革方向。AI芯片加速升级带动光模块、交换机等底层网络硬件迭代提速,2024年1.6T需求将现,速率升级同时伴随功耗成本增加等问题,硅光、L

5、PO、CPO、薄膜铌酸锂等新技术方案导入有望加快。国内光模块厂商全球份额过半,市场竞争力较强,带动光通信产业链逐步向国内转移,上游光芯片国产替代预计加速。B100后续迭代版本功耗或达1000W,GB200或进一步增长至1200W,英伟达已联合行业伙伴布局混合液冷等创新散热方案。算力器件功耗持续增长对传统风冷带来挑战,AI算力将导致数据中心能耗不断抬升与PUE指标趋严将共同倒逼产业对液冷需求升级,冷板式液冷或率先放量,浸没式液冷为长期方向。温控、IDC、服务器、运营商等多方积极部署液冷路线。随着AI发展,液冷产业链参与者不断增加,上下游协同增强。投资建议投资建议:重点关注光模块器件:中际旭创、天

6、孚通信、新易盛、源杰科技、仕佳光子、腾景科技、光库科技、光迅科技、联特科技、太辰光等;液冷:英维克、申菱环境、高澜股份、佳力图、依米康、网宿科技等;ICT设备:菲菱科思、盛科通信、锐捷网络、紫光股份、中兴通讯等;数据中心:宝信软件、润泽科技、光环新网、奥飞数据等。风险提示:风险提示:AI发展不及预期、技术迭代不及预期、市场竞争加剧、海外贸易争端、市场系统性风险、研究报告使用的公开资料可能存在信息滞后或更新不及时等风险HVjWNA9UlXfUIUkYcZmV8OaO9PmOpPpNrNlOoOmPeRpNqR9PrQqRNZnPrONZoNyQGTC 2024前瞻:见证前瞻:见证AI的变革时刻的

7、变革时刻3来源:英伟达官网,中泰证券研究所GTC 2022:硬件为主,发布全新Hopper架构H100 GPU及Grace CPU 超级芯片,第四代NVLink和第三代NVSwitch技术、DGX H100 SuperPOD等。GTC 2023:侧重软件及服务更新,发布及更新H100 NVL GPU,PCIe H100等硬件,以及AI超级计算服务DGX Cloud、光刻计算库CuLitho、GPU加速量子计算系统等。GTC 2024:当地时间3月18-21日举行,黄仁勋将发表主题演讲“见证AI的变革时刻”,发布加速计算、生成式AI以及机器人领域突破性成果。会议期间将举办超过1000场演讲、圆桌

8、讨论、培训等各种活动,来自英伟达、Meta、微软、斯坦福等业界及学术界众多权威AI研究者将参加200多场会议。共有1000多家企业将参加本届GTC,包括但不限于亚马逊、OpenAI、微软、Meta、谷歌等AI巨头以及Anthropic、Cohere、Runway等AI初创企业。300多家参展商将展示企业如何在航空航天、农业、汽车和运输、云服务、金融服务、医疗和生命科学、制造、零售和电信等各行业部署英伟达平台。图表:图表:GTC 2024会议主题数量分布会议主题数量分布关注一:关注一:Blackwell GPU架构及架构及B1004来源:英伟达官网,中泰证券研究所英伟达有望在英伟达有望在GTC

9、2024上发布上发布B100及及B200系列。系列。B100将首次采用Blackwell架构,基于更复杂的多芯片模块(MCM)设计,与现有采用Hopper架构的H200系列相比性能有望翻倍提升,预计使用台积电3nm或N4P工艺制程,功耗或达1000W,采用液冷方案,2024Q2/Q3开始规模生产。此外,根据英伟达最新官方路线图及IT之家报道,预计2024-2025年之间推出GB200,或采取差异化策略推动客户采购,加大其与B100/B200之间的配置差距,特别在NVLink和网络性能方面。B100预计配套全新组件。此外根据路线图,英伟达将于2024年底前推出速度更快、功能更强大的 Infini

10、Band 和以太网 NIC 以及交换机,每个端口的带宽可达 800Gb/s,本次大会上或将有所透露。据Barrons报道,英伟达将于2025年推出B200 GPU,单张功耗达1000W,升级后的B200变体可能采用更快版本的HBM内存,以及更高的内存容量,升级规格和增强功能。图表:英伟达芯片路线图图表:英伟达芯片路线图关注二:具身智能关注二:具身智能/人形机器人人形机器人/自动驾驶自动驾驶5来源:英伟达官网,中泰证券研究所人形机器人:人形机器人:AgilityRobotics、波士顿动力公司、迪士尼和Google DeepMind等公司将参会,现场将展出25款机器人,包括人形机器人、工业机械手

11、等。英伟达于2018年推出包含全新硬件、软件和虚拟世界机器人模拟器的NVIDIA Isaac,同时还推出专为机器人设计的计算机平台Jetson Xavier和相关的机器人软件工具包,2023年发布多模态具身智能系统VIMA和自主移动机器人平台Isaac AMR。同时,英伟达通过仿真模拟平台Omniverse与AI结合,帮助建立训练数据集,23年3月Omniverse Cloud托管至微软Azure,以扩大英伟达AI机器人开发和管理平台Isaac Sim的接入范围。2024年2月英伟达向人形机器人公司Figure AI投资5000万美元并成立通用具身智能体研究实验室GEAR,人形机器人作为具身智

12、能优良载体,有望迎来加速发展。自动驾驶:自动驾驶:2022年英伟达发布全新一代自动驾驶SoC芯片Thor,内部拥有770亿个晶体管,算力高达2000TFLOPS,较此前Orin提升8倍,计划2024年量产,极氪将于2025年搭载首发。图表:英伟达自动驾驶芯片路线图图表:英伟达自动驾驶芯片路线图图表:英伟达图表:英伟达Isaac AMR硬件配置图硬件配置图关注三:关注三:AI推理推理/边缘计算边缘计算6来源:英伟达官网,Bloomberg,中泰证券研究所GTC2024有望更新以太网架构及产品、有望更新以太网架构及产品、ASIC芯片计划等相关信息。芯片计划等相关信息。英伟达FY2024数据中心业务

13、收入40%来自AI推理,AI在汽车、医疗和金融服务等垂直领域广泛应用,其正在推出全新Spectrum-X端到端产品进入以太网领域,引入新技术为AI处理提供较传统以太网高1.6倍的网络性能。根据路透社报道,英伟达正在建立新业务部门,专注为云厂商及其他企业设计定制芯片(ASIC),包括先进的AI处理器。本次GTC共有亚马逊、Anthropic、Runway等1000多家参会企业,会上将展示英伟达平台在农业、汽车、云服务等行业的应用,英伟达、HuggingFace、Zalando、AWS、微软、Cloudflare、谷歌等将参加AI推理相关会议。生成式生成式AI在影视上的应用将被重点展示。在影视上的

14、应用将被重点展示。中国游戏厂商腾讯、网易,以及传媒巨头奈飞、皮克斯、迪士尼动画工作室等均将参与游戏/传媒娱乐讨论,可能探讨如何利用生成式AI和路径追踪技术创造更加逼真的虚拟人物和世界,辅助游戏开发和影视制作;Runway、腾讯及Digitrax等有望介绍其文生图、文生视频模型及其他AI应用。其他可能被讨论的应用包括3D内容生成、云端创作游戏等。2万亿美元可寻址市场(万亿美元可寻址市场(TAM):):英伟达预计随着通用AI技术发展,目前1万亿美元数据中心基础设施安装量(可寻址市场,TAM)将在未来五年翻一番。AI设备有望替换掉所有的传统计算。图表:英伟达在图表:英伟达在GTC2023上推出上推出

15、4款款AI推理平台推理平台图表:图表:ASIC芯片在边缘芯片在边缘AI应用占比提升应用占比提升图表:英伟达图表:英伟达1万亿美元万亿美元TAM结构结构BlackWell架构演进架构演进7来源:英伟达官网,51CTO,中泰证券研究所英伟达每隔英伟达每隔1-2年提出新的芯片架构以适应计算需求升级。年提出新的芯片架构以适应计算需求升级。2017年提出Volta架构,专注深度学习和AI应用,并引入Tensor Core,2020年Ampere架构在计算能力、能效和深度学习性能方面大幅提升,采用多个SM和更大的总线宽度,提供更多CUDA Core及更高频率,引入第三代Tensor Core,具有更高的内

16、存容量和带宽,适用于大规模数据处理和机器学习任务。2022年发布Hopper架构,支持第四代TensorCore,采用新型流式处理器,每个SM能力更强。Blackwell:或为英伟达首次采用多chiplet设计的架构,一方面可能简化基于Blackwell架构的GPU硅片层面生产,最大限度提高小型芯片产量,另一方面,多芯片封装将更加复杂。预计SM和CUDA将采用新结构,光线追踪性能等将进一步优化和加强,RT单元有可能被PT单元所取代,以实现对Ada Lovelace架构的性能翻倍。Blackwell架构GPU很可能会支持GDDR7内存,相比GDDR6X效率更高,鉴于第一代 GDDR7 SGRAM

17、 IC将具有32GT/s 的传输数据速率,采用这些芯片的384位内存子系统将提供约1536 GB/s 的带宽。与Hopper/Ada架构不同,Blackwell或将扩展到数据中心和消费级GPU,但消费级场景或将延续单芯片设计,以实现时间可控及低风险。图表:英伟达芯片架构演进图表:英伟达芯片架构演进架构架构VoltaTuringAmpereHopper发布时间发布时间20022核心参数核心参数80个SM,每个SM包括32个FP64+64个Int32+64个FP32+8个TensorCore102核心92个SM,SM重新设计,每个SM包含64个Int32+64个FP32+8个

18、TensorCore108个SM,每个SM包含64个FP32+64个INT32+32个FP64+4个TensorCore132个SM,每个SM包含128个FP32+64个INT32+64个FP64+4个TensorCore特点特点NVLink2.0,TensorCore第一代,支持AI运算TensorCore2.0,RTCore第一代TensorCore3.0,RTCore2.0,NVLink3.0,结构稀疏性矩阵MIG1.0TensorCore4.0,NVLink4.0,结构稀疏性矩阵MIG2.0制程制程12nm,211亿晶体管12nm,186亿晶体管7nm,283亿晶体管4nm,800亿晶

19、体管代表产品代表产品V100/TiTan VT4/2080Ti/RTX5000A100/A800/A30系列H100/H800B100:性能翻倍,带宽、显存等大幅提升:性能翻倍,带宽、显存等大幅提升8来源:51CTO,半导体行业观察,中泰证券研究所B100:预计为MCM多芯片封装,台积电N3或N4P制程工艺,可能使用CoWoS-L,性能预计至少为H200的2倍,相当于H100的4倍;首发内存或为200G HBM3e,约为H200的140%;参考历代NVLink迭代,预计双向带宽有望较H100接近翻倍,或采用224Serdes。为了更快推向市场,为了更快推向市场,B100前期版本或使用前期版本或

20、使用PCIe5.0和和C2C式链接,功耗式链接,功耗700W,方便直接沿用,方便直接沿用H100的现有的现有HGX服务器,以大幅提高供应服务器,以大幅提高供应链更早提高产量和出货量的能力。后续将推出链更早提高产量和出货量的能力。后续将推出1000W版本,转向液冷,并将通过版本,转向液冷,并将通过ConnectX8实现每实现每GPU网络的完整网络的完整800G。这些。这些 SerDes 对于以太网对于以太网/InfiniBand 仍然是仍然是 8x100G。虽然每个。虽然每个 GPU 的网络速度翻倍,但基数减半,因为它们仍然必须经过相同的的网络速度翻倍,但基数减半,因为它们仍然必须经过相同的 5

21、1.2T 交换机。交换机。B100预计预计2024H2规模出货。规模出货。MorganStanley预计2024年英伟达CoWoS需求量15万片,对应AI GPU出货量400万张,其中H100/B100分别为377万张/28万张。图表:英伟达芯片性能参数图表:英伟达芯片性能参数性能参数性能参数V100 PCIeA100 80GB PCIeA800 80GB PCIeH100 80GB PCIe微架构微架构VoltaAmpereHopperFP647TFLOPS9.7TFLOPS26TFLOPSFP3214TFLOPS19.5TFLOPS51TFLOPSFP16 TensorCore312TFL

22、OPS756.5TFLOPSINT8 TensorCore62TOPS624TOPS1513TOPSGPU显存显存32/16GB HBM280GB HBM2e80GB HBM3GPU显存带宽显存带宽900GB/s1935GB/s2TB/sTDP250W300W300-350W多实例多实例GPU最多7个MIG,每个10GB外形规格外形规格PCIe双插槽风冷式或单插槽液冷式PCIe双插槽风冷式互连技术互连技术NVLink:300GB/sPCIe:32GB/sNVLink:600GB/sPCIe4.0:64GB/sNVLink:400GB/sPCIe4.0:64GB/sNVLink:600GB/sP

23、CIe5.0:128GB/s服务器选项服务器选项搭载18个GPU的合作伙伴认证系统和NVIDIA认证系统英伟达采用英伟达采用CoWoS-L,驱动先进封装升级,驱动先进封装升级9来源:Bloomberg,中泰证券研究所CoWoS封装成为英伟达封装成为英伟达GPU供应产能瓶颈之一。供应产能瓶颈之一。CoWoS(Chip On Wafer On Substrate)是台积电开发的一种2.5D先进封装技术,由CoW和oS组合,先将芯片通过Chip on Wafer(CoW)的封装制程连接至硅晶圆,再把CoW芯片与基板(Substrate)连接,整合成CoWoS。根据不同中介层(interposer),

24、CoWoS封装又分为CoWoS-S/R/L三种类型。CoWoS-S:应用最为广泛,采用硅作为中介层;CoWoS-R:基于InFO技术,利用RDL中介层互连各chiplets;CoWoS-L:使用小芯片(chiplet)和RDL作为中介层(硅桥),结合了CoWoS-S和InFO技术的优点,使用内插器与LSI(本地硅互连)芯片进行芯片间互连,同时用于电源和信号传输的RDL层提供灵活集成。MorganStanley预计预计2024年全球年全球CoWoS产能翻倍扩张至产能翻倍扩张至32kwpm(千片(千片/月),台积电产能将达到月),台积电产能将达到27kwpm,英伟达仍为需求主力。,英伟达仍为需求主

25、力。图表:图表:CoWoS-L图表:图表:CoWoS-S英伟达加快液冷方案布局英伟达加快液冷方案布局10来源:大模型之家,中加创新中心,中泰证券研究所英伟达积极与行业伙伴合作创新液冷方案。英伟达积极与行业伙伴合作创新液冷方案。2022年推出基于直接芯片冷却技术(Direct-to-chip)的A100 800G PCIe液冷GPU,较风冷版本性能相当,电力节省约30%,单插槽设计节省最多66%的机架空间。2023年,与Vertiv、BOYD、Durbin、霍尼韦尔等6家行业伙伴合作打造混合液冷创新方案,将芯片直接冷却、泵送两相(P2P)和单相浸没式冷却集成在带有内置泵和液体-蒸汽分离器的机架歧

26、管中,使用两相冷板冷却芯片,其余具有较低功率密度的服务器组件将浸没在密封的浸没式箱体内,服务器使用绿色制冷剂分别进行两相冷却和浸没冷却。相较当前无法处理高于400W/cm 功率密度的液冷,混合冷却支持服务器机架功率高达200kW,是目前的25倍,与风冷相比成本至少降低5%,冷却效率提高20%。同时与台积电、高力等合作开发AI GPU浸没式液冷系统。2024年3月,Vertiv与英伟达专家团队共同针对GPU型高密数据中心制冷方案进行研发测试并发布实测数据,结果显示冷板液冷和风冷的创新风液混合制冷方案中大约75%的IT负载可通过冷板液冷技术实现有效冷却,IT负载从100%风冷转型为75%液冷的方案

27、时,服务器风扇用电量降低最多达到80%,使总体使用效率(TUE)提高15%以上。图表:英伟达图表:英伟达A100&H100液冷方案液冷方案图表:英伟达混合液冷方案图表:英伟达混合液冷方案AI算力芯片功耗提升,催化液冷需求算力芯片功耗提升,催化液冷需求11来源:通信世界,英维克,中泰证券研究所冷板式液冷或率先放量,浸没式液冷技术不断优化。冷板式液冷或率先放量,浸没式液冷技术不断优化。液冷技术目前主要包括冷板式液冷、浸没式液冷和喷淋式液冷三种,其中冷板式液冷将服务器芯片等高发热元件的热量通过冷板间接传递给液体进行散热,低发热元件仍通过风冷散热,兼具性能与价格优势,技术相对成熟;浸没式液冷将服务器完

28、全浸入冷却液中,全部发热元件热量直接传递给冷却液,通过冷却液循环流动或蒸发冷凝相变进行散热,散热效率更高,数据中心基础设施中应用比例有望逐步提升,但对冷却液要求严格,在建设改造以及后续管理维护方面成本更高。温控、温控、IDC、服务器、运营商等多方积极部署液冷路线。、服务器、运营商等多方积极部署液冷路线。随着AI发展,液冷产业链参与者不断增加,上下游协同增强。英维克、申菱环境等领先温控厂商普遍推出数据中心液冷解决方案,润泽科技、科华数据等IDC厂商积极改造或新建液冷智算中心,新华三、中兴通讯等ICT设备厂商均推出液冷服务器,以提升自身竞争力,满足客户需求。图表:液冷技术方案对比图表:液冷技术方案

29、对比图表:英维克图表:英维克Coolinside全链条液冷解决方案全链条液冷解决方案分类分类冷板式液冷冷板式液冷浸没式液冷浸没式液冷喷淋式液冷喷淋式液冷作用原理作用原理冷却液与服务器发热部件不直接接触,将液冷冷板固定在服务器的主要发热器件上,依靠流经冷板的液体将热量带走服务器发热部件完全浸泡在冷却液中,发热部件与冷却液接触充分,发出的热量随时被循环的冷却液带走面向服务器发热部件,冷却液借助重力或系统压力直接喷淋至发热器件或与之连接的固体导热材料上,与之进行热交换冷却液使用情况冷却液使用情况 冷却液用量小,要求低冷却液用量大,对冷却液安全要求高冷却液用量适中,要求高建设成本建设成本主要成本在换热

30、系统和冷却系统,成本适中架构调整大且冷却液用量大,成本较高仅增加必需装置,成本较低服务器改造成本服务器改造成本 冷板需要定制,改造成本高无需改造,新、老设备均可使用服务器改动小,成本较低运营成本运营成本与传统风冷基本相同,运维成本低遇故障需将服务器从冷却液中取出,运维成本高服务器部件表面带有冷却液,运维成本适中服务器兼容性服务器兼容性根据服务器定制冷板,兼容所有机器因冷却液不同,需要进行兼容性测试因冷却液不同,需要进行兼容性测试空间利用率空间利用率较高中等最高主流厂家主流厂家华为、浪潮、中科曙光、新华三等阿里、绿色云图、诺基亚、云酷等广东合一等GB200有望超预期有望超预期12来源:英伟达官网

31、,信息平权,中泰证券研究所GB200是将是将CPU和和GPU组合的超级芯片,组合的超级芯片,GB200NVL是超级计算使用的互连平台。是超级计算使用的互连平台。根据产业链信息,预计芯片包括1个Grace CPU和2个B100 GPU,内存为192GB HBM3e,CPU和GPU之间使用NVLink C2C连接,采用NVLink5.0,NVSwitch或将突破寻址限制,支持NVLink连接2500张GPU集群。芯片功耗或达1200w,采用混合冷却,预计其中GPU/CPU/网卡/NVLink Switch ASICs使用液冷,其他组件使用风冷。预计预计2024-2025年之间发布,年之间发布,JP

32、Morgan预期预期2025年出货量年出货量50万张。万张。GH200:上一代超级芯片,2023年5月发布,包含1个Grace CPU和1个Hopper GPU,之间通过900GB/s的NVLink-C2C芯片互连,从而使GPU可以共享CPU内存,不再需要传统的CPU至GPU PCIe连接。与最新的PCIe Gen5技术相比,GPU和CPU之间带宽提高7倍,互连功耗减少5倍以上。基于GH200芯片的DGX GH200集群,所有256个GPUs连接可以访问到累计144TB内存,较DGX H100的640GB提升约230倍。GH200对推荐系统提升效果尤其明显。对推荐系统提升效果尤其明显。GH20

33、0在LLM 65B上的推理速度较H100提升2倍多,在VectorDB和DLRM上较H100提升5-6倍。谷歌云、Meta和微软预计成为首批DGX GH200用户。图表:英伟达图表:英伟达Grace Hopper超级芯片架构超级芯片架构图表:大内存图表:大内存 AI 工作负载的性能比较工作负载的性能比较英伟达下一代英伟达下一代GPU展望展望13来源:Wccftech,世界先进制造技术论坛,TSMC,中泰证券研究所产品性能进一步加快提升。产品性能进一步加快提升。根据Bloomberg,英伟达可能在2026年推出下一代数据中心GPU N100,N100的GPU芯片数量可能由B100的2个增加到4个

34、,每个芯片的尺寸相似,尽管GPU芯片总面积可能翻倍,性能跃进将更加显著。N100预计采用台积电N3E工艺,晶体管密度或增加50%,芯片内存可能升级到全新一代HBM4。封装设计将同步升级以扩大芯片尺寸,可能加速热压缩键合(TCB)和混合键合技术应用。芯片算力、工艺及互连等组网方案升级将持续带动交换机、光模块等相关硬件创新迭代,芯片算力、工艺及互连等组网方案升级将持续带动交换机、光模块等相关硬件创新迭代,LPO、硅光、硅光、CPO等新技术有望加快推进。等新技术有望加快推进。图表:英伟达数据中心图表:英伟达数据中心/AI GPU基础信息基础信息图表:台积电工艺制程路线图图表:台积电工艺制程路线图AI

35、服务器对光模块弹性测算服务器对光模块弹性测算14来源:A Scalable,Commodity Data Center Network Architecture,英伟达官网,中泰证券研究所测算BOM测算:以500台DGX H800主机测算,每台搭载8张GPU&400G IB,“铜线+光模块“方案下,铜线=GPU/2=2000,光模块数量按400G计算为4000*4=16000个,考虑800G二合一,即为8000个,交换机数量=GPU*5/端口数=320台;全光模块方案,类似上一代计算,2000*800G+4000*400G光模块替换铜线,总光模块数包括1万个800G(2.5倍GPU)和4000

36、个400G(GPU1:1对应)BOM(500 DGX H800,8 GPU&IB/SERVER)物料(铜线物料(铜线+光模块方案)光模块方案)数量数量物料(全光模块方案)物料(全光模块方案)数量数量GPU(H800)4000GPU(H800)4000IB网卡(400G NDR IB)4000IB网卡(400G NDR IB)4000铜线(400G Server-to-ToR)2000光模块(400G Server)4000光模块(800G Spine/Core switch)8000光模块(800G ToR)2000IB交换机(400G 64port)320光模块(800G Spine/Cor

37、e switch)8000IB交换机(400G 64port)320图表:图表:Fat-Tree网络架构网络架构BOM(250 DGX A800,8 GPU&IB/SERVER)物料(铜线物料(铜线+光模块方案)光模块方案)数量数量物料(全光模块方案)物料(全光模块方案)数量数量GPU(A800)2000GPU(A800)2000IB网卡(200G NDR IB)2000IB网卡(200G NDR IB)2000铜线(200G Server-to-ToR)2000光模块(200G Server-to-ToR)4000光模块(200G Spine/Core switch)8000光模块(200G

38、 Spine/Core switch)8000IB交换机(200G 40port)250IB交换机(200G 40port)250GPU迭代加速迭代加速1.6T光模块升级光模块升级15来源:ITPUB,光通信女人,中泰证券研究所光模块趋势向高速率发展。光模块趋势向高速率发展。AIGC等技术的快速发展带来数据量呈指数级增长,设备与设备之间的亦需要更大带宽连接,因此光模块需要向更高带宽发展。现有光模块带宽主要以100G/200G/400G,目前正朝着800G、1.6T甚至更高的带宽发展。交换机芯片密度的提升有望带来交换机芯片密度的提升有望带来1.6T加速放量加速放量。数据中心交换芯片的演变趋势基本

39、上处于每两年翻一番的快速增长,25.6T交换芯片用7nm工艺,51.2T则需要选择5nm工艺节点,预计2025年3nm工艺节点可实现,并支持交换芯片能实现102.4T的容量。对于102.T的交换容量,则需要1.6T光模块,光口每波长速率需要达到200G。我们预计2024年1.6T有望小批量出货,2025年1.6T即可进入产业化节点。图表:光模块向高速率发展趋势图表:光模块向高速率发展趋势图表:交换机密度提升带动光模块速率提升图表:交换机密度提升带动光模块速率提升光通信:硅光光通信:硅光/LPO/CPO前沿技术方向前沿技术方向16来源:光电汇OESHOW,MACOM,鲜枣课堂,光学小豆芽,中泰证

40、券研究所硅光:技术集成化更具优势。硅光:技术集成化更具优势。硅光方案可继承CMOS工艺,芯片层面最大程度实现混合集成,在短距、场景、相干光场景应用有望成为主流。硅光方案可大幅节约器件、组装成本,控制占地空间,实现低成本、大规模的光连接,从根本上改变光器件和模块行业。1.6T时代,多模VCSEL200G芯片或面临瓶颈,硅光有望替代成为主流方案。LPO:线性驱动可插拨光模块。:线性驱动可插拨光模块。通过LPO技术把DSP替换,使用高线性度、具备EQ功能的TIA和DRIVER芯片(成本上升少许,比传统DSP解决方案降低功耗、延迟和成本,满足AI计算短距离、大宽带、低延时要求。400G光模块中使用7n

41、m DSP,功耗约为4W占整个模块功耗的50%,DSP的BOM成本约占20-40%。高线性度的TIA、Driver芯片作为LPO技术的核心零部件,目前有Macom、Semtech、美信(已被ADI收购)等主要供应商,博通也在推进相关产品研发。微软、Meta、AWS都有可能逐步接受LPO方案。CPO:光电共封装。:光电共封装。交换ASIC芯片和硅光引擎(光学器件)在同一高速主板上协同封装,集中解决散热问题,同时也可以省去很多SerDes功能,节省功耗,是有望最有潜力实现高集成度、低功耗和低成本的封装方案。但是由于目前的技术与产业链尚不成熟等原因,短期内难以大规模应用。预计从1.6T开始,传统可插

42、拔速率升级或达到极限,后续光互联升级可能转向CPO和相干方案。图表:硅光模块结构图表:硅光模块结构图表:图表:CPO结构图示结构图示图表:图表:LPO结构图示结构图示算力网络图谱:算力网络图谱:GTC聚焦光通信与液冷产业链聚焦光通信与液冷产业链17来源:各公司官网,中泰证券研究所整理通 信 大 变 革算 网 新 基 建 算网设备算网运营算网建设运营商:移动、电信、联通有线/无线参股/合作中国通信服务润建股份、元道通信算 力 网 络运营商云互联网云设备商云中立云/IDC移动云、天翼云、联通云、电子云算力散热算力供给算力连接算力接入卫星互联网工业互联网芯片:高通、联发科、紫光展锐、翱捷科技模组:移

43、远通信、广和通、美格智能、有方科技车联网:移为通信、鸿泉物联、锐明技术T/R芯片&组件:铖昌科技、臻镭科技、国博电子通信载荷:上海瀚讯、信科移动、创意信息核心网:震有科技、信科移动卫星运营:中国卫通卫星终端:海格通信、华力创通、盟升电子传感层:威胜信息、四方光电、力合微网络层:东土科技、三旺通信、映翰通、震有科技平台层:宝信软件光模块液冷风冷英维克、曙光数创、申菱环境、高澜股份、佳力图、依米康、网宿科技冷板式散热浸没式散热喷淋式散热散热模组系统风扇算 力 交 换全球:Cisco、HPE、Juniper、Arista、NVIDIA国内:华为、紫光股份、锐捷网络、中兴通讯、迈普科技交换机代工厂商台

44、资:工业富联、台达电子、智邦科技、明泰科技大陆:菲菱科思、共进股份、剑桥科技、卓翼科技交换芯片全球:BroadCom、Cisco、Intel、Marvell国内:华为、中兴通讯、盛科通信、裕太微阿里云、腾讯云、京东云、字节云华为云、紫光云、浪潮云、金山云青云、优刻得、首都在线、宝信软件、润泽科技、光环新网、奥飞数据、数据港、科华数据光器件光芯片全球:Finisar、Lumentum、MOLEX、Intel国内:中际旭创、新易盛、光迅科技、华工科技、博创科技、剑桥科技、联特科技、德科立、铭普光磁全球:Finisar、Oclaro、Broadcom等国内:天孚通信、三环集团、太辰光、腾景科技、兆龙

45、互连全球:Finisar、Lumetum、BroadCom、三菱、住友国内:源杰科技、长光华芯、仕佳光子、光库科技、永鼎股份、华西股份连接器全球:安费诺、莫仕、泰科国内:鼎通科技、意华股份、瑞可达传输设备:华为、中兴通讯、烽火通信服务器:浪潮信息、紫光股份、超聚变、中科曙光、中兴通讯基站:华为、中兴通讯、信科移动光纤光缆:长飞光纤、亨通光电、中天科技边缘算力AIOT重点关注标的重点关注标的18来源:Wind,中泰证券研究所GTC大会召开在即,预计将在本次大会上推出大会召开在即,预计将在本次大会上推出Blackwell架构的架构的B100 GPU,与,与H200系列相比性能有望翻倍提升,后续版本

46、功率或达系列相比性能有望翻倍提升,后续版本功率或达1000W,采用液冷散热。随着采用液冷散热。随着B100等芯片算力持续提升,光通信产品有望朝高速率进一步演进,成本与功耗瓶颈有望加速硅光等芯片算力持续提升,光通信产品有望朝高速率进一步演进,成本与功耗瓶颈有望加速硅光/LPO/CPO等新技术方等新技术方案落地。建议关注光通信与液冷产业链。案落地。建议关注光通信与液冷产业链。同时,本次同时,本次GTC大会将围绕机器人、数据中心云计算等多领域开展主题演讲、讨论交流等活动,现场将展出大会将围绕机器人、数据中心云计算等多领域开展主题演讲、讨论交流等活动,现场将展出25款机器人,有望发布具身智能款机器人,

47、有望发布具身智能相关进展。大模型向多模态演进,加速相关进展。大模型向多模态演进,加速AI应用落地,数据中心、应用落地,数据中心、CDN等或将受益推理场景拓宽带来的新一轮流量增长。等或将受益推理场景拓宽带来的新一轮流量增长。图表:重点标的估值图表:重点标的估值细分板块细分板块 代码代码公司公司股价(元)股价(元)市值(亿元)市值(亿元)归母净利润(亿元)归母净利润(亿元)PE2023E增速增速2024E增速增速2023E2024E光模块器件光模块器件300308.SZ中际旭创177.36 1423.89 21.81 78.19%40.26 84.60%65.29 35.37 300394.SZ天

48、孚通信156.01 616.06 7.30 81.14%12.11 65.91%84.40 50.87 688498.SH源杰科技162.00 138.45 0.19-80.58%1.06 442.61%710.73 130.98 300502.SZ新易盛76.98 546.50 6.91-23.57%12.58 82.14%79.13 43.45 688313.SH仕佳光子11.65 53.45-0.48-174.21%0.81 269.76%-112.03 65.99 688195.SH腾景科技27.08 35.03 0.42-28.34%0.75 80.21%83.72 46.46 30

49、0620.SZ光库科技51.03 125.18 0.73-37.92%1.56 113.75%171.18 80.09 002281.SZ光迅科技39.91 316.97 5.82-4.41%7.37 26.75%54.50 43.00 301205.SZ联特科技109.22 141.71 0.62-45.26%1.82 193.55%228.56 77.86 300570.SZ太辰光42.19 97.04 1.68-6.80%2.60 55.13%57.83 37.28 液冷液冷002837.SZ英维克33.85 192.43 3.89 38.78%5.23 34.55%49.47 36.7

50、7 872808.BJ曙光数创53.37 106.74 1.05-10.61%1.84 76.16%102.14 57.98 301018.SZ申菱环境27.82 74.02 2.27 36.51%3.04 34.00%32.61 24.34 300499.SZ高澜股份13.82 42.19 0.38-86.93%1.76 369.33%112.49 23.97 603912.SH佳力图8.16 44.21-300249.SZ依米康7.92 34.89-300017.SZ网宿科技10.10 246.16 5.13 169.00%5.61 9.33%48.01 43.92 ICT设备设备3011

51、91.SZ菲菱科思95.62 66.30 1.72-11.79%3.21 86.63%38.55 20.66 688702.SH盛科通信-U42.34 173.59-0.20 0.00000.13 161.67%-854.31 1385.30 301165.SZ锐捷网络39.95 226.99 5.12-6.92%7.34 43.47%44.34 30.91 000938.SZ紫光股份23.17 662.68 22.64 4.90%28.08 24.05%29.28 23.60 000063.SZ中兴通讯29.00 1285.41 93.26 15.41%106.45 14.15%13.78

52、12.08 数据中心数据中心300442.SZ润泽科技25.10 431.86 17.93 49.67%23.25 29.67%24.09 18.57 600845.SH宝信软件42.86 869.59 26.36 20.59%33.04 25.34%32.99 26.32 300383.SZ光环新网9.87 177.42 7.16 181.36%9.24 29.05%24.78 19.20 300738.SZ奥飞数据9.88 94.21 1.78 7.74%2.56 43.67%52.78 36.74*注:以2024年3月15日收盘价计算,橙底加粗标的为已覆盖公司,盈利预测来自中泰预测,中际

53、旭创/天孚通信/源杰科技/中兴通讯2023年归母净利润来自业绩快报及年报,其余标的盈利预测及估值均取自Wind一致预期风险提示风险提示19AI发展不及预期风险。发展不及预期风险。AI是底层算力增长核心驱动力之一,若AI技术及应用发展不及预期,算力规模增速可能放缓,进而影响产业链扩张升级;技术迭代不及预期风险。技术迭代不及预期风险。技术升级带动硬件价值量提升,打开增量市场,若行业技术迭代速度不及预期,可能导致新品导入量产放缓,公司若不能及时根据市场需求变化进行技术、产品及业务创新,市场竞争力将可能被削弱,影响经济效益;市场竞争加剧风险。市场竞争加剧风险。竞争从业务布局、核心技术、人才、资金和政策

54、等方面展开,存在新的进入者导致市场竞争加剧的风险;海外贸易争端风险。海外贸易争端风险。中美之间经贸磋商不断反复,需要保持高度关注;市场系统性风险。市场系统性风险。全球和国内宏观层面相关因素仍可能对市场产生系统性影响;研究报告使用的公开资料可能存在信息滞后或更新不及时的风险。研究报告使用的公开资料可能存在信息滞后或更新不及时的风险。重要声明重要声明中泰证券股份有限公司(以下简称“本公司”)具有中国证券监督管理委员会许可的证券投资咨询业务资格。本报告仅供本公司的客户使用。本公司不会因接收人收到本报告而视其为客户。本报告基于本公司及其研究人员认为可信的公开资料或实地调研资料,反映了作者的研究观点,力

55、求独立、客观和公正,结论不受任何第三方的授意或影响。本公司力求但不保证这些信息的准确性和完整性,且本报告中的资料、意见、预测均反映报告初次公开发布时的判断,可能会随时调整。本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。本报告所载的资料、工具、意见、信息及推测只提供给客户作参考之用,不构成任何投资、法律、会计或税务的最终操作建议,本公司不就报告中的内容对最终操作建议做出任何担保。本报告中所指的投资及服务可能不适合个别客户,不构成客户私人咨询建议。市场有风险,投资需谨慎。在任何情况下,本公司不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。投资者应注意,在法律允许的情况下,本公司及其本公司的关联机构可能会持有报告中涉及的公司所发行的证券并进行交易,并可能为这些公司正在提供或争取提供投资银行、财务顾问和金融产品等各种金融服务。本公司及其本公司的关联机构或个人可能在本报告公开发布之前已经使用或了解其中的信息。本报告版权归“中泰证券股份有限公司”所有。事先未经本公司书面授权,任何机构和个人,不得对本报告进行任何形式的翻版、发布、复制、转载、刊登、篡改,且不得对本报告进行有悖原意的删节或修改。20

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(通信行业英伟达GTC专题:新一代GPU、具身智能与AI应用-240318(20页).pdf)为本站 (stock) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
相关报告
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部