上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

电子行业:AI浪潮势不可挡昇腾发力铸造国产算力基石-240117(38页).pdf

编号:151760 PDF  DOCX 38页 1.58MB 下载积分:VIP专享
下载报告请您先登录!

电子行业:AI浪潮势不可挡昇腾发力铸造国产算力基石-240117(38页).pdf

1、 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。1 20242024 年年 0101 月月 1717 日日 电子电子 行业专题行业专题 A AI I 浪潮势不可挡,昇腾发力铸造国产浪潮势不可挡,昇腾发力铸造国产算力基石算力基石 证券研究报告证券研究报告 投资评级投资评级 领先大市领先大市-A A 维持维持评级评级 首选股票首选股票 目标价(元)目标价(元)评级评级 行业表现行业表现 资料来源:Wind 资讯 升幅升幅%1M1M 3M3M 12M12M 相对收益相对收益 -7.9-0.3 9.4 绝对收益绝对收益 -11.2-11.6-12.6 马良马良 分析师分析师 SAC 执业

2、证书编号:S01 朱思朱思 分析师分析师 SAC 执业证书编号:S02 相关报告相关报告 CES 展会新品纷呈,AI 与显示交互成为焦点 2024-01-14 高端国产替代系列-光刻胶:半导体制造核心材料,国产替代突围在即 2024-01-10 高通推出第二代骁龙 XR2+平台,原生鸿蒙生态有望迎来快速发展 2024-01-07 华为、小米新车相继发布,全球首款商务 AI PC 亮相 2024-01-01 苹果 MR 发售在即,美光业绩超预期 2023-12-24 从“性能指标”到“性能密度指标”,海外从“性能指标”到“性能密度指标”,海外高端芯片高

3、端芯片进口进口受限受限范范围扩大围扩大:2023 年 10 月 17 日,美国商务部出台了出口管制清单的 ECNN 3A090和 4A090 要求,以进一步限制高性能 AI 芯片的出口,同时将 13 家中国公司列入实体清单。在新规发布之前,超过旧规性能指标限制的芯片仅为英伟达 A100,但当加入性能密度指标后,新规不仅限制了厂商出略低于性能标准的芯片以规避限制情况,同时针对数据中心芯片与非数据中心芯片进行了不同的限制约定,使更多的英伟达芯片受到禁令限制。修改后的出国管制设计产品包括但不限于:英伟达 A100、A800、H100、H800、L40、L40S 以及 RTX 4090 产品。实际上,

4、任何集成了一个或多个及以上的芯片的系统,包括但不限于英伟达 DGX、HGX系统,都在新规涵盖范围之内。全球全球科技巨头科技巨头纷纷纷纷布局算力芯片,布局算力芯片,AIAI 浪潮势不可挡浪潮势不可挡:AMD 推出的“MI 系列+Infinity Fabric+ROCm 平台”,性能强劲,成为英伟达全球范围内最强劲的对手。特斯拉自研 Dojo 超算服务器助力自动驾驶,在芯片间互连技术上独具特色,具备强大的扩展性。Intel推出 GPU 系列芯片和 oneAPI 开发平台,不断完善其 AI 数据中心布局。Google 推出 Cloud TPU 解决方案,在机器学习领域。Meta 布局自研 AI 生态

5、,2020 年正式推出第一代 MTIA 方案,侧重于处理低/中复杂度模型。英伟达在 GPU 领域深耕数十年,根据 Jon Peddie Research(JPR)报告显示,2023 年 Q1,英伟达 GPU 市场份额达到84%,Q2 达到 80%,但全球各大科技巨头结合其自身优势纷纷布局算力芯片。完整的芯片生态“软件完整的芯片生态“软件+硬件”缺一不可,华为推出全系列昇腾硬件”缺一不可,华为推出全系列昇腾解决方案:解决方案:一个完整的芯片生态中仅有硬件芯片是不够的,软件系统开发的便捷性以及现有系统的迁移难度同样至关重要。现阶段英伟达通过其“芯片+NVLINK+CUDA”构建产品高护城河,在 G

6、PU 市场长期占据全球市场领导地位。华为推出全系列昇腾解决方案,包括自研的昇腾芯片+高速芯片间接口+AI 计算架构,从软硬件上和主流厂商对标,昇腾芯片基于自研的达芬奇架构,功耗低,产品性能优异,从官方披露的数据来看,2019 年推出的昇腾 910,在半精度 FP16 运算速度可达-22%-12%-2%8%18%28%38%--01电子电子沪深沪深300300 108313798 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。2 行业专题行业专题/电子电子 320TFLOPS,整型 INT8 算力可达 640TOPS,英伟达 A100

7、 的 FP16 运算性能为 312TFLOPS。相关公司:相关公司:兴森科技、新益昌、天承科技、德邦科技、华海诚科、英维克、飞荣达、思泉新材、恒铭达、华丰科技、沪电股份、世运电路、胜宏科技、方正科技。风险提示:风险提示:宏观因素波动影响下游需求;市场开拓不及预期;宏观因素波动影响下游需求;市场开拓不及预期;行业竞争加剧;行业竞争加剧;mX8VvYjUNA9UlVfWwUnPmOtRaQbP9PoMnNoMqMlOmMnMfQnMuM7NmMuNMYtOuNvPqQtO行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。3 内容目录内容目录 1.美国加强限制规

8、则,海外高性能芯片进口受限.6 1.1.从“性能指标”到“性能密度指标”,英伟达高端芯片进口受限范围扩大.6 1.2.人工智能大势所趋,各地政策推进实施.7 2.构建完整的芯片生态系统,“硬件+软件”缺一不可.8 3.华为昇腾软硬件全面布局,构建国产 AI 算力基石.11 3.1.昇腾生态包括全栈的 AI 计算基础设施、行业应用及服务.11 3.2.基于“自研芯片+自研接口+自研软件生态”,华为推出全系列解决方案.14 4.科技巨头纷纷布局算力芯片,AI 浪潮势不可挡.18 4.1.AMD 的“MI 系列+Infinity Fabric+ROCm 平台”,成为英伟达全球范围内最强劲的对手.18

9、 4.2.特斯拉自研 Dojo 超算服务器,芯片间高带宽互连为其一大特色.20 4.3.Intel 推出 GPU 系列芯片和 oneAPI 开发平台,完善其 AI 数据中心布局.21 4.4.Google 推出 Cloud TPU 解决方案,更专注于机器学习领域.22 5.AI 产业带动国内算力数据中心建设,大规模招标陆续启动.25 6.相关公司.28 6.1.兴森科技.28 6.2.新益昌.28 6.3.天承科技.29 6.4.德邦科技.29 6.5.华海诚科.30 6.6.英维克.31 6.7.飞荣达.31 6.8.思泉新材.32 6.9.恒铭达.33 6.10.华丰科技.33 6.11.

10、飞荣达.34 6.12.世运电路.34 6.13.方正科技:.35 7.风险提示.36 7.1.宏观因素波动影响下游需求.36 7.2.市场开拓不及预期.36 7.3.行业竞争加剧.36 图表目录图表目录 图 1.“CPU+GPU+DPU”三芯布局.8 图 2.Grace Hopper 架构.8 图 3.NVLink 与 PCIE 带宽对比.10 图 4.NVLink 版本迭代.10 图 5.CUDA 架构.10 图 6.昇腾生态全景.12 图 7.CANN 生态.14 图 8.Atlas 900 AI 集群.17 图 9.AMD ROCm 软件堆栈框架.19 图 10.特斯拉 Dojo 的整

11、体算力规模将达到 100EFLOPs.21 行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。4 图 11.Dojo 未来路线图.21 图 12.英特尔至强产品的路线图.22 图 13.英特尔数据中心 GPUmax 系列参数.22 图 14.OneAPI 架构.22 图 15.TPU v5e 芯片互联效率提升.23 图 16.TensorFlow 详细架构.24 图 17.MITA V1.24 图 18.MTIA 的深度学习推荐模型(DLRM)端到端性能结果.24 图 19.AI RSC 与基于 V100 的集群的运算速度对比.25 图 20.RSC 计算

12、性能.25 图 21.2022 年中国人工智能芯片规模占比.25 图 22.2023-2024 中国电信 AI 算力服务器集采中标候选人表.26 图 23.兴森科技营收及同比增速.28 图 24.兴森科技归母净利润及同比增速.28 图 25.新益昌营收及同比增速.29 图 26.新益昌归母净利润及同比增速.29 图 27.天承科技营收及同比增长.29 图 28.德邦科技营收及同比增速(单位:亿元).30 图 29.德邦科技归母净利润及同比增速(单位:亿元).30 图 30.华海诚科营收及同比增速(单位:亿元).30 图 31.华海诚科归母净利润及同比增速(单位:亿元).30 图 32.英维克营

13、收及同比增速(单位:亿元).31 图 33.英维克归母净利润及同比增速(单位:亿元).31 图 34.飞荣达营收及同比增速(单位:亿元).32 图 35.飞荣达归母净利润及同比增速(单位:亿元).32 图 36.思泉新材营收及同比增速(单位:亿元).32 图 37.思泉新材归母净利润及同比增速(单位:亿元).32 图 38.恒铭达营收及同比增速(单位:亿元).33 图 39.恒铭达归母净利润及同比增速(单位:亿元).33 图 40.华丰科技营收及同比增速.33 图 41.华丰科技归母净利润及利润率情况.33 图 42.飞荣达营收及同比增速(单位:亿元).34 图 43.飞荣达归母净利润及同比增

14、速(单位:亿元).34 图 44.世运电路营收及同比增速(单位:亿元).35 图 45.世运电路归母净利润及同比增速(单位:亿元).35 图 46.方正科技 PCB 销量及同比变化.35 图 47.方正科技营收及同比增速.35 表 1:限制法令变化.6 表 2:英伟达芯片受限情况.7 表 3:行动计划概览.8 表 4:英伟达 GPU 迭代.9 表 5:H100,A100,H800,A800 对比.9 表 6:英伟达产品概览.11 表 7:昇腾系列处理器算力详情.12 行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。5 表 8:昇腾系列与英伟达系列功耗对比

15、.13 表 9:HCCS 接口与 NVLink、PCIe 5.0 对比.13 表 10:Atlas 200 DK 开发者套件硬件规格.15 表 11:Atlas 300 T 训练卡(型号 9000)硬件规格.15 表 12:Atlas 300I 推理卡(型号 3000)硬件规格.16 表 13:Atlas 800 训练服务器规格.16 表 14:Atlas 800 推理服务器硬件规格.17 表 15:AMD Redeon Instinct 系列产品迭代.18 表 16:AMD Redeon Instinct MI300X 对比 NVIDIA H100 SXM.19 表 17:AMD 相关软件生

16、态.19 表 18:Dojo ExaPOD 算力在 BF16/FP32 精度下可达 1.1ExaFLOPs.20 表 19:Dojo ExaPOD 算力在 BF16/FP32 精度下可达 1.1ExaFLOPs.21 表 20:Google TPU v5e 对比 NVIDIA H100 SXM.23 表 21:Google TPU v5e 对比 NVIDIA H100 SXM.23 表 22:各厂商芯片性能对比.26 表 23:中国电信此次 AI 服务器集 4 个标包情况.27 行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。6 1.1.美国加强限制规则

17、,海外高性能芯片进口受限美国加强限制规则,海外高性能芯片进口受限 1.1.1.1.从“性能指标”到“性能密度指标”,英伟达高端芯片进口受限范围扩大从“性能指标”到“性能密度指标”,英伟达高端芯片进口受限范围扩大 2023 年 10 月 17 日,美国商务部出台了出口管制清单的 ECNN 3A090 和 4A090 要求,以进一步限制高性能 AI 芯片的出口,同时将 13 家中国公司列入实体清单。修改后的出国管制设计产品包括但不限于:英伟达 A100、A800、H100、H800、L40、L40S 以及 RTX 4090 产品。实际上,任何集成了一个或多个及以上的芯片的系统,包括但不限于英伟达

18、DGX、HGX 系统,都在新规涵盖范围之内。此前,2022 年 8 月 26 日,美国政府要求英伟达停止向中国(包括中国香港)出口两款用于人工智能发展的高端计算芯片,涉及英伟达 A100 和 H100 两款芯片,以及未来推出峰值性能等同或超过 A100 的其他芯片。同时,英伟达应用这些高性能芯片的系统级产品也均在新的管制范围内。2022 年 9 月 1 日,英伟达发布声明称美国政府允许英伟达在 2023 年 9 月 1 日前,通过公司的香港工厂履行 A100 和 H100 的订单和物流运输,但售卖给中国的终端客户仍需要受美国政府批准。表表1 1:限制法令变化限制法令变化 资料来源:对向中国出口

19、的先进计算和半导体制造物项实施新的出口管制(2022),先进计算芯片更新规则及 半导体制造物项更新规则(2023),国投证券研究中心 限制限制强度加大,强度加大,新增新增多款芯片受到新规限制。多款芯片受到新规限制。根据英伟达主要芯片规格,可以计算每种芯片的性能密度指标。在新规发布之前,超过旧规性能指标限制的芯片仅为英伟达 A100,但当加入性能密度指标后,新规不仅限制了厂商出略低于性能标准的芯片以规避限制情况,同时针对数据中心芯片与非数据中心芯片进行了不同的限制约定,使更多的英伟达芯片受到禁令限制。内容内容 2 2022022 年年 1 10 0 月月 7 7 日日 2 2023023 年年

20、1 10 0 月月 1 17 7 日新规日新规 性能指标性能指标 限制每次运算位长乘以限制每次运算位长乘以 T TOPSOPS 为单位的处理性能不能大于为单位的处理性能不能大于 4 4800800 增加性能密度指标,同时限制总处理性能与性能密度增加性能密度指标,同时限制总处理性能与性能密度 限制主体限制主体 拒绝英伟达向中国出口、转让的申请拒绝英伟达向中国出口、转让的申请 扩大限制范围,不仅包括大陆与澳门特别行政区,还包扩大限制范围,不仅包括大陆与澳门特别行政区,还包括母公司设置在中国大陆以及澳门特别行政区的实体括母公司设置在中国大陆以及澳门特别行政区的实体 行业专题行业专题/电子电子 本报告

21、版权属于国投证券股份有限公司,各项声明请参见报告尾页。7 表表2 2:英伟达芯片受限情况英伟达芯片受限情况 资料来源:芯东西半导体产业媒体,国投证券研究中心 1.2.1.2.人工智能人工智能大势所趋,各地政策推进实施大势所趋,各地政策推进实施 “1+N1+N”政策体系全面推动人工智能产业政策体系全面推动人工智能产业。2017 年国务院发布新一代人工智能发展规划,部委层面陆续出台相关发展规划、实施方案等落地政策,形成“1+N”政策体系,从相关法律法规和伦理规范、人工智能发展支持政策、标准和产权体系、监管和评估体系以及 AI 人才培训等五个角度全面推动人工智能健康快速发展。同时,各一二线城市均针对

22、 AI 产业制定了产业规模目标和企业数量目标,其中北京市于 2023年 5 月 30 日发布北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025 年)与北京市促进通用人工智能创新发展的若干措施两项重磅政策,以迅速建设具有全球广泛影响力的人工智能创新策源地。算力发展目标明确,将带动算力发展目标明确,将带动 A AI I 算力的迅速发展。算力的迅速发展。2023 年 10 月,工业和信息化部、中央网信办、教育部、国家卫生健康委、中国人民银行、国务院国资委等六部门联合发布算力基础设施高质量发展行动计划,在计算力、运载力、存储力、应用赋能等方面提出了具体目标,以进一步加强算力资

23、源配置,提升国内算力总体水平。智算的快速发展,一方面要求智算中心的建设需要更加合理,要兼顾东西部协同发展和资源的合理利用。另一方面,智能算力更多的采用 AI 芯片,带来更大带宽的网络传输需求,这些都将显著促进 AI 芯片和网络技术的研发创新。型号型号 算力性能及性能密度算力性能及性能密度 备注备注 A A100100 性能指标性能指标 TPPTPP4 4800800,性能密度指标,性能密度指标5 5.92.92 受到新规旧规双重限制受到新规旧规双重限制 H H100100 性能指标性能指标 TPPTPP4 4800800,性能密度指标,性能密度指标5 5.92.92 受到新规限制受到新规限制

24、A A800800 性能指标性能指标 TPPTPP4 4800800,性能密度指标,性能密度指标5 5.92.92 受到新规限制受到新规限制 H H800800 性能指标性能指标 TPPTPP4 4800800,性能密度指标,性能密度指标5 5.92.92 受到新规限制受到新规限制 L L40S40S 性能指标性能指标 T TPPPP4 4800800,性能密度处于,性能密度处于 1 1.65.92.65.92 区间区间 受到新规限制受到新规限制 R RTX4090TX4090 性能指标性能指标 T TPPPP4 4800800,性能密度处于,性能密度处于 1 1.65.92.65.92 区间

25、区间 受到新规限制受到新规限制 行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。8 表表3 3:行动计划概览行动计划概览 资料来源:算力基础设施高质量发展行动计划,国投证券研究中心 2.2.构建完整的芯片生态系统,“硬件构建完整的芯片生态系统,“硬件+软件”缺一不可软件”缺一不可 芯片方面,英伟达通过芯片方面,英伟达通过“CPU+GPU+DPUCPU+GPU+DPU”三芯布局三芯布局,数据中心正成长为公司最大业务。,数据中心正成长为公司最大业务。CPU 作为逻辑处理单元,能更好地处理各种需要快速逻辑判断和并行处理能力的计算任务;GPU 侧重对图像像素进行

26、大规模的数据矩阵运算处理,与 AI 算法的并行结构运算匹配,GPU 在 AI 领域有着先天优势;DPU 则特别适合处理数据中心和网络设备的需求,能有效处理数据包和协议。英伟达通过将 CPU、GPU 和 DPU 集成到同一平台上,可以为客户提供更全面、高效的计算解决方案。公司推出的 Grace Hopper 超级芯片将 Grace 和 Hopper 架构相结合,为加速 AI 和高性能计算(HPC)应用提供 CPU+GPU 相结合的一致内存模型,并在大型服务器上广泛部署。2021 年及以前,游戏业务营收占比最高,但随着 AGI 引爆算力需求,公司数据中心成长极快。根据公司 2022 年年报,其数据

27、中心业务营收约 150 亿美元(占比约 56%),已成为公司最大业务。图图1.1.“CPU+GPU+DPU”三芯布局三芯布局 图图2.2.Grace Hopper 架构架构 资料来源:英伟达 GTC 大会 PPT 截图、国投证券研究中心 资料来源:公司官网,国投证券研究中心 针对方面针对方面/地区地区 政策内容政策内容 主要目标(到主要目标(到 2 2025025 年)年)计算力计算力 算力规模超过算力规模超过 3 300EFLOPS00EFLOPS,智能算力占比达到,智能算力占比达到 3 35%5%,东西部算力平衡协调发展,东西部算力平衡协调发展 运载力运载力 数据中心集群间基本实现不高于理

28、论时延数据中心集群间基本实现不高于理论时延 1 1.5.5 倍的直连网络传输,重点应用场所倍的直连网络传输,重点应用场所光传送网覆盖率达到光传送网覆盖率达到 8 80%0%存储力存储力 存储总量超过存储总量超过 1 1800EB800EB,先进存储容量占比达到,先进存储容量占比达到 3 30%0%以上,重点行业核心数据、重以上,重点行业核心数据、重要数据覆盖率达到要数据覆盖率达到 1 100%00%应用赋能应用赋能 打造一批算力新业务、新模式、新业态,工业、金融等领域算力渗透率显著提升打造一批算力新业务、新模式、新业态,工业、金融等领域算力渗透率显著提升 重点任务重点任务 京津冀、长三角、粤港

29、澳大京津冀、长三角、粤港澳大湾区等湾区等 面向重大区域发展战略实施需要有序建设算力设施面向重大区域发展战略实施需要有序建设算力设施 贵州、内蒙古、甘肃、宁夏贵州、内蒙古、甘肃、宁夏等节点等节点 推进数据中心集群建设同时,着力提升算力设施利用效率,促进东西部高效互补推进数据中心集群建设同时,着力提升算力设施利用效率,促进东西部高效互补核协同联动核协同联动 行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。9 G GPUPU 领域深耕数十年,领域深耕数十年,长期占据市场领导地位。长期占据市场领导地位。1999 年英伟达推出的首个 GPU 架构,开创了现代显卡的

30、时代,代表产品是 GeForce 256 显卡,此后其架构经历了多次变革迭代,GPU 计算能力的不断提升,从 2017 到 2022 这五年间,公司先后推出了 Volta、Ampere、Hopper 等针对高性能计算和 AI 训练的架构,并以此为基础发布了 V100、A100、H100 等高端 GPU。通过不断的技术革新,英伟达 GPU 产品向量双精度浮点算力已从 7.8TFLOPS 增至 30TFLOPS。根据 Jon Peddie Research(JPR)报告显示,2023 年 Q1,英伟达 GPU 市场份额达到 84%,Q2达到 80%,占据市场领导地位。表表4 4:英伟达英伟达 GP

31、UGPU 迭代迭代 架构代号架构代号 F Fermiermi K Keplerepler M Maxwelaxwel P Pascaasca V Voltaolta T Turningurning A Amperempere H Hopperopper 中文代号中文代号 费米费米 开普勒开普勒 表克斯韦表克斯韦 帕斯卡帕斯卡 伏特伏特 图灵图灵 安培安培 赫柏赫柏 时间时间 20102010 20122012 20142014 20162016 20172017 20182018 20202020 20222022 核心参数核心参数 1616 个个 SMSM,每个每个 SMSM 包括包括32

32、Cuda 32 Cuda Cores Cores 共计共计512 Cuda 512 Cuda CoresCores 1515 个个 SMxSMx,每个每个 SMXSMX 包包括括 192192 个单个单精度精度+64+64 个个双精度的双精度的Cudacores;Cudacores;1616 个个 SMMSMM,每,每个个 SMSM 包括包括 4 4 个个处理块,每个处理块,每个处理块包括处理块包括 3232个个 CUDACUDA 内核内核+8+8个个LD/STUnit+8LD/STUnit+8个个 SFUSFU PascalPascal 架构有架构有GP100GP100、GP102GP100

33、GP102GP100 有有6060 个个 SMSM 8080 个个 SMSM 每每个个 SMSM 里里 3232个个 FP6464FP6464 个个INT3264INT3264 个个FP328FP328 个个Tensor coreTensor core TU102TU102 核心核心7272 个个 SMSM,SMSM全新设计,全新设计,每个每个 SMSM 里里6464 个个INT3264INT3264 个个FP328FP328 个个Tensor coreTensor core A100A100 有有108 SMs108 SMs 每每个个 SM64 SM64 个个FP3264 FP3264 个个

34、INT3232 INT3232 个个 FP644FP644个个 Tensor Tensor corecore H100 132 SMH100 132 SM 每每个个 SM128SM128 个个FP3264 FP3264 个个INT3264INT3264 个个 FP644FP644个个 Tensor coreTensor core 特点特点 优势优势 首个完整首个完整GPUGPU 计算架计算架构,支持与构,支持与共享存储结共享存储结合纯合纯 CacheCache层次的层次的 GPUGPU架构,支持架构,支持ECCECC 的的 GPUGPU架构架构 游戏性能大游戏性能大幅提首次支幅提首次支持持GP

35、UDirect GPUDirect 技术技术 相比相比 KplerKpler 的的每组每组 SMSM 单元单元192192 个减少到个减少到了每组了每组 128128 个个但是每个但是每个 SMMSMM单元拥有更多单元拥有更多的逻辑控制电的逻辑控制电路路 每个每个 SMSM 包括包括 6464个个 cuda cores32cuda cores32个个 DP cores DP cores NVLink NVLink 代,双代,双向互联带宽向互联带宽160GB/sP100160GB/sP100 有有5656 个个 SMHBMSMHBM Nvlink Nvlink 2.0Tensor 2.0Tens

36、or Core 1.0Core 1.0 满满足深度学习足深度学习和和 AIAI 运算运算 Tensor Core Tensor Core 2.0RT Core 2.0RT Core 1.01.0 Tensor Tensor Core Core 3.0RT 3.0RT Core Core 2.0Nvlink 2.0Nvlink 3.03.0 结构稀结构稀疏性疏性 MIG MIG 1.01.0 Tensor Core Tensor Core 4.0Nvlink 4.04.0Nvlink 4.0结构稀疏性知阵结构稀疏性知阵MIG 2.0MIG 2.0 纳米制程纳米制程 40/28nm3040/28n

37、m30亿品体管亿品体管 28nm7128nm71 亿品亿品体管体管 28nm8028nm80 亿品体亿品体管管 16nm15316nm153 亿晶体亿晶体管管 12nm21112nm211 亿亿晶体管晶体管 12nm18612nm186 亿亿晶体管晶体管 7nm2837nm283 亿亿品体管品体管 4nm800 4nm800 亿个晶体亿个晶体管管 代表型号代表型号 Quadro 7000Quadro 7000 K80K80,K40MK40M M5000M4000M5000M4000 P100GTX P100GTX 1080P60001080P6000 V100TiTan VV100TiTan

38、V T42080TIRTX T42080TIRTX 50005000 A100A100、A303090A303090 H100H100 资料来源:英伟达公司官网,国投证券研究中心 2 2022022 年年 3 3 月月 GTC 2022GTC 2022 大会上,大会上,英伟达英伟达正式发布了基于正式发布了基于 HopperHopper 架构的面向数据中心架构的面向数据中心的的新一新一代顶级计算核心代顶级计算核心 GH100GH100、计算卡、计算卡 H100H100。在机器学习及人工智能领域开放产业联盟 MLCommons公布了最新的 MLPerf 基准评测中,英伟达 H100 Tensor

39、Core GPU 在每次 AI 推理测试中都展现出最高性能。得益于软件优化,该 GPU 的性能比去年 9 月份首次亮相时提高了 54%,A100 则是英伟达于 2020 年推出的上一代数据中心专用 GPU,但依然是目前 AI 训练的主流芯片产品。根据 New Street Research 的数据,英伟达占据了可用于机器学习的图形处理器市场的 95%。表表5 5:H100,A100,H800,A800H100,A100,H800,A800 对比对比 型号型号 H100 A100 H800 A800 Target Markets/Target Markets/目标市场目标市场 基于 GH800

40、图形处理器,SXM5 接口,有助于提高机器学习应用程序的速度,第四代 tensor core,支持FPB 和 transformer 引擎 H100 是全球范围内最大的性能出众的加速器,拥有革命性的 Transformer 引擎和高度可扩展的 NVIDIA NVLink 互连技术等突破性功能,可推动庞大的 AI 语言模型、深度推荐系统、基因组学和复杂数字孪生的发展 新引入 FP64,TF32,BF16 Tensor Core,支持MIG,深度学习/HPC 大规模算例并行加速计算 新引入 FP64,TF32,BF16 Tensor Core,支持 MIG,深度学习/HPC大规模算例并行加速计算

41、GPU/GPU/图形处理单元(架构)图形处理单元(架构)GH100(hopper)GH100(hopper)GA100(Ampere)GA100(Ampere)GPU Cores/CUDA GPU Cores/CUDA 单元数单元数 16,896 16896 6,912 6,912 VRAM/VRAM/显存显存 80 GB 80GB 80GB 40GB FP16 FP16 Computing(nonComputing(non-Tensor)Tensor)/半精性能半精性能 nonnon-TensorTensor 237.2 TFLOPS 267.6 TFLOPS 77.97 TFLOPS 70

42、 TFLOPS 资料来源:英伟达公司官网,国投证券研究中心 行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。10 NVNVLinkLink 是英伟达自研的高速互连技术,是英伟达自研的高速互连技术,解解决了多决了多 GPUGPU 并行计算时内存共享和通信的瓶颈问并行计算时内存共享和通信的瓶颈问题题,能有效提升数据中心的整体运算能力能有效提升数据中心的整体运算能力。PCIe 是 Intel 主导的高速串行计算机扩展总线标准,是当前服务器主流的总线解决方案,PCIe 标准迭代周期约为 3 年/代,PCIe 3.0 是目前消费市场的主流选择,4.0 于 2017

43、 年正式推出,自 2021 年下半年开始在数据中心逐步应用,并逐渐从企业级市场下沉到消费市场。目前 Intel/AMD 等主流 CPU 厂商正快速推出 PCIe 5.0产品,用于 AI 的高性能企业级服务器通常采用 PCIe5.0 接口。NVLink 是英伟达自研的高速接口,可以提供更强大的数据传输能力和更高的吞吐量,能有效缩短数据传输时间,满足当前针对大数据和复杂运算的高带宽需求。随着 NVIDIA GPU 架构的更新和技术的不断发展,NVLink 的版本也在不断演进,以满足不断增长的计算需求和提供更优秀的性能。图图3.3.NVLink 与与 PCIE 带宽带宽对比对比 资料来源:英伟达公司

44、官网,国投证券研究中心 CUDACUDA 架构搭建英伟达软件生态,是架构搭建英伟达软件生态,是英伟达英伟达 AIAI 解决方案的解决方案的核心优势之一核心优势之一。CUDA(Compute Unified Device Architecture)是由英伟达公司推出的 GPU 加速平台,在推出 CUDA 之前,程序员想要调用 GPU 的运算资源必须先编写大量底层代码,在开发和调试上需要花费大量的时间,而 CUDA 提供了易于使用的编程模型和软件环境,允许开发者使用类似于 C/C+的高层语言进行编程,使得开发者可以借助英伟达的图形处理器(GPU)进行更为高效的并行运算。经过多年优化,目前 CUDA

45、 已成为全球 AI 基础设施,主流的 AI 框架、库、工具都以 CUDA 为基础进行开发。国内第一批大模型厂商使用的基本都是英伟达已经构建完善的 CUDA 生态。即便竞争对手的 GPU 性能的硬件参数上比肩英伟达,如果缺乏 CUDA 的优化,其性能依然无法达到英伟达 GPU 的水平。图图4.4.NVLink 版本迭代版本迭代 图图5.5.CUDA 架构架构 资料来源:英伟达公司官网,国投证券研究中心 资料来源:英伟达公司官网,国投证券研究中心 基于其“芯片基于其“芯片+NVLNVLinkink +CUDACUDA”的生态系统,英伟达稳坐行业龙头地位,产品全面覆盖”的生态系统,英伟达稳坐行业龙头

46、地位,产品全面覆盖 A AI I场景。场景。公司 20 多年来始终引领 GPU 行业的发展,将 GPU 的主要应用场景从游戏以及画图等图像显示扩展到了以 AI、云计算等大数据相关的并行计算领域。根据 Jon Peddie Research 发布的 GPU 市场数据统计报告,英伟达 2022 年全年 PCGPU 出货量高达 3034 万块,是 AMD 的 行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。11 近 4.5 倍;截至 2022 年四季度,在独立 GPU 市场,英伟达占据 84%的市场份额,远超同业竞争公司。表表6 6:英伟达产品概览英伟达产品概

47、览 产品线产品线 应用方向 产品 数据中心数据中心 AI 训练加速器 AI 推理加速器 高性能计算加速器 Volta 系列、A100 Tensor Core GPU Tesla T4、Jetson Xavier NX Tesla 系列 游戏游戏 游戏 GPU 游戏笔记本 GPU 游戏平板 GPU GeForce 系列 RTX 系列 Tegra K1 专业可视化专业可视化 工作站 GPU 可视化集群 Quadro 系列、RTX 系列 Quadro Virtual Workstation 汽车汽车 汽车 SoC 自动驾驶计算平台 Drive AGX 系列、Orin 系列 NVDIA DRIVE 资

48、料来源:公司官网,国投证券研究中心 3.3.华为昇腾华为昇腾软硬件全面布局,构建国产软硬件全面布局,构建国产 A AI I 算力基石算力基石 3.1.3.1.昇腾生态包括全栈的昇腾生态包括全栈的 A AI I 计算基础设施、行业应用及服务计算基础设施、行业应用及服务 昇腾生态包括昇腾系列处理器、系列硬件、CANN 异构计算架构、AI 计算框架、应用使能、开发工具链、管理运维工具、行业应用及服务等全产业链。其硬件系统包括:基于华为达芬奇内核的昇腾系列处理器等多样化 AI 算力;给予昇腾处理器的系列硬件产品,比如嵌入式模组、板卡、小站、服务器、集群等。其基础软件体系包括:异构计算架构 CANN 以

49、及对应的驱动、运行时、加速库、编译器、调试调优工具、开发工具链 MindStudio 和各种运维管理工具等;AI 计算框架,包括开源的 MindSpore,以及各种业界流行的框架,作为生态的有机组成部分。同时昇腾计算产业支持各种计算框架的对接。行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。12 图图6.6.昇腾生态全景昇腾生态全景 资料来源:昇腾计算产业发展白皮书,国投证券研究中心 基于达芬奇架构的昇腾芯片,运算性能优异,可应用于基于达芬奇架构的昇腾芯片,运算性能优异,可应用于 A AI I 训练训练/推理场景。推理场景。DaVinci 架构是面向 A

50、I 计算设计的架构,通过独创的 16*16*16 的 3D Cube 设计,每时钟周期可以进行 4096个 16 位半精度浮点 MAC 计算。同样是完成 4096 次运算,2D 结构需要 64 行*64 列才能计算,3D Cube 只需要 16*16*16 的结构就能算出,因此在核数与频率确定的情况下,每时钟周期进行越多的计算则算力指标越高,而 Davinci 架构的 3D 设计实现了这一点。从性能指标上来看,昇腾 910 半精度 FP16 的运算性能可达 320TFLOPS,整型 INT8 算力可达640TOPS,英伟达 A100 的 FP16 运算性能为 312TFLOPS。表表7 7:昇

51、腾系列处理器算力详情昇腾系列处理器算力详情 资料来源:昇腾官网,国投证券研究中心 计算代价大幅缩小,功耗水平计算代价大幅缩小,功耗水平明显降低明显降低。Davinci 架构的 3D 设计以最小的计算代价增加矩阵乘的算力,实现更高的 AI 能效。2018 年 10 月华为联合奥迪展示了 L4 级无人驾驶的路测,汽车上配备了华为的 MDC 车载计算单元,但根据第五届世界互联网大会上前华为公司董事兼华为企业 BG 总裁阎力大披露,支持支持 L4L4 级无人驾驶这样非常复杂的边缘计算场景时,级无人驾驶这样非常复杂的边缘计算场景时,昇腾昇腾310310 芯片组仅消耗芯片组仅消耗共计共计 200200 瓦

52、的能耗瓦的能耗,相比英伟达系列芯片均有大幅缩减。型号型号 性能参数性能参数 备注备注 昇腾昇腾 3 31010 16TOPSINT8,16TOPSINT8,8TOPSFP168TOPSFP16 1 12V2V 主要应用在边缘计算等低功耗领域主要应用在边缘计算等低功耗领域 昇腾昇腾 9 91010 320TFLOPS320TFLOPSFP16FP16,640TOPS640TOPSINT8INT8 20192019 年推出,全场景人工智能领域年推出,全场景人工智能领域 行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。13 表表8 8:昇腾系列与英伟达系列功耗

53、对比昇腾系列与英伟达系列功耗对比 芯片芯片 设计功耗设计功耗 备注备注 昇腾 910 310W 昇腾 310 8W 昇腾 310 芯片组 200W 应用于 L4 级无人驾驶等极端复杂边缘计算场景 英伟达 H100 700W 英伟达 A100 700W 英伟达 H800 250W GPU 数目较少,峰值算力低于昇腾 910 英伟达 A800 250W 峰值算力远低于昇腾 910,半精度算力仅为 280TFLOPS 资料来源:第五届世界互联网大会上前华为公司董事兼华为企业 BG 总裁阎力大发言,国投证券研究中心 HCCSHCCS 是华为自研的高速互连接口,可是华为自研的高速互连接口,可为内核、设备

54、、集群提供系统内存的一致访问为内核、设备、集群提供系统内存的一致访问,片间带,片间带宽最高可达宽最高可达 480Gbps480Gbps,是业界主流 CPU 互联速率的 2 倍多,HCCS 单个 AI 处理器提供 3 条链路能实现最多 4 个鲲鹏 920 处理器互联和最高 256 个物理核的 NUMA 架构。相比于英伟达NVLink 与 PCIe 5.0,NVLink 单条链路双向带宽最大为 50GB/s,PCIe 5.0 仅为 4GB/s,HCCS单条链路双向带宽可以达到 20GB/s,H HCCSCCS 在在单一链路的单一链路的单向单向/双向互联带宽双向互联带宽上比上比 P PCICIe e

55、 5.05.0更具优势更具优势,将有效提升多个,将有效提升多个 A AI I 处理器协同训练的能力处理器协同训练的能力。表表9 9:H HCCSCCS 接口与接口与 N NVLVLinkink、P PCICIe e 5.05.0 对比对比 资料来源:CSDN,NVIDIA 云数据中心,Atlas 800 训练服务器技术白皮书,国投证券研究中心 CANNCANN 是是华为华为针对针对 AIAI 场景推出的异构计算架构,通过提供多层次的编程接口,支持用户快速场景推出的异构计算架构,通过提供多层次的编程接口,支持用户快速构建构建基于异腾平台的基于异腾平台的 AIAI 应用和业务。应用和业务。CANN

56、 支持端边云全场景协同,支持超过 10 种设备形态、EMUI、Andriod、openEuler、UOS、Ubuntu、Debian、Suse 等超过 14 种操作系统和多种AI 计算框架,一套体系支持 CPU、NPU 等架构;类型类型 链路数链路数 带宽带宽 H HCCSCCS 单个单个 A AI I 处理器提供处理器提供 3 3 条条链链路路 每个每个 A AI I 处理器间处理器间双向互联带宽双向互联带宽 6 60GB/0GB/s s(3 3 条链路)条链路)N NVLVLinkink 最大提供最大提供 1 18 8 条链路条链路 单链路双向互联带宽为单链路双向互联带宽为 50GB/50

57、GB/s s,1 18 8 条链路共计条链路共计 9 900GB/00GB/s s P PCICIe e 5.05.0 最多提供最多提供 1 16 6 条链路条链路 单链路双向互联带宽单链路双向互联带宽 8 8GB/GB/s s,1 16 6 条链路共计条链路共计 1 128GB/28GB/s s 行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。14 图图7.7.CANN 生态生态 资料来源:华为云-开发者社区-昇腾 AI 基础知识介绍,国投证券研究中心 软件生态建设是华为的一大优势软件生态建设是华为的一大优势。为了帮助 AI 开发者更简单、更高效的开发

58、和使用 AI 技术,华为推出面向全流程开发工具链 MindStudio。MindStudio 针对算子开发、模型训练、模型推理、应用开发、应用部署的所有全流程工具链进行整合,为开发者提供工程管理、编译、调试、运行、性能分析等全流程开发,提高开发效率。3.2.3.2.基于“自研芯片基于“自研芯片+自研接口自研接口+自研软件生态”,华为推出全系列解决方案自研软件生态”,华为推出全系列解决方案 供供开发者使用的高性能开发板开发者使用的高性能开发板 AtlasAtlas 200 DK200 DK,Atlas 200 DK 开发者套件(型号 3000)是以Atlas 200 AI 加速模块(型号 300

59、0)为核心的开发者板形态终端类产品(其中 Atlas 200 AI加速模块是高性能 AI 计算模块,集成了昇腾 310 AI 处理器,芯片内置 2 个 AI core,可支持 128 位宽的 LPDDR4X,最大算力为 22TOPS)。行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。15 表表1010:A Atlastlas 200 DK 200 DK 开发者套件硬件规格开发者套件硬件规格 资料来源:华为昇腾产品技术白皮书,国投证券研究中心 训练训练卡卡 A Atlas 300 Ttlas 300 T。Atlas 300 T 训练卡(型号 9000)可以

60、配合服务器为数据中心提供 AI加速卡,单卡最高可提供 220 TFLOPS FP16 算力。产品具有强算力、高度集成、高速带宽等特点,可满足大量人工智能训练以及高性能计算领域的算力需求。表表1111:AtlasAtlas 300 T300 T 训练卡(型号训练卡(型号 9 9000000)硬件规格)硬件规格 特征特征 规格规格 A AI I 处理器(昇腾处理器(昇腾 9 910 AI10 AI 处理器)处理器)3 30 0 个达芬奇个达芬奇 A AI CI Coreore+1616 个个 TaiTaiS Shanhan 核核 内存规格内存规格 3 32GB HBM2GB HBM 1 16GB

61、DDR46GB DDR4 2 2400M400Mbpsbps 支持支持 E ECCCC(ErrorError Connection CodeConnection Code)A AI I 算力算力 半精度(半精度(F FP16P16):最大):最大 2 220 TFLOPS20 TFLOPS 整数精度(整数精度(I INT8NT8):最大):最大 4 440 TOPS40 TOPS P PCICIe e 接口接口 P PCICIe e *16 G*16 Genen4.04.0 网络网络 1 1*100GE QSFP*100GE QSFP-DDDD 接口,支持接口,支持 RoRoCECE 协议协议

62、 资料来源:华为昇腾产品技术白皮书,国投证券研究中心 推理推理卡卡 AtlasAtlas 300 I 300 I。Atlas 300I 推理卡采用 4 个昇腾 310AI 处理器的 PCIe HHHL 卡,实现快速高效的推理计算、图像识别及视频处理等工作,支持多种规格的 H.264、H.265 视频编解码。特征特征 规格规格 A AI I 处理器(昇腾处理器(昇腾 3 310AI10AI 处理器)处理器)2 2 个个 DaDaVinci AI CoreVinci AI Core(达芬奇内核)(达芬奇内核)8 8 个个 A A55 A55 Armrm CoreCore(最大主频最大主频 1 1.

63、6GH.6GHz)z)A AI I 算力算力 半精度(半精度(F FP16P16):):4 4/8/11 TFLOPS/8/11 TFLOPS 整数精度(整数精度(I INT8NT8):):8 8/16/22 TOPS/16/22 TOPS 内存内存 类型:类型:L LPDDR4XPDDR4X 位宽:位宽:1 12828bitbit/64/64bitbit 容量:容量:8 8GB/4GBGB/4GB 速率:速率:3 3200M200Mbpsbps 支持支持 E ECCCC(ErrorError Correction CodeCorrection Code)千兆以太网接口:千兆以太网接口:1 1

64、 个个 G GE RJE RJ-4545 接口接口 接口接口 U USBSB 接口:接口:1 1 个个 U USB3.0 TSB3.0 Typeype C C 接口接口 1 1 个个 4 40 0pinpin IOIO 连接器,连接器,2 2 个个 M MIPIIPI 连接器,连接器,2 2 个板载麦克风个板载麦克风 行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。16 表表1212:Atlas 300I Atlas 300I 推理卡(型号推理卡(型号 30003000)硬件规格)硬件规格 数据来源:华为昇腾产品技术白皮书,国投证券研究中心 AtlasA

65、tlas 800 800 训练服务器训练服务器,8 8 颗昇腾算力芯片颗昇腾算力芯片+4 4 颗鲲鹏颗鲲鹏 C CPUPU。Atlas 800 训练服务器(型号:9000)是基于华为鲲鹏+昇腾处理器的 AI 训练服务器,具有超强算力密度、超高能效与高速网络带宽等特点。该服务器广泛应用于深度学习模型开发和训练,适用于智慧城市、智慧医疗、天文探索、石油勘探等需要大算力的行业领域。表表1313:Atlas 800 Atlas 800 训练服务训练服务器规格器规格 资料来源:华为昇腾产品技术白皮书,国投证券研究中心 特征特征 规格规格 A AI I 处理器(处理器(4 4 个昇腾个昇腾 3 310AI

66、10AI 处理器,每个处理器包含:)处理器,每个处理器包含:)2 2 个个 DaDaVinci AI CoreVinci AI Core(达芬奇内核)(达芬奇内核)8 8 个个 A A55 A55 Armrm CoreCore(最大主频最大主频 1 1.6GH.6GHz)z)A AI I 算力算力 半精度(半精度(F FP16P16):):4 44 TFLOPS4 TFLOPS 整数精度(整数精度(I INT8NT8):):88 TOPS88 TOPS 内存内存 类型:类型:L LPDDR4XPDDR4X 位宽:位宽:512512bitbit 容量:容量:32GB32GB 速率:速率:3 32

67、00M200Mbpsbps 总带宽:总带宽:2 204.8GB04.8GByteyte/s s 支持支持 ECCECC(Error Correction CodeError Correction Code)P PCICIe e 接口接口 PCIPCIe e3.0*83.0*8,兼容,兼容 P PCICIe e2.0/PCI2.0/PCIe e1.01.0 特征特征 规格规格 CPUCPU 4 4*鲲鹏鲲鹏 9 92020 处理器处理器 A AI I 处理器处理器 8*8*昇腾处理器昇腾处理器 内存规格内存规格 最多最多 3 32 2 个个 D DDR4DR4 内存插槽内存插槽 内存最高速率内存

68、最高速率 3 3200MT/s200MT/s 单根内存条容量支持单根内存条容量支持 1 16/32/64GB6/32/64GB P PCICIe e 拓展拓展 最多支持最多支持 2 2 个个 P PCICIe e 4.04.0 拓展插槽拓展插槽 功耗功耗 最大功耗最大功耗 5 5.6KW.6KW 行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。17 AtlasAtlas 800 800 推理服务器推理服务器,8 8 颗昇腾推理卡颗昇腾推理卡+2 2 颗鲲鹏颗鲲鹏 C CPUPU。Atlas 800 推理服务器(型号:3000)是基于昇腾处理器的推理服务器

69、,最大可支持 8 个 Atlas 300I 推理卡,提供强大的实时推理能力,广泛应用于中心侧 AI 推理场景。表表1414:AtlasAtlas 800 800 推理服务器硬件规格推理服务器硬件规格 资料来源:华为昇腾产品技术白皮书,国投证券研究中心 由数千颗昇腾处理器构成的由数千颗昇腾处理器构成的 A Atlastlas 900 AI 900 AI 集群。集群。Atlas 900 AI 集群由数千颗昇腾处理器构成,整合 HCCS、PCIe 4.0 和 100G RoCE 三种高速接口。其总算力达到 256P1024P FLOPS FP16,相当于 50 万台 PC 的计算能力。它可以在 60

70、 秒完成基于 Resnet-50 模型训练,比第2 名快 15%,这可以让使用者更快的进行 AI 训练,高效地推进预测天气、勘探石油、自动驾驶等等商用进程。图图8.8.Atlas 900 AI 集群集群 资料来源:华为昇腾开发者论坛,国投证券研究中心 特征特征 规格规格 C CPUPU 2*2*鲲鹏鲲鹏 9 92020 A AI I 加速卡加速卡 最大支持最大支持 8 8 个个 Atlas 300I Atlas 300I 推理卡推理卡 内存规格内存规格 鲲鹏鲲鹏 9 920 7260/525020 7260/5250:最多:最多 3 32 2 个个 D DDR4DR4 内存插槽内存插槽 P P

71、CICIe e 扩展槽位扩展槽位 鲲鹏鲲鹏 9 920 20 5220/32105220/3210:最多:最多 1 16 6 个个 D DDR4DR4 内存插槽内存插槽 内存设计最大速率内存设计最大速率 2 2933MT/933MT/s s 单根内存条支持单根内存条支持 8 8/16/32/64/128GB/16/32/64/128GB 最多支持最多支持 9 9 个个 P PCICIe e4.0 PCI4.0 PCIe e 接口接口 端口端口 (1 1)前面板提供)前面板提供 2 2 个个 U USB 3.0SB 3.0 端口、端口、1 1 个个 D DB15 VGA B15 VGA 端口端口

72、 (2 2)后面板提供)后面板提供 2 2 个个 U USB3.0SB3.0 端口,端口,1 1 个个 D DB15 VGAB15 VGA 端口、端口、1 1 个个 R RJ45J45 管理串口、管理串口、1 1 个个 R RJ45J45 管理网口管理网口 显卡显卡 显卡芯片集成在显卡芯片集成在 i iBMCBMC 管理芯片中,提供管理芯片中,提供 3 32MB2MB 显存,支持最高显存,支持最高 6 60H0Hz z 频率下频率下 1 16M6M 色彩的最大分辨率是色彩的最大分辨率是 1 1920*1080920*1080 像素像素 行业专题行业专题/电子电子 本报告版权属于国投证券股份有限

73、公司,各项声明请参见报告尾页。18 4.4.科技巨头纷纷布局算力芯片,科技巨头纷纷布局算力芯片,A AI I 浪潮势不可挡浪潮势不可挡 4.1.4.1.AMDAMD 的“的“M MI I 系列系列+Infinity FabricInfinity Fabric+ROCROCm m 平台”,成为英伟达全球范围内最强平台”,成为英伟达全球范围内最强劲的对手劲的对手 Radeon InstinctRadeon Instinct 系列是系列是 AMDAMD 专为数据中心和企业市场推出的专为数据中心和企业市场推出的 GPUGPU 解决方案解决方案,旨在支持深度,旨在支持深度学习、高性能计算和科学研究等学习

74、、高性能计算和科学研究等。从 2017 年发布 Radeon Instinct MI6,到如今更新至 Radeon Instinct MI300 系列,采用高性能的 GCN 或 RDNA 架构,支持大规模的并行计算和机器学习任务。同时支持 ROCm(Radeon Open Compute)平台,以提供开发和部署机器学习模型的工具和库。表表1515:AMD RedeonAMD Redeon InstinctInstinct 系列产品迭代系列产品迭代 型号型号 发布日期发布日期 GPUGPU 架构架构 光刻光刻 显存规格显存规格 峰值功耗峰值功耗 计算单元计算单元 峰值性能峰值性能(FPFP161

75、6)MI6 06/2017 Polaris 14nm FinFET 16GB(GDDR5)150W 5.73 TFLOPS MI8 06/2017 GCN 3rd Gen 28nm 4GB(HBM)175W 8.19 TFLOPS MI25 06/2017 Vega 14nm FinFET 16GB(HBM2)300W 64 24.6 TFLOPS MI60 11/18/2018 Vega20 TSMC 7nm FinFET 32GB(HBM2)300W 64 29.5 TFLOPS MI50(16GB/32GB)11/18/2018 Vega20 TSMC 7nm FinFET 16GB/3

76、2GB(HBM2)300W 60 26.5 TFLOPS MI100 11/16/2020 CDNA TSMC 7nm FinFET 32GB(HBM2)300W 120 184.6 TFLOPS MI250 11/08/2021 CDNA2 TSMC 6nm FinFET 128GB(HBM2e)560W 208 362.1 TFLOPS MI250X 11/08/20221 CDNA2 TSMC 6nm FinFET 128GB(HBM2e)560W 220 383 TFLOPS MI210 03/22/2022 CDNA2 TSMC 6nm FinFET 64GB(HBM2e)300W

77、104 181 TFLOPS MI300X 06/13/2023 CDNA3 TSMC 5nm FinFET 192GB(HBM3)800W 320 2615 TFLOPS 资料来源:AMD 官网,国投证券研究中心 2 2023023 年年 AMDAMD 公司推出公司推出 R Radeon Instinct MI300adeon Instinct MI300 系列,正式系列,正式迈进迈进“百亿亿级计算百亿亿级计算”时代时代。AMD Instinct MI300 系列加速器基于 AMD CDNA 3 架构打造,包括 AMD Instinct MI300A APU 加速器(创新的 AI 和 HPC

78、 工作负载专用 APU)和 AMD Instinct MI300X GPU 加速器,可为广泛的AI和HPC工作负载提供领先的应用程序性能。随着 AI 工作负载的扩展,AMD Instinct MI300X 加速器提供了采用 UBB 业界标准 OCP 平台设计的普适性解决方案,支持客户将 8 个 GPU 整合为一个性能主导型节点,并且具有全互联式点对点环形设计,单一平台内的 HBM3 显存总计可达到 1.5 TB提供足以应对各类 AI 或 HPC 工作负载部署的性能密集型解决方案。20232023 年年 6 6 月,月,AMDAMD 首席执行官苏姿丰(首席执行官苏姿丰(Lisa SuLisa S

79、u)在旧金山举行的发布会上表示)在旧金山举行的发布会上表示,M MI I300X300X 提提供的供的 HBMHBM 密度最高是英伟达密度最高是英伟达 AlAl 芯片芯片 H100H100 的的 2.42.4 倍,其倍,其 HBMHBM 带宽最高是带宽最高是 H100H100 的的 1.61.6 倍。倍。MI300X 是针对 LLM 的优化版,拥有 192GB 的 HBM3 内存、5.2TB/秒的带宽和 896GB/秒的Infinity Fabric 带宽。AMD 将 1530 亿个晶体管集成在共 12 个 5 纳米的小芯片中。Infinity FabricInfinity Fabric 是是

80、 A AMDMD 的高速接口技术,的高速接口技术,用于连接用于连接 CPUCPU 和和 GPUGPU 内部的不同部分,以及连接内部的不同部分,以及连接不同的不同的 CPUCPU 和和 GPUGPU,理论理论峰值峰值 P2P I/O P2P I/O 带宽最高可达带宽最高可达 896 GB/s896 GB/s,与,与 NV LinkNV Link 旗鼓相当。旗鼓相当。多达 8 个 Infinity Fabric 链接将 AMD Instinct MI300X 与节点中的第三代 EPYC 处理器和其他 GPU 相连,以实现统一的 CPU 内存/GPU 显存一致性和系统吞吐量最大化,通过加速器的强大性

81、能使 CPU 代码更简化。行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。19 表表1616:AMD RedeonAMD Redeon InstinctInstinct MIMI300300X X 对比对比 NVIDIANVIDIA H H100 100 SXMSXM 型号型号 发布日期发布日期 GPUGPU 架构架构 显存规格显存规格 互联技术互联技术 接口传输速率接口传输速率 峰值性能(峰值性能(FPFP1616)AMD Radeon Instinct MI300X 06/13/2023 CDNA3 192GB NV Link 896GB/s 261

82、5 TFLOPS NVIDIA H100 SXM 03/22/2022 Hopper 80GB Infinity Fabric 900GB/s 1979 TFLOPS 资料来源:AMD 官网,NVIDIA 官网,国投证券研究中心 ROCmROCm 是一个开源项目,支持多种加速器厂商和架构,提供了开放的可移植性和互操作性是一个开源项目,支持多种加速器厂商和架构,提供了开放的可移植性和互操作性。作为一个开源平台,任何 CPU/GPU 供应商都可以利用 ROCm,这意味着用 CUDA 或其他平台编写的代码可以移植到供应商中立的 HIP 格式,用户可以从那里为 ROCm 平台编译代码。ROCm ROC

83、m 平台平台针针对对 AMDAMD 的的 RedeonRedeon InstinctInstinct 系列有优化系列有优化,并对主流机器学习框架都有所支持,并对主流机器学习框架都有所支持。AMD 将 AI 方案部署到 Radeon Instinct 系列上,使开发者可以使用 ROCm 平台在 Radeon Instinct 系列上实现更加高效和稳定的运行。同时,ROCm 平台提供了对 TensorFlow 和 PyTorch 等主要机器学习框架的原生支持,从优化的 MIOpen 库到全面的 MIVisionX 计算机视觉和机器智能库、实用程序和应用程序,AMD 与人工智能开放社区广泛合作,以促

84、进和扩展机器和深度学习功能和优化,从而帮助扩大加速计算所适用的工作负载。表表1717:AMDAMD 相关软件生态相关软件生态 其他相关软件其他相关软件 功能功能 MIGraphX 图优化和编译器框架,提供高性能的模型执行 Radeon ML 机器学习库,提供针对 AMD GPU 和 CPU 的机器学习算法 Infinity Hub 云端 AI 服务平台,提供一站式的 AI 资源管理、训练、推理、部署等功能 Optimized Frameworks 提供优化后的 AI 框架,提高在 AMD GPU 上的性能和兼容性,提供预训练模型和示例代码 资料来源:AMD 官网,国投证券研究中心 图图9.9.

85、AMD ROCm 软件堆栈框架软件堆栈框架 资料来源:AMD 官网,国投证券研究中心 行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。20 但在生态系统和性能上,但在生态系统和性能上,ROCmROCm 还和还和 CUDACUDA 有一定差距。有一定差距。相比于 NVIDIA 的 CUDA,ROCm 的生态系统相对较弱,且只支持 Linux,同时更新速度较慢,生态不够完善。而在性能上,在大部分应用场景中,尽管在测试中 MI 系列的理论性能高于 NVIDIA 的加速器,但由于 ROCm 平台的优化问题,AMD 的程序性能普遍低于 NVIDIA。4.2.4.2

86、.特斯拉特斯拉自研自研 D Dojoojo 超算超算服务器,芯片间高带宽互连为其一大特色服务器,芯片间高带宽互连为其一大特色 特斯拉自研宏、微架构提高运行效率与可编程性特斯拉自研宏、微架构提高运行效率与可编程性,D D1 1 芯片在算力、互联带宽具有很强的优势芯片在算力、互联带宽具有很强的优势。与 Nvidia,Google 等厂商的计算集群相比,Dojo 在互连、内存访问以及互联和内存访问的IO 上是对称的,这就使得其具有独一档的 Scale Out(横向拓展)的能力,从而提高系统运行效率。微架构上,D1 芯片内部核心 Training Node 采用了图灵完备的 SMT+SIMD 设计,其

87、可编程性有可能会强于英伟达的 Tensor Core 架构和华为的 Cube 架构,并且为每一个 Node 设计了上下左右各 64bit 的片上 NoC 通道,这使得 Node 之间核心堆叠和数据传输的难度大大降低。D1 芯片采用台积电 7nm 制程,算力达 22.6TFLOPS,总互连带宽可达 16TB/s,远超英伟达 A100 的 600GB/s、华为昇腾 910 的 90GB/s。其组成的机柜集群 Dojo ExaPOD 算力在 BF16/FP32 精度下可达到 1.1ExaFLOPs,相当于约 3200 片 A100 的算力,并拥有 1.3TB的高速 SRAM 和 13TB 的高带宽

88、DRAM。同时,美国时间 2023 年 8 月 28 日,特斯拉上线了由 1万片 H100 组成的超级计算机,将用来训练包括 FSD 自动驾驶系统在内的各种 AI 应用。目前,特斯拉的 AI 训练方向主要为自动驾驶,其硬件 Hardware 4.0 已经搭载自研 FSD 2.0。表表1818:D Dojo ExaPODojo ExaPOD 算力在算力在 B BF16/FP32F16/FP32 精度下可达精度下可达 1 1.1ExaFLOPs.1ExaFLOPs 名称名称 算力算力 片上片上 S SRAMRAM 说明说明 C Coreore 1.02TFLOPs 1.25MB 单个计算核心,Do

89、jo 最小单位 D D1 1 362TFLOPs 442.5MB 单芯片 D1 由 354 个实际运转 Core 构成 T Tileile 9.05PFLOPs 11GB 单枚训练模组 Dojo Tile 由 25 个 D1 芯片构成 T Trayray 54.3PFLOPs 66GB Dojo Tray 由 6 个 Tile 构成 C Cabinetabinet 108.6PFLOPs 133GB Dojo Cabinet 由 2 个 Tray 构成 E ExaPODxaPOD 1.1EFLOPs 1.33TB 单个训练集群 Dojo ExaPOD 由 10 个 Cabinet 构成 包含

90、3000 个 D1,120 个训练板块 资料来源:特斯拉 AI DAY,国投证券研究中心 特斯拉将加快特斯拉将加快 D Dojoojo 建设更新,全新版本建设更新,全新版本 D Dojoojo 性能将提升近十倍。性能将提升近十倍。据特斯拉 AI 官方账号在Twitter上披露的算力预期图显示,预计在2024年10月,Dojo整体算力规模达到100EFLOPs,相当于约 30 万块 A100 的算力总和。在 2022 年 AI Day 上,特斯拉公布了 Dojo 的未来路线规划,同时宣布公司正在研发全新版本的 Dojo 构建,包括 Dojo D2 芯片、Dojo Training Tile V2

91、、Dip V2 和 DNIC V2。通过硬件研发更新,全新版本 Dojo 超级计算机将在性能上提升近十倍。马斯克在 Twitter 上曾表示,Dojo V1 主要面向大量的视频数据训练而优化,并不是面向通用人工智能(AGI),但 Dojo V2 将突破这一点。因此,Dojo 未来有望成为特斯拉的 AI 支柱,依靠其强大算力,特斯拉拥有的海量数据将充分释放其功能,Dojo 可全方面促进特斯拉前沿科技领域如自动驾驶、人形机器人、SpaceX 等领域。行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。21 图图10.10.特斯拉特斯拉 Dojo 的整体算力规模的

92、整体算力规模将将达到达到 100EFLOPs 图图11.11.Dojo 未来路线图未来路线图 资料来源:公司官网,国投证券研究中心 资料来源:公司官网,国投证券研究中心 自主研发自主研发 F FSD2.0SD2.0 芯片推动芯片推动 H HW4.0W4.0 更新,助力特斯拉自动驾驶突破。更新,助力特斯拉自动驾驶突破。特斯拉在自动驾驶领域多年来不断探索,处于行业前列,其依赖于 FSD 芯片与 HW 硬件。2023 年 2 月 HW4.0 发布,其搭载了 FSD2.0 芯片。FSD2.0 芯片的 ARM Cortex-A72 CPU 内核由 12 个增加至 20 个,运行频率在 1.37GHz-2

93、.35GHz 之间,采用 7nm 工艺,算力预测最多达到 216TOPS,仍低于英伟达Orin254TOPS。显存方面,特斯拉成为第一个在车载领域用 GDRR 的公司。通过 FSD2.0 芯片更新升级以及 HW4.0 架构调整,特斯拉自动驾驶有望突破。表表1919:D Dojo ExaPODojo ExaPOD 算力在算力在 B BF16/FP32F16/FP32 精度下可达精度下可达 1 1.1ExaFLOPs.1ExaFLOPs 项目项目 H HW1.0W1.0 H HW2.0W2.0 HW3.0 H HW4.0W4.0 发布时间 2014 年 9 月 2016 年 10 月 2019 年

94、 4 月 2023 年 2 月 制程 40nm 16nm 14nm 7nm 核心处理器 Mobileye EyeQ3*1 Nvidia Parker SoC*1 Nvidia Pascal GPU*1 英飞凌 TriCore MCU*1 FSD1.0*2(CPU 核*4*3)NPU*2 FSD2.0*2(CPU 核*4*5)NPU*3 ROM 256 兆字节 6GB LPDDR4 8*2GB GDDR6 16*2GB 算力 0.256TOPS 21TOPS 144TOPS(双芯片)216TOPS(预测)(双芯片)通讯接口 N/A N/A 1 个以太网接口 2 个以太网接口 资料来源:汽车之心,

95、国投证券研究中心 4.3.4.3.IntelIntel 推出推出 G GPUPU 系列系列芯片和芯片和 oneoneAPIAPI 开发平台开发平台,完善其,完善其 A AI I 数据中心布局数据中心布局 英特尔在数据中心的布局主要通过优化其至强系列英特尔在数据中心的布局主要通过优化其至强系列CPUCPU与推出数据中心与推出数据中心GPUGPU maxmax系列和系列和flaxflax系列以及系列以及对标对标 DPUDPU 的的 IPUIPU 数据接口芯片数据接口芯片来实现来实现。在英特尔 2022 年投资者会议上,英特尔 DCAI 公布了2022年至2024年下一代英特尔至强产品的路线图。数据

96、中心GPUmax系列有max1550与 max1100 两个系列,其专为 AI 和科学计算领域的数据密集型计算模型提供突破性性能。在 2021 年 6 月,英特尔首度提出 IPU 的产品概念。IPU 可以释放 CPU 的计算资源,以便于解决现代工作负载挑战,帮助提升云服务的性能。英特尔 IPU 既有基于 FPGA 的方案,如 Oak Springs Canyon,也有基于 ASIC 的方案,如 Mount Evans。行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。22 图图12.12.英特尔英特尔至强产品的路线图至强产品的路线图 图图13.13.英特尔

97、数据中心英特尔数据中心 GPUmax 系列参数系列参数 资料来源:公司官网,国投证券研究中心 资料来源:公司官网,国投证券研究中心 在软件生态上,英特尔推出了与在软件生态上,英特尔推出了与英伟达的英伟达的 CUDACUDA 和和 AMDAMD 的的 ROCmROCm 对标的对标的 oneAPIoneAPI。oneAPI 是由英特尔提出的一种开放的、统一的编程模型,它旨在简化在英特尔芯片上进行并行计算的复杂性。优点是它可以跨 CPU、GPU、FPGA 和其他硬件架构运行。通过这种方式,一套代码就可以应用于多种硬件平台,实现跨平台的并行计算,大大提高了开发效率和应用性能,其精简程度对标英伟达 CU

98、DA 架构与 AMD 的 ROCm。图图14.14.OneAPI 架构架构 资料来源:英特尔 OneAPI 规范 1.3 版本原文,国投证券研究中心 4.4.4.4.GoogleGoogle 推出推出 C Cloudloud TPUTPU 解决方案,更专注于机器学习领域解决方案,更专注于机器学习领域 G Googleoogle Cloud TPU Cloud TPU v5ev5e 专为提供大中型训练与推理所需的成本效益和性能而设计专为提供大中型训练与推理所需的成本效益和性能而设计。性能上,TPU v5e 能够平衡性能、灵活性和效率,允许多达 256 个芯片互连,聚合带宽超过 400 Tb/s和

99、 100 petaOps 的 INT8 性能,更加高的带宽,对于大模型的数据传输非常有利。Cloud TPU v5e 通过基准测试显示,大模型的训练速度提高了 5 倍。在推理指标方面,Cloud TPU v5e 也实现了巨大的提升,能够每秒实时处理 1000 秒的内部语音到文本和情感预测模型。行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。23 图图15.15.TPU v5e 芯片互联效率提升芯片互联效率提升 资料来源:谷歌数据中心,国投证券研究中心 和英伟达通用型和英伟达通用型 G GPUPU 相比相比,谷,谷歌歌 TPUTPU 更加更加专注深度学习领

100、域专注深度学习领域,可加快深度学习运算速度,降,可加快深度学习运算速度,降低功耗。低功耗。英伟达的 A100 和 H100 属于广义上的通用型 GPU,GPU 具有通用计算能力,适用于高性能计算、深度学习以及大规模数据分析等多种计算工作负载,而不仅仅是深度学习。谷歌 TPU 采用低精度计算,在几乎不影响深度学习处理效果的前提下大幅降低了功耗、加快运算速度,尤其对于中型 LLM 设计者来说完全够用,因此他们可能不需要依赖高性能的英伟达A100/H100。同时,TPU 使用了脉动阵列等设计来优化矩阵乘法与卷积运算。表表2020:G Google TPU v5eoogle TPU v5e 对比对比

101、NVIDIANVIDIA H H100 100 SXMSXM 型号型号 发布日期发布日期 显存规格显存规格 峰值性能(峰值性能(FPFP1616)Google TPU v5e 2023 95GB 459 TFLOPS NVIDIA H100 SXM 2022 80GB 1979 TFLOPS 资料来源:谷歌数据中心,NVIDIA 官网,国投证券研究中心 TensorFlowTensorFlow 框架的广泛框架的广泛性、泛用性性、泛用性为为 GoogleGoogle 构筑构筑 AIAI 护城河。护城河。TensorFlow 是由 Google 团队开发的最重要的深度学习框架,也是全世界使用人数最

102、多、社区最为庞大的一个框架。Tensorflow 灵活的架构可以部署在一个或多个 CPU、GPU 的台式及服务器中,支持多家 NVIDIA、AMD 等多家厂商的 GPU 加速器,或者使用单一的 API 应用在移动设备中。表表2121:G Google TPU v5eoogle TPU v5e 对比对比 NVIDIANVIDIA H H100 100 SXMSXM 其他相关软件其他相关软件 功能功能 Cloud AI Platform 一个云端的 AI 服务平台,提供了一系列的工具和服务,包括数据标注、数据集管理、模型管理、自动化机器学习、在线预测、批量预测等 BigQuery ML 一种在 B

103、igQuery 中直接使用 SQL 语句进行机器学习的功能,可以利用 BigQuery 的强大的数据分析能力,快速创建和部署机器学习模型 AI Hub 一个在线的 AI 资源库,可以分享和发现各种 AI 相关的资产,如数据集、模型、管道、笔记本等 Kubeflow 一个基于 Kubernetes 的开源平台,可以轻松地构建可移植和可扩展的机器学习工作流 资料来源:谷歌数据中心,TensorFlow 官网,国投证券研究中心 GoogleGoogle 以软件优势带动硬件发展,以以软件优势带动硬件发展,以 TensorFlowTensorFlow 框架助力框架助力 CloudCloud TPUTPU

104、。Google 的 Cloud TPU系列加速器经过优化,可加速和扩展使用 TensorFlow 编程的特定 ML 工作负载。Cloud TPU 还简化了对 ML 计算资源的计算和管理,可使得 ML 模型加速最优化,并根据需求动态调整容量;Cloud TPU 的大规模、高集群的 ML 模型已经过多年优化,无需投入专门的能源、冷却、网络和存储设备等方面的精力、时间和专业知识来进行设计、安装和维护。行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。24 图图16.16.TensorFlow 详细架构详细架构 资料来源:alanhou 网,国投证券研究中心 4.

105、5.4.5.M Metaeta 20202020 年推出第一代年推出第一代 M MTIATIA 方案,侧重于处理低方案,侧重于处理低/中复杂度模型中复杂度模型 作为 Facebook 母公司,META 在 AR/VR 头显全球市场上有明显份额优势,并开发有 Llama 2、Falcon 40B、Stable Diffusion 等 LLM 模型;为实现差异化竞争、提高公司核心实力,META在 AI、AR 芯片生态领域持续探索自研,目前已推出 AI 推理定制芯片 MTIA v1、RSC 超算集群与深度学习框架 Pytorch、Caffe2go 等。2020 年年 Meta 推出第一代推出第一代

106、MTIA 全栈解决方案,包括全栈解决方案,包括 MTIA 芯片、芯片、PyTorch 与推荐模型,与推荐模型,目前侧重于处理低目前侧重于处理低/中复杂度的中复杂度的 AI 模型。模型。其中,加速器采用台积电 7nm 工艺制造,具备 800 MHz 的运行功率,在 INT8、FP16 精度下分别能够提供 102.4 TOPS、51.2 TFLOPS 算力。MTIA 第一代致力于提高推荐模型效率、应用于广告及其他新闻推送,采用开源芯片架构RISC-V,功耗仅有 25 瓦,远低于英伟达等主流厂商的芯片产品;在基准测试中第一代 MTIA芯片处理低处理低/中中等复杂度的等复杂度的 AI 模型效率高于模型

107、效率高于 GPU,在这方面相较竞品芯片有明显优势。图图17.17.MITA V1 图图18.18.MTIA 的深度学习推荐模型(的深度学习推荐模型(DLRM)端到端性能结果)端到端性能结果 资料来源:Meta 官网,国投证券研究中心 资料来源:Meta 官网,国投证券研究中心 根据根据 Facebook 官网披露,官网披露,RSC AI 服务器系列由服务器系列由 META 与与 Penguin Computing、英伟达、英伟达、Pure Storage 合作组装,于合作组装,于 2022 年年 1 月首次亮相月首次亮相。目前,RSC 包含 2000 个英伟达 DGX A100 系统和 160

108、00 个英伟达 A100 GPU,能实现近 5 exaflops 的混合精度算力,已用于推动包括生成式 AI 在内的多领域前沿研究。Meta 将 RSC 应用于训练有 650 亿参数的大语言模型 LLaMA 并将该模型作为门控版本分享给研究社区,以帮助研究人员在无大量硬件的情况下对特定任务进行研究、微调。行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。25 图图19.19.AI RSC 与基于与基于 V100 的集群的集群的运算速度对比的运算速度对比 图图20.20.RSC 计算性能计算性能 资料来源:Meta 官网,国投证券研究中心 资料来源:Meta

109、 官网,国投证券研究中心 5.5.A AI I 产业带动国内算力数据中心建设,大规模招标陆续启动产业带动国内算力数据中心建设,大规模招标陆续启动 AIAI 产业崛起产业崛起,国产国产 AIAI 芯片和服务器的芯片和服务器的需求在需求在快速快速增长。增长。2023 年 11 月 29 日,在 AICC 2023中国人工智能算力大会上,国际数据公司(IDC)与浪潮信息联合发布2023-2024 中国人工智能计算力发展评估报告。根据报告,2023 年中国 AI 服务器市场规模将达 91 亿美元,同比增长 82.5%,智能算力规模预计达到 414.1EFLOPS,同比增长 59.3%。在 GPU、CP

110、U 领域,国产厂商如华为、中科曙光、兆芯、海光等纷纷推出自主研发的芯片产品,打破了国外厂商在高端芯片市场的垄断。在算力需求不断增长的大背景下,数据中心的建设也在加速进行。新技术和新应用的快速发展,如工业互联网、云计算、大数据等,加上 ChatGPT 技术的推广,对数据资源的存储、计算和应用需求提出了更高要求。国内外的数据中心建设有望迎来一个高峰期。根据新型数据中心发展三年行动计划(2021-2023 年)、数字中国发展报告(2022 年)以及共研产业咨询数据,到 2023 年,我国数据中心机架行业市场规模将达到 750 万架,市场规模预计将达到 2470.1 亿元人民币。图图21.21.202

111、2 年中国人工智能芯片规模占比年中国人工智能芯片规模占比 资料来源:IDC、国投证券研究中心 89.00%9.60%1.00%0.40%GPUGPUNPUNPUASICASICFRGAFRGA 行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。26 根据各大科技巨头公布的自研芯片性能参数,我们把运算性能用半精度 FP16 或 FP32 来统一比较,得到表格如下:表表2222:各厂商芯片性能对比各厂商芯片性能对比 产品产品 推出时间推出时间 半精度半精度 F FP16/TFLOPSP16/TFLOPS 昇腾 910 2019 年 8 月 23 日 360 T

112、FLOPS V100 2017 年 5 月 11 日 28 TFLOPS A100 2020 年 5 月 312 TFLOPS H100 2022 年 3 月 22 日 1979 TFLOPS H200 2023 年 11 月 13 日 1979 TFLOPS 思元 590 2023 年 4 月 18 日 312 TFLOPS 壁仞 BR100 2023 年 8 月 9 日 256 FP32 TFLOPS 海光 DCU8100-70%*312 TFLOPS 沐曦 MXC500 2023 年 6 月 13 日 FP32 15TFLOPS Dojo D1 2021 年 8 月 19 日 FP32

113、22.6 TFLOPS AMD MI300X 2023 年 12 月 7 日 FP32 45.3 RFLOPS 资料来源:各公司官网,国投证券研究中 2 2023023 年年 1 10 0 月月 1 15 5 日,中国电信官网披露,日,中国电信官网披露,AIAI 算力服务器(算力服务器(20 年)集中采购年)集中采购项目总计项目总计4 4157157 台,预计采购总额超过台,预计采购总额超过 8 80 0 亿元,根据评审结果,超聚变、浪潮、新华三等厂商入围,亿元,根据评审结果,超聚变、浪潮、新华三等厂商入围,并并显著增加了对训练型服务器的投资。显著增加了对训练型服

114、务器的投资。这一采购规模与 2021-2022 年仅采购 1268 台 GPU 型服务器相比,有显著增长。图图22.22.2023-2024 中国电信中国电信 AI 算力服务器集采中标候选人表算力服务器集采中标候选人表 资料来源:中国电信官网、新浪科技、国投证券研究中心 行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。27 具体到各标包的分布,标包 1 和标包 2 均属于 I 系列服务器,包括 2073 台训练型风冷服务器、125 台训练型液冷服务器和 1182 台 InfiniBand 交换机。而标包 3 和标包 4 则为 G 系列服务器,分别包括 1

115、048 台训练型风冷服务器和 929 台训练型液冷服务器。中标厂商主要为国内服务器集成商,为国产芯片导入营造良好的环境。中标厂商主要为国内服务器集成商,为国产芯片导入营造良好的环境。超聚变、浪潮信息、紫光华山、宁畅、中兴通讯、烽火通信和联想在 I 系列风冷和液冷服务器的投标中各占一席之地,超聚变在风冷服务器和液冷服务器的中标金额和市场份额中均是第一。另一方面,在G 系列服务器的标包中,华鲲振宇、昆仑、烽火通信、宝德计算、新华三、湘江鲲鹏、DCN 和黄河信产等公司均成为中标候选人。表表2323:中国电信此次中国电信此次 AIAI 服务器集服务器集 4 4 个标包情况个标包情况 标包类别标包类别

116、企业名称企业名称 报价报价/中标金额(亿元)中标金额(亿元)份额份额 标包标包 1 1:训练型:训练型风冷服务器风冷服务器(I(I系列系列)超聚变 16.56 31%浪潮信息 11.75 22%紫光华山 8.6 16%宁畅 6.44 12%中兴通讯 5.38 10%烽火通信 2.64 5%联想 2.02 4%标包标包 2 2:训练型:训练型液冷服务器液冷服务器(I(I系列系列)超聚变 1.37 40%浪潮信息 1.03 30%紫光华山 0.68 20%宁畅 0.34 10%标包标包 3 3:训练型:训练型风冷服务器风冷服务器(G(G系列系列)华鲲振宇 13.05-昆仑 13.01-烽火通信 1

117、3.02-宝德计算 13.09-新华三 13.02-湘江鲲鹏 13-DCN 13.02-黄河信产 13.07-标包标包 4 4:训练型:训练型液冷服务器液冷服务器(G(G系列系列)华鲲振宇 14.77-昆仑 14.75-烽火通信 14.75-新华三 14.76-宝德计算 14.85-湘江鲲鹏 14.74-DCN 14.76-黄河信产 14.84-资料来源:中国电信公告,国投证券研究中心 行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。28 6.6.相关公司相关公司 6.1.6.1.兴森科技兴森科技 兴森科技是国内领先的印制电路板(PCB)样板及批量板的设

118、计和制造服务提供商,公司于2012 年开始涉足 CSP 封装基板领域,是国内 IC 封装基板行业的先行者之一。目前,公司在薄板加工能力和精细路线能力方面居于国内领先地位,并与国内外主流的芯片厂商、封装厂建立了合作关系,积极投入 FCBGA 封装基板领域。6.2.6.2.新益昌新益昌 新益昌是国内领先的 LED 和半导体固晶机综合解决方案提供商,随近年来 3C 电子产品需求增加,同时以云计算、大数据、新能源及可穿戴设备等为主的新型应用领域强劲需求下,半导体市场出现巨大需求。根据 WSTS 预测,2024 年全球半导体销售额预计可回升至 5760 亿美元。其中,半导体封装环节的重点是固晶及焊线环节

119、,固晶环节对设备的超高精度、定位能力具有极高的要求,技术壁垒很高,是公司的核心竞争力所在。根据公司 2023 半年报披露,公司凭借过硬的产品质量和技术创新能力以及配套服务能力,在半导体封装领域为晶导微、灿瑞科技、扬杰科技、通富微、固锝电子、华天科技等知名公司在内的庞大优质客户群体提供定制化服务。目前,公司半导体固晶设备近年来客户导入顺利,受到业内认可,业务收入快速增长,根据公司 12 月 27 日发布的自愿披露订单情况,公司截至 12 月 26 日,固晶机板块在手订单共计 4.13 亿元。图图23.23.兴森科技营收及同比增速兴森科技营收及同比增速 图图24.24.兴森科技归母净利润及同比增速

120、兴森科技归母净利润及同比增速 资料来源:Wind、国投证券研究中心 资料来源:Wind、国投证券研究中心 34.7338.0440.3550.4053.540.00%0.00%5.00%5.00%10.00%10.00%15.00%15.00%20.00%20.00%25.00%25.00%30.00%30.00%35.00%35.00%0.000.0010.0010.0020.0020.0030.0030.0040.0040.0050.0050.0060.0060.002000222营业收入营业收入(亿元)亿元)营业收入同比增

121、长率营业收入同比增长率销售毛利率销售毛利率2.152.925.226.215.260.00%0.00%5.00%5.00%10.00%10.00%15.00%15.00%20.00%20.00%0.000.001.001.002.002.003.003.004.004.005.005.006.006.007.007.002000222归母净利润(亿元)归母净利润(亿元)销售净利率销售净利率ROE(ROE(摊薄摊薄)行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。29 6.3.6.3.天承科

122、技天承科技 天承科技成立于 2010 年,主要经营 PCB 所需要的专用电子化学品的研发、生产和销售(功能湿电子化学品)。PCB 专用电子化学品专用性强、品种多,公司经过多年积累,目前技术已经涵盖水平沉铜、电镀、垂直沉铜、化学沉锡、去膜、棕化、粗化、微蚀等多个 PCB 制作工艺流程,技术指标与应用性能达到行业先进水平,能够满足下游厂商对于生产高频高速 PCB、HDI、多层软板及软硬结合板等高端 PCB 需求,同时公司也解决了触摸屏金属网格沉铜,品牌知名度较高。图图27.27.天承科技营收及同比增长天承科技营收及同比增长 资料来源:Wind,国投证券研究中心 6.4.6.4.德邦科技德邦科技 公

123、司以其在高端电子封装材料研发及产业化领域的专业实力,已被认定为国家级的专精特新“小巨人”企业,其业务聚焦于集成电路封装材料、智能终端封装材料、新能源应用材料及高端装备应用材料等四大类别。这些产品广泛用于不同的封装工艺环节和应用场景,如晶圆加工、芯片级封装、功率器件封装、板级封装、模组及系统集成封装等,在国家集成电路产1.682.573.753.74-10.00%-10.00%0.00%0.00%10.00%10.00%20.00%20.00%30.00%30.00%40.00%40.00%50.00%50.00%60.00%60.00%0 00.50.51 11.51.52 22.52.53

124、33.53.54 42002020222营业总收入(亿元)营业总收入(亿元)营业收入同比增长率营业收入同比增长率销售毛利率销售毛利率图图25.25.新益昌营收及同比增速新益昌营收及同比增速 图图26.26.新益昌归母净利润及同比增速新益昌归母净利润及同比增速 资料来源:Wind、国投证券研究中心 资料来源:Wind、国投证券研究中心 6.996.557.0411.9711.84-20.00%-20.00%-10.00%-10.00%0.00%0.00%10.00%10.00%20.00%20.00%30.00%30.00%40.00%40.00%50

125、.00%50.00%60.00%60.00%70.00%70.00%80.00%80.00%0 02 24 46 68 842000222营业总收入营业总收入/亿元亿元营业收入同比增长率营业收入同比增长率销售毛利率销售毛利率1.010.881.082.322.050.00%0.00%5.00%5.00%10.00%10.00%15.00%15.00%20.00%20.00%25.00%25.00%30.00%30.00%35.00%35.00%0 00.50.51 11.51.52 22.52.520182

126、0020202020222归母净利润归母净利润/亿元亿元销售净利率销售净利率ROEROE(摊薄)(摊薄)行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。30 业基金的重点支持下,已在集成电路封装、智能终端封装、动力电池封装、光伏叠瓦封装等领域取得显著的技术突破。图图28.28.德邦科技营收及同比增速德邦科技营收及同比增速(单位单位:亿亿元元)图图29.29.德邦科技归母净利润及同比增速德邦科技归母净利润及同比增速(单位单位:亿亿元元)资料来源:Wind,公司年报,国投证券研究中心 资料来源:Wind,公司年报,

127、国投证券研究中心 6.5.6.5.华海诚科华海诚科 公司是一家专注于半导体封装材料的研发及产业化的国家级专精特新“小巨人”企业,以其在环氧塑封料领域的显著成就而闻名。在先进封装领域,华海诚科也取得了显著进展。据公司业绩会披露,其应用于 QN 封装的产品已通过通富微电和长电科技等知名企业的验收,并开始小批量销售。此外,跟据公司招股书,FC 底填胶等多款产品也已进入小批量生产和销售阶段,而应用于 FCBGA 的产品和液态塑封材料(LMC)目前正处于客户验证阶段,2021 年,公司成为长电科技、华天科技等多家知名封装企业的主要内资供应商。图图30.30.华海诚科营收及同比增速华海诚科营收及同比增速(

128、单位单位:亿亿元元)图图31.31.华海诚科归母净利润及同比增速华海诚科归母净利润及同比增速(单位单位:亿亿元元)资料来源:Wind,公司年报,国投证券研究中心 资料来源:Wind,公司年报,国投证券研究中心 1.973.274.175.849.290.00%0.00%1000.00%1000.00%2000.00%2000.00%3000.00%3000.00%4000.00%4000.00%5000.00%5000.00%6000.00%6000.00%7000.00%7000.00%0 01 12 23 34 45 56 67 78 89 9820192019202

129、0202020222营业收入营业收入(亿元亿元)营收同比增长率营收同比增长率(%)(%)销售毛利率销售毛利率(%)(%)-0.020.360.50.761.23-400.00%-400.00%-200.00%-200.00%0.00%0.00%200.00%200.00%400.00%400.00%600.00%600.00%800.00%800.00%1000.00%1000.00%1200.00%1200.00%1400.00%1400.00%-0.2-0.20 00.20.20.40.40.60.60.80.81 11.21.21.41.420

130、00222归母净利润归母净利润(亿元亿元)销售净利率销售净利率(%)(%)ROE(ROE(摊薄摊薄)(%)(%)1.341.722.483.473.03-2000.00%-2000.00%-1000.00%-1000.00%0.00%0.00%1000.00%1000.00%2000.00%2000.00%3000.00%3000.00%4000.00%4000.00%5000.00%5000.00%0 00.50.51 11.51.52 22.52.53 33.53.54 4200021202120222

131、022营业收入营业收入(亿元亿元)营收同比增长率营收同比增长率(%)(%)销售毛利率销售毛利率(%)(%)0.020.040.270.480.410.00%0.00%500.00%500.00%1000.00%1000.00%1500.00%1500.00%2000.00%2000.00%2500.00%2500.00%3000.00%3000.00%0 00.10.10.20.20.30.30.40.40.50.50.60.62000222归母净利润归母净利润(亿元亿元)销售净利率销售净利率(%)(%)ROE(ROE(摊薄摊薄

132、)(%)(%)行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。31 6.6.6.6.英维克英维克 液冷系统是一种先进的散热技术,它通过利用液体的高导热系数,有效提升了散热效率,尤其在处理高功率、高热量的 AI 服务器和 GPU/CPU 等高性能计算设备时表现卓越。2005 年创立以来,深圳英维克公司在精密温控节能设备领域持续发展和创新,成为该领域在国内的技术领导者。最初,该公司专注于为信息和通信行业提供温控解决方案,产品范围涵盖了通信基站、户外机柜和数据中心节能空调等,根据公司 2020 年报披露,公司与华为、中兴等行业巨头建立了深入合作关系。2013

133、年,英维克洞察市场前景,进入储能温控领域,到2020 年,已牢固占据行业领先地位。2015 年,公司进一步扩张,设立深圳科泰,进军新能源车空调领域,并于 2018 年收购上海科泰,拓展至轨道交通领域。在不断拓宽温控解决方案的同时,公司通过构建平台化解决方案,发挥了协同效应,增强了市场竞争力。图图32.32.英维克营收及同比增速英维克营收及同比增速(单位单位:亿亿元元)图图33.33.英维克归母净利润及同比增速英维克归母净利润及同比增速(单位单位:亿亿元元)资料来源:Wind,公司年报,国投证券研究中心 资料来源:Wind,公司年报,国投证券研究中心 6.7.6.7.飞荣达飞荣达 自 1993

134、年成立以来,公司在电子辅料产品生产领域取得了显著发展。自 2000 年开始,公司着手开发国际主流品牌的电磁屏蔽和导热材料与相关散热解决方案,逐步扩展其产品线至金属屏蔽器件、导电布衬垫、导热界面器件等,拓展应用至计算机和手机等高端领域。据公司公告与 2022 年年报,在通信基站领域,通过与中兴通讯的合作,公司成功开发并试制了 3D VC 技术样机,标志着 5G 基站首次采用这一先进的散热技术。在服务器领域,飞荣达向包括华为和超聚变在内的多个知名客户提供了一系列散热与电磁屏蔽解决方案和产品。其产品线涵盖单相和两相液冷模组、轴流风扇以及专门设计的散热器等,以满足客户多样化的散热需求。公司不仅拥有华为

135、、中兴、微软等国内外大型企业客户,还成功扩展至 Facebook 和 Google等全球知名企业。这一广泛的客户基础证明了其产品的实力和市场认可度。飞荣达的优势还体现在其完整的散热产业链布局上,公司不仅在散热器件和材料领域具有强劲竞争力,而且上下游一体化的产业链布局进一步增强了公司在整个散热行业的综合竞争优势。随着液冷散热市场的不断扩大及市场潜力逐步释放,飞荣达有望获得显著的市场机遇。10.703513.375417.033422.282229.23180.00%0.00%500.00%500.00%1000.00%1000.00%1500.00%1500.00%2000.00%2000.00

136、%2500.00%2500.00%3000.00%3000.00%3500.00%3500.00%4000.00%4000.00%0 05 502525303035352000222营业收入营业收入(亿元亿元)营业收入同比增长率营业收入同比增长率(%)(%)销售毛利率销售毛利率(%)(%)1.07791.6011.81682.05052.80280.00%0.00%200.00%200.00%400.00%400.00%600.00%600.00%800.00%800.00%1000.00%1000.00%

137、1200.00%1200.00%1400.00%1400.00%0 00.50.51 11.51.52 22.52.53 32000222归母净利润归母净利润(亿元亿元)销售净利率销售净利率(%)(%)ROE(ROE(摊薄摊薄)行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。32 图图34.34.飞荣达营收及同比增速飞荣达营收及同比增速(单位单位:亿亿元元)图图35.35.飞荣达归母净利润及同比增速飞荣达归母净利润及同比增速(单位单位:亿亿元元)资料来源:Wind,公司年报,国投证券研究中

138、心 资料来源:Wind,公司年报,国投证券研究中心 6.8.6.8.思泉新材思泉新材 思泉新材是一家专注于热管理材料的多元化功能性材料提供商,在电子电气产品稳定性及可靠性提升方面表现卓越。其主营业务包括研发、生产和销售热管理材料、磁性材料、纳米防护材料等。作为国内电子电气功能性材料领域的领先高新技术企业,思泉新材在自主研发和技术创新方面具有显著优势。公司在行业内获得了多项殊荣和认可,包括“专精特新小巨人企业”称号和“2021 年广东省专精特新中小企业”。此外,思泉新材还拥有“广东省石墨散热复合材料工程技术研究中心”和“广东省博士工作站”,并被认定为“2020 年度广东省知识产权示范企业”。至

139、2022 年底,公司共拥有 73 项专利,其中包括 22 项发明专利,展现了其在知识产权保护方面的重视和成效。图图36.36.思思泉新材泉新材营收及同比增速营收及同比增速(单位单位:亿亿元元)图图37.37.思泉新材思泉新材归母净利润及同比增速归母净利润及同比增速(单位单位:亿亿元元)资料来源:Wind,公司年报,国投证券研究中心 资料来源:Wind,公司年报,国投证券研究中心 13.257626.152729.293430.580141.24510.00%0.00%2000.00%2000.00%4000.00%4000.00%6000.00%6000.00%8000.00%8000.00%

140、10000.00%10000.00%12000.00%12000.00%0 05 50252530303535404045452000222营业收入营业收入(亿元亿元)营业收入同比增长率营业收入同比增长率(%)(%)销售毛利率销售毛利率(%)(%)1.62463.50762.08890.30090.9619-500.00%-500.00%0.00%0.00%500.00%500.00%1000.00%1000.00%1500.00%1500.00%2000.00%2000.00%2500.00%2500.0

141、0%0 00.50.51 11.51.52 22.52.53 33.53.54 42000222归母净利润归母净利润(亿元亿元)销售净利率销售净利率(%)(%)ROE(ROE(摊薄摊薄)1.972.732.954.494.23-1000.00%-1000.00%0.00%0.00%1000.00%1000.00%2000.00%2000.00%3000.00%3000.00%4000.00%4000.00%5000.00%5000.00%6000.00%6000.00%0.000.000.500.501.001.001.501.

142、502.002.002.502.503.003.003.503.504.004.004.504.505.005.0020182018年报年报 20192019年报年报 20202020年报年报 20212021年报年报 20222022年报年报营业收入营业收入(亿元亿元)营业收入同比增长率营业收入同比增长率(%)(%)销售毛利率销售毛利率(%)(%)0.250.370.530.570.580.00%0.00%500.00%500.00%1000.00%1000.00%1500.00%1500.00%2000.00%2000.00%2500.00%2500.00%0.000.000.100.10

143、0.200.200.300.300.400.400.500.500.600.600.700.7020182018年报年报 20192019年报年报 20202020年报年报 20212021年报年报 20222022年报年报归母净利润归母净利润(亿元亿元)销售净利率销售净利率(%)(%)ROE(ROE(摊薄摊薄)(%)(%)行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。33 6.9.6.9.恒铭达恒铭达 作为专业从事消费电子产品高附加值精密功能性器件的科技企业,公司具备显著的技术研发优势、丰富的生产经验、创新的生产工艺以及高精密与高品质的产品。公司的能

144、力不仅仅局限于产品供应,而是涵盖了设计研发、材料选型、产品试制和测试、批量生产、及时配送及后续跟踪服务等一系列综合解决方案,提供了全方位的客户支持。作为国家高新技术企业,恒铭达拥有 6 项发明专利和 27 项实用新型专利,这些成就反映了其在自主研发和创新方面的扎实实力。图图38.38.恒铭达营收及同比增速恒铭达营收及同比增速(单位单位:亿亿元元)图图39.39.恒铭达归母净利润及同比增速恒铭达归母净利润及同比增速(单位单位:亿亿元元)资料来源:Wind,公司年报,国投证券研究中心 资料来源:Wind,公司年报,国投证券研究中心 6.10.6.10.华丰科技华丰科技 高速连接器,作为现代电子设备

145、间信号传输的关键组件,其设计和功能的优势日益凸显,其高速连接器,作为现代电子设备间信号传输的关键组件,其设计和功能的优势日益凸显,其具备的高速传输性、低信号损耗、低串扰性能、高密度设计,具备的高速传输性、低信号损耗、低串扰性能、高密度设计,能支持高达数百 Gbps 的传输速度,对于 AI 服务器、GPU&CPU 等高带宽需求的设备来说至关重要。公司专注于光电连接器和线缆组件的研发、生产和销售,并向客户提供全面的系统解决方案。华丰科技以技术创新为驱动力,深耕于通讯、防务、工业等多个重要行业。其产品广泛应用于通讯、航空、航天、船舶、电子设备、核电、新能源汽车、轨道交通等关键领域。图图40.40.华

146、丰科技营收及同比增速华丰科技营收及同比增速 图图41.41.华丰科技归母净利润及利润率情况华丰科技归母净利润及利润率情况 资料来源:wind,国投证券研究中心 资料来源:wind,国投证券研究中心 55.856.441.1315.480.00%0.00%10.00%10.00%20.00%20.00%30.00%30.00%40.00%40.00%50.00%50.00%60.00%60.00%70.00%70.00%80.00%80.00%0 02 24 46 68 84820020202020222营业

147、收入(亿元)营业收入(亿元)营业收入同比增长率营业收入同比增长率销售毛利率销售毛利率1.261.661.050.311.930.00%0.00%5.00%5.00%10.00%10.00%15.00%15.00%20.00%20.00%25.00%25.00%30.00%30.00%0 00.50.51 11.51.52 22.52.52000222归母净利润归母净利润/亿元亿元销售净利率销售净利率ROEROE(摊薄)(摊薄)5.297.238.319.840.00%0.00%500.00%500.00%1000.00%1000

148、.00%1500.00%1500.00%2000.00%2000.00%2500.00%2500.00%3000.00%3000.00%3500.00%3500.00%4000.00%4000.00%0.000.002.002.004.004.006.006.008.008.0010.0010.0012.0012.002000212021营业收入营业收入(亿元亿元)营业收入同比增长率营业收入同比增长率(%)(%)-0.97-0.110.760.99-3000.00%-3000.00%-2000.00%-2000.00%-1000.00%-1000.0

149、0%0.00%0.00%1000.00%1000.00%2000.00%2000.00%3000.00%3000.00%4000.00%4000.00%-1.50-1.50-1.00-1.00-0.50-0.500.000.000.500.501.001.001.501.502000212021归属于母公司所有者的净利润归属于母公司所有者的净利润(亿元亿元)销售毛利率销售毛利率(%)(%)销售净利率销售净利率(%)(%)行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。34 6.11.6.11.飞荣达飞荣达 自

150、1993 年成立以来,公司在电子辅料产品生产领域取得了显著发展。自 2000 年开始,公司着手开发国际主流品牌的电磁屏蔽和导热材料与相关散热解决方案,逐步扩展其产品线至金属屏蔽器件、导电布衬垫、导热界面器件等,拓展应用至计算机和手机等高端领域。据公司公告与 2022 年年报,在通信基站领域,通过与中兴通讯的合作,公司成功开发并试制了 3D VC 技术样机,标志着 5G 基站首次采用这一先进的散热技术。在服务器领域,飞荣达向包括华为和超聚变在内的多个知名客户提供了一系列散热与电磁屏蔽解决方案和产品。其产品线涵盖单相和两相液冷模组、轴流风扇以及专门设计的散热器等,以满足客户多样化的散热需求。公司不

151、仅拥有华为、中兴、微软等国内外大型企业客户,还成功扩展至 Facebook 和 Google等全球知名企业。这一广泛的客户基础证明了其产品的实力和市场认可度。飞荣达的优势还体现在其完整的散热产业链布局上,公司不仅在散热器件和材料领域具有强劲竞争力,而且上下游一体化的产业链布局进一步增强了公司在整个散热行业的综合竞争优势。随着液冷散热市场的不断扩大及市场潜力逐步释放,飞荣达有望获得显著的市场机遇。图图42.42.飞荣达营收及同比增速飞荣达营收及同比增速(单位单位:亿亿元元)图图43.43.飞荣达归母净利润及同比增速飞荣达归母净利润及同比增速(单位单位:亿亿元元)资料来源:Wind,公司年报,国投

152、证券研究中心 资料来源:Wind,公司年报,国投证券研究中心 6.12.6.12.世运电路世运电路 世运电路作为国内 PCB 行业的大型先进企业之一,拥有从单面板到 24 层板、金属基板、高密度互联(HDI)、软板和软硬结合板等多种线路板产品。公司目前正建设“年产 300 万平方米线路板新建项目”,分三期建设,其中一期项目已于 2022 年投产。预计该项目全部达产后,公司整体产能将增加至 700 万平方米,为公司未来在新能源汽车、光伏储能和人工智能等领域的技术市场转型提供强大的产能支持。13.257626.152729.293430.580141.24510.00%0.00%2000.00%2

153、000.00%4000.00%4000.00%6000.00%6000.00%8000.00%8000.00%10000.00%10000.00%12000.00%12000.00%0 05 50252530303535404045452000222营业收入营业收入(亿元亿元)营业收入同比增长率营业收入同比增长率(%)(%)销售毛利率销售毛利率(%)(%)1.62463.50762.08890.30090.9619-500.00%-500.00%0.00%0.00%500.00%500.00%1000.00

154、%1000.00%1500.00%1500.00%2000.00%2000.00%2500.00%2500.00%0 00.50.51 11.51.52 22.52.53 33.53.54 42000222归母净利润归母净利润(亿元亿元)销售净利率销售净利率(%)(%)ROE(ROE(摊薄摊薄)行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。35 图图44.44.世运电路营收及同比增速世运电路营收及同比增速(单位单位:亿亿元元)图图45.45.世运电路世运电路归母净利润及同比增速归母净利润

155、及同比增速(单位单位:亿亿元元)资料来源:Wind,公司年报,国投证券研究中心 资料来源:Wind,公司年报,国投证券研究中心 6.13.6.13.方正科技:方正科技:方正科技成立于 1993 年,目前已经成为国内首屈一指的集 PCB 产品研发、生产、制造和销售的龙头企业。公司业务涵盖 PCB 元器件高速宽带接入多垂直行业解决方案,致力于利用云计算、大数据分析等前沿技术为智慧城市建设提供从顶层设计到垂直行业软硬件解决方案。公司 PCB 产品客户主要集中在通信设备、通讯终端、IT 产品、工业医疗、汽车电子、消费电子等领域。图图46.46.方正科技方正科技 PCB 销量及同比变化销量及同比变化 图

156、图47.47.方正科技营收及同比增速方正科技营收及同比增速 资料来源:萝卜投研,国投证券研究中心 资料来源:Wind,国投证券研究中心 21.6724.3925.3637.5944.320.00%0.00%1000.00%1000.00%2000.00%2000.00%3000.00%3000.00%4000.00%4000.00%5000.00%5000.00%6000.00%6000.00%0.000.005.005.0010.0010.0015.0015.0020.0020.0025.0025.0030.0030.0035.0035.0040.0040.0045.0045.0050.00

157、50.002000222营业收入营业收入(亿元亿元)营业收入同比增长率营业收入同比增长率(%)(%)销售毛利率销售毛利率(%)(%)2.263.293.042.104.340.00%0.00%200.00%200.00%400.00%400.00%600.00%600.00%800.00%800.00%1000.00%1000.00%1200.00%1200.00%1400.00%1400.00%1600.00%1600.00%0.000.000.500.501.001.001.501.502.002.002.502.503.0

158、03.003.503.504.004.004.504.505.005.002000222归母净利润归母净利润销售净利率销售净利率(%)(%)ROEROE(摊薄)(摊薄)10665347.139374841.19987911.419087203.179280629.599617994.33-15.00%-15.00%-10.00%-10.00%-5.00%-5.00%0.00%0.00%5.00%5.00%10.00%10.00%800000080000008500000850000090000009000000950000095

159、00000000000000000000200020202020222方正科技方正科技PCBPCB销量销量/平方英尺平方英尺同比增长率同比增长率65.16 66.14 50.99 57.01 58.30 59.73 54.32 48.89-25.00%-25.00%-20.00%-20.00%-15.00%-15.00%-10.00%-10.00%-5.00%-5.00%0.00%0.00%5.00%5.00%10.00%10.00%15.00%15.00%20.

160、00%20.00%0.000.0010.0010.0020.0020.0030.0030.0040.0040.0050.0050.0060.0060.0070.0070.0020152015 20162016 20172017 20182018 20192019 20202020 20212021 20222022营业总收入(亿元)营业总收入(亿元)营业收入同比增长率营业收入同比增长率销售毛利率销售毛利率 行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。36 7.7.风险提示风险提示 7.1.7.1.宏观因素波动影响宏观因素波动影响下游需求下游需求 下游

161、需求与华为产业链开拓情况以及 AI 芯片生产有较强相关性。政治政策问题、芯片技术壁垒突破问题都可能导致上游制造商对应的下游目标市场需求无法达到预期。7.2.7.2.市场开拓不及预期市场开拓不及预期 各公司在推动华为产业链各环节发展时,可能出现技术突破难度大等问题。若提供产品良率以及产量难以符合下游需求,可能导致公司市场渗透程度不及预期,对公司后续长期入局华为产业链带来困难,可能影响公司营收。7.3.7.3.行业竞争加剧行业竞争加剧 当前华为产业链前景广阔,是国内市场在半导体领域的重要推动力。因此更多的供应商带来了较大的竞争压力。半导体领域各龙头企业陆续布局华为产业链,如果市场需求不足预期,可能

162、导致供大于求,相关产品价格持续走低,利润空间大幅收缩。行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。37 行业行业评级体系评级体系 收益评级:领先大市 未来 6 个月的投资收益率领先沪深 300 指数 10%及以上;同步大市 未来 6 个月的投资收益率与沪深 300 指数的变动幅度相差-10%至 10%;落后大市 未来 6 个月的投资收益率落后沪深 300 指数 10%及以上;风险评级:A 正常风险,未来 6 个月的投资收益率的波动小于等于沪深 300 指数波动;B 较高风险,未来 6 个月的投资收益率的波动大于沪深 300 指数波动;分析师声明分析师

163、声明 本报告署名分析师声明,本人具有中国证券业协会授予的证券投资咨询执业资格,勤勉尽责、诚实守信。本人对本报告的内容和观点负责,保证信息来源合法合规、研究方法专业审慎、研究观点独立公正、分析结论具有合理依据,特此声明。本公司具备证券投资咨询业务资格的说明本公司具备证券投资咨询业务资格的说明 国投证券股份有限公司(以下简称“本公司”)经中国证券监督管理委员会核准,取得证券投资咨询业务许可。本公司及其投资咨询人员可以为证券投资人或客户提供证券投资分析、预测或者建议等直接或间接的有偿咨询服务。发布证券研究报告,是证券投资咨询业务的一种基本形式,本公司可以对证券及证券相关产品的价值、市场走势或者相关影

164、响因素进行分析,形成证券估值、投资评级等投资分析意见,制作证券研究报告,并向本公司的客户发布。行业专题行业专题/电子电子 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。38 免责声明免责声明 。本公司不会因为任何机构或个人接收到本报告而视其为本公司的当然客户。本报告基于已公开的资料或信息撰写,但本公司不保证该等信息及资料的完整性、准确性。本报告所载的信息、资料、建议及推测仅反映本公司于本报告发布当日的判断,本报告中的证券或投资标的价格、价值及投资带来的收入可能会波动。在不同时期,本公司可能撰写并发布与本报告所载资料、建议及推测不一致的报告。本公司不保证本报告所含信息及资料保持在最

165、新状态,本公司将随时补充、更新和修订有关信息及资料,但不保证及时公开发布。同时,本公司有权对本报告所含信息在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。任何有关本报告的摘要或节选都不代表本报告正式完整的观点,一切须以本公司向客户发布的本报告完整版本为准,如有需要,客户可以向本公司投资顾问进一步咨询。在法律许可的情况下,本公司及所属关联机构可能会持有报告中提到的公司所发行的证券或期权并进行证券或期权交易,也可能为这些公司提供或者争取提供投资银行、财务顾问或者金融产品等相关服务,提请客户充分注意。客户不应将本报告为作出其投资决策的惟一参考因素,亦不应认为本报告可以取代客户自身的

166、投资判断与决策。在任何情况下,本报告中的信息或所表述的意见均不构成对任何人的投资建议,无论是否已经明示或暗示,本报告不能作为道义的、责任的和法律的依据或者凭证。在任何情况下,本公司亦不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。本报告版权仅为本公司所有,未经事先书面许可,任何机构和个人不得以任何形式翻版、复制、发表、转发或引用本报告的任何部分。如征得本公司同意进行引用、刊发的,需在允许的范围内使用,并注明出处为“国投证券股份有限公司研究中心”,且不得对本报告进行任何有悖原意的引用、删节和修改。本报告的估值结果和分析结论是基于所预定的假设,并采用适当的估值方法和模型得出的,由于假

167、设、估值方法和模型均存在一定的局限性,估值结果和分析结论也存在局限性,请谨慎使用。国投证券股份有限公司对本声明条款具有惟一修改权和最终解释权。国投国投证券研究中心证券研究中心 深圳市深圳市 地地 址:址:深圳市福田区福田街道福华一路深圳市福田区福田街道福华一路 1 11 19 9 号安信金融大厦号安信金融大厦 3333 楼楼 邮邮 编:编:5 上海市上海市 地地 址:址:上海市虹口区东大名路上海市虹口区东大名路 638638 号国投大厦号国投大厦 3 3 层层 邮邮 编:编:200080200080 北京市北京市 地地 址:址:北京市西城区阜成门北大街北京市西城区阜成门北大街 2 2 号楼国投金融大厦号楼国投金融大厦 1515 层层 邮邮 编:编:4

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(电子行业:AI浪潮势不可挡昇腾发力铸造国产算力基石-240117(38页).pdf)为本站 (新科技) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部