《电子行业专题研究:AI服务器元年接口芯片核心受益-230510(21页).pdf》由会员分享,可在线阅读,更多相关《电子行业专题研究:AI服务器元年接口芯片核心受益-230510(21页).pdf(21页珍藏版)》请在三个皮匠报告上搜索。
1、本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 1 电子行业专题研究 AI 服务器元年,接口芯片核心受益 2023 年 05 月 10 日 AIGC 带动 AI 服务器需求量与日俱增,用于服务器内、外部数据传输等接口芯片也随之攀升,本文基于服务器内、外部高速互联需求,梳理了各类高速接口芯片市场情况。海量数据带来高速传输需求,服务器高速互联芯片不可或缺:CPU 和 GPU 等组件互联:PCIe Switch。自 2003 年 PCIe 1.0 推出起速率持续升级,目前 PCIe 6.0 传输速率跃升至 64GT/s。参考 QYResearch 数据,2021 年全球 P
2、CIe 芯片销售额 7.9 亿美元,预计 2028 年将达到 18 亿美元。目前全球仅少数厂商量产 PCIe Switch 芯片,博通、微芯科技和祥硕科技三家共占全球约 58%份额。因PCIe传输速率不断攀升,工作频率越来越高,不可避免的带来了信号衰减问题,PCIe Retimer、Redriver 可有效解决信号衰减,其中 PCIe Retimer 有望为解决信号衰减最优方案。目前 PCIe Retimer 市场,谱瑞-KY、Astera labs、澜起科技三足鼎立,其中澜起为全球可量产 PCIe 4.0 Retimer 的唯一中国大陆供应商,且 PCIe 5.0 Retimer 研发顺利。
3、GPU与GPU互联:NVLink、NVSwitch。针对AI服务器中PCIe带宽限制,以NVDIA NVLink 为代表的高速接口芯片应运而生。NVLink 迭代升级至第四代,单链可实现 50 GB/s 的双向带宽,单芯片可支持 18 链路,即 900 GB/s 的总双向带宽。多 GPU 间通信则采用 NVSwitch,第三代 NVSwitch 采用 TSMC 4N 工艺,每个 NVSwitch 芯片上拥有 64 个 NVLink 4.0 端口。此外,NVLink、NVSwitch 也可实现服务器节点间的高速扩展性互联。通过在服务器外部增加一层 NVSwitch,NVLink 网络最多可连接
4、32 个服务器、256 个 GPU,并提供 57.6TB/s 的多对多带宽 CPU与 DRAM高速互联:内存接口芯片(RCD+DB)。DDR5 时代速率进一步升级,最高传输可由 DDR4 Gen2plus 支持的 3200MT/s 进一步提升至 4800MT/s 以上,且工作电压持续降低至 1.1V。目前内存接口芯片三强争霸,澜起科技可为 DDR5 系列内存模组提供完整的内存接口及模组配套芯片解决方案,是目前全球可提供全套解决方案的两家公司之一。服务器外部模块间高速传输需求激增,SerDes 核心受益:服务器互联传输速率提升,光纤成为服务器间传输的主流介质,其中光模块内需集成高速 SerDes
5、 通道,例如 QSFP28 光模块会配备 4 个 25Gbps SerDes 通道来满足 100GE速率的光电信号转化。并且随着服务器传输需求增长,光模块带宽也会增长,提升方法有两种:1)增加 SerDes 通道数;2)提高每个 SerDes 通道的比特速率。交换机的带宽也会随应用需求而提升,各厂商正推动交换机的数据链路从 100GE 向400GE 和 800GE 等更高速率方向发展带动,交换机 ASIC 内 SerDes 通道数增加至 512通道,速率提升至 100Gbps。此外,服务器的各种外接设备连接、驱动等需求的提升,拓展多种接口芯片市场空间,如 USB(用于连接鼠标等)、SAS(用于
6、连接存储设备)、SATA(用于连接驱动)等。投资建议:AI 时代浪潮汹涌,海量数据催生庞大的算力需求,将带动服务器产业链需求量持续上涨。作为芯片与外部世界的交互媒介,接口芯片实现量增的同时,也朝向更高速率、更大传输带宽发展。建议关注芯原股份、裕太微-U、澜起科技、龙迅股份等。风险提示:AI 应用不及预期;AI 服务器出货不及预期;国产替代进展不及预期。重点公司盈利预测、估值与评级 代码 简称 股价(元)EPS(元)PE(倍)评级 2022A 2023E 2024E 2022A 2023E 2024E 688521 芯原股份 80.00 0.15 0.3 0.46 533 267 174 推荐
7、688008 澜起科技 57.87 1.14 0.86 1.31 51 67 44 推荐 688515 裕太微-U 155.05-0.5 0.14 0.58/1108 267 推荐 688486 龙迅股份 77.19 1.33 1.41 2.02 58 55 38/资料来源:Wind,民生证券研究院预测(注:股价为 2023 年 5 月 9 日收盘价;未覆盖公司数据采用 wind一致预期)推荐 维持评级 Table_Author 分析师 方竞 执业证书:S04 邮箱: 分析师 童秋涛 执业证书:S08 邮箱: 相关研究 1.电子行业专题研究:国产 A
8、I 算力芯片全景图-2023/03/19 2.电子行业跟踪:高温超导特性优异,行业应用前景广阔-2023/03/13 3.电子行业周报 20230313:曙光渐显,把握芯片设计底部布局机遇-2023/03/13 4.电子行业周报 20230228:Chiplet:AI 芯片算力跨越的破局之路-2023/02/28 5.电子行业周报 20230222:ChatGPT 开启行业变革,Chiplet 引领破局之路-2023/02/22 行业深度研究/电子 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 2 目录 1 AI 服务器前景广阔,接口芯片需求广泛.3 2 服务器内部
9、:组件高速互联,接口芯片不可或缺.4 2.1 以 DXG H100 服务器为例,拆解服务器内部高速互联架构.4 2.2 CPU、GPU 等组件互联:PCIE Switch、Retimer 芯片.5 2.3 GPU 与 GPU 连接:NVLink、NVSwitch.9 2.4 CPU 与 DRAM 高速互联,拉动内存接口芯片.11 3 服务器外部:高速传输需求激增,SerDes 核心受益.14 3.1 光模块速率升级,SerDes 通道用量及速率双升.14 3.2 交换机带宽需求激增,SerDes 持续成长.16 3.3 广阔服务器市场推动服务器外部各类接口增长.16 4 投资建议.18 5 风
10、险提示.19 插图目录.20 表格目录.20 OY8ZvVhUlXsQtRtObR8Q8OoMqQnPtQlOqQqNeRoPpO6MoOyRuOsOmQwMqQnR行业深度研究/电子 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 3 1 AI 服务器前景广阔,接口芯片需求广泛 AIGC 大时代来临,ChatGPT 等大语言模型的推出,带动 AI 服务器需求量与日俱增。服务器行业由早期以传统服务器为主的市场格局,转变为传统服务器、云服务器、AI 服务器和边缘服务器四足鼎立。当下,AI 下游应用的持续火爆和算力要求的增加,AI 服务器需求与日俱增。据 TrendFor
11、ce 数据,AI 服务器出货约 13 万台,占全球服务器出货约 1%,展望 2023年,Microsoft、Meta、Baidu 与 ByteDance 相继推出基于生成式 AI 衍生的产品服务而积极加单,预估 23 年 AI 服务器出货量年增率可望达 15.4%,且随着未来 ChatGPT 对 AI 服务器需求用量,预计 2023-2027 年 AI 服务器将以 12.2%年复合增速成长。图1:2022-2027 年全球 AI 服务器出货量及增速 资料来源:TrendForce,民生证券研究院 接口芯片在 AI 服务器数据传输中至关重要,需求将伴随服务器市场增长。在 AI 服务器需求增长的同
12、时,针对于服务器内部之间或与其他设备的数据的传输、控制和管理等接口功能的要求也随之逐渐增加。服务器的升级与需求量提升也会带动接口芯片的增长。接下来,本文将具体从服务器内部互联,服务器外部接口两方面来梳理接口芯片行业情况。0%2%4%6%8%10%12%14%16%18%050020222023E2024E2025E2026E2027E出货量(千台)yoy 行业深度研究/电子 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 4 2 服务器内部:组件高速互联,接口芯片不可或缺 2.1 以 DXG H100服务器为例,拆解服务器内部高速互联架构 DGX
13、 H100 于 2022 年推出,是 NVIDIA 的 DGX 系统的最新迭代产品,也是 NVIDIA DGX SuperPOD 的基础。DXG 服务器配备 8 块 H100 GPU,6400亿个晶体管,在全新的 FP8 精度下 AI 性能比上一代高 6 倍,可提供 900GB/s 的带宽。DGX H100 服务器内部架构如下图所示:图2:英伟达 DGX H100 服务器内部芯片互联架构图 资料来源:NVDIA 官网,民生证券研究院 在 DGX H100 服务器内部,蓝色方块为 IP 网卡,既可充当网卡又可发挥PCIe Switch 扩展功能,成为 CPU 与 GPU(H100)之间互联的桥梁
14、。其内部采用 PCle 5.0 标准。此外,CX7 以网卡芯片的形式做成 2 块板卡来插入服务器,每 4 个 CX7 芯片组成一块板卡并且对外输出 2 个 800G OSFP 光模块口。而 GPU(H100)之间互联主要通过 NV Switch 芯片来实现。每个 DGX H100 内的一个 GPU 向外伸出 18 个 NVLink,单链双向带宽为 50 GB/s,共计18*50GB/s=900GB/s 双向带宽,拆分到 4 个板载的 NV Switch 上去,因而每个NV Switch 对应 4-5 个 OSFP 光模块(共计 18 个)。每个 OSFP 光模块采用 8 个光通道,每个通道的传
15、输速率为 100Gbps,因此总速率高达 800Gbps,能够实现高速的数据传输。行业深度研究/电子 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 5 2.2 CPU、GPU 等组件互联:PCIE Switch、Retimer 芯片 2.2.1 PCIe 技术不断升级,速率持续提升 PCIe Switch 即 PCIe 开关或 PCIe 交换机,主要作用是实现 PCIe 设备互联,PCIe Switch 芯片与其设备的通信协议都是 PCIe。由于 PCIe 的链路通信是一种端对端的数据传输,因此需要Switch提供扩展或聚合能力,从而允许更多的设备连接到一个 PCl
16、e 端口,以解决 PCIe 通道数量不够的问题。目前 PCIe Switch 不仅已经被广泛应用在了传统存储系统中,而且在部分服务器平台中也逐渐普及,用于提高数据传输的速度。PCIe 总线技术升级,PCIe Switch 每代速率提升。PCIe 总线是 PCI 总线的高速串行替代品。2001 年,Intel 公布取代 PCI 总线的第三代 I/O 技术“3GIO”,2002 年该项技术经过 PCI 特殊兴趣组织(PCI-SIG)审核后正式改名为“PCI Express”,标志着 PCIe 的诞生。2003 年,PCIe 1.0 正式发布,可支持每通道传输速率为 250MB/s,总传输速率为 2
17、.5 GT/s。2007 年 PCI-SIG 宣布推出 PCI Express Base 2.0 规范。在 PCIe 1.0 的基础上将总传输速率提高了一倍,达到 5 GT/s,每通道传输速率从 250 MB/s 上升至 500 MB/s。2022 年 PCI-SIG 正式发布 PCIe 6.0 规范,将总带宽提高至 64 GT/s。表1:PCIe 1.0 到 6.0 不同 Lane 下的带宽变化 PCIe 版本 发布时间 Line 编码 原始传输率 带宽 X1 X2 X4 X8 X16 1 2003 8b/10b 2.5 GT/s 250 MB/s 0.50 GB/s 1.0 GB/s 2.
18、0 GB/s 4.0 GB/s 2 2007 8b/10b 5.0 GT/s 500 MB/s 1.0 GB/s 2.0 GB/s 4.0 GB/s 8.0 GB/s 3 2010 128b/130b 8.0 GT/s 984.6 MB/s 1.97 GB/s 3.94 GB/s 7.88 GB/s 15.8 GB/s 4 2017 128b/130b 16.0 GT/s 1969MB/s 3.94 GB/s 7.88 GB/s 15.75 GB/s 31.5 GB/s 5 2019 NRZ 128b/130b 32.0 GT/s 3938 MB/s 7.88 GB/s 15.75 GB/s
19、31.51 GB/s 63.0 GB/s 6 2021 PAM4&FEC FLIT 1b/1b 64.0 GT/s 7877 MB/s 15.75 GB/s 31.51 GB/s 63.02 GB/s 126.03 GB/s 资料来源:Wikipedia,民生证券研究院 随着 PCIe 在服务器中越来越广泛地被应用,PCIe Switch 的市场需求也被带动起来。根据 QYResearch(恒州博智)的统计及预测,2021 年全球 PCIe 芯片市场销售额达到了 7.9 亿美元,预计 2028 年将达到 18 亿美元,年复合增长率(CAGR)为 11.9%。行业深度研究/电子 本公司具备证券投
20、资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 6 图3:2021-2028 年全球 PCIe 芯片市场销售额(亿美元)资料来源:QYResearch,民生证券研究院 中国是 PCIe Switch 最大市场。随着服务器对海量数据存储与传输的要求日益提高,PCIe Switch 市场发展成为一片蓝海。中国是全球最大的电子产品生产和消费国家之一,在大数据、云计算、人工智能等领域,需要大量高速互联解决方案来实现海量数据传输。而 PCIe Switch 作为高速互联解决方案,在中国市场具有极大的需求。据QYResearch(恒州博智)的报告,中国是全球PCIe Switch最大的市场,占有
21、大约50%的市场份额,之后是北美和欧洲,分别占比约13%和9%。图4:PCIe Switch 在不同地区的市场份额 资料来源:QYResearch,民生证券研究院 博通、微芯科技和祥硕科技为领域龙头。目前全球仅少数几家公司具备 PCIe Switch 芯片技术,核心厂商主要包括博通、微芯科技和祥硕科技三家,共占有全球约 58%的份额。此外,国内如边缘智芯推出一款 XPU X100 芯片,可用于通讯行业、边缘计算、智慧工厂等领域,该芯片为国内第一颗 PCIe 交换芯片,既可以起到 PCIe Switch 数据芯片的功能,又可以实现以太网网络芯片的功能。02468020212
22、028E50%13%9%28%中国北美欧洲其他地区 行业深度研究/电子 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 7 表2:PCIe Switch 厂商及其产品介绍 厂商 地区 简述 产品 产品特性 祥硕科技(Asmedia)中国台湾 华硕旗下集成电路设计公司 ASM2480B;ASM1480 具有 Hi-Z(高阻抗)输出的 16 至 8 通道多路选择器/分频器 Switch;适用于 PCIe Gen 4.0(ASM2480B),PCIe Gen 3.0(ASM1480)博通(BroadCom)美国 全球领先的半导体供应商 PEX 系列:PEX 8796、PEX
23、 8780、PEX 8764、PEX 8750 等 端口配置灵活;低功耗,低延迟;DMA 通道传输;点对点数据传输方式;支持热插拔 微芯科技(microchip)美国 全球领先的单片机和模拟半导体供应商 Switchtec PFX PCIe 5.0系列 世界上首款 PCIe 5.0 Switch;传输速率为 32 GT/s 边缘智芯 中国大陆 面向 5G 边缘计算的芯片设计公司 XPU X100 国内第一颗 PCIe Swtich 芯片;低功耗,高性能;Switch SoC;兼具 PCIE Switch 和以太网双协议 资料来源:Asmedia 官网,BroadCom 官网,microchip
24、 官网,民生证券研究院 2.2.2 信号衰减限制 PCIe 发展,PCIe Retimer 提供解决方案 PCIe Retimer 是为了解决 PCIe 总线的信号衰减问题而诞生的。由于 PCIe传输速率不断攀升,工作频率越来越高,不可避免的带来了信号衰减问题。解决信号衰减的方案主要包括信号中继器调节器(Redriver)、重定时器(Retimer)等。Redriver:一种模拟信号芯片,功能主要为信号中继器。Redriver 采用同等化(equalization)和预强调(pre-emphasis)技术来补偿信号损失,进而通过放大信号来增加讯号质量。Redriver 信号通道包括 CTLE(
25、Continuous Time Linear Equalizer)、宽带增益节点以及线性驱动器。此外,Redriver 可以发挥自动检测输入信号衰减情况和探测输出接收器(Rx)的功能,以确保Redriver在任何时候都能够提供最佳的信号传输性能。Retimer:一种数模信号混合芯片,功能主要为重新生成信号。Retimer 先恢复抖动的时钟信号,再生成新信号并重新发送,从而有效解决信号衰减问题。与 Redriver 相比,Retimer 还包含时钟数据恢复电路(CDR,Clock Data Recovery)、决策反馈均衡器(DFE,Decision Feedback Equalizer)和有限
26、脉冲响应驱动器(FIR,Finite Impulse Response)。在 AI 服务器中,GPU 与 CPU 连接时至少需要一颗 Retimer 芯片来保证信号质量。具体而言,很多 AI 服务器都会配置多颗 Retimer 芯片,例如 Astera Labs在 AI 加速器中配置了 4 颗 Retimer 芯片。行业深度研究/电子 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 8 图5:Astera Labs GPU 与 AI 加速器中的 Retimer 芯片配置 资料来源:Astera Labs 官网,民生证券研究院 与 Redriver 相比,Retimer
27、 恢复信号的效果更好。由于 Retimer 具备数位信号处理(DSP)能力,能够在通讯信号已经与干扰耦合的情况下,仍然重建通讯信号。而 Redriver 仅能在物理层面增强信号,并且在增强信号的同时增强了噪音,因而难以处理杂糅信号。综上,在高带宽PCIe 总线发展的背景下,Retimer芯片有望成为解决信号衰减问题的最优方案。PCIe Retimer 蓝海市场三足鼎立,潜在竞争者跃跃欲试。目前谱瑞-KY、Astera labs、澜起科技是 PCIe Retimer 蓝海市场中的三家主要厂商,占据领先地位。其中澜起科技布局 PCIe 较早,是全球可量产 PCIe 4.0 Retimer 的唯一中
28、国大陆供应商,且目前 PCIe 5.0 Retimer 研发顺利。此外,包括瑞萨,TI,微芯科技等在内的芯片厂商也在积极投入 PCIe Retimer 的产品研发中。根据官网信息,瑞萨可提供包括 89HT0816AP 和 89HT0832P 在内的两款 PCIe 3.0 Retimer产品;TI 可提供一款 16Gbps 8 通道 PCIe 4.0 RetimerDS160PT801;同样地,微芯科技于 2020 年 11 月发布 XpressConnect 系列 Retimer 芯片,可支持PCIe 5.0 的 32GT/s 速率。表3:PCIe Retimer 厂商及其研发情况 厂商 阐释
29、 产品研发情况 澜起科技(Montage)唯一一家 PCIe Retimer 中国大陆供应商 2020 年 9 月量产两款 PCIe 4.0 Retimer:M88RT40816 和M88RT41632;2023 年 1 月量产 PCIe 5.0/CXL 2.0 Retimer:M88RT51632 Astera Labs 总部位于加州硅谷中心的 IC(Integrated Circuit)设计公司 2020 年 8 月量产 PCIe 4.0 Retimer 芯片;2022 年 3 月量产 Aries PCIe 5.0 和 CXL 2.0 Retimer 芯片 谱 瑞-KY(Parade Te
30、chnologies)设计中心位于上海和美国华盛顿州的高速混合讯号 IC 芯片供应商 2019 年量产 4 链路 Retimer 芯片 PS8925;2020 年量产 PS8926、PS8926A 两款 16 链路 Retimer 芯片;2023 年公布 16 链路 Retimer芯片 PS8936 资料来源:澜起科技官网,Astera Labs 官网,Parade Technologies 官网,民生证券研究院 行业深度研究/电子 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 9 2.3 GPU 与 GPU 连接:NVLink、NVSwitch 2.3.1 GPU
31、 互联革命,NVLink 高速接口应运而生 高性能服务器的血液高速串行接口芯片。在大数据与万物互联的智能时代,以高速串行接口(wireline SerDes)为核心的高速互连技术是数据传输所不可或缺的部分。针对 AI 服务器中 PCIe 带宽限制对于 GPU 间通信带来的阻碍,以 NVDIA NVLink 为代表的高速接口芯片应运而生。全球各大芯片厂商均在关注高速接口的相关技术,除了 NVDIA的NVLink之外,AMD 的 Infinity Fabric 和 Intel 的 CXL(Compute Express Link)等也为服务器内部的高速串联提供了解决方案。表4:高速串行接口技术对比
32、 技术 厂商 推出时间 基本阐述 原理构成 产品特性 单链带宽 总带宽 NVLink Nvidia 2016 年第一代发布;2017 年第二代发布;2020 年第三代发布;2022 年第四代发布 世界首项高速 GPU 互连技术 一根 Link 由一对sub-link 组成,一根 sub-link 又由八对差分线组成 点对点的传输形式;一个设备可由多个 NVLink 组成;网状连接结构 基于 Hopper 架构的 NVLink 4.0可实现单链 50 GB/s 的双向带宽 每个 GPU 可支持 18 链路,提供 900 GB/s 的总双向带宽 Infinity Fabric AMD 2016 年
33、首次公布;2017 年首次在 Zen处理器中应用 IF 总线,基于HyperTransport 的通信总线技术 由 Infinity Scalable Data Fabric(SDF)和Infinity Scalable Control Fabric(SCF)组成 集数据传输与控制于一体 Infinity Architecture 架构可支持 Infinity Fabric 3实现单链 100 GB/s 的带宽 加速器之间可支持 8 链路,提供800GB/s 的总带宽 CXL Intel 2019 年 CXL 1.0 发布;2020 年 CXL 2.0 发布;2022 年CXL 3.0 发布
34、Compute Express Link,开放性高速互联协议 由 CXL.io、CXL.cache、CXL.mem 三个子协议组成 基于 PCIe 协议,兼容性高;高效,低延迟,高带宽;内存一致性-CXL 3.0 通过 x16 链路实现 128 GB/s 的双向带宽 资料来源:NVDIA 官网,AMD 官网,Wikipedia,民生证券研究院 不断迭代更新的 NVlink 掀起高速互联技术革命。NVLink 是一种由 NVIDIA开发的高速互连技术,旨在加快 CPU 与 GPU、GPU 与 GPU 之间的数据传输速度,提高系统性能。从 2016 年到 2022 年,NVLink 已经迭代至第四
35、代。2016 年,NVDIA 发布了 Pascal GP100 GPU 所搭载的新的高速接口芯片 NVLink,这 是 第 一 代 NVLink。NVLink 采 用 High-Speed Signaling interconnect(NVHS)技术,主要用于 GPU 与 GPU 之间、GPU 与 CPU 之间的信号传输。GPU 之间传输 NRZ(Non-Return-to-Zero)编码形式的差分阻抗 行业深度研究/电子 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 10 电信号。第一代NVLink单链可实现40 GB/s的双向带宽,单芯片可支持4链路,即 160
36、 GB/s 的总双向带宽。此后,NVLink 历经多次迭代更新,掀起了高速互联技术革新浪潮。2017 年,基于 Volta 架构的第二代 NVLink 发布,单链可实现 50 GB/s 的双向带宽,单芯片可支持 6 链路,即 300 GB/s 的总双向带宽。2020 年,基于 Ampere 架构的第三代 NVLink 发布,单链可实现 50 GB/s 的双向带宽,单芯片可支持 12 链路,即 600 GB/s 的总双向带宽。2022 年,基于 Hopper 架构的第四代 NVLink 发布,传输信号变为 PAM4 调制电信号,单链可实现 50 GB/s 的双向带宽,单芯片可支持 18 链路,即
37、 900 GB/s 的总双向带宽。表5:四代 NV Link 对比 产品 发布时间 显卡 最大链数 GPU 之间总带宽 应用架构 NV Link 1.0 2016 P100 4 160 GB/s Pascal NV Link 2.0 2017 V100 6 300 GB/s Volta NV Link 3.0 2020 A100 12 600 GB/s Ampere NV Link 4.0 2022 H100 18 900 GB/s Hopper 资料来源:NVDIA 官网,民生证券研究院 2.3.2 NVSwitch:实现服务器内多 GPU 高速互联 2018 年 NVDIA 发布了第一代
38、NVSwitch,为提高服务器内部带宽、降低延迟、实现多 GPU 间通信提供了解决方案。第一代 NVSwitch 采用台积电 12nm FinFET 工艺制造,共有 18 个 NVLink 2.0 接口。一台服务器内部可以通过 12 个NVSwitch 支持 16 个 V100 GPU,实现以 NVLink 最高速率互联。目前 NVSwitch 已经迭代至第三代。第三代 NVSwitch 采用 TSMC 4N 工艺构建,每个 NVSwitch 芯片上拥有 64 个 NVLink 4.0 端口,GPU 间通信速率可达 900GB/s,这些通过 NVLink Switch 互联的 GPU 可用作单
39、个高性能加速器,拥有深度学习的功能。表6:三代 NV Switch 性能对比 产品 直连或节点中 GPU 数上限 GPU 间带宽 应用架构 NV Switch 1.0 8 300 GB/s Volta NV Switch 2.0 8 600 GB/s Ampere NV Switch 3.0 8 900 GB/s Hopper 资料来源:NVIDIA 官网,民生证券研究院 NVLink 与 NVSwitch 也可以实现服务器节点间的高速扩展性互联。基于第三代NVSwitch,通过在服务器外部增加一层 NVSwitch,NVLink 网络最多可连接 32个服务器、256 个 GPU,并提供 57
40、.6TB/s 的多对多带宽,满足 AI 和高性能计算(HPC)对于多节点、多 GPU 之间高速通信的需求。行业深度研究/电子 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 11 图6:基于 NVSwitch,NVLink 可以实现多 GPU 在服务器节点间的通信扩展 资料来源:NVIDIA 官网,民生证券研究院 2.4 CPU 与 DRAM 高速互联,拉动内存接口芯片 2.4.1 CPU 与 DRAM 互联:内存接口芯片(RCD+DB)服务器内存模组主要类型为 RDIMM、LRDIMM,相较于其他类型内存模组,服务器内存模组对稳定性、纠错能力以及低功耗均有较高要求。
41、内存接口芯片是服务器内存模组的核心逻辑器件,是服务器 CPU 存取内存数据的必由通路。其主要作用是提升内存数据访问的速度及稳定性,满足服务器 CPU对内存模组日益增长的高性能及大容量需求。内存接口芯片需与内存厂商生产的各种内存颗粒和内存模组进行配套,并通过服务器 CPU、内存和 OEM 厂商针对其功能和性能进行全方位认证。表7:内存模组分类及下游应用 内存模组种类 市场定位 主要特征 SODIMM-UDIMM PC、服务器 在 CPU 和内存之间没有任何缓存,因此同频率下延迟较小,同时在容量和频率上都较低 RDIMM 服务器 在内存条上位于 CPU 和内存颗粒之间增加一个寄存器进行传输,减少并
42、行传输的距离且保证并行传输的有效性 LRDIMM 高端服务器 相比于 RDIMM,一方面降低了内存总线的负载和功耗,另一方面提供了内存的最大支持容量 资料来源:CSDN,民生证券研究院 从 DDR4 至 DDR5,内存接口芯片速率持续升级。2016 年开始,DDR4 成为内存市场的主流技术,为了实现更高的传输速率和支持更大的内存容量,JEDEC 组织进一步更新和完善了 DDR4 内存接口芯片的技术规格。在 DDR4 世代,从 Gen1.0、Gen1.5、Gen2.0 到 Gen2plus,每一子代内存接口芯片所支持的最高传输速率在持续上升,DDR4 最后一个子代产品 Gen2plus 支持的最
43、高传输已达 3200MT/s。随着 JEDEC 组织不断完善对 DDR5 内存接口产品的规格定义,DDR5 内存技术正在逐步实现对 DDR4 内存技术的更新和替代。DDR5 第一子代内存接口芯片相比于 DDR4 最后一个子代的内存接口芯片,采用了更低的工作电压(1.1V),同时在传输有效性和可靠性上又迈进了一步。目前 DDR5 内存 行业深度研究/电子 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 12 接口芯片已经规划了三个子代,支持速率分别是 4800MT/s、5600MT/s、6400MT/s,行业内预计后续可能还会有 12 个子代。表8:内存接口芯片发展 世
44、代 技术特点 主要厂商 研发时间跨度 DDR2 最低可支持 1.5V 工作电压 TI(德州仪器)、英特尔、西门子、Inphi、澜起科技、IDT 等 2004 年-2008 年 DDR3 最低可支持 1.25V 工作电压,最高可支持 1866MT/s的运行速率 Inphi、IDT、澜起科技、Rambus、TI(德州仪器)等 2008 年-2014 年 DDR4 最低可支持1.2V工作电压,最高可支持3200MT/s的运行速率 澜起科技、IDT、Rambus 2013 年-2017 年 DDR5 最低可支持 1.1V 工作电压,可实现 4800MT/s 的运行速率,并在此产品基础上,继续研发 56
45、00MT/s、6400MT/s 的产品 澜起科技、瑞萨电子(原 IDT)、Rambus 2017 年至今 资料来源:澜起科技年报,民生证券研究院 内存接口芯片按功能分为两类,分别为是寄存缓冲器(RCD)以及数据缓冲器(DB)。RCD 用来缓冲来自内存控制器的地址、命令、控制信号,DB 用来缓冲来自内存控制器或内存颗粒的数据信号。RCD 与 DB 组成套片,可实现对地址、命令、控制信号和数据信号的全缓冲。RDIMM 仅采用了一颗 RCD 芯片,而LRDIMM 采用了 RCD 和 DB 套片组合,在 DDR4 世代是“1+9”架构即 1 颗RCD 和 9 颗 DB 芯片,在 DDR5 世代则演变成
46、“1+10”架构。图7:澜起科技 RCD+DB 套片组合“1+9”架构与“1+10”架构对比 资料来源:澜起科技官网,民生证券研究院 表9:DDR4、DDR5 服务器内存接口及内存模组配套芯片数量 接口协议标准 内存模组 内存接口芯片 内存模组配套芯片 DDR4 RDIMM RCD-LRDIMM RCD+9*DB-DDR5 RDIMM RCD SPD+2*TS+PMIC LRDIMM RCD+10*DB SPD+2*TS+PMIC 资料来源:澜起科技年报,民生证券研究院 DDR5 内存模组升级带来内存接口芯片及模组配套芯片新机遇。2016 年全球内存接口芯片市场规模约 2.8 亿美元,2018
47、 年达到约为 5.7 亿美元,三年年化 行业深度研究/电子 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 13 增长率为 40%。DDR5 升级,将带来内存接口芯片市场规模攀升。相较于 DDR4,由于 DDR5 支持速率更高、设计更为复杂,DDR5 第一子代内存接口芯片的起始单价比 DDR4 内存接口芯片更高。同时,随着 DDR5 内存在服务器、PC 端的渗透率逐步提升,DDR5 相关内存接口芯片市场规模有望实现高速增长。图8:2016-2018 年内存接口芯片市场规模(亿美元)资料来源:观研天下,民生证券研究院 2.4.2 内存接口芯片高壁垒,市场三足鼎立形成 内
48、存接口芯片行业壁垒高,三足鼎立格局已经形成。内存接口芯片是技术密集型行业,需要通过 CPU、内存和 OEM 厂商的全方位严格验证后,方可进行大规模使用,新的玩家很难介入。随着技术难度不断升级,内存接口芯片玩家从 DDR2 世代的 10 多家到 DDR4 世代只剩 3 家,行业基本出清,三足鼎立格局已经形成。在 DDR5 世代,全球只有三家供应商可提供 DDR5 第一子代的量产产品,分别是澜起科技、瑞萨电子(IDT)和 Rambus。表10:内存接口芯片主要厂商对比 澜起科技 Rambus IDT 成立时间 2004 1990 1980 总部地区 中国 美国 美国 主营业务 内存接口芯片;津逮服
49、务器 CPU 以及混合安全内存模组;PCIe Retimer;Memory eXpander Controller(MXC)内存扩展器控制器 基础架构许可;SiliconIP 授权,包括安全 IP 和接口 IP,其中接口IP 有 Memory、SerDes、PHY 和控制器;内存接口芯片 时钟与计时、内存与逻辑、接口与连接、传感器产品、电源管理和射频产品 营业收入 2022 年:36.72 亿元(约 5.34 亿美元)2022 年:4.55 亿美元 2018 年:8.43 亿美元 内存接口芯片业务收入 2021 年:17.17 亿元(约 2.66 亿美元)2021 年:1.44 亿美元 201
50、9 年:约 2.4 亿美元 内存接口芯片营收占比 2021 年:67.02%2021 年:43.90%2019 年:25%-30%内存接口芯片市占率 2019 年:47%2019 年:8%2019 年:45%资料来源:澜起科技官网,Rambus 官网,Renesas 官网,澜起科技年报,Rambus 年报,华经情报网,民生证券研究院 00172018 行业深度研究/电子 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 14 3 服务器外部:高速传输需求激增,SerDes 核心受益 3.1 光模块速率升级,SerDes 通道用量及速率双升 服务器互
51、联传输速率提升,AOC 替代 DAC 成为主流传输介质。过去服务器主流背板数据传输速度是 40Gbps 时,常用 DAC(Direct Attach Cable)铜线电缆满足多数机房设备连接的需求,同时由于其造价成本较低,成为服务器传输用 主 流 介 质。不 过 随 着 带 宽 的 逐 步 升 级,尤 其 是 目 前 传 输 速 率 达 到400Gbps/800Gbps 时,铜线电缆受限于自身的铜材料物理属性、传输的电信号性质及电磁干扰,已无法满足传输需求。因此 100Gbps 以上高速传输,已逐步采用 AOC(Active Optical Fiber)作为传输介质。光收发器(光模块)是AOC
52、核心基件,其作用实现需要配备高速SerDes通道。AOC 由集成光电器件(两个光收发器和多模光纤)组成,其中,AOC 两端的光收发器作为光电转换枢纽,提供光电转换以及光传输功能,以提高光缆的传输速度和传输距离,且不会减弱与标准电接口之间的兼容性。图9:光模块工作原理 资料来源:华为,民生证券研究院 拆解光收发器,其内部由光发射器件(TOSA,含激光器)、光接收器件(ROSA,含光探测器)、功能电路和光(电)接口等部分组成。在发射端,驱动芯片对电信号进行处理,然后驱动半导体激光器(LD)或发光二极管(LED)发射出调制光信号,将电信号变成光信号;在接收端,光信号进入后,由光探测二极管转换为电信号
53、,经前置放大器后输出电信号,将光信号变成电信号。此外,光模块还需集成 SerDes 通道,完成从服务器到 AOC 的光电信号转化。服务器内部的并行电信号需要通过 SerDes 通道转换为高速串行电信号,再通过光模块将高速串行电信号转换为光信号,反之亦然。此外,SerDes 通道还可提供如数据打包、编码和解码等额外功能,以增强光模块性能。例如速率为 100GE 的 QSFP28 光模块中,通常具有 4 个 25Gbps SerDes 通道来满足传输速率需求。行业深度研究/电子 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 15 图10:QSFP28 光模块工作原理图
54、资料来源:易天光通信,民生证券研究院整理 通过提升 SerDes 通道用量及速率,实现光模块速率升级。随着 AI、云计算等业务的快速发展,服务器传输需求增长,光模块也随之快速发展。光模块提升带宽的方法有两种:1)增加 SerDes 通道数;2)提高每个 SerDes 通道的比特速率。具体来看,光模块从 10GE 提升到 40GE,主要利用通道数提升(从 1 通道提升到4通道);而从40GE提升到100GE,主要利用单通道的比特速率提升(单SerDes 通道速率从 10Gbps 提升到 25Gbps)。图11:10GE 到 100GE 光模块带动 SerDes 通道增长 资料来源:民生证券研究院
55、整理 随着服务器发展对带宽要求提升,需采用 400GE/800GE 甚至更高速率的光模块,也会继续带动 SerDes 升级需求。以 400GE 为例,光模块需要更快的 SerDes 通道速率(50Gbps)。可以采用PAM4(PAM4 是采用 4 个不同的信号电平进行传输,每个时钟周期可以传输2bit 的逻辑信息,即(00、01、10、11)信号调制技术),利用该技术可以在相同的物理带宽下传输两倍的信息量。此外,目前业内也在研发基于光电集成技术出现的光 SerDes,该技术可直接将低速并行电信号转换为高速串行光信号,并实现低静态功耗,进一步提高带宽。行业深度研究/电子 本公司具备证券投资咨询业
56、务资格,请务必阅读最后一页免责声明 证券研究报告 16 3.2 交换机带宽需求激增,SerDes 持续成长 交换机带宽伴随应用需求而提升,SerDes 速率及数量激增。随着 AI 和虚拟现实等更高带宽应用的出现,交换机在数据中心市场迎来巨大发展空间,为满足带宽需求,各厂商正推动交换机的数据链路从 100GE 向 400GE 和 800GE 等更高速率方向发展。这种趋势促使交换机芯片带宽呈发展趋势,带动交换机芯片周围的 SerDes 速度从 10Gbps 提升到 100Gbps,同时,SerDes 数量也从 64 通道逐步增加到 512 通道(用于容量 51.2T 交换机,容量=SerDes 速
57、率通道数)。图12:交换机内 SerDes 发展趋势 资料来源:民生证券研究院整理 表11:交换机 ASIC 演进过程 年份 2010 2012 2014 2016 2018 2020 2020 2022 SerDes 数量 64 128 128 256 256 512 256 512 SerDes 速率(Gbps)10 10 25 25 50 50 100 100 调制方式 NRZ NRZ NRZ NRZ PAM4 PAM4 PAM4 PAM4 容量(Tb/s)0.64 1.28 3.2 6.4 12.8 25.6 25.6 51.2 资料来源:Co-packaged datacenter
58、optics:Opportunities and challenges,民生证券研究院 3.3 广阔服务器市场推动服务器外部各类接口增长 服务器的各种外接设备连接、驱动等需求,还需用到多种接口芯片,例如USB(用于连接鼠标等)、SAS(用于连接存储设备)、SATA(用于连接驱动)等。服务器各种新兴应用场景及带宽要求增加也会给予其外部接口发展契机,各类接口芯片用量及单价空间也将迎来想象空间。行业深度研究/电子 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 17 表12:服务器外部其余常用接口 接口 描述 传输速率 特点 应用 USB USB 一种计算机系统与外部设备的
59、串口总线标准,支持即插即用和热插拔功能。最新版本 USB4 支持40Gbps 适用于多种外设、速度快、功能多、使用方便、成本低 常用于 U 盘,鼠标等移动外设。SATA SATA 是 SSD 最古老,最具成本效益的接口。最新版本的 SATA Express可达 16Gb/s 高速数据传输、可靠性高、成本效益、体积小、支持热拔插 主要通过高速串行电缆在主板和存储设备(如连接硬盘、固态硬盘等)之间传输数据 SAS SAS 是串行 SCSI 技术,是一种磁盘连接技术 高速,SAS 3.0 达到12Gb/s 高性能、可扩展性强、可靠性高、灵活性强,可以兼容 SATA 标准 应用于带宽要求更高的主流服务
60、器和企业级存储 资料来源:公开资料整理,民生证券研究院 行业深度研究/电子 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 18 4 投资建议 AI 时代浪潮汹涌,海量数据催生庞大的算力需求,将带动服务器产业链需求量持续上涨。作为芯片与外部世界的交互媒介,接口芯片实现量增的同时,也朝向更高速率、更大传输带宽发展。建议关注芯原股份、裕太微-U、澜起科技、龙迅股份等。表13:重点公司盈利预测 证券代码 证券简称 股价(元)EPS PE 评级 2022A 2023E 2024E 2022A 2023E 2024E 688798 芯原股份 80.00 0.15 0.3 0.4
61、6 533 267 174 推荐 688368 澜起科技 57.87 1.14 0.86 1.31 51 67 44 推荐 688045 裕太微-U 155.05-0.5 0.14 0.58/1108 267 推荐 688279 龙迅股份 77.19 1.33 1.41 2.02 58 55 38/资料来源:Wind,民生证券研究院;(注:股价为 2023 年 5 月 9 日收盘价;龙迅股份数据采用 wind 一致预期)行业深度研究/电子 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 19 5 风险提示 1)AI 应用不及预期风险。若 AIGC 应用因算力、投资等问
62、题落地不及预期,则相关公司成长逻辑有可能不及预期的风险。2)AI 服务器出货不及预期的风险。若企业对算力投资不及预期,或是 GPU供应不足,可能影响 AI 服务器出货量。3)国产替代进展不及预期的风险。若自主可控推进不及预期,存在相关上市公司业绩增速不及预期的风险。行业深度研究/电子 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 20 插图目录 图 1:2022-2027 年全球 AI 服务器出货量及增速.3 图 2:英伟达 DGX H100 服务器内部芯片互联架构图.4 图 3:2021-2028 年全球 PCIe 芯片市场销售额(亿美元).6 图 4:PCIe
63、Switch 在不同地区的市场份额.6 图 5:Astera Labs GPU 与 AI 加速器中的 Retimer 芯片配置.8 图 6:基于 NVSwitch,NVLink 可以实现多 GPU 在服务器节点间的通信扩展.11 图 7:澜起科技 RCD+DB 套片组合“1+9”架构与“1+10”架构对比.12 图 8:2016-2018 年内存接口芯片市场规模(亿美元).13 图 9:光模块工作原理.14 图 10:QSFP28 光模块工作原理图.15 图 11:10GE 到 100GE 光模块带动 SerDes 通道增长.15 图 12:交换机内 SerDes 发展趋势.16 表格目录 重
64、点公司盈利预测、估值与评级.1 表 1:PCIe 1.0 到 6.0 不同 Lane 下的带宽变化.5 表 2:PCIe Switch 厂商及其产品介绍.7 表 3:PCIe Retimer 厂商及其研发情况.8 表 4:高速串行接口技术对比.9 表 5:四代 NV Link 对比.10 表 6:三代 NV Switch 性能对比.10 表 7:内存模组分类及下游应用.11 表 8:内存接口芯片发展.12 表 9:DDR4、DDR5 服务器内存接口及内存模组配套芯片数量.12 表 10:内存接口芯片主要厂商对比.13 表 11:交换机 ASIC 演进过程.16 表 12:服务器外部其余常用接口
65、.17 表 13:重点公司盈利预测.18 行业深度研究/电子 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 21 分析师承诺 本报告署名分析师具有中国证券业协会授予的证券投资咨询执业资格并登记为注册分析师,基于认真审慎的工作态度、专业严谨的研究方法与分析逻辑得出研究结论,独立、客观地出具本报告,并对本报告的内容和观点负责。本报告清晰准确地反映了研究人员的研究观点,结论不受任何第三方的授意、影响,研究人员不曾因、不因、也将不会因本报告中的具体推荐意见或观点而直接或间接收到任何形式的补偿。评级说明 投资建议评级标准 评级 说明 以报告发布日后的 12 个月内公司股价(或
66、行业指数)相对同期基准指数的涨跌幅为基准。其中:A 股以沪深 300 指数为基准;新三板以三板成指或三板做市指数为基准;港股以恒生指数为基准;美股以纳斯达克综合指数或标普500 指数为基准。公司评级 推荐 相对基准指数涨幅 15%以上 谨慎推荐 相对基准指数涨幅 5%15%之间 中性 相对基准指数涨幅-5%5%之间 回避 相对基准指数跌幅 5%以上 行业评级 推荐 相对基准指数涨幅 5%以上 中性 相对基准指数涨幅-5%5%之间 回避 相对基准指数跌幅 5%以上 免责声明 民生证券股份有限公司(以下简称“本公司”)具有中国证监会许可的证券投资咨询业务资格。本报告仅供本公司境内客户使用。本公司不
67、会因接收人收到本报告而视其为客户。本报告仅为参考之用,并不构成对客户的投资建议,不应被视为买卖任何证券、金融工具的要约或要约邀请。本报告所包含的观点及建议并未考虑个别客户的特殊状况、目标或需要,客户应当充分考虑自身特定状况,不应单纯依靠本报告所载的内容而取代个人的独立判断。在任何情况下,本公司不对任何人因使用本报告中的任何内容而导致的任何可能的损失负任何责任。本报告是基于已公开信息撰写,但本公司不保证该等信息的准确性或完整性。本报告所载的资料、意见及预测仅反映本公司于发布本报告当日的判断,且预测方法及结果存在一定程度局限性。在不同时期,本公司可发出与本报告所刊载的意见、预测不一致的报告,但本公
68、司没有义务和责任及时更新本报告所涉及的内容并通知客户。在法律允许的情况下,本公司及其附属机构可能持有报告中提及的公司所发行证券的头寸并进行交易,也可能为这些公司提供或正在争取提供投资银行、财务顾问、咨询服务等相关服务,本公司的员工可能担任本报告所提及的公司的董事。客户应充分考虑可能存在的利益冲突,勿将本报告作为投资决策的唯一参考依据。若本公司以外的金融机构发送本报告,则由该金融机构独自为此发送行为负责。该机构的客户应联系该机构以交易本报告提及的证券或要求获悉更详细的信息。本报告不构成本公司向发送本报告金融机构之客户提供的投资建议。本公司不会因任何机构或个人从其他机构获得本报告而将其视为本公司客户。本报告的版权仅归本公司所有,未经书面许可,任何机构或个人不得以任何形式、任何目的进行翻版、转载、发表、篡改或引用。所有在本报告中使用的商标、服务标识及标记,除非另有说明,均为本公司的商标、服务标识及标记。本公司版权所有并保留一切权利。民生证券研究院:上海:上海市浦东新区浦明路 8 号财富金融广场 1 幢 5F;200120 北京:北京市东城区建国门内大街 28 号民生金融中心 A 座 18 层;100005 深圳:广东省深圳市福田区益田路 6001 号太平金融大厦 32 层 05 单元;518026