上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

超威半导体-美股公司首次覆盖报告:不断超越挑战AI算力新边际-240307(33页).pdf

编号:156115 PDF  RTF 33页 3.11MB 下载积分:VIP专享
下载报告请您先登录!

超威半导体-美股公司首次覆盖报告:不断超越挑战AI算力新边际-240307(33页).pdf

1、请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 超威半导体(超威半导体(AMD.US)不断超越,挑战不断超越,挑战 AI 算力新边际算力新边际 超威半导体超威半导体(AMD)首次覆盖报告首次覆盖报告 秦和平秦和平(分析师分析师)李奇李奇(分析师分析师) 证书编号 S0880523110003 S0880523060001 本报告导读:本报告导读:AMD 以其完整的产品矩阵及高性价比实现高中低端市场全覆盖,不断提高市占率。以其完整的产品矩阵及高性价比实现高中低端市场全覆盖,不断提高市占率。我们关注我们关注 MI300 系列出

2、货量的预期变化,及多线布局带来的新增量。系列出货量的预期变化,及多线布局带来的新增量。摘要:摘要:首次覆盖首次覆盖,给予给予“增持增持”评级评级,目标价目标价 232 美元美元。考虑到 AMD 将在 AI浪潮中受益,助推公司营收改善,产品生态完善,具备高性价比优势。我们预计公司 FY2024E/FY2025E/FY2026E 营业收入分别为 291.8/364.4/437.9 亿美元,同增 29%/25%/20%,对应经调整净利润分别为74/103/131 亿美元,同增 73%/39%/28%。数据中心数据中心业务的增量为业务的增量为 AMD2024 年业绩与估值的聚焦点年业绩与估值的聚焦点。

3、归功于人工智能(AI)需求的显著增长,市场对 AMD 的数据中心业务表现出极高的关注度。而理解这块业务的关键在于 MI300 芯片的预期表现。该芯片的销售预期已经从最初的每季度 4 亿美元上调至每年 35 亿美元。我们认为未来 MI300 系列的销量将逐步提升:第一,AI 需求急迫下,AMD 是通用 GPU 卡赛道下英伟达少数的替代品,包括微软、Meta 等大公司纷纷下单;第二,下游的 CSP 云厂商害怕过度依赖英伟达,在上下游关系中失去议价权,从而扶持 AMD 作为二供。AI PC 和和 Embedded 为长期增量,完善的多线布局将持续受益于为长期增量,完善的多线布局将持续受益于 AI时代

4、的红利。时代的红利。AMD 已经拥有了业内最全的 CPU+GPU+FPGA+DPU 数据中心产品组合,可以覆盖全场景 AI 数据计算需求。目前,数据中心业务短期内确实由 AI 训练所推动,但我们认为中长期趋势将逐渐转向大语言模型的推理应用。我们认为,面对中长期市场需求的转移,AMD 广泛的产品组合使其具有最好的资源去整合所以的 AI 相关产品,抓住更多的增长机会,与竞争对手在数据中心领域差异化竞争。催化剂:催化剂:1)英伟达有限的供给满足不了市场需求,行业内将产生多个赢家,AMD 作为少数的替代品份额扩大;2)公司层面)公司层面:MI300 系列极具竞争力,对标 H100,已有多个大厂宣布部署

5、 MI300X;公司同时加大硬件和软件生态方面的研发投入。风险提示:风险提示:AI 应用发展不及预期;公司研发进度不及预期;地缘政治冲突影响产品销售。评级:评级:增持增持 当前价格(美元):203.17 2024.03.07 交易数据 52 周内股价区间(周内股价区间(美元美元)78.52-202.72 当前股本(百万股)当前股本(百万股)1616 当前市值(当前市值(亿美元亿美元)3274 海外公司(海外公司(美国美国)财务摘要(财务摘要(百万百万美元美元)FY2020A FY2021A FY2022A FY2023A FY2024E FY2025E FY2026E 营业收入营业收入 9,7

6、63 16,434 23,601 22,680 29,180 36,443 43,792 (+/-)%45%68%44%-4%29%25%20%经营利润经营利润 1,369 3,648 1,264 401 3,574 6,131 8,610 净利润净利润 1,275 3,669 1,184 492 3,669 6,227 8,706 (+/-)%26%19%6%4%15%20%23%Non-Gaap净利润净利润 1,575 3,435 5,504 4,302 7,423 10,307 13,147 经调整经调整 PE 207.9 95.3 59.5 76.1 44.1 31.8 24.9 -4

7、0%0%40%80%120%160%2023-02-212023-03-132023-03-312023-04-212023-05-112023-06-012023-06-222023-07-132023-08-022023-08-222023-09-122023-10-022023-10-202023-11-092023-11-302023-12-202024-01-112024-02-015252周股价走势图周股价走势图AMD纳斯达克综指股票研究股票研究 证券研究报告证券研究报告 海外信息科技海外信息科技 AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之

8、后的免责条款部分 2 of 33 目录目录 1.投资建议.4 2.成长之路跌宕起伏,逐步稳扎 CPU 与 GPU 市场.5 2.1.横跨多产品线,布局完善.5 2.1.1.1969 年-1998 年:起步期,主攻性价比并依靠代工起家.5 2.1.2.1999 年-2006 年:成长期,自研处理器带动公司快速发展 5 2.1.3.2007 年-2016 年:沉寂期,整合业务摸索前行.5 2.1.4.2017 年至今:重塑竞争优势,完善全产品线布局.6 2.2.股价复盘.7 2.3.采取扁平化管理,技术部门占据主导地位.7 2.4.股权架构分散,无单一大股东.8 2.5.产品线较为分散,覆盖范围广

9、泛.8 3.数据中心:拥抱 AI 浪潮,是短期公司最大的增量业务.9 3.1.提供性能及能效俱佳的服务器处理器产品组合,市场份额稳步提升 .9 3.2.APU 加速器集成多项创新技术,覆盖 AI 和 HPC 工作负载.12 3.3.GPU 加速器取得较大进展,追赶 AIGC 浪潮.13 3.4.软件生态是 AMD 破局的关键,短期兼容 CUDA,长期自研+收购,发展自己的软件生态.14 3.5.收购赛灵思,将 FPGA 带入数据中心布局.15 3.6.收购 Pensando,将 DPU 带入数据中心布局.16 3.7.全面完善数据中心布局,囊括 CPU+GPU+FPGA+DPU.17 4.客户

10、端:全新架构、制程优势和 Chiplet 技术带动性能提升,在 CPU市场的地位逐步稳定.18 4.1.CPU 业务后来居上,提供了支撑 AMD 走出困境的最大动力 18 4.2.XDNA 架构首先应用至 PC 端处理器,布局 AI PC,该业务可以为 AMD 带来长期差异化竞争.20 5.游戏:硬件及软件技术逐步完善,主打性价比优势.20 5.1.作为技术层面的追赶着,主打性价比优势.20 5.2.提供全套方案且性价比较高,游戏半定制业务长年领先.22 6.嵌入式:通过收购成为行业龙头,覆盖各行业及各级市场的应用需求 .22 7.AI 浪潮催生千亿算力市场,AMD 有望成为赢家之一,为营收增

11、长提供新动力.23 7.1.AI 加速器市场格局:垄断局面或被破解.24 7.1.1.云计算及科技大厂开启自研芯片.24 7.1.2.谷歌:最早布局自研 TPU,已进入成熟应用阶段.24 7.1.3.亚马逊:Trainium 和 Inferentia 分别覆盖 AI 训练及推理工作负载 .25 7.1.4.微软:Maia 100 进入测试阶段,持续研发将推出更多新品.26 7.1.5.自研芯片会对传统芯片厂商的市场份额造成一定影响,但较难撼动其在技术上的领先地位.26 7.2.AI 芯片市场高增,逐渐分散化,利好 AMD AI 芯片发展.27 7.3.拥有丰富的产品组合,或可在 AI 市场差异

12、化竞争.28 ZYnXlYvVhU9UsR9PbP9PnPoOpNtPfQmMmPjMqQsN9PqRmMxNtRmQNZnRqR AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 3 of 33 8.营收重回正增长,高研发投入注入成长动力.28 9.风险提示.30 AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 4 of 33 1.投资建议投资建议 考虑到 AMD 产品将在 AI 浪潮中受益,助推公司营收改善。我们预计公司 FY2024E/FY2025E/FY2026E 营业收入分别为

13、291.8/364.4/437.9 亿美元,同增 29%/25%/20%,对应经调整净利润分别为 74/103/131 亿美元,同增 73%/39%/28%。估值方面,我们选取全球半导体市场的头部企业作为 AMD 的可比公司。结合彭博的一致预测,可比公司 NTM(未来 12 个月)的平均 PE 31.6X,平均 PS10.6X。AMD 在 CPU 和 GPU 市场都占据第二位。AMD 有望在此次人工智能的大浪潮中受益,产品竞争力不断追赶英特尔与英伟达,且我们预计人工智能部分的收入将不断提升,因此我们预计 AMD 将享有比可比公司更高的估值。第一,我们使用 PE 估值法,给予 AMD 高于可比公

14、司平均的 PE 50X,对应 2024 年目标市值 3700 亿美元,合理估值为 229 美元;第二,我们使用 PS 估值法,给予 AMD 高于可比公司平均的 PS 13X,对应 2024 年目标市值 3793 亿美元,合理估值为 235 美元;综合平均两种估值方法,给予目标价 232 美元,首次覆盖,给予“增持”评级。表表 1 AMD 可比公司估值可比公司估值 数据来源:Bloomberg,国泰君安证券研究 表表 2 AMD 核心指标预测核心指标预测 AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 5 of 33 数据来源:公司财报 2.

15、成长之路跌宕起伏,逐步稳扎成长之路跌宕起伏,逐步稳扎 CPU与与 GPU市场市场 2.1.横跨多产品线横跨多产品线,布局布局完善完善 2.1.1.1969 年年-1998 年:起步期,主攻性价比并依靠代工起家年:起步期,主攻性价比并依靠代工起家 AMD 初期作为模仿者,定位“第二供应商”主攻性价比。初期作为模仿者,定位“第二供应商”主攻性价比。AMD 于 1969年由桑德斯创立。桑德斯与英特尔的创始人罗伯特均来自仙童半导体,但罗伯特从事技术岗位工作,而桑德斯作为销售人员,相较于罗伯特创业初期更为困难,因此不同于英特尔以技术发展为导向,AMD 决定以市场为导向,凭借学习模仿和生产制造能力,定位“

16、第二供应商”主攻性价比,提供更加质优价廉的产品。至 1974 年,AMD 营收达到 2650 万美元,已站稳第二供应商的地位。IDM 处理器订单外放使处理器订单外放使 AMD 获得英特尔授权,获得英特尔授权,AMD 同英特尔联合生同英特尔联合生产产 PC 处理器芯片。处理器芯片。1981 年,IBM 在其 PC 处理器上采取外包策略,向英特尔订购 8086 处理器,英特尔将其技术授权予 AMD,共同为 IDM 进行生产。1986 年,AMD 推出基于英特尔授权的 286 处理器,比英特尔同期的 8086 处理器更优质,英特尔决定终止技术授权,自此 AMD 开始大力投入自主技术研发。2.1.2.

17、1999 年年-2006 年:成长期,自研处理器带动公司快速发展年:成长期,自研处理器带动公司快速发展 AMD 开始推出自主开始推出自主技术技术研发的处理器,研发的处理器,逐渐对英特尔形成赶超之势。逐渐对英特尔形成赶超之势。AMD 于 1999 年推出速龙(Athlon)处理器,综合性能超越英特尔奔腾,并率先英特尔突破主频 1GHz 门槛,2003 年推出业内首款 x86 架构64 位处理器皓龙(Opteron),为 AMD 带来大量的服务器市场份额。这一时期 AMD 发展极为迅速,甚至一度在台式机处理器市场中市占率超过 50%,超越英特尔。图图 1 皓龙皓龙处理器为处理器为 AMD 带来带来

18、 20-25%的服务器市的服务器市场份额增量场份额增量 图图 2 台式机处理器市场中台式机处理器市场中,AMD 市占率曾超过市占率曾超过50%,超越英特尔,超越英特尔 数据来源:Mercury Research,Company data 数据来源:Passmark,国泰君安证券研究 2.1.3.2007 年年-2016 年:沉寂期,整合业务摸索前行年:沉寂期,整合业务摸索前行 AMD CPU 与与 GPU 业务皆遭遇重大打击。业务皆遭遇重大打击。2006 年英特尔推出酷睿 2,AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 6 of 33

19、其大幅提升的性能使得 AMD CPU 性能优势不再突出。而 2011 年 AMD推出全新的“Bulldozer”微架构,但在处理器技术发展路线上判断失误,拥有更多的核心数的同时单核性能却存在倒退,后续推出的同系列微架构,市场反馈均相对较弱。在 GPU 市场,2006 年 AMD 以约 54 亿美元收购 GPU 市场排名第二的 A TI,开始与英伟达进行正面竞争。但在收购后,AMD 不得不投入大量精力以整合业务,而英伟达却推出了一系列强劲的 GeForce 新品抢夺市场份额。2008 年,AMD 将 A TI 移动业务部Imageon 产品线卖给高通,因而错失移动互联网时代。2011 年,AMD

20、 尝试将 CPU 和 GPU 融合到 APU 处理器中,但性能仍不佳。在此过程中,英特尔和英伟达逐步抢占了 AMD 在 CPU 和 GPU 市场的份额。图图 3 2006-2017 年,英特尔逐步抢占年,英特尔逐步抢占 AMD CPU 市市场份额,最高达场份额,最高达 80%图图 4 AMD 与英伟达在桌面独立显卡市场市占率,随与英伟达在桌面独立显卡市场市占率,随着英伟达着英伟达 GeForce 一系列新产品发布,英伟达逐步一系列新产品发布,英伟达逐步占领了占领了 GPU 中高端市场中高端市场 数据来源:Passmark 数据来源:Jon Peddie Research AMD 分拆制造业务,

21、英特尔先进制程进度出现延期,成为分拆制造业务,英特尔先进制程进度出现延期,成为 AMD 后续后续反超的一大伏笔。反超的一大伏笔。2009 年,AMD 决定将旗下制造业务分拆成立格芯,并专注于硬件集成电路设计及产品销售业务,这为后续能够使用台积电更先进的制程技术做出铺垫。2014 年,英特尔 14nm 制程延期,后续 10nm制程仍出现延期,为后续 AMD 的反超埋下伏笔。2.1.4.2017 年至今:重塑竞争优势,完善全产品线布局年至今:重塑竞争优势,完善全产品线布局 AMD 推出基于推出基于 Zen 架构的架构的锐龙系列锐龙系列处理器处理器,重塑竞争优势。重塑竞争优势。2012 年 1月,长

22、期处于困境的 AMD 在第五任 CEO 苏姿丰的加入下开始了逆袭之路。2017 年首先推出基于 Zen 架构的锐龙系列处理器,Zen 2 及后续订单开始交由台积电代工,强大的综合性能与先进的制程技术,使得 AMD在消费级 CPU 市场站稳脚跟;随后推出 EPYC 系列 CPU、Radeon 系列GPU 等,并通过收购赛灵思逐步完善了业务布局。这一系列举措帮助AMD 逐渐扭转了困境,重塑了在市场上的竞争地位。苏姿丰博士苏姿丰博士具备出类拔萃的专业知识与管理能力。具备出类拔萃的专业知识与管理能力。她拥有麻省理工学院(MIT)电气工程学士、硕士与博士学位。1994 年博士毕业后进入美国德州仪器公司的

23、半导体制程与元件中心任职;1995 年进入 IBM,在多个工程和业务部门担任过领导职位;2007 年作为首席技术官加入飞思卡尔公司,后担任高级副总裁兼网络与多媒体部门总经理;2012 年 1 月加入AMD,从工程师晋升为职业经理人。苏资丰喜欢挑战,且极为坚毅理性,AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 7 of 33 所有决策的制定都是从解决问题的角度出发。她因电气工程有挑战性遂选择作为大学专业,在身处研发岗位时主动尝试经营管理,她相信竞争让她变得更好。在上任 CEO 之后,为解决 AMD 当时资金困难、产品落后的困境,果断做出了裁

24、员、简化业务流程等决策,并通过将新研发的架构授权给中国公司、与中国公司成立合资公司并转让芯片封装业务筹集资金,使其有足够的资金研发对当时的AMD有显著意义的Zen架构。苏资丰领导下的苏资丰领导下的 AMD 制定了三项核心战略:以产品驱动、维持良好的制定了三项核心战略:以产品驱动、维持良好的合作伙伴关系和简化运营。合作伙伴关系和简化运营。AMD 简化研发流程,基于可扩展设计完善了 Zen 架构的路线图,同时建立新的可迭代的产品周期,每年推出新一代 GPU,每 1.5 年推出新一代 CPU。AMD 加深了与索尼和微软的合作,摆脱对传统 PC 市场的依赖,业务来源更加多元化,扩展到游戏、数据中心等增

25、长市场。AMD 进行了自上而下的组织结构微调,提高了高管沟通的透明度和频率,并鼓励培养包容性的上海品茶。这三大战略为 AMD在竞争激烈的市场中取得成功提供了坚实的基础。2.2.股价复盘股价复盘 图图 5 AMD 股价经历了成长、沉寂与反超三个大周期股价经历了成长、沉寂与反超三个大周期 数据来源:Choice,国泰君安证券研究 2.3.采取扁平化管理,技术部门占据主导地位采取扁平化管理,技术部门占据主导地位 AMD 采用扁平化的管理结构,其组织架构层级相对较少。采用扁平化的管理结构,其组织架构层级相对较少。其中,技术部门规模较大且划分较为详细,而各核心业务都设有专门的团队,与职能部门平行运作。这

26、种结构体现了公司注重以产品驱动的战略。根据Zppia 的数据显示,AMD 员工中最常见的专业是电气工程,占比高达33%。同时,公司官网开放的招聘岗位以工程研发为主,进一步印证了公司技术部门占据主导地位的安排。这种结构的设计有助于加强对产品研发的专注,并确保在技术创新方面取得竞争优势。AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 8 of 33 图图 6 AMD 组织架构组织架构层级较少,技术部门较为庞大层级较少,技术部门较为庞大 数据来源:theofficialboard,国泰君安证券研究 2.4.股权架构分散,无单一大股东股权架构分散,

27、无单一大股东 大部分为机构持股,股权结构分散。大部分为机构持股,股权结构分散。据 Yahoo Finance 2023 年 12 月数据显示,AMD 72.03%为机构持股,0.49%为内部人士持股。机构投资者共有 2770 家,其中持股占比前三高的依次为先锋领航集团、贝莱德、道富公司,分别占比 8.75%/7.60%/4.01%,股权结构总体较为分散。表表 3 AMD 股权分散,无单一大股东股权分散,无单一大股东 投资者投资者 持股数量持股数量 持股比例持股比例 先锋领航集团先锋领航集团 142,442,745 8.90%贝莱德贝莱德 123,699,344 7.73%道富公司道富公司 66

28、,319,789 4.14%富达管理与研究富达管理与研究 40,339,216 2.52%摩根大通公司摩根大通公司 35,979,845 2.25%Geode 资本管理有限责任公司资本管理有限责任公司 31,776,843 1.99%费舍尔资产管理有限责任公司费舍尔资产管理有限责任公司 28,368,826 1.77%普徕仕普徕仕 27,675,684 1.73%杰尼森资产管理公司杰尼森资产管理公司 26,886,280 1.68%摩根士丹利摩根士丹利 26,590,372 1.66%数据来源:Yahoo Finance,国泰君安证券研究 2.5.产品线较为分散,覆盖范围广泛产品线较为分散,覆

29、盖范围广泛 公司将所有业务划分为了四个板块:数据中心、客户端、游戏及嵌入式公司将所有业务划分为了四个板块:数据中心、客户端、游戏及嵌入式业务业务,产品类型涵盖处理器、显卡、FPGA 等等。1)数据中心业务包含了 EYPC 服务器处理器、Instinct GPU 加速器、赛灵思中数据中心部分的 FPGA 和自适应 SoC,以及Pensando 的 DPU。2)客户端业务包含了笔记本、台式机及工作站 CPU 和 APU。3)游戏业务包含了 Radeon 系列台式机及笔记本 GPU、游戏机半定制 SoC。4)嵌入式业务包含了锐龙和霄龙嵌入式处理器,以及赛灵思的FPGA、自适应 SoC。各产品线收入占

30、比均衡,各产品线收入占比均衡,AI 业务是公司头号战略重点。业务是公司头号战略重点。四条产品线中,AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 9 of 33 客户端和游戏业务是 AMD 过去主要的收入来源,截止 2019 年占据总收入高达 85%。随着赛灵思的收购落地及数据中心的发展,AMD 的收入构成逐渐多样化;截止 2023Q3,数据中心、客户端、游戏和嵌入式业务分别占据总营收的 27.6%/25.1%/26.0%/21.4%。AMD 多次强调,AI 业务将是目前公司的头号战略重点,接下来的目标是进一步扩大数据中心的收入占比。图图

31、7 AMD 的收入结构逐渐多样化的收入结构逐渐多样化 数据来源:公司财报,国泰君安证券研究 3.数据中心:拥抱数据中心:拥抱 AI浪潮浪潮,是短期公司最大的增量,是短期公司最大的增量业务业务 AMD 的数据中心产品线涵盖 EYPC服务器处理器、Instinct GPU加速器、赛灵思中数据中心部分的 FPGA和自适应 SoC,以及 Pensando 的 DPU。3.1.提供性能及能效俱佳的服务器处理器产品组合,市场份额提供性能及能效俱佳的服务器处理器产品组合,市场份额稳步提升稳步提升 AMD 数据中心主要的数据中心主要的 CPU 产品是产品是 EPYC(霄龙)系列处理器(霄龙)系列处理器,于 2

32、017年推出第一代 7001 Naples,2019 年推出第二代 7002 Rome,2021 年推出第三代 7003 Milan。最新的第四代 EPYC 处理器于 2022 年发布,并于2023 年全面完善,共包含 Genoa、Genoa-X、Bergamo 及 Siena 四个系列,满足全方位的计算需求。AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 10 of 33 表表 4 EPYC 系列更新稳定每系列更新稳定每 1-2 年更新一代年更新一代 数据来源:AMD 官网,国泰君安证券研究 公司现提供业界性能最高、能效最高的服务器处理器

33、产品组合,涵盖云、公司现提供业界性能最高、能效最高的服务器处理器产品组合,涵盖云、企业、技术、企业、技术、HPC 和边缘计算。和边缘计算。第四代 EPYC 产品组合覆盖多应用需求。首先,Genoa 和 Genoa-X 系列采用 Zen 4 架构,针对每核性能进行优化;其次,Genoa-X 运用了 3D V-Cache 技术,将 L3 缓存垂直堆叠,从而在占用很少空间的情况下显著增加缓存的大小,适用于缓存需求较高的技术运算;而 Bergamo 和 Siena 采用 Zen 4c 架构,是 Zen 4 架构的加强版,针对每瓦性能进行优化,从而能够提供更高的密度和能效。Genoa 和 Bergamo

34、 区别在于 CCD 核心小芯片:Bergamo 通过在针对功率和面积进行优化并改动 L3 缓存层次结构以提高吞吐量,最终核心小芯片的面积缩小 35%,每瓦性能显著提高,使得每一个计算小芯片中包含的内核数量是 Genoa 的两倍,达到每个插槽 128 个内核,更适合注重吞吐量、高密度和高能效的云原生计算,相比英特尔 Xeon platinum,具有最高 2.6 倍的性能提升、2.1 倍的密度和 2 倍的能耗比。最后,Siena是针对最佳性能、能耗和成本进行了优化。同样采用 Zen 4c 架构,但相比于其他三款拥有更少的内核数,规模更小,主要针对低功耗领域。Siena适合智能边缘等较小的服务器节点

35、,提供均衡的性能、较高的能效和更低的成本。在摩尔定律逐渐失效的趋势下,在摩尔定律逐渐失效的趋势下,AMD 在在 chiplet 技术和架构设计上的竞技术和架构设计上的竞争优势重要性凸显。争优势重要性凸显。2015 年 AMD 开始研发 chiplet 技术,通过将芯片分解成更小的碎片,将制造成本降低了 40%。在半导体工艺节点下探到物理极限、摩尔定律发展到达瓶颈、但对芯片性能的要求不断提高的背景下,从前的单片 SoC 尺寸过大且成本太高、良率下降。chiplet 技术将功能模块的芯片单元化,再根据需要将不同功能的裸片进行组合和拼接,具有高集成度、高设计弹性、高良率、低成本的优点。第四代 EPY

36、C 全系列均采用了台积电 5nm 制程及小芯片技术。AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 11 of 33 图图 8 小芯片技术有效降低生产成本小芯片技术有效降低生产成本 图图 9 第四代第四代 EPYC 系列覆盖多样化的应用需求系列覆盖多样化的应用需求 数据来源:Open Compute Project 数据来源:AMD 官网 相比英特尔,相比英特尔,EPYC 系列系列具有制程和性能方面的竞争优势。具有制程和性能方面的竞争优势。对标 EPYC,英特尔在服务器 CPU 领域于 23Q1 推出了第四代可扩展 Xeon CPU Sap

37、phire Rapids,并公布了第五代可扩展 Xeon CPU Emerald Rapids 将于23Q4 推出。EPYC 采用台积电 5nm 制程,相较于 Sapphire Rapids 和Emerald Rapids 采用的 Intel 7 工艺,制程工艺上领先英特尔。实际性能方面,AMD 官方分别将三级缓存最高的 EPYC 9684X、核心数和线程数最高的EPYC9754与英特尔Xeon内核数和缓存最高的8490H进行对比,EPYC 均大幅领先。EPYC 系列性能表现良好,助推市场份额上升。系列性能表现良好,助推市场份额上升。自 2017 年第一代 EPYC处理器推出后,AMD 在服务

38、器处理器领域的市场份额稳步上升。第四代EPYC 市场反馈良好,市占率在 23Q3 达到 23%,公司于第三季度财报会上表示,亚马逊、谷歌、微软、甲骨文、腾讯等公司在该季度推出了近 100 个由 AMD 驱动的新的云应用。其主要竞争对手英特尔因在 CPU领域的长期优势,市占率约为八成。短期内,凭借 EPYC 处理器的优异性能,AMD 的市场份额有望进一步提升。从长远来看,英特尔提出的“四年五个节点”的计划中,计划于 2024 年达到 2nm 制程,可能会重新夺回市场份额。然而,截至 2023 年 12 月 22 日,计划于 2023 年下半年投产的 Intel 3 节点暂无具体的投产消息,这意味

39、着 AMD 的竞争优势有望继续维持。图图 10 AMD 在服务器在服务器 CPU 市场的市占率稳步上升市场的市占率稳步上升 表表 5 第四代第四代 EPYC 领先领先于于第四、五代可扩展第四、五代可扩展 Xeon 数据来源:Mercury Research,国泰君安证券研究 数据来源:AMD 官网,Intel 官网,国泰君安证券研究 AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 12 of 33 3.2.APU 加速器集成多项创新技术,覆盖加速器集成多项创新技术,覆盖 AI 和和 HPC 工作负工作负载载 AMD 面向数据中心的加速器产品

40、为面向数据中心的加速器产品为 Instinct 系列系列。最新的 Instinct MI300系列中,MI300A 于 2023 年 1 月发布发布,MI300X 于 2023 年 6 月发布。其中,MI300A 是首款针对 AI 和 HPC 的 APU 加速器(CPU+GPU),MI300X 是针对生成式 AI 和大语言模型的 GPU 产品。MI300A 作为第一款数据中心作为第一款数据中心 APU 产品,应用了多项领先技术。产品,应用了多项领先技术。MI300A与英伟达的 GH200 同属于 CPU+GPU 的异构芯片,且都定位于 HPC 和AI 计算,两者有以下几个区别:1)芯片结构方面

41、芯片结构方面,MI300A 是市场上首款“CPU+GPU+内存”一体化产品,结合了 Zen 4 CPU 和 CDNA 3 GPU。采用 chiplet 技术,共由 13块小芯片组成,在 4 块 6nm 内存小芯片上堆叠了 9 块 5nm 计算小芯片(6 个 GPU 芯片和 3 个 CPU 芯片),共配置 128GB的 HBM3 内存和 1个 CDNA 3 图形引擎。GH200 整合了基于 Arm 的 NVIDIA Grace CPU 与NVIDIA H100 Tensor Core GPU。其中,GH200 的 CPU 采用 ARM 架构而 MI300 的 CPU采用 x86 架构,两种 CP

42、U架构在 AI 应用中各有优势:ARM 架构能耗较低,x86 架构性能更高。2)封装技术方面)封装技术方面,MI300 使用台积电 SoIC(3D)和 CoWoS(2.5D)两种封装技术,而 Nvidia H100 和 GH200 仅使用 CoWoS(2.5D)封装技术。相较 2.5D 封装方案,SoIC 的凸块密度更高,传输速度更快,功耗更低。且 AMD 在先进封装上具有先发优势,经验更为丰富:AMD 于 2015 年研发了 chiplet 技术,后于 2021 年和台积电一起开发了 3D chiplet。图图 11 3D 封装将芯粒垂直堆叠封装将芯粒垂直堆叠 图图 12 3D 封装有效提升

43、封装有效提升凸块密度凸块密度 数据来源:Sofics 官网 数据来源:台积电官网 3)内存带宽方面内存带宽方面,MI300A 使用了创新的“统一内存架构”(Unified Memory),使得 GPU 和 CPU 可以共享同一内存空间。一方面绕过了传输协议速率限制,另一方面消除了不必要的内存复制从而减少内存带宽的占用,加速了 CPU-GPU 之间的数据传输。GH200 则使用了 NVLink-C2C(Chip-to-Chip)进行 GPU-CPU 高速互联,传输带宽高达 900 GB/s,不过仍受到传输协议速率限制和需要内存复制的限制,不同于 MI300 实现了真正物理意义上的统一。AMD 有

44、在 APU产品上有长期的技术积累,AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 13 of 33 在 PC 端和游戏主机业务中都推出过 APU 产品,相比英伟达在整合CPU+GPU 在同一芯片内具有经验优势。图图 13“统一内存架构统一内存架构”加速数据加速数据传输传输 图图 14 GH200 使用使用 NVLink-C2C 进行进行 GPU-CPU 互互联联 数据来源:AMD 官网 数据来源:英伟达官网 3.3.GPU 加速器取得较大进展,追赶加速器取得较大进展,追赶 AIGC 浪潮浪潮 MI300X 性能亮眼,大幅提升了性能亮眼,大幅

45、提升了 AMD 在在 AI 芯片上的竞争力。芯片上的竞争力。MI300X同样采用 chiplet 技术,共由 12 个小芯片组成,将 8 个 12Hi堆栈的 HBM3内存与 8 个 3D 堆栈的 5nm CDNA 3 GPU 小芯片融合在 4 个底层 6nm I/O 芯片上,具有 256MB Infinity Cache 用作共享 L3 缓存层,以促进小芯片之间的通信。为满足大语言模型和 AI 计算的需求,MI300X 将MI300A 中 3 块 CPU 小芯片换成了两个 CDNA 3 GPU 小芯片。该芯片拥有 304 个 GPU 计算单元,可为 FP16 和 BFLoat16 等关键 AI

46、 数据类型的运算提供三倍以上的性能,8 个 HBM3 的槽位从 16GB的规格升级到了 24GB的规格,共拥有 192GB的 HBM3 内存,有效解决了大模型时代的显存瓶颈与带宽瓶颈问题,可以容纳比 H100 多两倍的 300 亿参数训练模型和 700 亿参数的推理模型,并可支持 700 亿参数训练模型和2900 亿参数的推理模型,相较于 H100 HGX 多一倍。MI300X 相比相比 Instinct 系列的前几代加速器有大幅性能提升,参数及实系列的前几代加速器有大幅性能提升,参数及实际性能层面都对标了英伟达的际性能层面都对标了英伟达的 H100。据 AMD 官方数据显示,在推理性能方面,

47、与 H100 HGX 相比,AMD Instinct 平台在 176B BLOOM 模型上运行推理时性能是其 1.6 倍,在 Llama2 700 亿参数模型上运行推理时性能是其 1.4 倍;单个 MI300X 芯片的推理性能是 H100 的 1.2 倍。在关键 AI kernel 性能表现上,MI300X 平台的表现也优于 H100 10%-20%。训练性能方面,MI300X 平台训练 30B MPT 模型的性能与 H100 HGX 持平。与此同时,AMD 还为 MI300X 配备了 400GbE 网络并支持多种网卡,比英伟达的选择更多。AMD半导体(半导体(AMD.US)请务必阅读正文之后

48、的免责条款部分请务必阅读正文之后的免责条款部分 14 of 33 图图 15 MI300X 涵盖涵盖 8 块块 CDNA 3 GPU 小芯片小芯片 表表 6 MI300X 参数对标参数对标 H100 数据来源:AMD 官网 数据来源:AMD 官网,英伟达官网,国泰君安证券研究 3.4.软件生态是软件生态是 AMD 破局的关键,短期兼容破局的关键,短期兼容 CUDA,长期自,长期自研研+收购,发展自己的软件生态收购,发展自己的软件生态 市场一致认为,市场一致认为,AMD 数据中心加速器的瓶颈在于软件生态。数据中心加速器的瓶颈在于软件生态。软件生态极大的影响了硬件产品的实际应用成本,故在硬件部署的

49、过程中不可或缺。英伟达于 2007 年发布 CUDA 生态系统,开发人员可以通过 CUDA部署 GPU 进行通用计算。通过先发优势和长期耕耘,CUDA 生态圈已较为成熟。AMD 则起步较晚,于 2016 年发布对标 CUDA 的 ROCm。ROCm 旨在提供一个可移植、高性能的旨在提供一个可移植、高性能的 GPU 计算平台。计算平台。支持 HIP 和OpenCL 两种 GPU 编程模型,可实现 CUDA 到 ROCm 的迁移,但是存在转译带来的性能损失。与与 CUDA 主要存在以下几方面的区别主要存在以下几方面的区别:1)生态系统:)生态系统:ROCm 拥有不断发展的工具和库生态系统,包括Te

50、nsorFlow、PyTorch 和 MIOpen,可针对高性能计算进行了优化。CUDA同样拥有完善的工具和库生态系统,包括TensorFlow、PyTorch 和 cuDNN。但总的来说 ROCm 的算子库的丰富度和用户数远低于 CUDA。2)框架迁移:)框架迁移:CUDA 在训练推理过程中对开发者需要做框架迁移的支持显著优于 ROCm。3)底层框架支持:)底层框架支持:ROCm 目前在底层框架支持上只针对少数主流框架,CUDA 相较完整。4)开源与闭源:)开源与闭源:ROCm 作为一个开源平台,开发人员可以根据自己的特定需求定制 ROCm,CUDA 则是全闭源。ROCm落后于落后于 CUD

51、A,但已取得重要进展。,但已取得重要进展。第一,ROCm曾只包括Radeon Pro 和 Radeon Instinct 等较高端的系列,现已逐步向游戏显卡拓展;第二,ROCm 曾只支持 Linux 系统,现已开始支持 Windows 系统;第三,ROCm 已经开始支持主流机器学习框架包括 TensorFlow、Caffe 和PyTorch 等,进一步完善了其 GPU 在机器学习方面的应用。短期兼容短期兼容 CUDA,长期自研,长期自研+收购收购,发展自己的软件生态。发展自己的软件生态。为弥补在软件生态方面的不足,AMD 采取了如下策略:短期内支持 ROCm 通过 HIP(可移植异构计算接口)

52、兼容 CUDA,吸引用户转移。AMD 提供了将CUDA 应用程序通过 HIPIFY 工具自动转换为 HIP 内核语言及运行 API AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 15 of 33 的功能,HIP 源码通过不同的编译工具可以实现在AMD 或英伟达的 GPU上运行,从而实现兼容。长期 AMD 将通过收购+自研打造自己的软件生态。2023 年初 AMD 成立了人工智能部门,该部门拥有约 1500 名工程师,绝大多数从事与软件相关的工作;8 月收购了法国初创公司Mipsology,拓展其人工智能推理软件能力;10 月宣布收购专注于

53、开发针对硬件平台优化人工智能算法的开源软件 Nod.ai,拓展其在开源 AI 软件方面的实力。所有收购团队都将整合进 AMD 人工智能部门。ROCm 的低转换成本使得的低转换成本使得 AMD GPU 在推理端更具优势。在推理端更具优势。目前,英伟达凭借其训练结果精度优势在训练端市场占据了难以撼动的市场地位。然而,由于英伟达 GPU 价格较高及供应量受限,客户在推理端根据市场需求或者产品需求通常选用其他 GPU 进行推理以节约产品成本。在训练与推理过程种选择不同品牌 GPU,会涉及到模型的转换和迁移的问题,AMD 以其兼容优势可以有效降低模型转换成本。英伟达 GPU 多使用PyTorch 和 T

54、ensorFlow 进行模型训练,ROCm 同样支持该主流机器学习框架,同时,ROCm 使用 HIP 和与 CUDA 相同的对外 API 接口,实现了低性能损耗,奠定了 AMD GPU 在推理端市场的占有更大市场份额的基础。3.5.收购赛灵思,将收购赛灵思,将 FPGA 带入数据中心布局带入数据中心布局 AMD 于于 2022 年完成对年完成对 FPGA 大厂赛灵思的收购,主要目的大厂赛灵思的收购,主要目的为为助力数助力数据中心。据中心。FPGA 全称为现场可编程门阵列,其制造完成后,用户通过对逻辑单元和开关阵列编程,使 FPGA 内部形成不同的逻辑电路,从而实现用户所需的功能。FPGA 对

55、AMD 的数据中心业务具有极大的补强作用:首先,FPGA 现场可编程的性质使其具备灵活性高的特点,面对当前数据中心里不断变化的运算需求,FPGA 可以帮助节省大量成本。其次,FPGA 拥有的大量逻辑块使其具备并行性好的特点,而当前 AI 的发展对高吞吐量和实时计算的需求不断提升,可以利用 FPGA 进行大量并行计算。通用 CPU 的性能无法支撑计算密集的 AI 应用,因此需要专用的芯片去加速,结合 FPGA的两大特点,预计在 FPGA有较大发展空间。赛灵思的产品在数据中心领域的主要功能在于硬件加速赛灵思的产品在数据中心领域的主要功能在于硬件加速,目前原赛灵思旗下用于数据中心的产品主要有以下几项

56、:1)Versal 自适应计算加速平台(自适应计算加速平台(Versal ACAP):):ACAP 是赛灵思于2018 年发布的具有自适应计算能力的、完全软件可编程的异构计算平台。ACAP 保留了 FPGA的可编程性和自适应性,由硬件可编程逻辑单元(自适应引擎)、软件可编程处理器(标量引擎,ARM 处理器)、软件可编程的加速引擎(矢量引擎,AI 引擎)整合而成,充分利用各自的优势。同时,ACAP 有以下两点创新:第一,ACAP 对传统 FPGA 基本单元算力有限的弱点进行了优化,增加了高并行度的计算引擎 AI 引擎;第二,增加了高度灵活的、每秒多兆位可编程片上网络(NoC),无缝集成所有引擎和

57、重要接口,且可以快速高效地传输数据。V ersal ACAP 中适用于数据中心的有两个系列:AI Core 系列凭借 AI 引擎可实现突破性的 AI 推断和无线加速,与当今的服务器级 CPU 相比,AI 引擎提供的计算性能高出 100 倍以上。AI Edge 系列可在边缘节点提供相较领先的 GPU 4 倍的AI 单位功耗性能,且适用于功率和热受限的环境。AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 16 of 33 2)Alveo 系列加速卡:系列加速卡:专门面向数据中心工作负载的加速卡,实现多个型号覆盖多场景应用。例如,Alveo U5

58、5C 专为 HPC 和大数据应用而构建,Alveo U25N 面向网络和安全加速。图图 16 Versal ACAP 基于创新架构基于创新架构 图图 17 赛灵思拥有完善的开发平台赛灵思拥有完善的开发平台 数据来源:AMD 官网 数据来源:赛灵思公众号 赛灵思面向所有开发者赛灵思面向所有开发者均均拥有完整的开发平台。拥有完整的开发平台。赛灵思于 2012 年推出针对其 FPGA 产品的开发套件 Vivado,主要针对硬件,开发人员需要具备比较强的 FPGA 硬件开发能力。2019 年推出统一软件开发平台 Vitis,Vitis 平台无需用户深入掌握硬件专业知识,即可根据软件或算法代码自动适配和

59、使用赛灵思的硬件架构。此外,Vitis 平台不限制使用专有开发环境,可以插入到通用的软件开发工具中,并利用丰富的优化过的开源库,使开发者能够专注于算法的开发。针对 AI 领域,赛灵思整合出了Vitis AI,可以帮助 AI 开发者用于加速 AI 及机器学习开发。Vitis AI 不只支援主流 ML 开发框架(TensorFlow、PyTorch、Caffe 等),还整合多种 AI 开发套件,包括 AI 优化器、AI 量化器、AI 编辑器,以及 AI 分析器等,更支援深度学习这一类 DSA(专用领域)应用架构的 DNN 处理器,例如电脑视觉 CNN、LTSM 及 MLP 多层感知神经网路。AI

60、科学家能利用 Vitis 平台,迅速开发出行业所需的特定领域 AI 应用。3.6.收购收购 Pensando,将,将 DPU 带入数据中心布局带入数据中心布局 收购收购 Pensando,布局布局 DPU 优化数据中心工作负载。优化数据中心工作负载。由于数据中心的复杂性不断提升,CPU 的性能达到瓶颈,针对数据中心的工作负载进行优化的必要性进一步显现,促使了 AMD 对 Pensando 的收购。Pensando 最主要的技术为 DPU,是一种提供数据中心基础设施服务的通用处理器,前身为基础网卡和智能网卡。DPU 在硬件架构上增加了通用处理单元CPU 和丰富的硬件加速单元,从而可以实现对网络、

61、存储、安全和管控等通用基础设施的加速、卸载和隔离,使 CPU 专注于其他计算,能够大幅提升整体性能、降低功耗和成本,降低云的 TCO。Pensando 的主要产品是的主要产品是“分布式服务平台分布式服务平台”,其核心是完全可编程 P4 数据处理单元(DPU)和对应的一套软件。通过硬件和软件的结合,提供云服务、计算、网络、存储和安全服务。硬件部分包括用于服务器网络加速的 DSC(Distributed Services Card)系列和用于数据中心架顶交换机的 DSS(Distributed Services Switch)系列,软件部分是用于网络和安全策略管理的 PSM(Policy and

62、Services Manager)软件系列。DSC 和 DSS AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 17 of 33 是软件可编程的,将 DPU 安装在服务器和交换机中,通过 PSM 按需部署计算加速、网络协议加速、安全加速、存储加速、NVMe-over-Fabric 加速、数据加密和解压缩等业务,将这些服务从 CPU 卸载到 DPU 上集中管理。目前目前 Pensando 最新的最新的 DPU 产品代号为产品代号为 Giglio,可以在云规模下以 2 x 200Gb/s 的线路速率负载各种数据中心网络、存储和安全服务。它具有由

63、 144 个定制匹配处理单元(MPU)组成的 P4 可编程管道,结合 16 倍A72 ARM 核心复杂结构,以及专用数据加密和存储卸载引擎,并通过专有的快速片上网络互连连接在一起。战略意义上,认为 Pensando 的产品和赛灵思 Alveo SmartNIC 并不冲突,且是相辅相成的:Pensando 的芯片架构可以高速支持几个同时进行的工作任务,而 Alveo SmartNIC 可以提供更高的性能,但不能同时支持太多的工作负载。图图 18“分布式服务平台分布式服务平台”结合了硬件与软件结合了硬件与软件 图图 19 Pensando 的的 DPU 架构架构 数据来源:Pensando 研讨会

64、 数据来源:AMD 发布会 3.7.全面完善数据中心布局,囊括全面完善数据中心布局,囊括 CPU+GPU+FPGA+DPU AMD 已经拥有了业内最全的已经拥有了业内最全的 CPU+GPU+FPGA+DPU 数据中心产品组数据中心产品组合,可以覆盖全场景合,可以覆盖全场景 AI 数据计算需求:数据计算需求:锐龙 CPU、EPYC CPU 将用于训练和推理小到中型模型;搭载 AI 引擎的 EPYC CPU、Radeon GPU 和V ersal 芯片将覆盖用于训练和推理中型到大型模型;Instinct GPU 和Xilinx 的自适应芯片将覆盖用于训练和推理超大型模型。CEO 苏资丰表示,数据中

65、心的工作负载正变得越来越专业化,AMD 广泛的数据中心产品组合可以做到为正确的工作负载使用正确的计算。软件生态层面,AMD 计划推出 AMD Unified AI Stack,将此前用于 CPU、GPU 和自适应芯片的不同软件堆栈整合到一个接口。第一个版本将整合 AMD 用于GPU 编程的 ROCm 软件、CPU 软件和赛灵思的 Vitis AI 软件,为推理工作负载提供统一的开发和部署工具。AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 18 of 33 图图 20 AMD 的产品组合覆盖全场景的产品组合覆盖全场景 AI 数据计算需求数据

66、计算需求 数据来源:AMD FAD 2022 图图 21“AMD Unified AI Stack”将整合用于将整合用于 CPU、GPU 和自适应芯片的不同软件堆栈和自适应芯片的不同软件堆栈 数据来源:AMD FAD 2022 4.客户端:全新架构、制程优势和客户端:全新架构、制程优势和 Chiplet技术带动技术带动性能提升,在性能提升,在 CPU市场的地位逐步稳定市场的地位逐步稳定 4.1.CPU 业务后来居上,提供了支撑业务后来居上,提供了支撑 AMD 走出困境的最大走出困境的最大动力动力 全新架构全新架构+制程优势制程优势+Chiplet 技术带动技术带动 CPU 性能提升,通过高性能

67、性能提升,通过高性能+高性价比后来居上。高性价比后来居上。AMD PC 端的消费级显卡为锐龙系列。2017 年前AMD CPU 的硬件技术在市场内全方位落后,直到 2017 年推出了具有历史意义的第一款基于 Zen 架构的处理器锐龙 1000 系列,较之前的推土机架构有了巨大的性能提升,开始具备了与英特尔竞争的实力。2018 年,发布了基于 12nm 工艺和 Zen+架构的锐龙 2000 系列;2019 年,发布基于 7nm 工艺和 Zen 2 架构的锐龙 3000 系列,第一次在消费级 CPU 中采用了 chiplet 技术,具有高设计弹性、高良率、低成本的优点;2020 年 7月发布了新的

68、 7nm 工艺的锐龙 4000 系列,10 月发布了基于 7nm 工艺和Zen 3 架构的锐龙 5000 系列,针对游戏玩家第一次采用了 3D V-Cache 技 AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 19 of 33 术,将 L3 缓存垂直堆叠,从而在占用很少空间的情况下显着增加缓存的大小,游戏性能较普通版提升达 15%;2022 年 1 月发布了基于 6nm 工艺和 Zen 3+架构的锐龙 6000 系列,8 月推出了采用目前最新的 Zen 4 架构的 Ryzen 7000 系列。AMD 预计将于 2024 年推出 Zen 5

69、 架构。相较于Intel 处理器优化的单核性能和较高的时钟频率,AMD CPU 则以其多核心设计和高频率性能在多线程任务上表现出色,尤其擅长运行视频编辑、3D 渲染和大型数据处理等高强度应用。图图 22 AMD 锐龙锐龙 CPU 发展历程:后来居上,超过英特尔发展历程:后来居上,超过英特尔 数据来源:AMD 官网,英特尔官网,国泰君安证券研究 全面拥抱全面拥抱 DDR5 内存和内存和 AM5 接口的主板,短期内失去性价比优势接口的主板,短期内失去性价比优势,但,但在在长期长期内影响将逐渐消失内影响将逐渐消失。AMD 的消费级 CPU市占率呈波动上升趋势,只在 22Q3 有一次较大的下降,主要原

70、因是锐龙 7000 系列只支持 DDR5内存和 AM5,后两者较高的价格使得锐龙 7000 系列 CPU 的性价比较低。但由于内存和主板升级是必然趋势,长期内此影响将不再存在。工作站处理器性能领先。工作站处理器性能领先。AMD 针对工作站市场推出的处理器为台式机的 Threadripper(线程撕裂者)Pro 系列和笔记本电脑的锐龙 Pro 系列。线程撕裂者 Pro 于 2020 年 7 月发布,专门面向专业工作站,对标英特尔的 Xeon(至强)系列。目前最新的是锐龙 Threadripper PRO 7000 WX 系列,基于 Zen 4 架构,拥有 5nm 制程工艺,大幅提升建筑设计、设计

71、与制造、媒体娱乐、软件与科学等行业的工作效率。由于具有更好的性能,AMD 在工作站 CPU 的市场份额远高于英特尔。图图 23 AMD 的客户端的客户端 CPU 市占率呈波动上升趋势市占率呈波动上升趋势 图图 24 AMD 在工作站在工作站 CPU 的市占率远高于英特尔的市占率远高于英特尔 数据来源:Mercury Research,国泰君安证券研究 数据来源:Puget Systems,国泰君安证券研究 AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 20 of 33 4.2.XDNA 架构首先应用至架构首先应用至 PC 端处理器,布局端

72、处理器,布局 AI PC,该业,该业务可以为务可以为 AMD 带来长期差异化竞争带来长期差异化竞争 将赛灵思与将赛灵思与 AMD 的产品深度整合,推出的产品深度整合,推出 XDNA 架构,并将其整合到多架构,并将其整合到多个产品线中。个产品线中。2022 年 AMD 面向 AI 应用推出了新架构 XDNA,是来自赛灵思的自适应架构 IP,专为 AI 计算而生。XDNA 包含 FPGA 架构和AI 引擎(AIE)等多项技术,其中 FPGA 架构将自适应互连与 FPGA 逻辑、本地存储器相结合,而 AI 引擎则提供了针对高性能和高能效 AI 与信号处理应用而优化的数据流架构。AMD 计划将 AI

73、引擎整合到其他多个产品线中,拓宽其在 AI 领域的布局:包括锐龙处理器、EPYC 处理器和赛灵思 V ersal 等产品,以用于中小型 AI 模型。首先将首先将 AI 引擎引入锐龙处理器,布局引擎引入锐龙处理器,布局 AI PC 市场。市场。第一代内置 AI 引擎的锐龙处理器 AMD 锐龙 7040 系列于 2023 年 1 月发布,采用 AMD Zen4处理器架构和 RDNA3 核显架构;第二代锐龙 8040 系列于 2023 年 12 月发布。AI 引擎具有以下几个优点:首先,AI 引擎单元有专属的本地内存空间,可以直接在本地处理不同的 AI 神经网络,摆脱了对云侧的依赖,从而能够无延时地

74、处理数据,且在隐私保护方面更加安全。第二,AI 引擎的峰值算力可以达到 10TOPS,是专为 AI 推理负载设计的,具备远超CPU/GPU 的能效。第三,AI 引擎改变了推理模型的处理方式,不再像传统神经网络那样只能在多个“神经元”之间一层一层地逐次流动,而是采用了全新的适应性数据流架构和适应性互连,可以针对不同负载、模型、数据,由不同单元、层级进行同步处理,从而大大提高性能、效率和能效,还可以由开发者进行定制,找到更适合特定负载的处理方式,实现效率最大化。图图 25 AMD 的客户端的客户端 CPU 市占率呈波动上升趋势市占率呈波动上升趋势 图图 26 带有带有 AI 引擎的引擎的 PC C

75、PU 已布局至第三代已布局至第三代 数据来源:AMD 发布会 数据来源:AMD 发布会 5.游戏:硬件及软件技术逐步完善,主打性价比优势游戏:硬件及软件技术逐步完善,主打性价比优势 5.1.作为技术层面的追赶着,主打性价比优势作为技术层面的追赶着,主打性价比优势 通过收购开启显卡业务,技术逐步进步。通过收购开启显卡业务,技术逐步进步。AMD 自 2006 年收购 A TI 后开始了显卡业务,2012 年发布了 GCN 架构,持续四代。2019 年 AMD 推出了 RDNA 架构和采用 RDNA 架构的 Radeon RX 5000 系列 GPU,较先前使用的 GCN 架构有大幅度提升。2020

76、 年推出了采用 RDNA2 架构的RX6000 系列,首次加入光线追踪和无限缓存技术。2022 年 11 月推出了目前最新的采用 RDNA 3 架构的 Radeon RX 7000 系列,该系列为第一款采用了chiplet技术的游戏显卡,具有更高的芯片良品率和更低的成本;AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 21 of 33 内置第二代线追踪加速单元和第二代无线缓存,首次加入了人工智能加速器和 Radiance Display 引擎;较 RDNA 2 性能功耗比提升多达 50%。主打性价比优势,迅速抢占中低端市场显卡份额。主打性价

77、比优势,迅速抢占中低端市场显卡份额。英伟达的游戏显卡为GeForce 系列,对比英伟达定位相同的游戏显卡,AMD 产品推出时间更晚,性能较为落后,但同时价格更低。例如同样作为定位最高的消费级显卡 Radeon 7900 XTX 和 GeForce RTX 4090,7900 XTX 的性能略低于RTX 4090,价格低了 600 美元。因此,AMD 在性价比更为重要的中端与入门级显卡市场占据更多的市场份额。图图 27 AMD 与英伟达同定位的显卡性能略微落后与英伟达同定位的显卡性能略微落后 图图 28 AMD 与英伟达同定位的显卡价格更低与英伟达同定位的显卡价格更低(美元)(美元)数据来源:T

78、OPCPU 数据来源:公司公告,国泰君安证券研究 逐步完善配套技术,向英伟达看齐。逐步完善配套技术,向英伟达看齐。英伟达于 2018 年在游戏显卡中加入光追技术,AMD 于 2020 年加入。英伟达于 2018 年推出 DLSS 技术,通过机器深度学习来训练人工智能,让人工智能把图像从较低的分辨率提升到较高的分辨率;AMD 于 2021 年推出对标 DLSS 的 FSR 技术,通过软件算法以低分辨率渲染输出高分辨率图像的超采样,两者的效果相似但实现原理不同。对比目前最新的光追技术,英伟达较为领先,对比DLSS 3.5 和 FSR 3,两者的差距逐渐缩小,且 FSR 可以同时支持 AMD和英伟达

79、的显卡,范围更广。图图 29 23Q2 显卡出货量:显卡出货量:AMD 在中端与入门在中端与入门级市级市场显卡市场中的市占率更高场显卡市场中的市占率更高 图图 30 AMD 的游戏主机客户的游戏主机客户(索尼、微软和任天堂)(索尼、微软和任天堂)市占率领先市占率领先 数据来源:Jon Peddie Research,国泰君安证券研究 数据来源:Ampere Analysis,国泰君安证券研究 AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 22 of 33 5.2.提供全套方案且性价比较高,游戏半定制业务长年领先提供全套方案且性价比较高,游

80、戏半定制业务长年领先 涵盖热门游戏主机及掌机客户,市场占有率第一。涵盖热门游戏主机及掌机客户,市场占有率第一。AMD 在游戏主机部分相比其他芯片厂商有以下优势:第一,可以提供整套的 CPU+GPU 方案,便于整合;第二,价格具有竞争力,综合性价比较高;第三,经历几代合作后与合作伙伴保持了良好的关系。这几点竞争优势有望在未来继续维持。目前合作过的方案包括索尼 PlayStation 4、5 的 SoC,微软Xbox X&S 的 APU、任天堂 Wii U 的 GPU。Ampere Analysis 数据显示,2022 年索尼 PS 在全球游戏主机硬件、游戏及服务销售中占比为 45%,任天堂 Sw

81、itch 为 27.7%,微软 Xbox 为 27.3%,其中 Switch 与英伟达合作,PS 和 Xbox 与 AMD 合作,AMD 占据更大的市场份额。掌上游戏机部分,V alve 的 Steamdeck 采用了 AMD 定制的处理器,运用了 AMD 的CPU 核心和显卡架构。华硕的 ROG Ally 掌机、联想的 Legion Go 都采用了 AMD 锐龙 Z1 和 Z1 Extreme 系列处理器。游戏主机进入下行周期游戏主机进入下行周期,半代升级可提供部分增长动力半代升级可提供部分增长动力。游戏主机的产品更新分为“整代升级”和“半代升级”两种;其中“整代升级”是如 PS 4 到PS

82、 5,或从 Xbox One 到 Xbox Series S/X,产品周期大约为 5-7 年;“半代升级”是指如推出 PS5 Pro 版,一般在整代升级的产品周期中间推出。AMD 的游戏主机业务中,PS 5、Xbox X&S 都于 2020 年 11 月推出,三年过后需求开始进入下行周期。虽距离整代升级还有 3-4 年,但 PS5的半代升级版本 PS 5 Pro 预计于 2024 年下半年推出,能够为 AMD 的游戏主机业务提供动力。6.嵌入式:通过收购成为行业龙头,覆盖各行业及各嵌入式:通过收购成为行业龙头,覆盖各行业及各级市场的应用需求级市场的应用需求 赛灵思作为最大的赛灵思作为最大的 F

83、PGA 厂商,产品覆盖高中低端市场和各行业。厂商,产品覆盖高中低端市场和各行业。不止局限于传统的 FPGA,赛灵思提供多样化的可编程器件产品,产品类型涵盖传统的 FPGA(仅包含可编程结构)、SoC(集成单个硬核心处理器的 FPGA 可编程结构)、MPSoC(集成多个硬核心处理器的 FPGA 可编程结构)、RFSoC(具有 RF 功能的 MPSoC)和 ACAP(自适应计算加速平台)。在 FPGA 器件方面,赛灵思提供可满足不同需要的多节点产品,包括16nm、20nm、28nm、45nm;Zynq系列可编程SoC是一款ARM+FPGA的 SoC 平台,包含 Zynq 7000 SoC、Zynq

84、 UltraScale+MPSoC 和 Zynq UltraScale+RFSoC;V ersal ACAP 将自适应处理和加速引擎与可编程逻辑和可配置连接相结合,包含 AI Edge、AI Core、Prime、Premium、HBM系列。AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 23 of 33 图图 31 赛灵思提供多样化的可编程器件赛灵思提供多样化的可编程器件 图图 32 赛灵思提供多节点的赛灵思提供多节点的 FPGA 产品产品 数据来源:Max Maxfield 数据来源:Max Maxfield 表表 7 赛灵思的嵌入式产

85、品赛灵思的嵌入式产品覆盖高中低端市场覆盖高中低端市场及及各行业各行业 细分产品线细分产品线 定位及应用领域简介定位及应用领域简介 FPGA Spartan 低端市场;低成本、低功耗的大批量应用(显示器,机顶盒,无线路由器等)Artix 中低端市场;小尺寸和低功耗性能要求的应用(电池供电的便携式超声设备、商用数码相机镜头控制以及军用航空电子和通信设备等)Vrtix 中端市场,并提供信号处理性能、功耗和成本的平衡(光纤有线通信设备等)Kintex 高端市场(有线和无线基础设施设备、先进医疗设备、测试和测量以及国防系统等)SoC、MPSoC、RFSoC Zynq 7000 SoC ADAS、医疗内窥

86、镜、小型蜂窝基带、专业相机、机器视觉、电信级以太网回传、多功能打印机等 Zynq UltraScale+MPSoC 5G 无线基础设施、面向数据中心和有线通信的软件定义网络、ADAS、IIoT、超高清和超高画质摄像机、航空电子以及便携式软件定义无线电等 Zynq UltraScale+RFSoC 5G 及 LTE 无线技术、相控阵雷达/数字阵雷达、测试与测量、卫星通信等 ACAP AI Core 数据中心、无线通信 AI Edge 汽车、无线通信、广播、航空航天和国防 AI RF 无线通信、航空航天和国防、有线通信 Prime 数据中心、有线通信 Premium 有线通信、数据中心、航空航天和

87、国防、测试与测量 HBM 数据中心、有线通信、测试与测量 数据来源:AMD 官网,Wikipedia,国泰君安证券研究 AMD 的处理器及显卡系列均拥有嵌入式版本。的处理器及显卡系列均拥有嵌入式版本。除赛灵思的产品外,AMD原有的嵌入式产品为锐龙和霄龙系列嵌入式处理器及 Radeon 嵌入式显卡,已经在汽车、工业、网络、存储等领域有着广泛应用。通过收购赛灵思,通过收购赛灵思,AMD 嵌入式业务迅速庞大。嵌入式业务迅速庞大。FPGA 市场中赛灵思占约50%的市场份额,被英特尔收购的 Altera 占 35%,剩余厂商占 10%以下。通过收购赛灵思,AMD 成为了新的 FPGA 最大的厂商,极大地

88、拓宽了嵌入式业务的范围,如今涵盖建筑、汽车、医疗、通信、机器人等近 20个细分行业,在多个细分行业中处于领先地位。7.AI 浪潮催生千亿算力市场,浪潮催生千亿算力市场,AMD 有望成为赢家之有望成为赢家之 AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 24 of 33 一,为营收增长提供新动力一,为营收增长提供新动力 7.1.AI 加速器市场格局:垄断局面或被破解加速器市场格局:垄断局面或被破解 7.1.1.云计算及科技大厂开启自研芯片云计算及科技大厂开启自研芯片 英伟达凭借先发优势和在 GPU 领域的长期深耕,在 AI 浪潮的起步阶段迅

89、速抢占市场,目前近乎于拥有垄断地位,但这一局面有被打破的趋势。近年来各云计算及互联网大厂都各自开始研发自己的近年来各云计算及互联网大厂都各自开始研发自己的 AI 芯片,主要基芯片,主要基于以下几个原因:于以下几个原因:第一,不满于英伟达的垄断地位,拥有自研芯片可以一定程度上保障算力供给,不再受制于英伟达有限的供给分配;第二,如达到一定规模,购买及运营成本的节省足以覆盖研发成本,使用自研芯片可以降低成本,且自研芯片的“存在”本身使得大厂拥有更强的议价能力,一定程度上可以限制英伟达芯片价格无限上涨;第三,各厂商的自研芯片在设计时可以侧重自身应用的需求,更加“定制化”,从而提升效率。现阶段自研芯片的

90、性能暂落后于英伟达的现阶段自研芯片的性能暂落后于英伟达的 H100 和和 AMD 的的 MI300X,但均已投入应用,其中谷歌较为领先。但均已投入应用,其中谷歌较为领先。目前三大云厂商亚马逊 AWS、微软云、谷歌云和特斯拉都已自己研发出 AI 芯片,属于 ASIC(针对具体应用定制开发的专用集成电路)。综合来看,现阶段各厂商的自研芯片性能大多处于超越 A100,但落后于 H100/H200 的阶段;但各产品均已投入测试或使用,表明了科技大厂支持自研芯片逐步发展的决心,已成为了一个必然的趋势。图图 33 云计算及科技大厂开启自研芯片云计算及科技大厂开启自研芯片 数据来源:AMD 官网,英伟达官网

91、,谷歌官网,亚马逊官网,微软官网,特斯拉官网,国泰君安证券研究 7.1.2.谷歌:最早布局自研谷歌:最早布局自研 TPU,已进入成熟应用阶段,已进入成熟应用阶段 最早开始自研最早开始自研 AI 芯片,专用于处理神经网络工作负芯片,专用于处理神经网络工作负载。载。最早开始自研芯片的互联网巨头是谷歌,其于 2016 年推出 TPU(张量处理单元),用于加速机器学习工作负载。采用脉动阵列架构,是专门用于神经网络工作负载的矩阵处理器。更新换代迅速,不断提升性能,同时更加多样化。更新换代迅速,不断提升性能,同时更加多样化。谷歌仅用了 15 个月的时间就完成了第一代 TPU 的设计、验证、构建并将其部署在

92、了数据中心里。从自 2016 年第一代推出后,TPU 每隔 1-2 年更新一代。2017 年发布了第二代,将内存带宽大幅提升到 600 GB/s,性能从而可达到45TFLOPS;2018 年发布了第三代,性能是第二代的两倍,2021 年发布了第四代,性能是第三代的 2.1 倍,每瓦性能是第三代的 2.7 倍。谷歌研究团队发表的论文TPU v4:An Optically Reconfigurable Supercomputer AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 25 of 33 for Machine Learning with

93、 Hardware Support称,在类似规模的系统中,TPU v4 比 Nvidia A100 快 1.2-1.7 倍,功耗低 1.3-1.9 倍。AI and ML Accelerator Survey and Trends 中的数据显示,TPUv4 的表现优于 A100,略逊于 H100,但功耗均低于 A100 和 H100。2023 年 8 月发布的 TPUv5e着力于成本效益,拥有成本节省、可扩展性好、通用型强的优点:与 TPU v4 相比,性能提高 2.5 倍,推理延迟降低 1.7 倍;TPU 互联以支持各种规模的 LLM 和生成式 AI,最高可达 2 万亿个参数;以及拥有强大的

94、 AI框架和编排支持。2023 年 12 月发布的 TPUv5p 着力于高性能,专为性能、灵活性和规模而设计,训练大型 LLM 模型的速度比上一代 TPUv4快 2.8 倍,训练嵌入密集模型的速度比 TPUv4 快 1.9 倍。同时就每个 pod的可用 flop 总数而言,TPU v5p 的可扩展性比 TPU v4 高 4 倍。表表 8 TPU 专为矩阵计算而设计专为矩阵计算而设计 表表 9 TPU 更新换代迅速,产品组合逐渐丰富更新换代迅速,产品组合逐渐丰富 数据来源:谷歌云官网,国泰君安证券研究 数据来源:谷歌云官网,国泰君安证券研究 TPU 应用趋于成熟,极大程度上替代了英伟达的芯片。应

95、用趋于成熟,极大程度上替代了英伟达的芯片。经过不断的技术更新,TPU 的应用范围逐渐扩大。在谷歌内部的应用中,谷歌团队在 2023年 4 月发表的论文TPU v4:An Optically Reconfigurable Supercomputer for Machine Learning with Hardware Support for Embeddings中称,谷歌90%以上的人工智能训练工作都在使用 TPU。2023 年 12 月发布 TPUv5p及 Gemini 时表示,长期以来 TPU 一直是 YouTube、Gmail、谷歌 Maps、谷歌 Play 和 Android 等人工智能

96、产品的训练和支持基础,其最新发布的最强大、最通用的 AI 模型 Gemini 也是使用 TPU 进行训练和提供支持的。在提供的谷歌云服务中,客户可以自行选择 TPU 或 GPU。7.1.3.亚马逊:亚马逊:Trainium 和和 Inferentia 分别覆盖分别覆盖 AI 训练及推理工作负训练及推理工作负载载 亚马逊亚马逊 AWS 近年来先后发布推理及训练芯片,加速深度学习工作负载。近年来先后发布推理及训练芯片,加速深度学习工作负载。亚马逊 AWS 于 2018 年发布推理芯片 Inferentia,于 2020 年发布训练芯片 Trainium,于 2023 年推出 Inferentia

97、2,专门为深度学习工作负载而构建。Trainium 和和 Inferentia 芯片性能亮眼,有效降低实例推理和训练成本。芯片性能亮眼,有效降低实例推理和训练成本。第一代 Inferentia 拥有容量 8GB、带宽 50GB/s 的 DDR4 内存,第二代Inferentia 拥有容量 32GB、带宽 820GB/s 的的 HBM 内存。第二代的延迟低至第一代的 1/10,提供比第一代高 4 倍的吞吐量和高 3 倍的计算性能,FP16 算力达到 190TFLOPS。根据 AWS 官方数据,基于 Inferentia AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅

98、读正文之后的免责条款部分 26 of 33 芯片的 Amazon EC2 Inf1 与同类 Amazon EC2 实例相比,每次推理的成本可降低多达 70%,吞吐量可提高多达 2.3 倍;基于 Inferentia2 芯片的Amazon EC2 Inf2 相比同类实例单位功率性能高出了 50%。训练芯片Trainium 是 AWS 专门为超过 1000 亿个参数模型的深度学习训练打造的AI 芯片。每个 Trainium 加速器具有 32GB容量和 820GB/s 带宽的 HBM内存,FP16 算力达到 190TFLOPS,FP32 算力达到 47.5TFLOPS。采用实例内、超高速非阻塞互连技

99、术 NeuronLink,互联带宽达到 768GB/s。根据 AWS 官方数据,由 Trainium 芯片支持的 Trn1 实例为在 Amazon EC2 中进行深度学习模型训练提供最佳性价比以及最快的训练速度,与P4d 实例(由 A100 Tensor Core GPU 支持)相比,通过 Trn1 实例训练深度学习模型的成本降低多达 40%。7.1.4.微微软软:Maia 100 进入测试阶段,持续研发将推出更多新品进入测试阶段,持续研发将推出更多新品 微软于微软于 2023 年年底发布自研底发布自研 AI 芯片,处于测试与布局阶段。芯片,处于测试与布局阶段。2023 年 11月微软发布了

100、Azure Maia AI 加速器(Maia 100),针对人工智能任务和生成式人工智能进行了优化,专为在微软云上运行通用计算工作负载而定制。目前 Maia 100 已在微软的 Bing 和 Office AI 产品上测试,OpenAI也在试用,将于 2025 年初在微软的几个数据中心首次公开亮相,且后续还会继续研发并更新产品。Maia 100 算力表现优越,内存略有落后。算力表现优越,内存略有落后。Maia 系列旨在为 OpenAI 模型、Bing、GitHub Copilot 和 ChatGPT 等 AI 工作负载运行云端训练和推理。Maia 100 作为 Maia 系列的第一代,基于台积

101、电 5 纳米工艺打造,总共包含 1050 亿个晶体管。性能方面,Maia 100 在 MXInt8 下的性能为1600 TFLOPS,在 MXFP4 下为 3200 TFLOPS,远超 Google 的 TPUv5 以及亚马逊的 Trainium/Inferentia2 芯片,与 H100 和 MI300X 相比也差距不远。内存带宽方面,Maia 100 拥有 1.6TB/s 的内存带宽,超越亚马逊的 Trainium 和 Inferentia2,但落后于 TPUv5,更远低于 H100 和 MI300X。由于该芯片是在 LLM 浪潮开始之前设计的,其片上内存与片外内存方面不太平衡:微软在芯片

102、上放置了大量 SRAM,大型缓存通常有助于减少所需的内存带宽,但不太适用于大语言模型。7.1.5.自研芯片会对传统芯片厂商的市场份额造成一定影响,但较难自研芯片会对传统芯片厂商的市场份额造成一定影响,但较难撼动其在技术上的领先地位撼动其在技术上的领先地位 自研芯片主要通过以下两个方式影响到芯片厂商的市场份额自研芯片主要通过以下两个方式影响到芯片厂商的市场份额:第一,自研芯片的投入使用减少了云厂商对英伟达芯片的需求量;第二,云厂商虽不对外出售 ASIC 芯片,但其对外提供基于自研芯片的 AI 算力服务,通过云业务渗透给客户,间接压缩传统芯片厂商的潜在市场。市场定位不同决定了技术迭代能力。市场定位

103、不同决定了技术迭代能力。据 2023 年 5 月 TrendForce 的数据显示,英伟达的 GPU 在 AI 服务器市场的市占率约为 6070%,其次为云厂商自主研发的 AISC 芯片,市占率逾 20。目前云服务和科技大厂的自研芯片还大多处于早期阶段,随着微软推出自研芯片和其他厂商的芯片更新迭代,AISC 的占有率有望进一步提升。但 ASIC 的定位与 GPU有所不同:自研芯片都只基于个公司自身的业务方向来布局,比如谷歌的 TPU 针对卷积神经网络,特斯拉的 Dojo 是专门用于 FSD 的机器视觉分析;而 GPU 则具备更强的通用性。基于这点,针对特定一款 ASIC 来 AMD半导体(半导

104、体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 27 of 33 说,其市场规模要小于通用芯片;相比于传统芯片厂商更小的市场规模和资金投入,一定程度上决定了 ASIC 的峰值性能将不及传统芯片厂商生产的 GPU,定制化、功耗更低、性价比更高是大厂选择 ASIC 的主要原因。表表 10 AMD 和英伟达和英伟达 AI 加速器的峰值性能领先于自研芯片加速器的峰值性能领先于自研芯片 数据来源:AMD 官网,英伟达官网,谷歌官网,亚马逊官网,微软官网,国泰君安证券研究 7.2.AI 芯片市场高增,逐渐分散化,利好芯片市场高增,逐渐分散化,利好 AMD AI 芯片发展

105、芯片发展 在 AI 芯片的市场里英伟达是领头羊,但基于以下几个原因,我们认为AMD 也有望受益于此番 AI 浪潮。第一,科技大厂因想要打破英伟达的垄断局面,将硬件供给多样化,会第一,科技大厂因想要打破英伟达的垄断局面,将硬件供给多样化,会一定程度上支持一定程度上支持 AMD 发展发展,其中以微软为代表。多年前,微软就建立了 MI50 和 MI100 集群,在 AMD GPU 上使用 ROCm 优化大型模型的训练和推理;2022 年 5 月微软宣布 Azure 将成为首个采用 AMD Instinct MI200 加速器的公共云,协同其他 AMD 产品共同被用于 Microsoft Azure上

106、,包括全新发布的 Azure HBv3 虚拟机;2023 年 11 月,微软首先宣布决定将即将推出的 AMD MI300 Instinct GPU 引入 Azure,为客户提供可能成为英伟达 GPU 的主要替代方案的早期访问。除此之外,在 2023 年12月AMD的发布会上,OpenAI宣布该公司开发的GPU编程语言Triton,将从接下来的 3.0 版本开始支持 MI300 等 AMD 芯片;Meta 和甲骨文的高管当场表示,将在自己的 AI 和数据中心服务中使用 Instinct MI300X加速器。一方面,云计算大厂有意的支持将为 AMD 带来大量订单,另一方面,如云计算大厂开始部署 A

107、MD 的芯片,会在软件生态上对 AMD形成帮助。第二,第二,MI300 系列大概率将维持系列大概率将维持 AMD 的性价比优势。的性价比优势。基于 AMD 在消费级 GPU 和 CPU 与英伟达及英特尔的定价对比,以及其通过性价比优势抢占消费级 GPU 和 CPU 市场份额的先例,推测 MI300 系列对比英伟达的产品仍将维持性价比优势,因此有机会获得更多除云服务巨头以外客户的市场。其中 AMD 在 2023 年三季度财报发布时提到,AI 初创公司 Lamini 将在 AMD Instinct 加速器上运行已准备就绪的大语言模型。第三,第三,AI 加速器的市场足够大,即便处于第二位也能从中受益

108、。加速器的市场足够大,即便处于第二位也能从中受益。人工智能仍处于早期发展阶段,12 月的发布会上 AMD 将其对人工智能芯片的市场预测上调至 4000 亿美元,由于受制于台积电有限的产能,英伟达的供给满足不了市场需求;此外,云服务及科技大厂也想要多个供应商,打破英伟达的垄断。因此,AMD 拥有很好的机会,只要能够入局。第三 AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 28 of 33 季度财报会上 AMD 表示 2024 年预计数据中心 GPU 营收超 20 亿美元,并表示这部分有足够的供应,其余部分将取决于供应链;如根据DigiTim

109、es 报道,此前业内人士透露预计 2024 年 MI300 出货量将达到30-40 万来估计,2024 年数据中心 GPU 的营收将不止 20 亿。而目前AMD的人工智能业务才刚进入起步阶段,预计未来还将会有大幅增长。7.3.拥有丰富的产品组合,或可在拥有丰富的产品组合,或可在 AI 市场差异化竞争市场差异化竞争 AMD 的优势在于其拥有业内最丰富的的优势在于其拥有业内最丰富的 CPU+GPU+FPGA+DPU 产品产品组合组合。据彭博研究数据显示,生成式 AI 市场预计会以 42%CAGR 的速度增长,短期内由 AI 训练所推动,中长期逐渐转向大语言模型的推理、数字广告、专业化的软件及服务应

110、用。我们认为,面对中长期市场需求的转移,AMD广泛的产品组合使其相对而言能够抓住更多的增长机会,与竞争对手在数据中心领域差异化竞争。图图 34 AI 芯片芯片市场市场中中 AISC 与与 FPGA 占比将提升占比将提升 数据来源:MarketResearch,国泰君安证券研究 8.营收重回正增长,营收重回正增长,高研发投入注入成长动力高研发投入注入成长动力 营收重回正增长,净利润同比大幅增长。营收重回正增长,净利润同比大幅增长。2023 年,AMD 的营收达 226.80亿美元,较 2023 年的 236.01 亿美元同降 3.9%;2023 年相比 2022 年同期营收的下降主要是由于客户端

111、收入收到 PC 市场低迷的影响,已于2023 年第三季度结束。2023 年第四季度,AMD 的营收达 61.68 亿美元,较 2023 年同期的 55.99 亿美元同增 10.2%,相较上一季度的 58 亿美元环增 6.3%。AMD 从 23Q3 开始实现营收同比和环比季度的增长,并在该季度结束了连续五个季度的同比下降。AMD 23Q3 净利润为 2.99 亿元,23Q4 净利润为 6.67 亿元,同比大幅增长了 367.6%,AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 29 of 33 图图 35 营收重回正增长营收重回正增长 图图

112、36 GAAP 净利润重回正增长净利润重回正增长 数据来源:公司财报,国泰君安证券研究 数据来源:公司财报,国泰君安证券研究 AI 趋势引领数趋势引领数据中心业务高增,叠加客户端、游戏和嵌入式业务一定程据中心业务高增,叠加客户端、游戏和嵌入式业务一定程度上受到周期影响。度上受到周期影响。根据产品条线划分,AMD 的数据中心业务受益于AI 算力扩张,短期内增长趋势不减,将为 AMD 提供强劲的营收增长动力。客户端、游戏和嵌入式业务则一定程度上受到周期的影响。受到 PC市场持续低迷的冲击,下游客户的库存上涨,AMD 的客户端、游戏显卡营收自 2022Q3 开始持续下滑;截止 2023Q2 库存水平

113、到达历史高位,增速收窄,客户端与游戏显卡业务营收开始回升,预计 PC 业务 2024 年会恢复增长。游戏主机业务在经历了从 2020 年开始的整代升级带来的需求上涨后开始进入下行周期,预计嵌入式业务收入将同样环比下降,因为客户在 2024 年上半年将继续应对库存水平上升的问题。图图 37 AMD 存货周转天数同比仍在增加,但已到达高位,增长速度收窄存货周转天数同比仍在增加,但已到达高位,增长速度收窄 数据来源:公司财报,国泰君安证券研究 毛毛利率和净利率持续回升利率和净利率持续回升,MI300 有望改善有望改善整体产品组合的利润结构整体产品组合的利润结构。毛利率和净利率在触底后持续回升,其中较

114、低的净利率部分是由于持续增加的研发开支。AMD 表示数据中心 GPU的毛利率将超过企业平均水平,因此有望助推公司毛利率上升,但目前正处于产品升级的极早期阶段,需几个季度后才能将其提升至正常水平。运营费用率持平,研发开支率整体呈上升趋势,下一阶段主要集中在运营费用率持平,研发开支率整体呈上升趋势,下一阶段主要集中在AI及数据中心领域。及数据中心领域。公司深度践行产品驱动、简化运营的战略,研发开支绝对值逐年上升,研发开支率整体呈缓慢上升趋势,多年来公司一直在 AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 30 of 33 控制运营支出,销售、

115、一般及行政费用率维持在 10%左右。其中 23Q4 的研发投入主要集中在 AI 产品,公司在第四财报会中表示,团队在重新分配预算范围内的资源,真正投资于人工智能和数据中心等最重要的领域,鉴于其在人工智能和数据中心领域面临巨大的机遇,会同同时增加研发投资和市场投资。图图 38 毛利率与净利率回升毛利率与净利率回升 图图 39 研发开支率呈上升趋势,销售、一般及行政费研发开支率呈上升趋势,销售、一般及行政费用率较低且维持平稳用率较低且维持平稳 数据来源:公司财报,国泰君安证券研究 数据来源:公司财报,国泰君安证券研究 9.风险提示风险提示 1)AI 应用发展不及预期,则对上游的芯片产业造成影响;2

116、)半导体行业技术发展迅速,要求持续的研发投入来维持竞争力。如果AMD 的新产品的竞争力不及预期,可能会丢失份额 3)全球经济环境的不确定性可能影响消费者对产品的需求,进而影响对半导体的需求;4)地缘政治冲突,如中美的贸易紧张局势可能影响产品销售。AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 31 of 33 国泰君安海外科技团队介绍国泰君安海外科技团队介绍 深耕全球互联网,辐射海外大科技,全面覆盖社交、游戏、电商、互联网金融、互联网服务、AI 及硬科技、美股等领域,致力于结合产业视角与买方视角做差异化研究。秦和平秦和平 执业证书编号:S0

117、880523110003 海外科技领域负责人、首席分析师 梁昭晋梁昭晋 执业证书编号:S0880523010002 海外科技分析师 李奇李奇 执业证书编号:S0880523060001 海外科技分析师 AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 32 of 33 本公司具有中国证监会核准的证券投资咨询业务资格本公司具有中国证监会核准的证券投资咨询业务资格 分析师声明分析师声明 作者具有中国证券业协会授予的证券投资咨询执业资格或相当的专业胜任能力,保证报告所采用的数据均来自合规渠道,分析逻辑基于作者的职业理解,本报告清晰准确地反映了作者的

118、研究观点,力求独立、客观和公正,结论不受任何第三方的授意或影响,特此声明。免责声明免责声明 本报告仅供国泰君安证券股份有限公司(以下简称“本公司”)的客户使用。本公司不会因接收人收到本报告而视其为本公司的当然客户。本报告仅在相关法律许可的情况下发放,并仅为提供信息而发放,概不构成任何广告。本报告的信息来源于已公开的资料,本公司对该等信息的准确性、完整性或可靠性不作任何保证。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值及投资收入可升可跌。过往表现不应作为日后的表现依据。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。本公

119、司不保证本报告所含信息保持在最新状态。同时,本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。本报告中所指的投资及服务可能不适合个别客户,不构成客户私人咨询建议。在任何情况下,本报告中的信息或所表述的意见均不构成对任何人的投资建议。在任何情况下,本公司、本公司员工或者关联机构不承诺投资者一定获利,不与投资者分享投资收益,也不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。投资者务必注意,其据此做出的任何投资决策与本公司、本公司员工或者关联机构无关。本公司利用信息隔离墙控制内部一个或多个领域、部门或关联机构之间的信息流动。因此,投资者应注意,在

120、法律许可的情况下,本公司及其所属关联机构可能会持有报告中提到的公司所发行的证券或期权并进行证券或期权交易,也可能为这些公司提供或者争取提供投资银行、财务顾问或者金融产品等相关服务。在法律许可的情况下,本公司的员工可能担任本报告所提到的公司的董事。市场有风险,投资需谨慎。投资者不应将本报告作为作出投资决策的唯一参考因素,亦不应认为本报告可以取代自己的判断。在决定投资前,如有需要,投资者务必向专业人士咨询并谨慎决策。本报告版权仅为本公司所有,未经书面许可,任何机构和个人不得以任何形式翻版、复制、发表或引用。如征得本公司同意进行引用、刊发的,需在允许的范围内使用,并注明出处为“国泰君安证券研究”,且

121、不得对本报告进行任何有悖原意的引用、删节和修改。若本公司以外的其他机构(以下简称“该机构”)发送本报告,则由该机构独自为此发送行为负责。通过此途径获得本报告的投资者应自行联系该机构以要求获悉更详细信息或进而交易本报告中提及的证券。本报告不构成本公司向该机构之客户提供的投资建议,本公司、本公司员工或者关联机构亦不为该机构之客户因使用本报告或报告所载内容引起的任何损失承担任何责任。评级说明评级说明 投资建议的比较标准投资建议的比较标准 评级评级 说明说明 投资评级分为股票评级和行业评级。以报告发布后的 12 个月内的市场表现为比较标准,报告发布日后的 12 个月内的公司股价(或行业指数)的涨跌幅相

122、对同期的当地市场指数涨跌幅为基准。股票投资评级股票投资评级 增持 相对当地市场指数涨幅 15%以上 谨慎增持 相对当地市场指数涨幅介于 5%15%之间 中性 相对当地市场指数涨幅介于-5%5%减持 相对当地市场指数下跌 5%以上 行业投资评级行业投资评级 增持 明显强于当地市场指数 中性 基本与当地市场指数持平 减持 明显弱于当地市场指数 国泰君安证券研究所国泰君安证券研究所 上海上海 深圳深圳 北京北京 地址 上海市静安区新闸路 669 号博华广场 20 层 深圳市福田区益田路 6003 号荣超商务中心 B 栋 27 层 北京市西城区金融大街甲 9 号 金融街中心南楼 18 层 邮编 200

123、041 518026 100032 电话(021)38676666(0755)23976888(010)83939888 E-mail: 附:海外当地市场指数附:海外当地市场指数 亚洲指数名称亚洲指数名称 美洲指数名称美洲指数名称 欧洲指数名称欧洲指数名称 澳洲指数名称澳洲指数名称 沪深 300 标普 500 希腊雅典 ASE 澳大利亚标普 200 恒生指数 加拿大 S&P/TSX 奥地利 ATX 新西兰 50 日经 225 墨西哥 BOLSA 冰岛 ICEX AMD半导体(半导体(AMD.US)请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 33 of 33 韩国 KOSPI 巴西 BOVESPA 挪威 OSEBX 富时新加坡海峡时报 布拉格指数 台湾加权 西班牙 IBEX35 印度孟买 SENSEX 俄罗斯 RTS 印尼雅加达综合 富时意大利 MIB 越南胡志明 波兰 WIG 富时马来西亚 KLCI 比利时 BFX 泰国 SET 英国富时 100 巴基斯坦卡拉奇 德国 DAX30 斯里兰卡科伦坡 葡萄牙 PSI20 芬兰赫尔辛基 瑞士 SMI 法国 CAC40 英国富时 250 欧洲斯托克 50 OMX 哥本哈根20 瑞典 OMXSPI 爱尔兰综合 荷兰 AEX 富时 AIM 全股

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(超威半导体-美股公司首次覆盖报告:不断超越挑战AI算力新边际-240307(33页).pdf)为本站 (蓝色烟花) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部