上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

计算机行业“数字经济”系列专题(一):国产服务器CPU研究框架-220327(104页).pdf

编号:65873 PDF 104页 8.95MB 下载积分:VIP专享
下载报告请您先登录!

计算机行业“数字经济”系列专题(一):国产服务器CPU研究框架-220327(104页).pdf

1、“数字经济”系列专题(一): 国产服务器CPU研究框架 “数字经济”系列专题(一): 国产服务器CPU研究框架 西南证券研究发展中心 计算机研究团队 2022年3月 分析师:王湘杰 执业证号:S02 电话: 邮箱: 联系人:叶泽佑 电话: 邮箱: 联系人:邓文鑫 电话: 邮箱: 1 数字经济+国产替代双轮驱动,国产服务器CPU空间广阔。数字经济大背景下,服务器作为底层算力支撑,在各行各业数智化转型的浪潮中迎来需求爆发,根据IDC,预计2025年中国服务器出货量将达到525.2万台,市场规模达到350亿美元。

2、同时,严峻的国际贸易形势再次强调自主可控的必要性与紧迫性,根据国务院印发的新时代促进集成电路产业和软件产业高质量发展的若干政策,中国芯片自给率要在2025年达到70%(当前不到20%),预计2025年国产x86芯片出货量超700万颗,市场规模约为158亿美元。 六大国产CPU,角逐行业信创市场。当前主流国产CPU厂商包括采用x86架构的兆芯、海光,采用 ARM架构的飞腾、海思,基于MIPS架构的龙芯,以及基于Alpha架构的申威。综合考虑产业需求及各厂商旗舰级产品的性能和生态适配等因素,我们认为,短期内海光、鲲鹏及飞腾三家企业最有望受益于行业信创及新基建的爆发节奏,1-3年内迎来出货量高增的确

3、定性强;后续的市场格局还存在不确定性,龙芯等厂商凭借全栈自主可控的技术路径持续迭代,亦有望实现快速发展。 曙光海光协同效应突出,共享高增长机遇。中科曙光为海光信息的第一大股东,二者业务形成良好协同。海光提供性能优异的国产CPU,为曙光的战略转型提供支点;曙光在计算产业的全面布局已积累大量优质的客户资源和销售渠道,为海光芯片的放量打下基础。 风险提示:国际贸易形势恶化风险;电信、金融等行业信创国产化率不达预期;海光芯片出货量不及预期;行业竞争加剧等。 投资要点 2 2 5 目 录 一、服务器及CPU综述 二、全球CPU市场格局 三、服务器视角看CPU发展趋势 四、国产CPU行业篇 1.1 服务器

4、的定义及分类 1.2 CPU的定义及分类 五、国产CPU厂商篇 3 Q1:CPU占服务器的成本比重? 根据IDC,在经典的基础服务器中CPU成本约占服务器整体硬件成本的32%; 在在更高高性能的服务器中,如面向计算推理的AI服务器,处理器相关成本占比高达50%-83%。 本章导读 Q2:服务器CPU的分类? 按指令集架构分类,主要可分为复杂指令集(CISC)服务器和精简指令集(RISC)服务器。 CISC:一条指令完成一个复杂的基本功能。单条指令集功能强,指令类型丰富完善,编译后指令数量较少,通用场景下性能具有优势。以x86架构为代表,主要用于桌面PC及服务器领域,配套软硬件丰富完善。 RIS

5、C:一条指令完成一个基本动作,多条指令组合完成一个复杂的基本功能。指令集架构在不断完善,译码效率高,偏向低功耗领域优化。以ARM架构为代表,还包括MIPS、Power、Risc-V等,过去主要用于手机、平板等移动终端,软硬件生态逐步建设完善。 1.1 服务器信息化时代的基石产品 4 服务器的定义 服务器是一种高性能计算机,其中包含向网络用户提供特定服务的软件和硬件,它比普通计算机运行更快、负载更高、价格更贵。服务器的定义包含了以下两个方面的内容:一方面,服务器可以为网络提供特定服务,人们通常会以服务器所能提供的服务来命名服务器;另一方面,服务器是软件和硬件的统一体,特定的服务程序需要运行在特定

6、的硬件或一般通用的微机上才能完成服务功能,由服务程序完成服务策略,并通过硬件实现所需的服务。 服务器的功能 服务器可以为网络中的客户机(如PC、智能手机、大型系统设备等终端)提供特定应用服务,主要完成数据的存储、传输、处理和发布。 服务器的构成 由处理器(CPU)、内存、磁盘、网卡、监视器、电源、机箱系统总线等软硬件构成。其中最重要的部分是CPU和内存,CPU 用于实现判断和计算功能,内存用于暂时存放CPU 的运算数据,以及与硬盘、外部存储交换数据。 服务器的性能 由于需要提供高可靠的服务,服务器在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面的要求比普通的个人电脑高。同时服务器具

7、有高速的CPU运算能力、长时间的可靠运行、强大的I/O外部数据吞吐能力以及更好的扩展性。 数据来源: CSDN,西南证券整理 1.1 全球服务器发展历程 5 数据来源: CSDN,西南证券整理 第一代电子管计算机时代 1946年,第一台电子计算机ENIAC研制成功;1951年,IBM生产出第一台用于科学计算的大型机IBM 701;1953年,IBM推出了第一台用于数据处理的大型机IBM702和第一台小型机IBM650,为第一代商用计算机描绘出了一个丰满而生动的形象。 1946-1954年年 晶体管造就第二代计算机 1954年,第一台使用晶体管的第二代计算机TRADIC诞生于美国贝尔实验室,采用

8、了浮点运算,实现计算能力的飞跃;1958年,大型科学计算机IBM 7090诞生,实现了晶体化;1961年,第一台流水线计算机IBM7030研制成功,其成为了超级计算机的雏形 1954-1964年年 集成电路使第三代计算机脱胎换骨 1964年,第一台通用计算机IBM/360研制成功,其采用了集成电路技术,实现了通用性(集科学计算、数据处理和实时控制功能于一身)、系列化(区分了小型机、大型机和超级计算机,统一了指令格式、数据格式、字符编码、IO接口和中断系统,实现了不同型号兼容)和可扩展性(具有开发价值),成为了计算机发展史上的一个重要里程碑; 1964-1970年年 第四代计算机时代 1970年

9、,IBM S/370问世,单晶硅电路技术、虚拟存储器技术、多处理技术相继应用其中,到1976年,S/370已发展成为具有17种型号的庞大家族。 1981年,S/370系列的地址线位数被增加到了31位,大大增强了其寻址能力,并且在存储方面还增加了扩展存储器,与主存分离,改善了系统性能。80代年上半叶以前,服务器主要是面向高端用户。80年代下半叶,大型机系统体系机构更新步伐加快。1986年,IBM 9370系列发布,标志着S/370开始向低端方向延伸,目标是服务于中小型企业。 1970年至今年至今 1.1 服务器的构成 6 数据来源:IDC,CSDN,西南证券整理 服务器的主要组成部分 服务器的逻

10、辑架构仍然遵循冯诺依曼架构,主要包含:处理器(CPU、GPU、DPU等)、存储器、I/O接口,以及SSD、BMC、PCIe插槽、主板、电源、风扇和相关软件等。 处理器是服务器的大脑,根据IDC,以经典x86服务器E5高配为例,CPU成本在基础型服务器中约占32%,在更高高性能的服务器中,处理器相关成本占比高达 50%-83%。 三大核心零部件(处理器、内存、硬盘)成本占服务器总成本比例约为服务器总硬件成本的80%。 服务器内部结构图 各类服务器成本构成 1.1 服务器的分类 7 数据来源:CSDN,西南证券整理 按服务器形态分类 刀片式服务器: 塔式服务器: 机架式服务器: 标准高度的机架式机

11、箱内可插装多个卡式的服务器单元,实现高可用和高密度。每一块“刀片”实际上就是一块独立的服务器。 正面类似PC机,但侧面较长,无统一标准,一般无需和机柜搭配 外形类似交换机,有1U(1U=1.75英寸)、2U、4U等标准规格。 优点:价格低 缺点:体积较大 使用场景:中小企业及入门级客户 优点:体积小,统一工业标准生产 缺点:扩充性受限,散热问题 使用场景:大型企事业单位及IDC 优点:空间密度较高 缺点:存储能力不如机架式服务器 使用场景:特殊应用行业及高性能计算机、云计算等 机柜式服务器: 面向新一代数据中心的形态,功能模块和支撑模块分离,容易实现统一集中管理和业务自动部署。 优点:高密度、

12、模块化、节省电能 缺点:定制化设备,对机房称重要求严苛 使用场景:大型数据中心 1.2 CPU服务器的大脑 8 数据来源: CSDN,西南证券整理 处理器作为服务器的核心组成部分,对于服务器的整体性能发挥有着决定性的作用。此处列举中央处理器(CPU),图形处理器(GPU)以及深度学习处理器(DPU)这三大对于现今服务器行业有着长远影响的处理器。 CPU 中央处理器(CPU),是电子计算机的主要设备之一,电脑中的核心配件。其功能主要是解释计算机指令以及处理计算机软件中的数据。CPU主要包括两个部分,即控制器、运算器,其中还包括高速实现缓冲处理器之间联系的数据、控制的总线。其功效主要为处理指令、执

13、行操作、控制时间、处理数据。在计算机体系结构中,CPU 是对计算机的所有硬件资源(如存储器、输入输出单元) 进行控制调配、执行通用运算的核心硬件单元。CPU 是计算机的运算和控制核心。计算机系统中所有软件层的操作,最终都将通过指令集映射为CPU的操作。 1.2 CPU服务器的大脑 9 数据来源: CSDN,西南证券整理 处理器作为服务器的核心组成部分,对于服务器的整体性能发挥有着决定性的作用。此处列举中央处理器(CPU),图形处理器(GPU)以及深度学习处理器(DPU)这三大对于现今服务器行业有着长远影响的处理器。 GPU DPU 图形处理器(GPU),又称显示核心、视觉处理器、显示芯片,是一

14、种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的微处理器。GPU使显卡减少了对CPU的依赖,并进行部分原本CPU的工作,尤其是在3D图形处理时GPU所采用的核心技术有硬件T&L(几何转换和光照处理)、立方环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四像素256位渲染引擎等。GPU的构成相对简单,有数量众多的计算单元和超长的流水线,特别适合处理大量的类型统一的数据。但GPU无法单独工作,必须由CPU进行控制调用才能工作。 数据处理器(DPU)最早由国内深鉴科技提出,基于Xilinx可重构特性的FPGA芯片,设计专用的深度学习处理单元

15、,且抽象出定制化的指令集和编译器,从而实现快速的开发与产品迭代。DPU集三个关键要素于一身,分别为: 行业标准的、高性能及软件可编程的多核CPU,通常基于已应用广泛的Arm架构,与其的SOC组件密切配合。 高性能网络接口,能以线速或网络中的可用速度解析、处理数据,并高效地将数据传输到GPU和CPU。 各种灵活和可编程的加速引擎,可以卸载AI、机器学习、安全、电信和存储等应用,并提升性能。 1.2 CPU的分类指令集 10 数据来源: CSDN,艾瑞咨询,西南证券整理 按照设计思路的不同,CPU可分为复杂指令集(CISC)架构和精简指令集(RISC)架构。 CISC(Complex Instru

16、ction Set Computer):一条指令完成一个复杂的基本功能。单条指令集功能强,指令类型丰富完善,编译后指令数量较少,通用场景下性能具有优势。以x86架构为代表,主要用于桌面PC及服务器领域,配套软硬件丰富完善。 RISC(Reduced Instruction Set Computer):一条指令完成一个基本动作,多条指令组合完成一个复杂的基本功能。指令集架构在不断完善,译码效率高,偏向低功耗领域优化。以ARM架构为代表,过去主要用于手机、平板等移动终端,软硬件生态逐步建设完善。 CISC RISC 指令系统 复杂、庞大 精简 指令数目 一般大于200条 一般小于200条 指令字长

17、 不固定 定长 可访存指令 不限制 只有Load/store指令 通用寄存器数 较少 多 各种指令使用频率 相差较大 都比较常用 控制方式 绝大多数为微程序控制 绝大多数为组合逻辑控制 指令流水线 可通过一定方式实现 必须实现 代表架构 x86 ARM、MIPS、RISC-V等 特点 高性能、生态完善 低功耗、生态逐步完善 应用场景 桌面PC、服务器 移动终端、服务器 CISC RISC 处理器性能: = 两种指令集设计思路 两种指令集差异 优化每个程序的指令数量 牺牲每个指令的时钟周期 牺牲每个程序的指令数量 减少每个指令的时钟周期 x86 ARM、MIPS、Power、RISC-V等 1.

18、2 CPU的分类x86 11 数据来源: CSDN,西南证券整理 按CPU体系架构分类 X86架构简介: X86架构应用场景: X86架构(The X86 architecture)是微处理器执行的计算机语言指令集,指一个intel通用计算机系列的标准编号缩写,也标识一套通用的计算机指令集合。X86指令集是美国Intel公司为其第一块16位CPU(i8086)专门开发的,同时电脑中为提高浮点数据处理能力而增加的X87芯片系列数学协处理器则另外使用X87指令,后续就将X86指令集和X87指令集统称为X86指令集。虽然随着CPU技术的不断发展,Intel陆续研制出更新型的i80386、i80486

19、直到今天的Pentium 4(以下简为P4)系列,但为了保证电脑能继续运行以往开发的各类应用程序以保护和继承丰富的软件资源,所以Intel公司所生产的所有CPU仍然继续使用X86指令集。X86架构具有性能高、速度快、兼容性好的特点,目前占据了服务器、桌面及移动PC的主要市场份额。 适用于高主频、高功耗,覆盖高性能和通用计算场景,主要运用于PC和自动化设备,也有应用在手机和平板电脑上。X86运行的主要为DOS,非ARM版Windows,旧版MacOS等操作系统,起步早,基于Wintel联盟,生态完善。 1.2 CPU的分类ARM 12 数据来源: CSDN,西南证券整理 按CPU体系架构分类 A

20、RM架构简介 ARM架构,曾称进阶精简指令集机器(Advanced RISC Machine)更早称作Acorn RISC Machine,是一个32位精简指令集(RISC)处理器架构,此外还有基于ARM设计的派生产品,包括Marvell的XScale架构和德州仪器的OMAP系列。ARM架构具有成本低、低费用、低功耗、小体积、高性能的特点,同时是业界领先的微处理器体系结构,为系统和软件工程师提供了开发低耗能、高性能消费类和工业产品的硅验证解决方案,其完整产品线包括微控制器、微处理器、圆形处理器、实现软件、单元库、嵌入式内存、高速连接产品、外设以及开发工具。 ARM架构应用场景 类别 领域 应用

21、 嵌入式 家用电器、HVAC系统、智能测量平台、触摸屏控制器、远程医疗、安全/监视、航空电子 ARM将嵌入式归类为利用微控制器作为主处理器的所有应用程序。在家用电器、HVAC系统、智能测量平台、触摸屏控制器等应用程序中,ARM Cortex-M系列处理器是理想解决方案的核心。ARM Cortex-A系列处理器在远程医疗、安全/监视、航空电子领域的应用同样属于类别。 企业 闪存卡和UFD、家庭网络 ARM将企业应用程序定义为提供网络连接和/或存储功能的完整系统或子系统。这包括家庭和公司网关、企业路由器、以太网交换机、无线访问点、基站、多服务配置平台、硬盘驱动器、网络连接存储和固态磁盘。随着更高性

22、能的多核处理器核心和经过优化的性能改进物理逻辑IP的问世,可通过ARM技术满足需求的上述应用领域得到了拓展。 家庭 蓝光和DVD、计算数字机顶盒、静态数码相机、数字电视、游戏 ARM为用户在所有屏幕类型上随时随地地访问和享受媒体内容,并与这些内容交互提供了技术平台。 移动 智能手机、功能手机连接和调制解调Trustzone和移动支付 ARM在提供支持一系列移动设备的处理器和其他关键模块方面占据着市场领先地位,这些设备可在提供卓越性能的同时延长电池寿命。将PC性能、优异的多媒体性能和卓越连接融入到移动设备的功率范围中耗费了ARM和芯片合作伙伴的大量设计精力。 1.2 CPU的分类MIPS 13

23、数据来源: CSDN,西南证券整理 按CPU体系架构分类 MIPS架构简介 MIPS是高效率、低功耗CPU设计原则中的闪耀明星,已经在移动和嵌入式工业领域销售了近三十年。这一架构于20多年前由斯坦福大学开发,是一种简洁、优化、具有高度扩展性的RISC架构。它的基本特点是:包含大量的寄存器、指令数和字符、可视的管道延时时隙,这些特性使MIPS架构能够提供最高的每平方毫米性能和当今SoC设计中最低的能耗。MIPS公司的R系列就是在此基础上开发的RISC工业产品的微处理器。这些系列产品为很多计算机公司采用构成各种工作站和计算机系统。 MIPS架构应用场景 领域 应用 联网 基于MIPS的FourGe

24、e-3100芯片组用于多款Chromebook笔记本电脑,例如惠普Chromebook 11和华硕Chromebook 13.3。 基于MIPS 34K多线程CPU的RT6856被广泛用于众多知名品牌的家用无线路由器中,例如华硕、友讯(D-Link)、领势(Linksys)和合勤(ZyXEL)。 消费类多媒体 松下、LG等品牌的数字电视搭载了晨星半导体(MStar)的SoC,而34K MIPS CPU则广泛用于这些SoC中。 企业存储 博安思通信(PMC-Sierra)利用多线程功能为其企业服务器专用maxRAID架构提供极具竞争力的性能。 汽车 MIPS因受到Mobileye的青睐而在汽车行

25、业占据了举足轻重的地位。Mobileye是ADAS(高级驾驶辅助系统)领域的全球领导者,目前大部分ADAS都采用了Mobileye的技术。 物联网 Creator Ci40物联网中心开发板使用了运行频率550MHz的多线程MIPS inter Aptiv CPU。 14 2 5 目 录 一、服务器及CPU综述 二、全球CPU市场格局 三、服务器视角看CPU发展趋势 2.1 CPU产业链 2.2 CPU市场规模 2.3 CPU全球市场格局 2.4 CPU全球主要厂商 四、国产CPU行业篇 五、国产CPU厂商篇 15 Q3:服务器市场格局? x86仍是主力,ARM奋起直追。2018年前,x86架构

26、的服务器占据全球服务器99%以上市场份额;2020年,采用ARM架构服务器的市场份额快速提升至2.7%。 在x86领域里,Intel仍是王者,AMD挑战势头正盛。Intel在全球服务器市场的份额一直保持在90%以上,AMD自从推出基于Zen架构的EYPC系列服务器后开始不断侵蚀Intel的地盘,截至2021年H1,AMD服务器出货量占比超过10%。 本章导读 Q4:CPU的主要玩家? 基于x86架构的王者Intel与挑战者AMD;基于ARM架构的挑战者Apple。 本章亦详细梳理了三家厂商在UMA(Unified Memory Architecture,统一内存架构)方向的尝试与布局,探讨CP

27、U未来演进的方向众核、异构、集成。 2.1 CPU产业链 数据来源:IDC,西南证券整理 上游包括晶体代工、设备、封装测试和内核授权四个方面,覆盖面广。上游中相关产业存在超额利润率,CPU产业市场集中,能够对上游纵向垄断,且垄断性强。 中游包括CPU设计企业、ARM授权及嵌入式处理器三部分。全球龙头包括英特尔(IDM模式)、AMD,国内厂商包括中科曙光、中国长城、华为海思等。 下游包括PC、服务器、消费电子、物联网等。下游产业在国内外都拥有巨大市场,整体利润率高,但垄断情况相对较低。 上游 安全集成 中游 下游 晶体代工 设备 封装测试 内核授权 CPU处理器 ARM授权 嵌入式处理器 PC、

28、服务器 消费电子 物联网 16 2.2 集成电路市场规模 17 全球集成电路行业稳步增长,重心由欧美转向亚太 数据来源: WSTS,Gartner,公司年报,西南证券整理 2011-2019全球集成电路行业市场规模及增速 (亿美元) 2020年全球前十大集成电路厂商销售收入 (亿美元) 亚太地区经济水平快速发展,居民消费能力提升,对集成电路产品的需求增加,因此世界集成电路市场重心也转移至亚太地区。2020年,根据数据统计,亚太地区(除日本外)已成为全球最大的集成电路市场,销售额占全球市场的62.0%。2019 年受全球宏观经济低迷影响,行业景气度有所下降,下半年开始逐步回暖。伴随5G、可穿戴设

29、备及云服务器市场的稳健成长,行业收入较2019年有所增长。预计2021年全球集成电路行业将持续保持复苏势头,至2025年将保持稳步增长的趋势。 从全球竞争格局的角度看,集成电路产业的头部效应较为明显,少数领军企业占据了市场的主导地位。目前,全球集成电路市场主要由美国、韩国、日本以及中国台湾企业所占据。 702.4 562 252.7 221 179.1 157 130.7 110.1 102.1 111 005006007008002470 2382 2517 2773 2745 2766 3432 3933 3304 -3.6% 5.7% 10.2% -1.0% 0.8

30、% 24.1% 14.6% -16.0% -20%0%20%40%050002500300035004000450020001720182019全球集成电路行业销售额 增速 2.2 CPU市场规模 18 CPU市场规模稳健回升,国内市场增长空间巨大 数据来源: IDC、西南证券整理 2015-2020年全球及中国桌面出货量(亿台) 2015-2020年全球服务器出货量(亿台) CPU的重要应用领域包括桌面和服务器,每台桌面通常只有一颗CPU,而每台服务器的CPU数量不定。桌面领域,2015年-2018年全球出货量增速呈现缓慢下降

31、的趋势,但是整体出货量依然保持在2.6亿台/年左右。2019年开始,全球桌面出货量出现回升,2020年全球桌面出货量较前5年有较大增长。服务器领域,根据IDC数据,2020年全球服务器出货量达1,220万台,同比增长3.9%。 国内桌面领域,近年来出货量同样呈现缓慢下降的趋势,但是整体出货量依然保持在 0.5 亿台/年左右。近两年采用国产 CPU 的桌面产品发展迅速,但市场份额仍不足 5%,增长空间巨大。国内服务器领域,根据 IDC 数据,2020 年中国服务器出货量为 350 万台,同比增长 9.8%。 0.1 0.1 0.1 0.1 0.1174 0.122 -1.6% 6.6% 15.8

32、% -0.4% 3.9% -4%1%6%11%16%00.020.040.060.080.10.120.0020出货量 增长率 2.8 2.6 2.6 2.6 2.7 3.0 0.6 0.6 0.5 0.5 0.5 -5.8% 0.0% -0.4% 3.1% 13.5% -4.2% -3.9% -2.5% -2.7% -10%-5%0%5%10%15%00.511.522.533.52001820192020全球出货量 中国出货量 全球增长率 中国增长率 2.3 CPU全球竞争格局 19 X86领域:Intel和AMD占领市场

33、数据来源: IDC,西南证券整理 X86架构目前占据服务器、桌面及移动PC的主要市场份额,非X86架构产品不断发起进攻。 2018-2019年,在X86领域,AMD市场规模增长了1.0%,Intel市场份额小幅度下滑,但仍然呈现出主导态势。 在服务器领域,Intel市占率仍然高达96%以上,同时AMD公司正在努力提升自己的市场份额,从2018年的1.8%增长到2019年的3.9%,同比增长117.0%。 在笔记本电脑领域,AMD市占率大幅上升,从2018年的10%增长到2019年的14.6%,Intel则下降了5.1%。 在桌上型电脑领域中,AMD市占率持续上升,兆芯也占据了一定市场份额。 全

34、部X86 桌上型电脑 服务器 笔记本电脑 20182018 85.4% 14.6% IntelAMD90.0% 10.0% IntelAMD98.2% 1.8% IntelAMD96.1% 3.9% IntelAMD86.0% 14.0% IntelAMD85.0% 15.0% IntelAMD86.4% 13.4% 0.2% IntelAMD兆芯 82.3% 17.6% 0.1% IntelAMD兆芯 20192019 2.3 CPU全球竞争格局 20 非X86领域:ARM占据绝对优势 数据来源: IDC,西南证券整理 非X86架构CPU重要参与厂商 几种非X86架构对比 在非X86领域,A

35、RM以低能耗、高效率、发展时间长的优势占据移动终端市场的主导地位,使用最广泛、发展最成熟,市占率达到43.2%;RISC-V发展时间短且更加灵活,在物联网领域备受关注,近几年以其开源性质被重点关注发展,后续有望在新兴领域崭露头角;MIPS主要应用在网关、机顶盒等网络设备中,市占率达到9%;Power所代表的小型机是企业IT基础设施的核心,但在相关市场的占有率仅1%左右;Alpha指令集基本已退出国际主流应用;SPARC早先被Sun公司开源,后被Oracle公司并购,如今已消失。 在移动终端方面,ARM占据绝对优势,通过授权占据移动设备端90%以上的市场,构成市场上的标准架构;在服务器方面,非X

36、86目前参与者有华为、飞腾、高通、亚马逊等,华为的鲲鹏服务器是ARM服务器的重要参与者,而国产龙芯是基于MIPS的服务器重要厂商;在桌面PC市场,ARM正逐渐被跟多企业应用,2011年微软开始采用ARM的Windows系统,ARM开始进入X86的传统优势领域,如今苹果MacOS、新版Windows等均采用了ARM。 公司名称公司名称 架构架构 主要产品主要产品 苹果苹果 ARM A12x、A14、M1等芯片广泛应用于苹果iPad,Mac等热门产品中 三星电子三星电子 ARM Exynos系列芯片 高通高通 ARM 经典高通骁龙系列芯片在手机市场应用广泛 联发科联发科 ARM 天玑系列芯片在手机

37、上应用广泛 龙芯龙芯 MIPS 网络相关硬件、激光打印机、视频游戏等具有优势应用地位。龙芯3B4000属于龙芯服务器CPU产品线 MIPSMIPS AlphaAlpha PowerPower SPARCSPARC 代表公司代表公司 龙芯 申威 IBM Oracle 主要应用领域主要应用领域 党政办公 超算 高性能计算 超算 可控性可控性 国产龙芯2020年底准备研发完全采用中国技术的可兼容指令集 服务器和桌面领域,申威初步建立了包括CPU、操作系统、数据库、办公软件等在内的国产生态,实现从不可用到基本可用的初突破 在高性能计算领域有重要地位,其一些技术特性可与Intel一较高下 - 市占率市占

38、率 党政办公领域占一定比例 超算领域占一定比例 1%左右 将近消失 2.4 CPU厂商- 21 数据来源:公司官网,西南证券整理 产品布局: X86:英特尔在服务器CPU领域的布局,自首款产品Pentium Pro推出以来,已经有25年之久。近12年来,英特尔服务器CPU的平台包括:Thurley 、 Romley、Grantley、Purley和Whitley,公司预计2021年发布全新的Eagle Stream。这些服务器CPU的演化几乎采用了和桌面CPU相同的“Tick-Tock”(钟摆)战略,即在“Tick”时升级CPU的制程,而在“Tock”时升级微架构。2017年以来,英特尔将服务

39、器CPU的原有的E7、E5、E3产品线由高到低细分为Platinum(铂金)、Gold(金)、Silver(银)、Bronze(铜),满足从低阶的中小企业到高阶的人工智能,不同的性能需求。2020年6月,英特尔发布了最新的Whirley平台的Cooper Lake服务器CPU,使用14nm+制程,支持8通道DDR4 ECC内存和PCIE3.0协议。 ARM/MIPS/Power:为了保证电脑能继续运行以往开发的各类应用程序以保护和继承丰富的软件资源,所以很长一段时间内Intel公司所生产的所有CPU仍然继续使用X86指令集。 2.4 CPU厂商- 22 数据来源:前瞻研究院,西南证券整理 产品

40、布局: RISC-V : 2021年10月英特尔就已推出了基于RISC-V架构的Nios V处理器。2022年2 月 ,以X86架构为主的英特尔宣布加入RISC-V 国际基金会,并设立了10亿美元基金用于扶持初创和成熟企业进行代工生态的创新,其中很大一部分资金将用于RISC-V。 RISC-V基金会白金成员 数据来源: 公司官网,西南证券整理 5月,Intel推出史上第一个双核处理器Pentium D系列,采用90nm工艺核心,每核心拥有1MB L2缓存,均是800MHz的FSB,随后还推出了带超线程技术的Pentium Extreme Edition 840处理器,双核四线程,FSB也提升到

41、了1066MHz,频率也更高。 2005年年 2006年年 2013年年 2014年年 Intel的单核到多核之路:自Intel在1978年推出第一颗x86处理器8086后,CPU的发展方向一直都是整合更多的指令集与外部控制器,以及更高的主频。当CPU的单核效能与频率都到瓶颈之后,Intel与AMD都开始向多核发展。 2.4 CPU厂商- Pentium D处理器的继任者是非常经典的Core 2 Due处理器,而且他们还用当年炮制首款双核处理器的手法造出了首款四核处理器Core 2 Quad。而首款桌面级的四核处理器诞生于2006年11月2日,首发产品为Core 2 Extreme Editi

42、on QX6700。 3月16日推出的Core i7-980X是首款6核处理器,核心代号Gulftown,它基于Westmere架构,处理器每核心拥有256KB L2缓存,共享12MB L3缓存,主频是3.33GHz,最高睿频3.6GHz。 桌面市场的第一颗真八核处理器是Intel在2014年推出的Core i7-5960X,属于22nm的Haswell-E架构,基础频率3GHz,最高睿频3.5GHz,拥有20MB L3缓存,属于HEDT的X99平台。 23 数据来源:公司官网,西南证券整理 Intel在5月发布的Core i7-6950X是首款桌面的十核处理器,它所用的Broadwell-E

43、架构其实就是Haswell-E的制程升级版,生产工艺从22nm升级到14nm,核心数量从上代Core i7-5960X的8核增加到10核,晶体管数量也从26亿增加到32亿,但因为更先进的制程工艺,芯片面积从355.52mm2缩减到246mm2。 2016年年 2017年年 2020年年 Intel的单核到多核之路:自Intel在1978年推出第一颗x86处理器8086后,CPU的发展方向一直都是整合更多的指令集与外部控制器,以及更高的主频。当CPU的单核效能与频率都到瓶颈之后,Intel与AMD都开始向多核发展。 2.4 CPU厂商- 6月份,Intel推出了第七代Core X系列处理器,包括

44、Skylake-X与Kabylake-X两种不同架构的处理器,Skylake-X处理器多了12核、14核、16核、18核的产品,并且用Core i9取代Core i7成为Intel消费级市场上最强处理器的代名词。 Intel的Lakefield项目于2019年正式公开,2020年正式上市,这款产品的实验性质很重,它是首款采用Intel Foveros 3D堆叠工艺的产品,也是首款采用混合架构的x86五核处理器。从此Intel开启混合架构新时代。 24 25 数据来源:Intel官网,西南证券整理 UMA(Unified Memory Architecture):传统的CPU和GPU虽位于同一个

45、SoC芯片上,但由于于内存的不同访问习惯和数据结构,导致它们虽使用相同的内存RAM,但其存取空间仍然是分开的。而UMA基于异构计算,将CPU、GPU、NPU、FPGA等通用、专用处理器集成到一起,协同计算、各司其职,从而提升带宽、延迟和性能表现。 2.4 CPU厂商- Intel的UMA尝试 Intel第六代酷睿处理器(Skylake,2015年)i7-6700K的ring互联架构集成了Intel Gen9核显。CPU核心、LLC(last level cache)、GPU和System Agent之间通过SoC Ring Interconnect相连,而且每个连接对象都有专门的本地接口。所有

46、来自或者去往CPU核心,以及来自或者去往Intel GPU的(片外)系统内存数据交换事务,都经由这条互联ring实施,通过System Agent以及统一DRAM内存控制器。该LLC也与GPU共享。对于CPU核心与GPU而言,LLC着力于降低访问系统DRAM的延迟,提供更高的有效带宽。Intel处理器内部的核显其实是连片内的LLC cache都是可以访问的,和CPU核心算是平起平坐。也就是说,从很多年前开始,Intel就开始尝试UMA架构。 2.4 CPU厂商- 26 数据来源:公司官网,西南证券整理 产品布局: X86:AMD 2022年的旗舰产品将是EPYC Genoa服务器,它基于Zen

47、 4架构,拥有庞大的96核。此外,AMD还计划在2022年底发布基于Zen 4c的128核EPYC Bergamo服务器。AMD在发布7nm产品之后得到许多公有云服务商采用,如Google Cloud Platform、Microsoft Azure与Tencent,占比逐渐在2021年提升,目前渗透率已达一成以上。TrendForce集邦咨询预估,2022年AMD渗透率在全球服务器领域可望达到约15%。 ARM/MIPS/Power/RISC-V:ADM在CPU市场中是坚定的X86追随者。基于庞大的软件基数以及所掌握的工具技术资源,X86可以最快速度、最便捷途径去优化提高。 2022年AMD

48、的旗舰产品将是EPYC Genoa服务器芯片 数据来源:公司官网,西南证券整理 双核 安全集成 2.4 CPU厂商- AMD的双核处理器Athlon 64 X2诞生于200 5年5月。 但与Intel的Pentium D不同,AMD的Athlon 64 X2是在同一块芯片内整合了两个K8核心,两个核心之间可透过System Request Queue实现数据互通,因此执行效率远高于竞争对手产品。 三核、四核 2007年K10架构的四核于11月11日发布,它确实是首款原生四核处理器,并且首次把L3缓存引入到消费级市场,但整体效能不如对手的Core 2 Quad。通过改进B3步进的工艺,AMD还推

49、出了首款三核处理器Phenom X3。每个核心独享512KB L2缓存,所有核心共享2MB L3缓存。 八核、12核、16核 32核、64核 2011年的Bulldozer推土机是首款八核处理器。因备受争议,没有进入主流市场。主流平台的八核处理器,是2017年Zen架构的第一代Ryzen7系列处理器,它正式引发了Intel与AMD在处理器市场的核心数量大战。同年,首个12核和16核处理器锐龙Threadripper 1920X和1950X上市。 2018年发布的第二代锐龙Threadripper,最大核心数量已达到3 2 核 。 到 了 锐 龙Threadripper 3000,CPU被拆分成

50、CCD计算核心和IOD输入输出核心,解决了每个核心之间访问内存和PCI-E时延迟不一的问题,于是2020年,64核的锐龙T h r e a d r i p p e r 3990X从此诞生。 27 数据来源:公司官网,西南证券整理 2.4 CPU厂商- AMD的UMA尝试APU的提出 AMD在很早就发现在以游戏为代表的多媒体体验上,比起CPU,更强的GPU才是大势所趋。考虑到Intel有自家的集成显卡技术,AMD另辟蹊径,以GPU作为突破口,在笔记本领域取代Intel成为市场的主流。 随后,AMD又提出APU概念“Accelerated Processing Units”,中文名字叫加速处理器,

51、是AMD基于Fusion融聚理念且已酝酿3年之久的战略级产品。APU最大的特色就是将AMD的CPU、DX11级别的GPU和北桥芯片整合在一个单元中,首次将AMD引以为豪的3A平台“融聚”到了一颗APU上。 为了实现此目的,AMD在2006年收购了拥有21年历史的全球领先图形IC厂商ATI。随后提出了著名的AMD+ATI芯片组+ATI显卡的“3A”平台概念,一时间声名鹊起。 28 29 数据来源:公司官网,西南证券整理 2.4 CPU厂商- AMD的UMA尝试七代APU产品 第一代:Llano 允许Radeon HD 6000M系列独立显卡可通过PCI-E X16通道和处理器相连,与APU内置的

52、图形核心组成双显切换、混合使用。(2011年) 第二代:Trinity 支持Turbo CORE 3.0动态超频技术,将Barts架构引入APU,加深GPU与CPU的联系,实现显示输出与通用计算性能的同步提升。(2012年) 第三代:Richland/Kabini Richland最高主频3.5GHz,集成RadeonHD8650G显卡,和独显组成交叉火力后可以实现更强大的3D性能。Kabini是三代的低功耗版。(2013年) 第四代:Kaveri 首次实现了HSA架构特性,让GPU与CPU同时成为一件任务的处理媒介,从而使处理任务的效率得到大幅提升,达到1+12的效果。(2014年) 第五代

53、:Beema Kabini的升级版,在近乎一半的TDP下带来50的频率提升。(2014年) 第六代:Carrizo 在架构、操作系统、加速计算等方面做到CPU/GPU的真正融合与异构计算。(2014年) 第七代:Bristol Ridge/Stoney Ridge 较上代产品主要在游戏性能、视频渲染以及文件压缩性能上有所改进。(2016年) 30 数据来源:公司官网,西南证券整理 2.4 CPU厂商- AMD的UMA尝试高开低走的APU 在2017年以前,虽然AMD APU和英特尔酷睿都经历了七次更新迭代,但能被消费者口熟能详的却大都为酷睿家族,作为首创Fusion融聚理念的APU却逐渐被边缘

54、化。AMD的APU产品如今集成的GPU核显,在性能上并未能如十多年前刚诞生之时预期的那样,显著优于竞争对手。 强劲的竞争对手:在AMD筹备第一代Llano APU之际,Intel抢先一步推出了第一代酷睿处理器(Westmere架构),将CPU和GPU打包封装,在物理结构上实现了“二合一”。2011年,第二代酷睿处理器(Sandy Bridge)进一步实现了CPU和GPU的融合。虽然AMD的融合理念提出的最早,但在落实方面却还是落在了Intel后面。随后,历代酷睿家族不断强化集成显卡性能,最终导致APU在GPU性能上的优势逐渐被稀释。 落后的工艺:生产工艺是制约处理器性能发挥的最核心指标,AMD

55、的上游晶圆公司厂Globalfounderies的生产效率难以跟上,使第一代Llano APU就因GF 32nm量产遇阻而从2010年延期到了2011年。给Intel抢先一步融合CPU和GPU的机会。 落伍的核心架构:AMD APU从诞生之初,核心架构经历了K10Bulldozer(推土机)Piledriver(打桩机)Steamroller(压路机)Excavator(挖掘机),就AMD自身来看的确是越来越先进,但与同期的英特尔酷睿家族相比,AMD的核心架构却早已落伍。受制于工艺和TDP的限制,APU在3D性能上几乎没什么提升。近些年AMD移动显卡和NVIDIA同期产品相比性能也是明显落后的

56、,这就导致AMD笔记本在高端游戏市场的集体失利。 APU逐渐边缘化的原因 31 数据来源:公司官网,西南证券整理 2.4 CPU厂商- AMD的UMA尝试HSA的成立与没落 2012年6月,AMD联合ARM、Imagination、联发科、德州仪器共同组建了非营利组织“异构系统架构基金会”(HSA Foundation),随后吸引了三星电子、高通以及大批行业公司、科研机构的加盟。 异构系统架构(HSA)联盟的目标:1) 实现节能,提高性能;2) 提高异构处理器的可编程性; 3) 增加处理器和平台之间代码的可移植性;4) 增加整个行业中异构解决方案的普遍性 HSA的结局:除了游戏主机这个主场完整

57、践行了APU思路,在PC领域APU完全体的HSA联盟和生态基本处于荒废状态。如今应用于PC的APU更像是单纯将CPU、GPU放在同一颗die上的普通处理器;而且AMD的APU产品如今集成的GPU核显,在性能上也没能像刚诞生之时预期的那样,显著优于竞争对手。 HSA失败的原因:1)AMD对这个方向不再看好,对生态疏于维护;2)在PC领域,HSA需要开发者响应,鉴于AMD在PC市场上的号召力不足,HSA难以真正实现;3)AMD如今的Zen架构处理器,在性能和效率上与推土机大相迳庭,也实现了对Intel酷睿处理器的超越,不再需要运用APU概念进行竞争。 2.4 CPU厂商- 32 数据来源:公司官网

58、,西南证券整理 产品布局: ARM:苹果在2020年11月发布会中推出了新的面向Mac计算机的M1芯片,将为其新一代基于A的Mac提供动力。M1拥有160亿个晶体管,包括CPU、GPU、神经引擎和统一的内存架构,5纳米制程。苹果表示,新处理器将专注于电源效率,它有一组八核CPU,提供了世界上最好的CPU每瓦特的性能,能以四分之一的功耗提供与典型笔记本电脑CPU相同的峰值性能。 X86/Power: 33 数据来源:公司官网,西南证券整理 2.4 CPU厂商- Apple的UMA尝试 M1的诞生:Apple M1是由苹果公司研发的处理器芯片,基于UMA统一内存架构。于2020年11月11日在苹果

59、新品发布会上发布,适用于部分Mac、iPad设备。 为什么研发M1:1) 拥有核心技术是苹果的重要战略;2)Intel的制造能力相对落后;3)不仅能延长电池寿命,还有可能提升性能,甚至让笔记本电脑像手机一样工作。 Apple研发M1的优势:1)苹果公司采用垂直整合的封闭系统,不受兼容性需求的限制;2)苹果在过去Ax系列处理器自行定义独特功能,使苹果累计了雄厚的软件资产,布局了相对成熟的生态系统;3)苹果的强劲的技术实力和自主研发能力;4)苹果在移动领域和PC领域的号召力。这些优势使得苹果虽然晚于其他市场竞争者很久才进入市场,但却有着得天独厚的发展基础。 M1的基本思想:将RAM作为处理器的所有

60、部分都可以访问的单个内存池。当GPU需要更多的系统内存,则可以提高使用率,而SoC的其他部分则可以降低。另外,GPU,CPU和处理器的其他部分可以在相同的内存地址访问相同的数据。无需为SoC的每个部分分配部分内存,然后在处理器的不同部分的两个空间之间穿梭数据。 M1的未来展望:苹果在3月9日的发布会上推出自研的M1 Ultra芯片,通过UltraFusion架构将两个M1 Max芯片拼在一起,使芯片的各项硬件指标翻倍,性能也得到大幅提升。苹果的UltraFusion技术充分结合封装互连技术、半导体制造和电路设计技术,为整合面积更大、性能更高的算力芯片提供巨大的想象空间。 34 2 5 目 录

61、一、服务器及CPU综述 二、全球CPU市场格局 三、未来处理器的演进 3.1 CPU优化历程回顾 3.2 后摩尔时代的展望 3.3 服务器视角展望边缘服务器 3.4 服务器视角展望公有云服务器 3.5 服务器视角展望AI服务器 四、国产CPU行业篇 五、国产CPU厂商篇 35 Q5:处理器演进的方向? 背景:1)后摩尔定律时代,单靠制程工艺的提升带来的性能受益已经十分有限,Dennard Scaling规律约束,芯片功耗急剧上升,晶体管成本不降反升;单核的性能已经趋近极限,多核架构的性能提升亦在放缓。2)AIoT时代来临,下游算力需求呈现多样化及碎片化,通用处理器难以应对。 方向: 1)从通用

62、到专用:面向不同的场景特点定制芯片,XPU、FPGA、DSA、ASIC应运而生。 2)从底层到顶层:软件、算法、硬件架构。架构的优化能够极大程度提升处理器性能,例如AMD Zen3将分离的两块16MB L3 Cache合并成一块32MB L3 Cache,再叠加改进的分支预测、更宽的浮点unit等,便使其单核心性能较Zen2提升19%。 3)异构与集成:苹果M1 Ultra芯片的推出带来启迪,利用逐步成熟的3D封装、片间互联等技术,使多芯片有效集成,似乎是延续摩尔定律的最佳实现路径。 主流芯片厂商已开始全面布局:intel已拥有CPU、FPGA、IPU产品线,正加大投入GPU产品线,推出最新的

63、Falcon Shores架构,打磨异构封装技术;NvDIA则接连发布多芯片模组(MCM,Multi-Chip Module)Grace系列产品,预计即将投入量产;AMD则于近日完成对塞灵思的收购,预计未来走向CPU+FPGA的异构整合。 此外,英特尔、AMD、Arm、高通、台积电、三星、日月光、Google云、Meta、微软等十大行业主要参与者联合成立了Chiplet标准联盟,正式推出通用Chiplet的高速互联标准“Universal Chiplet Interconnect Express”(通用小芯片互连,简称“UCIe”)。在UCIe的框架下,互联接口标准得到统一。各类不同工艺、不同

64、功能的Chiplet芯片,有望通过2D、2.5D、3D等各种封装方式整合在一起,多种形态的处理引擎共同组成超大规模的复杂芯片系统,具有高带宽、低延迟、经济节能的优点。 本章导读 3.1 CPU优化历程回顾 36 数据来源:EEWORLD,西南证券整理 从单核到多核 从单线程到多线程 以多核提升性能功耗比 多核处理器把多个处理器核集成到同一个芯片之上,每个单元的计算性能密度得以大幅提升。同时,原有的外围部件可以被多个CPU系统共享,可带来更高的通信带宽和更短的通信时延,多核处理器在并行性方面具有天然的优势,通过动态调节电压/频率、负载优化分布等,可有效降低功耗,提升性能。 以多线程提升总体性能

65、通过复制处理器上的结构状态,让同一个处理器上的多个线程同步执行并共享处理器的执行资源,可以极小的硬件代价获得相当比例的总体性能和吞吐量提高。 3.1 CPU优化历程回顾 37 数据来源:wikipedia,西南证券整理 英特尔的制程及微架构演进 制程的提升 根据摩尔定律,集成电路芯片上、所集成的电路数目每隔18个月翻一番,微处理器性能每隔18个月提高一倍。 CPU的制程工艺越小,意味着单个晶体管的尺寸越小,同样的内核面积可以放下更多的晶体管,同样的空间内可以增加更多内核;同时制程工艺越小,元件的电容就越小,电流在晶体管中的传输距离越短,CPU的主频可以进一步提升,功耗也能不断降低。 微架构的改

66、进 众多算数单元、逻辑单元、寄存器在三态总线和单项总线,以及各个控制线的连接下共同组成CPU微架构。不同的微架构设计,对CPU性能和效能的提升发挥着直观重要的作用。 微架构的升级,一般涉及到指令集拓展、硬件虚拟化、大内存、乱序执行等等一系列复杂的工作,还涉及到编译器、函数库等软件层次的修改,牵一发而动全身。 全球头部晶圆制造厂商的制程工艺演进 3.1 CPU优化历程回顾 38 数据来源:CSDN,中科院计算技术研究所,西南证券整理 摩尔定律放缓 从“Tick-Tock”到“PAO” 摩尔定律放缓 摩尔定律于上世纪60年代提出,直至2011年前,计算机元器件的小型化是提升处理性能的主要因素。20

67、11年后,摩尔定律开始放缓,制硅工艺的改进将不再提供显著的性能提升。 “Tick-Tock”模式失效 自2007年开始,英特尔开始实施“Tick-Tock”发展模式,以两年为周期,在奇数年(Tick)推出新制成工艺,在偶数年(Tock)推出新架构的微处理器。 在14nm转10nm接连推迟后,英特尔自2016年起宣布停止 “Tick-Tock”处理器升级周期,改为处理器升级的三步战略:制程工艺(Process)-架构更新(Architecture)-优化(Optimization)。 3.2 后摩尔时代的展望从底层到顶层 39 数据来源:中科院计算技术研究所,西南证券整理 算力提升或更依赖顶层优

68、化 后摩尔时代,顶层优化或更为重要 新的底层优化路径被提出,例如3D堆叠、量子计算、光子学、超导电路、石墨烯芯片等,技术目前仍处于起步阶段,但后续有望突破现有想象空间。 根据MIT在Science发布的文章,后摩尔定律时代,算力提升将更大程度上来源于计算堆栈的顶层,即软件、算法和硬件架构。 通用指令集为了覆盖更多应用,往往需要支持上千条指令,导致流水线前端设计(取指、译码、分支预测等变得十分复杂),对性能功耗会产生负面影响。 领域专用指令集可大大减少指令数量,并且能够增大操作粒度,融合访存优化,实现数量级提高性能功耗比。 专用指令集可大幅提升性能功耗比 3.2 后摩尔时代的展望从通用到专用 4

69、0 数据来源:中科院计算技术研究所,艾瑞咨询,西南证券整理 牧村波动 新兴场景出现,CPU从通用向专用发展 1972年,戈登贝尔(Gordon Bell)提出,每隔10年,会出现新一类计算机(新编程平台、,新网络连接、新用户接口,新使用方式且更廉价),形成新的产业。 1987 年, 原日立公司总工程师牧村次夫(Tsugio Makimoto) 提出,半导体产品未来可能将沿着“标准化”与“定制化”交替发展的路线前进,大约每十年波动一次。 经历了桌面PC、互联网时代和移动互联网时代后,“万物智联”已成为新的风向标,AIoT正掀起世界信息产业革命第三次浪潮。而AIoT最明显的特征是需求碎片化,现有的

70、通用处理器设计方法难以有效应对定制化需求。 处理器从通用到专用 底层驱动 41 数据来源:Science,中科院计算技术研究所,西南证券整理 几类处理引擎比较 几类处理器适用领域 通用与性能,难以兼得 CPU是最通用的处理器引擎,指令最为基础,具有最好的灵活性。 Coprocessor,是基于CPU的扩展指令集的运行引擎,如ARM的NEON、Intel的AVX、AMX扩展指令集和相应的协处理器。 GPU,本质上是很多小CPU核的并行,因此NP、Graphcore的IPU等都和GPU处于同一层次的处理器类型。 FPGA,从架构上来说,可以用来实现定制的ASIC引擎,但因为硬件可编程的能力,可以切

71、换到其他ASIC引擎,具有一定的弹性可编程能力。 DSA,是接近于ASIC的设计,但具有一定程度上的可编程。覆盖的领域和场景比ASIC要大,但依然存在太多的领域需要特定的DSA去覆盖。 ASIC,是完全不可编程的定制处理引擎,理论上最复杂的“指令”以及最高的性能效率。因为覆盖的场景非常小,因此需要数量众多的ASIC处理引擎,才能覆盖各类场景。 3.2 后摩尔时代的展望从通用到专用 灵活性 性能 单位成本 co-processor DSA 3.2 后摩尔时代的展望异构与集成 42 数据来源:Apple,西南证券整理 后摩尔定律时代,从苹果M1(Ultra)展望CPU未来发展之路 不可逆转的SoC

72、集成:由于集成电路集成度不断提高,将完整计算机所有不同的功能块一次直接集成于一颗芯片上的 SoC 片上就成为整个半导体行业发展的一个趋势,可以显著降低系统成本和功耗,提高系统可靠性。M1 并不是传统意义上的 CPU,而是一颗SoC。CPU采用了8核心,包括4个高性能核心和4个高能效核心。每个高性能核心都提供出色的单线程任务处理性能,并在允许的范围内将能耗降至最低。 异构能力的大幅提升:M1还采用了统一内存架构(UMA),CPU、GPU、神经引擎、缓存、DRAM内存全部通过Fabric高速总线连接在一起,得益于此,SoC中的所有模块都可以访问相同的数据,而无需在多个内存池之间复制数据,带宽更高、

73、延迟更低,大大提高了处理器的性能和电源效率。此外,最新一代的M1 Ultra本质上是两个M1 MAX的有效组合,通过UltraFusion架构,提供高达128G统一内存,相较M1的GPU性能提高8倍。 苹果M1处理器完成了一次从多芯片走向一体化的过程,这也是苹果打造完整PC生态链的必经之路,让我们看见了CPU未来发展的更多可能性。 M1芯片架构 M1 Ultra与苹果Chiplet专利 3.2 后摩尔时代的展望异构与集成 43 数据来源:半导体行业观察,ERI summit,西南证券整理 后摩尔时代,异构与集成 海外芯片巨头积极布局异构计算:英特尔现已布局CPU、FPGA、IPU、GPU产品线

74、,并接连公布Alder Lake、Falcon Shores等新架构;英伟达接连发布多芯片模组(MCM,Multi-Chip Module)Grace系列产品,预计即将投入量产;AMD则于近日完成对塞灵思的收购,预计未来走向CPU+FPGA的异构整合。 晶圆厂和封装厂亦积极投入异构集成:异构计算需要有先进的集成封装技术,得益于近十年来先进封装与芯片堆叠技术的发展,例如3D堆叠、SiP等,也使得异构集成成为了大幅存在可能。目前,2.5D封装技术已发展较为成熟,例如台积电的CoWoS,三星的I-Cube,3D封装成为各大晶圆厂发力方向。英特尔已开始量产Foveros技术,三星已完成X-Cube的验

75、证,台积电亦提出了SoiC的整合方案。 异构集成有望成为延长摩尔定律的第四波技术浪潮 封装从2D逐渐发展至3D来提升性能 3.2 后摩尔时代的展望异构与集成 44 数据来源:半导体行业观察,Intel,西南证券整理 UCIe标准推出 后摩尔时代,异构与集成 CPU+XPU已广泛应用,但仍有优化空间。传统的异构计算架构存在IO路径较长,输入输出资源损耗等固有问题,并且仍然无法完全兼顾极致性能与灵活性。 Chiplet联盟组建,探索超异构可能性。2022年3月3日,英特尔、AMD、Arm、高通、台积电、三星、日月光、Google云、Meta、微软等十大行业巨头联合成立了Chiplet标准联盟,正式

76、推出了通用Chiplet的高速互联标准“Universal Chiplet Interconnect Express”(通用小芯片互连,简称“UCIe”)。 在UCIe的框架下,互联接口标准得到统一。各类不同工艺、不同功能的Chiplet芯片,有望通过2D、2.5D、3D等各种封装方式整合在一起,多种形态的处理引擎共同组成超大规模的复杂芯片系统,具有高带宽、低延迟、经济节能的优点。 Intel在超异构的布局 3.3 服务器视角展望边缘服务器 45 数据来源:浪潮信息,IDC,西南证券整理 边缘服务器示意图 边缘计算服务器是解决AIoT时代“算力荒”的必备产物 云计算无法满足海量、实时的处理需求

77、。伴随人工智能、5G、物联网等技术的逐渐成熟,算力需求从数据中心不断延伸至边缘,以产生更快的网络服务响应,满足行业在实时业务、应用智能、安全与隐私保护等方面的基本需求。 市场规模爆发式增长。根据IDC,中国边缘计算服务器整体市场规模达到33.1亿美元,较2020年增长23.9%,预计2020-2025年CAGR将达到22.2%,高于全球的20.2%。 定制服务器快速增加。当前通用服务器和边缘定制服务器占比分别为87.1%和12.9%,随着边缘应用场景的逐渐丰富,为适应复杂多样的部署环境和业务需求,对于具有特定外形尺寸、低能耗、更宽工作温度以及其他特定设计的边缘定制服务器的需求将快速增加。IDC

78、预计边缘定制服务器将保持76.7%的复合增速,2025年渗透率将超过40%。 边缘计算服务器市场规模 3.3 服务器视角展望边缘服务器 46 数据来源:博时特,西南证券整理 边缘服务器CPU示意图 根据业务场景多样定制,集成化是趋势 区别于数据中心服务器,边缘服务器配置并不一味追求最高计算性能、最大存储、最大扩展卡数量等参数,而是在有限空间里面尽量提供配置灵活性。当前边缘服务器多用于工业制造等领域,需根据具体环境(高压、低温、极端天气)等选择主板、处理器等,下游需求呈现碎片化,未有统一的标准。 伴随越来越多的计算、存储需求被下放至边缘端,当前趋势通常涉及更紧密的加速集成,以满足包括AI算力在内

79、的多种需求。超大规模云提供商正在开始研究分类体系结构,为了减少熟悉的多租户方法不可避免的碎片化,其中计算、存储、网络和内存成为一组可组合的结构,机柜式架构(RSA)分别部署了CPU、GPU、硬件加速、RAM、存储和网络容量。 边缘计算服务器亦呈现集成化趋势 3.4 服务器视角展望-公有云服务器 47 数据来源:华为云官网,腾讯云官网,西南证券整理 华为云服务器架构 腾讯云提供多种服务器租用 云服务器正在全球范围内取代传统服务器 云服务器的发展使中国成为全球服务器大国。随着移动终端、云计算等新一代信息技术的发展和应用,企业和政府正陆续将业务从传统数据中心向云数据中心迁移。虽然目前中国云计算领域市

80、场相比美国相对落后,但近年来我国的云计算发展速度显著高于全球云计算市场增长速度,预计未来仍将保持这一趋势。 面向不同需求,提供多样性算力。一般小型网站请求处理数据较少,多采用1、2核CPU;地方门户、小型行业网站,需要4核以上的CPU;而电商平台,影视类网站等,则需要16核以上的CPU。此外,云服务器亦提供灵活的扩容、升级等服务,一般均支持异构类算力的加载 48 数据来源:AWS,西南证券整理 AWS Nitro架构 CPU+ASIC,云服务器异构趋势明显 在传统的计算机虚拟化架构中,业务层为虚拟机,管理层为宿主机,业务和管理共存于CPU运行,导致CPU大概只有七成的资源能够提供给用户。 AW

81、S创造性进行架构重构,将业务和管理分离到两个硬件实体中,业务运行在CPU,管理则运行在NITRO芯片中,既将虚拟化的损耗挪到定制的Nitro系统上,又提高了安全性。 Nitro架构不仅性能强大,而且特别灵活,可以基于一些常用的Hypervisor(如qemu-kvm,vmware)运行虚拟机,甚至可以直接裸跑操作系统,可节省30%CPU资源。 3.4 服务器视角展望-公有云服务器 49 数据来源:Nvidia,西南证券整理 英伟达推出数据中心专属CPU GRACE ARM或成重要挑战者,英伟达推出首款数据中心专属CPU GRACE 公有云巨头价格竞争激烈,国内一线城市能耗管控严格,ARM移动端

82、的优势和低能耗特征是超大型数据中心解决节能和成本问题的重要方案之一;国内自主可控趋势背景下,若能够搭建强有力的生态联盟,是未来可能颠覆原有格局的最有力挑战者。 英伟达宣布推出首款面向AI基础设施和高性能计算的数据中心专属CPUNvDIA Grace,由两个CPU芯片通过最新一代NVLink-C2C技术互联组成。 Grace基于最新的ARMv9架构,单个socket拥有144个CPU核心,利用纠错码(ECC)等机制提供当今领先服务器芯片两倍的内存带宽和能效,兼容性亦十分突出,可运行NvDIA所有的软件堆栈和平台,包括NvDIA RTX、HPC、Omniverse等。 3.4 服务器视角展望-公有

83、云服务器 50 数据来源:DPU技术白皮书,Nvdia,西南证券整理 带宽性能增速比失调,DPU应运而生 从CPU到CPU+DPU DPU,即数据处理单元(Data Processing Unit),主要作为CPU的卸载引擎,主要处理网络数据和IO数据,并提供带宽压缩、安全加密、网络功能虚拟化等功能,以释放CPU的算力到上层应用。 2013年,AWS研发的的Nitro和阿里云研发的X-Dragon均可看作DPU前身;英伟达在2020年正式发布一款命名为“DPU”的产品,将其定义为CPU和GPU之后的第三颗主力芯片,DPU的出现是异构计算的另一个阶段性标志。 DPU是CPU和GPU的良好补充,据

84、英伟达预测,每台服务器可能没有GPU,但必须有DPU,用于数据中心的DPU的量将达到和数据中心服务器等量的级别。 NvDIA BlueField-3 DPU 3.4 服务器视角展望-公有云服务器 51 数据来源:浪潮,IDC,西南证券整理 2021H1全球AI服务器市场份额 AI服务器产品示意图 浪潮信息 20.2% 戴尔 13.8% HPE 9.8% 联想 6.1% 华为 4.8% IBM 3.9% 新华三 3.9% 思科 2.6% Oracle 1.2% 富士通 1.0% 其他 32.6% AI算力已成为驱动人工智能发展的核心动力 人工智能是全球IT产业发展最快的新兴技术应用之一,在人工智

85、能发展的三要素中,无论是数据还是算法,都离不开算力的支撑。2020年,深度学习模型对算力的需求已达到了每天百亿亿次的计算需求。目前先进模型的参数量和复杂程度正呈现指数级的增长趋势,人工智能所需算力每四个月即翻一倍,AI算力已成为驱动人工智能发展的核心动力。承载AI的新型算力基础设施的供给水平,是直接影响AI创新迭代及产业AI应用落地的关键因素。 目前,全球AI服务器占AI基础设施市场的84.2%以上,是AI基础设施的主体。未来AI服务器将保持高速增长,预计在2024年全球市场规模将达到251亿美元。浪潮联合IDC发布的2020全球计算力指数评估报告显示,AI计算在整体计算市场占比正逐年提高,全

86、球增长的AI计算支出50%来自中国。 3.5 服务器视角展望-AI服务器 52 数据来源:Nvdia,西南证券整理 英伟达Grace Hopper芯片 从CPU到CPU+XPU AI模型通过数千亿的参数进行训练,增强包含数万亿字节的深度推荐系统,其复杂性和规模正呈现爆炸式增长。这些庞大的模型正在挑战当今系统的极限,仅凭CPU的优化难以满足其性能需求。 因此,AI服务器主要采用异构形式,表现形态多为机架式。在异构方式上,可以为CPUGPU、CPUFPGA、CPUTPU、CPUASIC或CPU多种加速卡。 现在市面上的AI服务器普遍采用CPU+GPU的形式,因为GPU与CPU不同,采用的是并行计算

87、的模式,擅长梳理密集型的数据运算,如图形渲染、机器学习等。继续扩展模型以实现高度准确性和实用性,需要能够快速访问大型内存池并使 CPU 和 GPU 紧密耦合。 3.5 服务器视角展望-AI服务器 53 数据来源:机器之心,西南证券整理 谷歌第一代TPU架构 从CPU到CPU+TPU TPU,即张量处理单元(Tensor Processing Unit),是Google为加速深度学习所开发的专用集成电路(DSA),采用专用CISC指令集,自定义改良逻辑、线路、运算单元、内存系统架构、片上互联等,并针对Tensorflow等开源框架进行优化。 2015年起,谷歌发布TPUv1,应用于Alpha G

88、o等特定内部项目;2018年,谷歌发布TPUv3,开始向第三方出售,TPU开始逐渐走向商用。 2021年,谷歌发布TPUv4i,其性能相较第三代TPU提升2.7倍;256块TPU仅用1.82分钟便完成NLP领域著名的“BERT”模型训练,而同样条件下,利用Nvdia A100 GPU则需要3.36分钟。 进行深度学习时性能远优于GPU 3.5 服务器视角展望-AI服务器 54 2 5 目 录 一、服务器及CPU综述 二、全球CPU市场格局 三、服务器视角看CPU发展趋势 四、国产CPU行业篇 五、国产CPU厂商篇 4.1 国产CPU发展历程及市场概况 4.2 国产CPU核心驱动一:需求旺盛,空

89、间扩容 4.3 国产CPU核心驱动二:形势所迫,信创如火如荼 55 Q6:国内服务器CPU市场概况? 服务器市场规模与出货量增速远快于全球。2020年中国x86服务器市场出货量为343.9万台,同比增长8.1%(全球增速为1.8%);市场规模达到218.7亿美元,同比增长16.5%(全球增速为3.3%)。 国内服务器CPU市场规模:根据服务器路数分布情况测算,预计2025年中国x86服务器芯片可达1066.2万颗,相应市场规模约为226亿美元。 国产服务器CPU市场规模:假设2025年国产化率到达70%,预计2025年国产x86芯片出货量超700万颗,市场规模约为158亿美元。 本章导读 Q7

90、:为何看好服务器CPU的国产替代? 增量部分:数字经济、新基建作为国家战略,持续推进,下游智能汽车、企业上云等需求并起,赛道维持高景气度。 国产替代部分:行业信创正处爆发元年,确定性强:1)党政信创进入深化阶段,过去党政信创的CPU替换主要集中在桌面PC端,现逐步转移至服务器、2)行业信创正处爆发阶段,服务器采购量大,金融、电信率先开启规模化落地,2020年、2021年已有逻辑验证,未来1-2年每年要求的国产化率仍呈翻倍态势提升。3)国内厂商新一代CPU性能差距逐步缩小,生态适配不断完善,有迎接市场化挑战的潜力。 4.1 服务器CPU未来趋势-国产化潜力巨大 56 数据来源:前瞻产业研究院,西

91、南证券整理 (1)我国政府对国产CPU领域持续颁布助推政策。政府相关部门对该领域的支持力度逐步加大,政策日趋完善,为产业后续实现跨越式发展创造了良好的外部环境。未来在科技领域竞争加剧的背景下,预计我国政府将继续对国产CPU的大力支持。 (2)中国将长期保持最大CPU消费市场地位,下游需求旺盛。首先,中国计算机用户基数十分庞大,迭代更新创造较大的CPU需求。其次,CPU市场将继续在云计算与企业数字化转型中受益。最后,工业控制领域嵌入式CPU需求广阔,CPU作为智能化的核心部件,将广泛应用于工控系统中。 (3)国际供应链断裂和信息安全风险加剧,国产CPU发展步伐加快。我国对进口通用处理器的过度依赖

92、是我国信息产业发展的一大软肋。近年来,受国际供应链不确定性的负面影响,部分企业的CPU供应也成为问题。 (4)未来国产CPU潜力巨大。政务及重点行业是国产CPU市场确定性最强的领域,相关行业的关键信息基础设施正在广泛开展国产CPU的应用。 (5)国产CPU存在超车机会。国内CPU知识储备趋于完善,国内技术人才积累也日趋丰富,CPU产业进入后摩尔定律时期升级速度趋缓,国产CPU性能与国际主流水平逐步缩小,存在赶超的可能。 国内服务器市场主要厂商市占率变化 2021年CPU专利申请数量 中国大陆 58% 美国 16% 日本 13% 韩国 4% 其他 7% 57 4.1 国产CPU发展历程 国产CP

93、U之路:几经波折,终迎腾飞 起步阶段(1950s-1970s):1956年,半导体科技被列为国家新技术四大紧急措施之一。此后,中科院计算所、109厂、半导体所先后成立,半导体器件相继取得突破。1975年,我国第一台集成电路百万次计算机013研制成功,彼时与国际先进水平相差不大。 迎来低谷(1980s-1990s):CPU开始进入市场化商用阶段,“Wintel”联盟组建并火速攻占全球市场,但与此同时我国的半导体产业政策支持力度明显下滑,国产CPU研制进度陷入停滞,与海外差距开始拉大。 重新启航(2000s-2010s):自主可控问题再次提上国家议程,“十五”期间,国家启动发展国产CPU的泰山计划

94、及863计划,产业政策开始不断加码。2002年,我国首款通用CPU龙芯1号流片成功;2006年,“核高基”重大专项推出;2014年,我国发布国家集成电路产业发展推动纲要,国家集成电路产业投资基金(简称国家大基金)第1期成立,主要投资集成电路制造企业。政策和资金倾斜下,国产CPU开始步入正轨,提速追赶。 加速腾飞(2010s-至今):历经数十年的艰辛探索,国产CPU产业已经初具规模。以鲲鹏、海光、飞腾、龙芯、兆芯、申威为代表的六大国产CPU领军企业在设计能力上已逐步接近全球领先水平,与此同时软件生态正逐步完善。巨大的下游市场配合积极的国家政策,叠加国际形势催生国产替代的紧迫性,国产CPU产业乘风

95、而上,正式进入高质腾飞阶段。 数据来源:半导体产业观察,芯东西,公开资料,西南证券整理 1950s-1970s 1980s-1990s 2000s-2010s 2010s-至今 起步阶段 政 策 助 力 , 109 机 、156机、013机等相继自主研发成功,与国际先进水平相差不大。 迎来低谷 受制于政策力度下滑、彼时国内的经济发展水平、国际技术封锁等原因,与海外差距拉大 重新启航 泰山计划、863计划、核高基专项等推出,国产CPU开始补课追赶,陆续诞生一批领军企业 加速腾飞 设计能力逐步追上,生态不断完善,下游需求扩容,叠加国际形势所迫,国产CPU迎来爆发 58 4.1 国产CPU市场概况

96、集成电路产业整体:高速发展,重心向高端设计制造转移 2020年中国集成电路产业市场规模高达8848亿元,同比增长17.01%,2013-2020年CAGR达到19.7%,接近全球增速的4倍。 分解来看:2020年,我国集成电路设计产业销售收入3778.4亿元,同比增长23.3%,所占比重从2013年的32.2%增加到42.7%;芯片制造销售收入2560.1亿元,同比增长19.1%,所占比重从2013年的24.0%增加到28.9%;封装测试业销售收入2509.5亿元,同比增长6.8%,所占比重从2013年的43.8%降低到28.4%。 芯片设计产业规模占比逐年攀升,象征着我国集成电路产业逐渐从低

97、端走向高端,产业发展也呈现高速且高质的特征。 数据来源:中国半导体行业协会,前瞻产业研究院,西南证券整理 中国集成电路产业市场规模 中国集成电路产业细分领域规模(亿元) 2509 3015 3610 4336 5411 6531 7562 8848 20% 20% 20% 25% 21% 16% 17% 0%5%10%15%20%25%30%004000500060007000800090000020中国集成电路产业规模(左轴,亿元) 同比增速(右轴) 809 1047 1325 1644 2074 251

98、9 3064 3778 601 712 901 1127 1448 1818 2149 2560 1099 1256 1384 1564 1890 2194 2350 2510 0%20%40%60%80%100%2000192020集成电路设计 芯片制造 封装测试 59 4.1 国产CPU市场概况 芯片设计企业:不断增加,但话语权仍然较弱 纵观全球竞争格局,集成电路设计位于产业链上游环节,对技术研发实力要求极高,具有产品附加值高,细分门类众多等特点,企业的头部效应尤为明显,高通、英特尔、博通、英伟达等少数几家企业长期占据市场大部分份额。 自2012

99、年以来,我国集成电路设计企业数量逐年增加,并逐步进入到全球市场的主流竞争格局中;截至2020年底,我国集成电路设计企业达到2218家,2013-2020年CAGR为19.6%,其中销售额过亿的企业为289家,市场集中度还较低,处于百花齐放的发展初期。 目前全球集成电路设计仍以美国为主导,市占率达到55%;随后依次是韩国公司21%,欧洲公司7%,中国台湾地区公司6%,日本公司6%;中国大陆地区公司市占率仅为5%,虽是全球重要的参与者之一,但话语权仍然较弱。 数据来源:CICPC,芯途研究院,西南证券整理 中国大陆集成电路设计企业数量 全球集成电路设计企业格局 55% 21% 7% 6% 6% 5

100、% 美国 韩国 欧洲 中国台湾 日本 中国大陆 632 681 734 1362 1380 1698 1780 2218 125 134 143 161 191 208 238 289 0500025002000192020中国大陆集成电路设计企业数量(家) 其中:销售额过亿企业数量(家) 60 4.1 国产CPU市场概况 服务器整机:x86仍是主流,增速远快于全球 无论全球还是国内,由于x86处理器起步较早,生态适配有明显优势,应用x86处理器的服务器销售额占全部服务器销售额的比例约90%以上,销量占比更是超过97%。 根据I

101、DC,2020年中国x86服务器市场出货量为343.9万台,同比增长8.1%(全球增速为1.8%);市场规模达到218.7亿美元,同比增长16.5%(全球增速为3.3%)。 2019年和2020年,服务器出货量和销售额两项增速较前期平均水平有所下降,主要是新冠疫情和全球互联网企业Capex收缩等原因所致。伴随 “数字经济”战略的持续落地与推进,预计未来服务器需求将持续旺盛,增速呈现回暖态势。预计2025年中国服务器出货量达到525.2万台,市场规模达到350亿美元。 数据来源:IDC,西南证券整理 全球服务器出货结构 中国x86服务器出货量及预测 177.9 215.2 236.6 262.1

102、 330.4 318.1 343.9 375.1 408.4 445 483.8 525.2 20.6% 21.0% 9.9% 10.8% 26.1% -3.7% 8.1% 9.1% 8.9% 9.0% 8.7% 8.6% -10%-5%0%5%10%15%20%25%30%005006002000202021E 2022E 2023E 2024E 2025E中国x86服务器出货量(左轴,万台) 同比增速(右轴) 99.43% 99.44% 99.39% 99.93% 99.67% 98.68% 97.30% 0.57% 0.5

103、6% 0.61% 0.07% 0.33% 1.32% 2.70% 80%100%200020x86服务器销量 非x86服务器销量 61 4.1 国产CPU市场概况 CPU芯片:预计2025年国内芯片出货量超千万颗,国产替代空间广阔 根据IDC,中国x86服务器以双路服务器为主,占比在80%以上;单路、4路服务器合计占比约为10%+;8路以上服务器较少,占比未超过1%。 结合服务器出货量及路数分布进行测算,2020年中国x86CPU芯片出货量为698.1万颗。芯片占服务器成本约为1/3,以此推算出2020年中国x86芯片市场规模约为150亿美元。 假设

104、2021-2025年路数分布情况与2020年保持一致,预计2025年中国x86服务器芯片可达1066.2万颗,相应市场规模约为226亿美元。 根据国务院印发的新时代促进集成电路产业和软件产业高质量发展的若干政策,中国芯片自给率要在2025年达到70%(当前不到20%),预计2025年国产x86芯片出货量超700万颗,市场规模约为158亿美元。 数据来源:IDC,西南证券整理 中国x86服务器路数分布情况 中国x86服务器芯片出货量及预测 11.3% 8.4% 7.4% 7.6% 6.6% 80.0% 84.7% 87.0% 87.7% 88.8% 8.4% 6.7% 5.3% 4.5% 4.5

105、% 0.3% 0.3% 0.2% 0.2% 0.1% 0%20%40%60%80%100%200192020单路 双路 4路 8路及以上 490.5 542.5 674.7 644.5 698.1 761.5 829.1 903.4 982.1 1066.2 10.6% 24.4% -4.5% 8.3% 9.1% 8.9% 9.0% 8.7% 8.6% -10%-5%0%5%10%15%20%25%30%02004006008006200202021E2022E2023E2024E2025E中国x86芯片出货量(左轴,万颗) 同

106、比增速(右轴) 62 4.2 核心驱动(一):需求旺盛,空间扩容 数字经济战略定调,底层新基建率先受益 2018年,中央经济工作集会首次提出“新型基础设施”概念;2020年,国家多次部署“新基建”相关任务,确定5G基站、大数据中心、人工智能、工业互联网等七大领域;2022年,“十四五”数字经济发展规划顶层设计出台,首次将数字经济地位提升至国家战略层面,紧随其来的重要文章不断做强做优做大我国数字经济进一步强调加快新型基础设施建设。 我们认为,传统产业的数字化转型将是未来长期的发展主线,以云计算为代表的底层IT基础设施则是核心之一;根据IDC,云平台建设的硬件成本中,服务器所占比重最大,达到75%

107、左右。 伴随5G逐步商用,物联网、智能汽车等新场景的加速落地,海量数据运算和存储的需求将快速增长,叠加数据中心等新基建建设要求,相关主体有望开展新一轮的设备采购计划,中国服务器整体空间扩容的趋势明朗。 数据来源:IDC,中国互联网协会,西南证券整理 云平台建设硬件成本分布 中国云计算市场规模 服务器 75% 网络设备 8% 其他设备 6% 软件 3% 其他 8% 514.9 691.6 962.8 1334.5 1781.8 2308.2 2951.5 34.3% 39.2% 38.6% 33.5% 29.5% 27.9% 0%5%10%15%20%25%30%35%40%45%0500100

108、00300035002001920202021E2022E中国云计算市场规模(左轴,亿元) 同比增速(右轴) 63 4.2 核心驱动(一):需求旺盛,空间扩容 东数西算工程启动,看好后续市场扩容 数据处理需求爆发,我国机架数持续增长。根据中国信通院,我国2019年数据中心机架达到315万架,2020年机架数超过400万架。根据最新的国家发改委高技术司数据,截止目前,我国机架规模已达500万架,算力达到130EFLOPS,CAGR超过32%。 东数西算规划IDC集群,后续建设拉动服务器采购需求。2022年2月,国家发改委等部门联合引发文件,同意在京津冀

109、、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等8地启动建设国家算力枢纽节点,并规划了10个国家数据中心集群,“东数西算”工程正式全面启动,有望带动服务器采购需求。 数据来源:国家发改委,中国信通院,西南证券整理 东数西算布局 中国数据中心机架数 124 166 226 315 400 500 49 83 167 237 005006002001920202021总机架数量(万架) 大型规模以上机架数量(万架) 64 大部分枢纽省市原本已对数据中心做出积极规划,中西部省市规划本就相对积极,例如成渝机架数量在十四五翻5倍,内蒙古翻3倍,宁夏翻2

110、4倍。 此次东数西算工程是数字经济战略的重要落子,将进一步强化相关落地。 枢纽地区 十三五期间目标 十四五期间目标 长三角 上海:2020年底,互联网数据中心103个,机柜总量14万架; 江苏:2020年全省在用数据中心机架数35万架; 浙江:2020年底建成数据中心193个,数据中心机架达17.3万架。 上海:2025年互联网数据中心机架28万架,算力14000PFLOPS 江苏:2020年数据中心标准机架数达70万架 浙江:2025年底数据中心标准机架数达45万架 京津冀 河北:2019年底在线运营服务器规模突破120万台 河北:2025年大数据服务器运营规模达300万台 粤港澳 广东:2

111、019年底在用机架数7.2万架,规划再见18.5万架,服务器86.4万台 广东:2025年标准机架数约100万个,平均上架率75%,平均PUE值小于1.25 成渝 重庆:2020年底数据中心标准机架数11.9万架 四川:2020年在用机架数超10.5万个 重庆:2025年数据中心标准机架数50万架 四川:2025年数据中心机架数达50万架 贵州 2020年全省数据中心规划安装服务器290万台 2025年全省数据中心规划安装服务器400万台,建成P级算力中心 内蒙古 2020年底大数据中心建设稳步推进,服务器达到120万台 以乌兰察布、和林格尔为重点布局大数据中心,2025年大数据装机突破300

112、万台 甘肃 2020年机架规模达到11.05万架 2021、2023、2025年总算力分别超过3.5、5.5、6.5EFLOPS 宁夏 数据中心标准机架数达到3万架,服务器总装机能力达到50万台 目标建成国家枢纽宁夏中卫节点,标准装机数达72万架 数据来源:各地方政府网站,西南证券整理 4.2 核心驱动(一):需求旺盛,空间扩容 65 4.3 核心驱动(二)形势所迫,信创如火如荼 数据来源:公开资料,艾瑞咨询,西南证券整理 三次信创浪潮 长期以来,我国对海外IT产品的依赖度较高,以Intel、Microsoft、Oracle、Cisco等为代表的IT厂商在芯片、操作系统、数据库、中间件等领域占

113、领了较大市场份额,高度渗透了政府、金融、民航、铁路、医疗等各行业环节。 自2008年以来,由海外产品引发的信息安全事件频出,IT技术的自主可控势在必行。 2018年,中兴、华为被纳入“实体清单”,成为信创产业真正进入爆发阶段的导火索,我国第三次“整芯铸魂”信创浪潮正式开启。 微软黑屏事件 2008年10月,微软中国为警示盗版用户,对盗版XP专业版采取60分钟黑屏一次的 做法, 对盗 版Office采取对话框提醒,此次事件引起了国内对信息安全的思考。 棱镜门事件 2013年6月,美国“棱镜计划”被披露,美国国安局对电话、即时消息等进行秘密监控,范围涉及谷歌、微软、苹果等多家跨国互联网公司,掀起了

114、“去IOE”浪潮。 2008 2013 苹果后门事件 2013年12月,苹果IOS操作系统被爆发现多个未经披露的“后门”程序,这些后门可以绕开IOS的加密功能,窃取用户的私人信息。 Intel芯片漏洞 2018年,英特尔芯片被爆存在技术缺陷导致重大安全漏洞,黑客可利用该漏洞读取设备内存,获得密码、密钥等敏感信息 2018 实体清单 2018年,美国商务部宣布7年内禁止美国企业向中兴通讯销售零部件,直接导致中兴通讯当年亏损69.8亿元。 随后,美国陆续将华为等上百家中国公司列入实体清单,采取出口管制措施。 以中美贸易战为导火索,美国加大对中国的制裁,国内开始意识到攻克“卡脖子”技术的紧迫性。 6

115、6 4.3 核心驱动(二)形势所迫,信创如火如荼 数据来源:公开资料,亿欧智库,艾瑞咨询,西南证券整理 信创的历史沿革 1993-2007 2008-2016 2017-2019 2020-至今 预研起步 1993年,中软推出第一代基于UNIX为底层的国产Linux操作系统“COSIX1.0”,国产操作系统横空出世。 1993年,浪潮信息研发SMP2000系列服务器。 2000年,红旗Linux发布。 2006年,中国中长期科学和技术发展规划( 2006-2020 ) 将“核高基”列为16个重大科技专项之一。 芯片、操作系统等关键技术领域出现实验性结果。 自主创新思维觉醒,从实验室科研起步,但

116、道阻且长。 加速发展 2008年,阿里巴巴内部IT技术全面进行自主和可控研发。 2010年,民用“中标Linux”和军用“银河麒麟”合并。 2013年,银监会明确提出国产化安全要求,浪潮天梭K1小型机系统上市,标志着中国掌握新一代主机技术。 2015年,信创工委会成立,国家信息化发展战略纲要提出,到2025年形成安全可控的信息技术产业体系。 民用实践下,国产软硬件产品可用性提升。 国家政策顶层设计,信创工委会统筹组织,为信创产业打造良好发展环境。 试点实践 2017年,核高基重大转向第二批工程启动会召开。 2018年,我国将信创行业纳入国家战略,提出“2+8”发展体系。 2019年,国产CPU

117、迎来收获期,兆芯、飞腾、鲲鹏等新一代处理器接连两项,性能大幅提升。 2019年,中国建设银行与中软合作开发的国产化办公自动化系统在境内外分支机构全面部署上线。 国产自主化产品性能提升,从可用转向好用,产业生态日益丰富。 党政军率先开启自主可控项目,重点行业积极推动酝酿。 融合落地 2020年,中国电信、中国移动集采指定国产化标包,各省份信创项目逐渐启动招标。 2020年,发改委、科技部、工信部等联合发布指导意见,要求加快关键芯片、关键软件等核心技术攻关,大力推动重点工程及项目建设,积极扩大有效投资。 2021年,建设银行信用卡核心系统全栈信创体系通过验收,性能提升10%。 金融、电信、电力、交

118、通等重点行业逐步开始信创产品和项目的融合落地。 从小范围试点开始大面积铺开。 67 4.3 核心驱动(二)形势所迫,信创如火如荼 数据来源:各政府部门网站,西南证券整理 近年来信创相关政策 国家政策持续牵引,地方政策跟进落地 近年来,“自主可控”、“国家创新体系建设”、“国产替代”等成为国家政策关键词,关键技术领域的攻关突破已纳入国际战略层面的重点工作。 地方政府积极响应,通过财政补贴、政府背书等形式扶持产业落地,重点打造信创产业集群、培育龙头企业。 时间 具体文件 关键内容 国家政策 2020年9月 关于扩大战略性新兴产业投资培育壮大新增长点增长极的指导意见 加快基础材料、关键芯片、高端元器

119、件、新型显示器件、关键软件等核心技术攻关,积极扩大合理有效投资。 2021年3月 “十四五”发展规划和2035年远景目标纲要 制定科技强国行动纲要,健全社会主义市场经济条件下新型举国体制,打好关键核心技术攻坚战,提高创新链整体效能。培育壮大人工智能、大数据、区块链、云计算、网络安全等新兴数字产业,提升通信设备、核心电子元器件、关键软件等产业水平。 2021年12月 “十四五”国家信息化规划 强化市场化和产业化引导,推动计算芯片、存储芯片等创新,面向关键基础软件、高端工业软件、云计算、大数据、信息安全、人工智能、车联网等重点领域和重大需求,加强重点软件的开发。加快软件知识产权保护与信息服务体系建

120、设。 2022年3月 政府工作报告 推进科技创新,促进产业优化升级,突破供给约束堵点,依靠创新提高发展质量,培育壮大集成电路、人工智能等数字产业,提升关键软硬件技术创新和供给能力。 地方政策 2020年5月 关于培训鲲鹏计算产业促进数字厦门创新发展的指导意见 建成全国性的基于鲲鹏全生态的产业集群,聚集一批国内知名的鲲鹏产业链上下游优秀企业,形成千亿级鲲鹏产业集群。 2020年10月 关于印发金东区促进制造业重点细分行业 发展政策意见(试行)的通知 打造全国信创产业示范基地,打造电子信息关键材料-芯片设计和封测-系统整机集成-智能终端应用产业体系。 2021年2月 深圳市中国特色社会主义先行示范

121、区科技创新行动方案 支持深圳强化关键核心技术攻关,优化和创新支持方式,采用“立军令状”、“滚动立项”等组织方式,集中突破集成电路等领域关键核心技术攻关。 2021年3月 武汉市加快推进武汉云建设实施方案的通知 建设武汉云信创资源池,使用国产芯片、服务器和密码保护系统等构建软硬件 信创体系,提供基于信创环境的信息基础设施服务,实现全程自主创新 68 4.3 核心驱动(二)形势所迫,信创如火如荼 数据来源:公开资料,亿欧智库,西南证券整理 信创的推进节奏 2013-2018 2019-2020 2021 2022-2025 2025-以后 党政 金融、电信、电力 石油、交通、航空航天 教育、医疗

122、汽车、物流、建筑 2 8 N 2013年开始,党政从公文系统开始替换计划,预计2023年左右基本完成公文系统的改造;当前开始进入电子政务系统的国产化替代。 八大行业中,金融最早开始信创试点,电信紧随其后,再之后是能源、交通、航空航天,教育和医疗领域起步较晚,但已逐步开始筹划推进;N+行业预计于2023年后开始启动。 信创整体在经历政策驱动引导的前期阶段后,逐渐走向需求导向的市场化阶段。 试点起步-规模化落地-深化成熟 政策驱动 市场驱动 69 4.3 核心驱动(二)形势所迫,信创如火如荼 金融、电信、电力三大领域信创需求各有侧重 金融行业业务种类多、复杂度高,数据量巨大,核心业务要求高吞吐、超

123、低延时等,对产品性能要求极高,同步保障安全稳定,兼容性强。 电信行业业务系统复杂、技术难度大,对产品稳定性和运行性能要求高,尤其是数据库技术等,同时要求日常运维、故障恢复等服务能力。 电力行业集中化程度高,对安全性、稳定性要求高,对兼容性要求一般,并且需要优秀的迁移改造及平滑过渡能力。 数据来源:亿欧智库,西南证券整理 信创招投标常见选型指标 指令集 授权情况 产品要求 性能 产品各方面符合国家、行业及采购人规定的质量和性能要求,保证产品高可用性 安全性 产品各方面符合国家标准,通过国家级安全测评机构检测 稳定性 产品具备高稳定性,保证使用期间的稳定可靠运行 兼容性 供应商应对产品的软件、硬件

124、兼容能力进行描述,针对常用软硬件进行双向认证,提供详细的官方的兼容性说明 服务要求 日常运维 供应商提供日产运维支持,包括但不限于电话、邮件、现场支持、例行运维、专项驻场等 故障恢复 供应商应及时解决产品故障,提供应急保障方案 任务类 供应商需提供迁移、扩容等技术支持服务 培训类 供应商需提供现场及集中技术培训,具备成熟的培训课程和团队 案例要求 过往相似案例经验 供应商应在某个时限内具备若干个相似项目的实施经验,需提供相关佐证材料 70 4.3 核心驱动(二)形势所迫,信创如火如荼 党政信创深化,行业信创爆发 2018年以来,华为、中兴等事件凸显卡脖子风险,倒逼信创进入“整芯铸魂”的高速发展

125、阶段,国家确立“2+8”安全可控体系,在相关领域逐步试点推广。 党政信创于2020年进入规模化落地元年,现正加速向区县一级下沉渗透;同时,过去的党政信创主要集中在电子公文领域,以桌面产品终端为主;2022年1月国家发改委印发“十四五”推进国家政务信息化规划,国产服务器的采购有望成为后续党政信创的主体。 行业信创于2022年正式进入规模化落地阶段,其中电信和金融两大领域已经率先启动:1)三大电信运营商自2020年起便在招标中指定国产化标包,根据中国移动目前公布的2021-2022年第1批PC服务器集采公示,“鲲鹏+海光”国产服务器渗透率已达到28.8%;根据产业调研,2022年目标国产化率为40

126、%,相较2021年的20%左右水平提升明显;2)金融信创紧随其后,2021年下半年中国银行发布“国芯服务器选型”项目公示;根据产业调研,2021年金融行业服务器采购国产化率达到12%左右水平,预计2022年目标国产化率为30%左右。 数据来源:中国移动采购与招标网,中国银行官网,产业调研,西南证券整理 中国移动服务器集采公示 中国银行“国芯服务器选型”公示 4.3 核心驱动(二)形势所迫,信创如火如荼 数据来源:公开资料,艾瑞咨询,西南证券整理 基础硬件 芯片 存储 存储 基础软件 数据库 中间件 操作系统 云 应用软件 办公软件 版式软件 OA ERP 其他 信息安全 信创产业大而全,多而垂

127、直,主要由基础硬件、基础软件、云计算、应用软件和信息安全组成。 整个产业的核心是芯片与操作系统,发展逻辑是围绕CPU和操作系统打造国产生态体系。 71 72 2 5 目 录 一、服务器及CPU综述 二、全球CPU市场格局 三、服务器视角看CPU发展趋势 四、国产CPU行业篇 五、国产CPU厂商篇 5.1 六大国产服务器CPU厂商详解 5.2 中科曙光核心受益标的 73 Q8:国内服务器CPU市场的主要玩家? 按指令集分类: 基于x86架构的兆芯、海光:性能起点较高,生态迁移难度小,替换空间大。 基于ARM架构的飞腾、鲲鹏:架构迭代空间广阔,性能提升较快,生态适配较好。 基于自研指令集架构的龙芯

128、、申威:全栈自研,自主可控程度极高,在当前紧迫性和必要性进一步提升的背景下,有望加速迭代迎来重大发展机遇。 本章导读 Q9:市场格局演进? 从当前行业信创的推进节奏看:短期内鲲鹏、海光两家,凭借领先的性能+较为完善的生态适配+被验证过的项目经验,最为受益;飞腾于2021年发布新产品,性能表现突出,预计后续将实现订单增长。 长维度看:客观来看,当下国产服务器CPU无论在性能还是生态方面都有较大的进步空间,短期订单的爆发是前期“天时、地利、人和”的集中表现,远期格局还存在不确定性;长远来看,各家均有弯道超车的机会,仍然是资金投入、技术团队、迭代升级情况等关键能力决定未来的企业核心竞争力。 Q10:

129、建议关注标的? 当前海光、兆芯、飞腾、鲲鹏、龙芯、申威六大国产CPU厂商均为上市,其中海光信息、龙芯中科已提交招股说明书;上市主体中,建议关注海光信息的第一大股东中科曙光。 曙光与海光业务可形成良好协同:海光提供性能优异的国产CPU,为曙光的战略转型提供支点;曙光在计算产业的全面布局已积累大量优质的客户资源和销售渠道,为海光芯片的放量打下基础。 数字经济战略背景下,ICT行业或长期维持高景气度;行业信创带来国产化机遇,曙光战略转型成效明显;再叠加曙光在手订单充裕,后续利润有望进一步释放。 74 5.1 六大国产CPU公司详解 六大领军企业,三条路径发展 当前阶段,国内主流的CPU厂商主要有海光

130、、兆芯、飞腾、海思、龙芯、申威六家领军企业,从指令集授权的角度看,主要可以分为三类: 1)IP内核授权:以兆芯为代表,获得x86内核层级的授权,可基于指令集系统进行SoC集成设计,具备良好的生态和性能起点,当下阶段具备快速放量潜质,但自主可控程度较低。 2)指令集架构授权:以海光为代表,获得x86指令集授权;以鲲鹏和飞腾为代表,获得ARM架构级授权,可基于指令集架构进行核心CPU设计,安全可控程度较高,但ARM的生态适配需进一步打造。 3)指令集架构授权+自研:以龙芯和申威为代表,分别获得MIPS和Alpha架构授权,并在此基础上进行自主研发,形成自有的指令集架构,安全可控程度极高,但当前生态

131、适配极为困难。 数据来源:各公司官网,亿欧智库,西南证券整理 指令集 授权情况 团队背景 代工厂 优势 劣势 兆芯 x86 VIA授权,架构较老 上海市国资委、威盛电子 台积电 性能起点较高,生态迁移成本小 自主化程度较低,技术创新受限制 海光 x86 AMD Zen 指令集授权 中科曙光 格芯、三星 飞腾 ARM v8架构层级永久授权 CEC、 中国长城 台积电 ARM架构潜在空间广,产品线丰富 兼容性和生态需进一步打造 鲲鹏 ARM v8架构层级永久授权 华为 台积电 龙芯 LoongArch 基于MIPS,逐步全面切换 中科院计算所 意法半导体 自主可控程度极高 性能相对较弱,生态应用匮

132、乏 申威 SW_64 基于Alpha,完全自主可控 江南计算所 中芯国际 自主化程度 弱 强 IP内核授权 指令集架构授权 授权+自研 75 兆芯合资CPU探路者 数据来源:兆芯官网,企查查,西南证券整理 公司成立于2013年,由上海联合投资有限公司(上海市国资委控股)和台湾威盛电子合资创建,同时掌握CPU、GPU、芯片组三大核心技术,形成台式机、笔记本、一体机、云终端、服务器以及嵌入式工业主板和工业计算平台等产品线,利用x86生态优势,为党政、金融、教育、工业、交通等行业提供可靠的解决方案。 兆芯的核心理念是“自主创新和兼容主流”,公司产品可兼容Win7、Win10等主流操作系统,桌面端可流

133、畅运行日常办公应用、主流游戏及4K视频解码;持续引入知名整机合作伙伴,联想、同方、AOC、东海、浪潮等产品已上线京东、淘宝等电商平台。 兆芯代表产品解决方案 兆芯股权结构 上海兆芯集成电路有限公司 上海联合投资有限公司 上海市国资委 100% 51.56% 威盛电子 3.40% 其他 45.04% 76 兆芯合资CPU探路者 数据来源:兆芯官网,企查查,西南证券整理 CPU方面,公司已形成PC处理器“开先”和服务器处理器“开胜”两大产品系列,实现了“从双核心到八核心”、“从1.6GHz到3.0GHz”、“从处理器+芯片组方案到SoC单芯片方案”等多方面的发展与创新,具备自主演进发展的能力和条件

134、。 公司主力产品为2019年发布的开先-KX6000和开胜KH-30000,制程达到16nm,是首款主频达到3.0GHz的国产通用处理器,支持双通道DDR4-3200内存,采用SoC设计,包含CPU、GPU和芯片组,芯片集成度进一步增强,性能功耗比上一代产品提升3倍,单芯片性能接近intel7代i5水平,SPEC 2006 INT RATE成绩为170分。 型号 工艺 发布日期 最高主频 内存(设计功耗) PC/嵌入式处理器 开先KX-6000系列 16nm Q219 3.0GHz 8核/4核 开先KX-5000系列 28nm Q417 2.0GHz 8核/4核 开先ZX-C+系列 28nm

135、Q316 2.0GHz 4核 开先ZX-C系列 28nm Q215 2.0GHz 4核 服务器处理器 开胜KH-30000系列 16nm Q219 3.0GHz 8核 开胜KH-20000系列 28nm Q417 2.0GHz 8核 开胜ZX-C+系列 28nm Q216 2.0GHz 8核 IO扩展芯片/芯片组 ZX-200 IO扩展芯片 40nm Q417 - 6W ZX-100S 芯片组 40nm Q316 - 15.5W(集显)/13W 77 兆芯合资CPU探路者 数据来源:芯智讯,西南证券整理 由于兆芯获得的是源自威盛电子相对老旧的x86CPU架构,其版权已于2018年到期,导致兆芯

136、过去的产品性能相较同期竞品仍有所差距;但随着威盛电子将其IP产权的出售,兆芯以获得了大部分后续x86芯片开发所需的核心技术和专利,自主可控能力开始强化。 根据公司公布的CPU路线图,公司已着手7nm一下工艺产品的定义和研发工作,预计于近期推出KX-7000和KH-40000产品系列。KX-7000采用全新CPU微架构,不仅支持DDR5,还将演进到PCIe 4.0总线,预计对标AMD Zen2;KH-40000单核性能将比上一代提升60%以上,多核性能提升高达5倍,支持多路互联、128PCIe Lane、16内存通道,具有高效的虚拟化性能,并且采用的是可插拔的LGA封装,能够有效减低开发维护成本

137、,可全面支持国内外主流的OS。 兆芯下一代产品值得期待 测试项目 i5-9400F I5-7400 兆芯KX-U6780 与i5-7400对比 CPU-Z单线程 481 391 181 -53.7% CPU-Z多线程 2685 1487 1401 -5.8% 3DMark物理分数 17791 7354 6557 -10.6% 性能百分比(单线程) 122% 100% 44% -56% 性能百分比(多线程) 185% 100% 82% -18% 性能百分比(浮点) 187% 100% 72% -28% 性能百分比(整数) 178% 100% 106% +6% 兆芯CPU与同类竞品比较 78 海光

138、性能领先的实干者 数据来源:海光官网,招股说明书,西南证券整理 公司成立于2014年,从事高端处理器、加速器等计算芯片产品和系统的研究和开发;2016年海光信息同AMD达成合作,共同成立两家子公司,引入x86以及Zen微架构授权,其中成都海光微电子拥有授权IP所有权,并负责芯片生产,成都海光集成电路设计有限公司负责芯片设计及销售工作;2018年中科曙光受让海光信息1948亿股股权,成为海光信息第一大股东。 公司以“性能强劲、安全可信、完善生态”作为主打标签,提供通用处理器(CPU)和协处理器(DPU)两大类别,能够适配主流的x86、Linux操作系统,支持多个版本的数据库、中间件、AI算法、云

139、计算平台等,已广泛应用于电信、金融、教育、科研、人工智能、大数据等领域的服务器及工作站。 海光代表产品解决方案 海光股权结构 海光信息 中科曙光 32.1% 49% 海光微电子 70% 海光集成 51% AMD 30% 79 CPU方面,面向不同的市场需求,公司已形成高中低端的全方位覆盖,分别对应7000、5000、3000三大产品系列;其产品节奏按照“量产一代、研发一代、规划一代”稳步推进,海光一号和海光二号两代产品实现了商业化应用,海光三号已经完成产品验证,海光四号处于研发阶段。 DPU方面,公司产品兼容“类CUDA”环境,软硬件生态丰富,迁移成本低,典型应用场景下性能达到国际同类高端水平

140、。 7200 5200 3200 功耗 175-225W 90-135W 45-105W 计算能力 SPECrate2017_int_base:348 SPECrate2017_fp_base:308 SPECrate2017_int_base:158 SPECrate2017_fp_base:148 SPECrate2017_int_base:40.7 SPECrate2017_fp_base:36.3 核心 16/24/32核 8/16核 4/8核 内存 8个DDR4 4个DDR4 2个DDR4 I/O 128 Lane PCLe Gen3 64 Lane PCLe Gen3 32 Lan

141、e PCLe Gen3 应用场景 云计算、大数据、AI等对计算能力、扩展能力、吞吐量要求较高的领域 满足互联网、金融、电信、交通、能源等多行业的运算需求 应用于入门级服务器、工作站、工业控制、边缘计算等市场,为中小企业提供系列解决方案 海光性能领先的实干者 海光产品命名方式 海光CPU主要参数 数据来源:海光官网,招股说明书,西南证券整理 80 基于AMD Zen1架构的优势明显,产品性能起点较高,典型场景下,公司最新一代CPU和DPU相关产品均已接近国际同类高端产品水平。 2019年公司被列入美国出口管制条例“实体清单”,AMD不再提供相关技术服务,公司自行实现了后续产品和技术的迭代开发。

142、海光DPU与主流竞品比较 发布时间 双路Speccpu_INT 双路Speccpu_FP 与海光数据对比 海光7285 2020年Q1 348 308 - Intel8380HL(铂金) 2020年Q2 392 329 +12.64%/+6.66% Intel8376HL(铂金) 2020年Q2 383 321 +9.91%/+4.06% Intel8360HL(铂金) 2020年Q3 345 300 -0.86%/-2.76% 海光CPU与Intel竞品比较 海光性能领先的实干者 数据来源:海光官网,招股说明书,西南证券整理 制程工艺 核心数量 内核频率 显存容量 显存位宽 显存频率 显存带

143、宽 海光深算1号 7nm FinFET 4096 (64 CUs) Up to 1.5GHz(FP64) Up to 1.7Ghz(FP32) 32GB HBM2 4096 bit 2.0 GHz 1024 GB/s NVIDIA Ampere100 7nm FinFET 2560 CUDA processors 640 Tensor processors Up to 1.53Ghz 80GB HBM2e 5120 bit 3.2 GHz 2039 GB/s AMD MI100 7nm FinFET 120CUs Up to 1.5GHz(FP64) Up to 1.7Ghz (FP32) 8

144、0GB HBM2e 4096bit 2.4 GHz 1228 GB/s 81 生态方面,公司高性能CPU已经得到众多OEM支持,自2018年起,浪潮、联想、新华三、同方等国内知名服务器厂商已经搭载海光CPU芯片,并成功应用到工商银行、中国银行等金融领域客户,中国石油、中国石化等化工领域客户,以及三大运营商的数据中心类业务。 伴随产品功能的不断升级完善,公司自2020年开始进入放量拐点,2021年整体CPU收入规模达到20.7亿,同比增长103%。 2021年主要应用于服务器领域的7000系列贡献主要收入,实现收入15.0亿元,平均单价达到8573.5元/颗,整体呈现量价齐升态势。 海光性能领先

145、的实干者 数据来源:海光官网,招股说明书,西南证券整理 2019 2020 2021 7000系列 324.9 785.9 1502.0 海光7100 324.9 426.8 280.9 海光7200 - 359.1 1221.1 5000系列 5.4 129.3 191.9 海光5100 5.4 11.9 0.7 海光5200 - 117.4 191.1 3000系列 48.9 106.6 377.5 海光3100 48.9 71.1 10.0 海光3200 - 35.5 367.5 海光CPU收入情况(百万元) 海光CPU单价情况(元) 2019 2020 2021 7000系列 6913

146、.32 7494.22 8573.52 海光7100 6913.32 5206.51 4269.56 海光7200 - 11162.28 15687.72 5000系列 4189.83 7721.51 6695.86 海光5100 4189.83 2839.70 508.78 海光5200 - 9363.17 7029.77 3000系列 1250.45 963.77 1046.24 海光3100 1250.45 833.67 522.50 海光3200 - 1402.33 1075.66 82 根据收入及单价计算得到海光CPU出货情况,2021年7000系列出货14.4万颗;其中7200芯片

147、出货达到7.8万颗,同比增长143.8%,7100芯片出货量达6.6万颗,相较2020年有所下降。由此可推断,当前市场对于性能的要求或大于性价比的考量。国内服务器以双路为主,预计2021年搭载海光7000系列CPU的服务器出货量大约为7.2万台。 行业信创相较党政信创更为市场化,而海光的服务器CPU性能优异叠加生态迁移难度低,对于原有的x86服务器有较大替换空间,我们预计海光或成为行业信创浪潮下最为受益的国产CPU厂商之一。 此外,海光于2021年实现DPU的规模化出货,当期即实现收入2.4亿元,表现亮眼;后续伴随新基建智算中心的建设,DPU有望迎来订单高增。 海光性能领先的实干者 数据来源:

148、海光官网,招股说明书,西南证券整理 2019 2020 2021 7000系列 4.7 11.4 14.4 海光7100 4.7 8.2 6.6 海光7200 3.2 7.8 5000系列 0.1 1.7 2.9 海光5100 0.1 0.4 0.1 海光5200 1.3 2.7 3000系列 3.9 11.1 36.1 海光3100 3.9 8.5 1.9 海光3200 2.5 34.2 海光CPU出货量(万颗) 海光DPU情况收入及单价情况 2021 收入(百万元) 238.9 单价(元) 19285.7 出货量(万颗) 1.24 83 飞腾PK生态的主导者 数据来源:飞腾官网,西南证券整

149、理 公司由国防科技大学研究团队创造,起步于1999年,由中国电子信息产业集团、天津市滨海新区政府和天津先进技术研究院于2014年联合支持成立。目前,CEC通过中国长城控股公司28.04%股份,是公司最大股东。 飞腾CPU产品具有谱系全、性能高、生态完善、自主化程度高等特点,基于飞腾CPU的产品覆盖多种类型的终端(台式机、一体机、便携机、瘦客户机等)、服务器和工业控制嵌入式产品等,在国内政务办公、云计算、大数据以及金融、能源和轨道交通等行业信息系统领域已实现批量应用。 飞腾代表产品解决方案 飞腾股权结构 飞腾信息技术有限公司 中国长城 39.35% 28.04% 天津先进技术研究院 26.70%

150、 天津滨海新区科技金融投资集团 25.37% 中国电子信息产业集团 84 飞腾PK生态的主导者 数据来源:飞腾S2500发布会,飞腾从端到云全栈解决方案白皮书 ,西南证券整理 CPU方面,公司经历20余年研发,形成高性能服务器CPU(飞腾腾云S系列)、高效能桌面CPU(飞腾腾锐D系列)和高端嵌入式CPU(飞腾腾珑E系列)三大产品系列。 服务器CPU方面,公司于2020年发布S2500处理器,采用16nm工艺,集成64个FTC663内核,2.0到2.2GHz频率。面向多路互联市场,S2500重点改进体系架构,高可扩展性是该芯片的最大特点,增加了64MB L3 Cache,配备4个直连接口,带宽8

151、00Gbps,支持8通道DDR4-3200内存,功耗为150W,并提升了可靠性。 根据飞腾负责人表示,该芯片性能相较上一代FT-2000产品有大幅提升,整体表现与intel Xeon E5相当。 飞腾最新一代服务器芯片S2500参数 飞腾CPU路线图 85 飞腾PK生态的主导者 数据来源:飞腾官网,飞腾S2500发布会,飞腾公众号,2020飞腾生态伙伴大会,西南证券整理 公司在2006年曾经研制出两代国产CPU,曾先后尝试过x86、Epic、SPARC、ARM四个指令集,并以SPARC开源代码为基础设计了FT-1000、FT-1000A、FT-1500等CPU。之后出于生态考虑,重点转向ARM

152、系列产品的开发。 生态方面是飞腾最大的优势,公司与国内1000余家软硬件厂商构建起了国内最完善最庞大的生态体系,仅2019年就新开案板卡设计430余款,已与千余家软件进行了适配和应用。此外,飞腾兼容安卓生态,在飞腾台式机上可以运行200万级安卓应用,极大拓展了飞腾生态。 此外,公司作为聚焦国家战略需求和重大项目的CPU国家队,还是CEC主导的PK体系(即飞腾Phytium CPU+麒麟Kylin操作系统)的重要参与者之一,已经建立起覆盖云边端的全栈体系。 基于飞腾的全栈式解决方案 飞腾部分生态合作伙伴 86 数据来源:鲲鹏社区,鲲鹏计算产业发展白皮书,西南证券整理 鲲鹏是华为在芯片领域布局的重

153、要一环,主要聚焦通用计算领域;华为针对不同的计算场景,自研打造了一系列芯片矩阵,除了主要应用在服务器领域的鲲鹏,还包括手机SoC芯片麒麟、人工智能芯片昇腾、5G基站芯片天罡、5G终端芯片巴龙,以及凌霄、NB IoT等一系列其他专用芯片。 在一系列芯片矩阵中,华为致力于围绕“鲲鹏+昇腾”双引擎形成两大计算产业,其中鲲鹏计算产业是基于鲲鹏处理器的基础软硬件设施,行业应用及服务,涵盖从底层硬件、基础软件到上层行业应用的全产业链条,可为下游各大行业应用提供全面、完整、一体化信息化解决方案。 鲲鹏代表产品解决方案 华为全产业芯片矩阵 华为全产业芯片布局 手机SoC芯片 麒麟系列 服务器芯片 鲲鹏系列 A

154、I芯片 昇腾系列 5G通信芯片 巴龙、天罡系列 其他专用芯片 凌霄、NB IoT 鲲鹏垂直生态的领导者 87 数据来源:鲲鹏社区,鲲鹏计算产业发展白皮书,西南证券整理 近年来,华为先后推出Hi1610、Hi1612、Hi1616等服务器CPU产品,不断实现主频与核数的提升,并最终开发出当下的旗舰产品鲲鹏920与鲲鹏920s,分别用于服务器和PC机。 鲲鹏920基于ARM V8架构,是首款国产的7nmARM服务器,其处理器核、微架构和芯片均由华为自主研发设计,相比X86异构最高能够提升3倍性能。规格方面,支持64内核,主频可达2.6GHz,集成8通道DDR4,支持PCIe4.0及CCIX接口,可

155、提供640Gbps总带宽。鲲鹏920主打低功耗、强性能,在典型主频下,SPECint Benchmark评分超过930,超出intel Xeon 8180系列25%,并且能效比优于Xeon30%。 与鲲鹏920同期推出的还有基于鲲鹏920的TaiShan服务器和华为云服务,形成独特的“端边云算力同构”的优势,通过软硬件协同进一步提升处理器性能。 鲲鹏920与intel性能对比 鲲鹏920性能参数 鲲鹏垂直生态的领导者 88 鲲鹏垂直生态的领导者 数据来源:鲲鹏社区,鲲鹏计算产业发展白皮书,西南证券整理 华为坚持“硬件开放、软件开源,使能合作伙伴”的生态策略,自身作为生态领导者,主要聚焦计算架构

156、创新、处理器和开源基础软件的研发,以及华为云服务,推动鲲鹏计算产业蓬勃发展。目前已有超过12家整机厂商基于鲲鹏主板推出自有品牌的服务器及PC产品,openEuler和openGauss开源社区合作伙伴超过17家,另有数千家应用软件合作伙伴。 优异的性能+良好的生态,促使鲲鹏服务器在发售后迅速开始放量。根据中国移动2021-2022年第1批PC服务器集采公示,鲲鹏服务器或占到总体招标量的18.8%,合计中标金额约28.4亿元。 同时,也正因华为的垂直整合型发展策略,市场上也具有一定的排他性。鲲鹏芯片只通过整机或主板出售,下游集成商或整机厂商的利润空间有所压缩,叠加美国制裁等风险,鲲鹏的发展挑战与

157、机遇并存。 鲲鹏生态合作伙伴 鲲鹏计算产业生态策略 89 龙芯自主架构的先驱者 2001年,龙芯起步于中科院计算所,曾得到863、973、核高基等项目的支持,先后成功流片我国首款通用CPU龙芯1号、首款64位通用CPU龙芯2B、首款主频超过1GHz的通用CPU龙芯2E、首款四核CPU龙芯3A等,完成底层核心技术的积累。2010年,中科院、北京市政府共同牵头出资,龙芯中科技术有限公司正式成立,开始产业化运作。 经历20年深耕,龙芯CPU已实现工控类和信息类的全方位覆盖。工控类芯片主要面向嵌入式专用设备、工业控制终端等,赋能通信、能源、交通等领域;信息类芯片面向桌面和服务器等,在政务、金融、电信、

158、教育等行业广泛应用。 龙芯代表产品解决方案 龙芯股权结构 数据来源:龙芯官网,招股说明书,西南证券整理 龙芯中科技术股份有限公司 北京天童芯源科技 100% 23.98% 北京中科算源资产管理 21.52% 宁波中科百孚股权投资 14.35% 中国科学院计算技术研究所 北京工业发展投资管理有限公司 7.17% 创始人 胡伟武 47.67% 北京市人民政府 100% 90 龙芯自主架构的先驱者 龙芯亦有完善的高中低端产品矩阵,主要分为龙芯1号、龙芯2号、龙芯三号三大系列:龙芯1号系列为低功耗、低成本专用嵌入式SoC或MCU处理器,通常集成1个32位低功耗处理器核;龙芯2号系列为低功耗通用处理器,

159、采用单芯片SoC设计,通常集成1-4个64位低功耗处理器核;龙芯3号系列为高性能通用处理器,通常集成4个及以上64位高性能处理器核。 公司于2021年发布最新一代龙芯3号5000系列芯片产品,采用12/14nm工艺,处理器核升级为LA464微结构,主频最高为2.5GHz,集成双通道DDR4-3200和HT3.0接口。单核SPEC CPU2006 Base定浮点分值均超过26分,是上一代4000系列的1.5倍水平,逼近市场主流水平。 龙芯3号5000系列性能对比 龙芯3号CPU性能简介 数据来源:龙芯官网,招股说明书,芯智讯,西南证券整理 型号 推出时间 制程 主频 核数 内存 I/O 3A10

160、00 2012年 65nm 0.8-1.0GHz 4 双通道DDR3-667 HT1.0 3A2000/3B2000 2016年 40nm 0.8-1.0GHz 4 双通道DDR3-1066 HT3.0 3A3000/3B3000 2017年 28nm 1.2-1.5GHz 4 双通道DDR3-1600 HT3.0 3A4000/3B4000 2019年 28nm 1.8-2.0GHz 4 双通道DDR4-2400 HT3.0 3A5000/3B5000 2021年 12nm 2.3-2.5GHz 4 双通道DDR4-3200 HT3.0 3C5000L 2021年 12nm 2.0-2.2G

161、Hz 16 双通道DDR4-3200 HT3.0 龙芯3A5000 Intel i5 9500 推出时间 2021年 2019年 核数 4 6 UnixBench 单核 1685 1888.9 SPEC2006 单核定点 25.1 62.8 SPEC2006 单核浮点 26.6 67.3 Stream内存 copy单核 16864 15936.5 Stream内存 Copy多核 21873 13637.6 91 龙芯自主架构的先驱者 公司在过去取得了MIPS架构授权,并以此为基础研发出自有的LoongISA指令系统,但部分关键IP仍需向MIP付费。为彻底解决关键技术“卡脖子”问题,龙芯于202

162、0年推出自主指令系统LoongArch,从整个架构的顶层规划,到各部分的功能定义,再到细节上每条指令的编码、名称、含义,均为自主重新设计。 性能方面,LoongArch相较MIPS运行效率更高,动态执行指令数平均可以减少10%-20%,并且仍留有一半的指令编码空间,可用于未来扩展。生态兼容方面,LoongArch指令系统融合X86、ARM等国际主流指令系统的主要功能特性,可实现跨指令平台应用兼容,高效运行MIPS、X86、ARM平台上的二进制应用程序。基础软件方面,公司基于LoongArch构建了完整的基础软件技术生态体系,开展操作系统内核、编译器、编程语言虚拟机、云计算等基础软件领域的研发工

163、作,形成了面向信息化应用的基础版操作系统Loongnix、面向工控类应用的基础版操作传统LoongOS以及面向云计算的龙芯云。 至此,公司已完成技术补课,形成从指令集到芯片再到OS的全面自主可控的生态体系,有望在进一步迭代优化后全面走向商用领域开放市场。 龙芯生态合作伙伴 自主指令系统LoongArch 数据来源:龙芯官网,招股说明书,西南证券整理 92 申威特种领域的引领者 申威研发中心成立于2003年,在国家863计划支持下,于2006年成功研制出第一代国产64位通用处理器“申威1”;在国家“核高基”专项支持下,于2010年成功研发世界首款16核通用处理器SW1600,该芯片成功应用于国内

164、首台采用国产处理器的千万亿次计算机系统神威蓝光超级计算机系统;2016年,搭载40960颗申威2610处理器的神威太湖超级计算机荣获世界性能榜首,速度比第二名“天河二号”快近2倍,效率提升3倍。 2016年,成都申威科技有限责任公司成立,从事对申威处理器的产业化推广,现已形成申威高性能计算处理器、服务器/桌面处理器、嵌入式处理器三个系列的国产处理器产品线,以及申威国产I/O套片产品线。 申威代表产品解决方案 申威26010处理器与太湖之光超级计算机 数据来源:申威官网,企查查,西南证券整理 40960颗颗 93 申威特种领域的引领者 公司最初取得了Alpha指令集的所有涉及资料,并基于此架构研

165、制出首颗芯片SW-1;后续出于安全可控考虑,公司设计出完全自主可控的指令集SW_64,完全区别于原有Alpha指令集,主要面向军用等对安全性要求极高的特种领域提供CPU处理器及其相关解决方案。 性能方面,申威26010双精度峰值算力可达到3.168TFLOPS,达到同期产品的国际领先水平,在超算领域表现突出。 生态方面,虽然采用完全自主的指令系统在兼容方面有天生劣势,但公司仍旧秉持“全国产自主研发,全流程安全可控”宗旨,积极建设申威信息安全产业联盟,现已发展出中标软件、中电科技、deepin、达梦数据等在内的50多家成员,形成了覆盖芯片设计、硬件平台、系统软件、支持平台、数据库、中间件、应用软

166、件的全链条自主生态。 申威生态 申威26010处理器性能对比 数据来源:申威官网,西南证券整理 推出时间 处理器类型 双精度峰值 SW26010 2014.12 异构众核CPU 3.168TFLOPS Intel Xeon Phi2 2015.11 众核CPU 3TFLOPS Intel Xeon Phi 2012.11 众核CPU 1.01TFLOPS NVDIA Kepler GK110 2012.05 GPU 1.32TFLOPS AMD GCN 2011.12 GPU 1.01TFLPOS 94 Intel AMD 海光 兆芯 飞腾 鲲鹏 龙芯 申威 产品 Xeon6354 EPYC7

167、542 海光7285 开盛KH-30000 S2500 鲲鹏920-7260 企业级3C5000L 申威1621 发布时间 2020 2020 2020 2019 2020 2019 2021 2017 制程 10nm 7nm 14nm 16nm 16nm 7nm 12nm 28nm 指令集 x86 x86 x86 x86 ARM ARM LoongArch SW_64 核心数 18 32 32 8 64 64 16 16 超线程 36 64 64 - - - - - 主频 3.0GHz 2.9GHz 2.0GHz 3.0GHz 2.2GHz 2.6GHz 2.2GHz 2.0GHz 内存类型

168、 DDR4 DDR4 DDR4 DDR4 DDR4 DDR4 DDR4 DDR3 内存通道数 8 8 8 2 8 8 4 8 最高内存频率 3200MHz 3200MHz 2666MHz 2666MHz 3200MHz 2933MHz 3200MHz 2133MHz Pcle通道数 64 128 128 16 17 40 32 16 数据来源:各厂商官网,公开资料,西南证券整理 各厂商主流服务器CPU性能对比 5.1 六大国产服务器CPU格局演绎 从性能角度看,海光7000系列、鲲鹏920分别是x86、ARM架构下的性能领先,飞腾在最新一代S2500发布后性能参数也跻身第一梯队;兆芯、龙芯、申

169、威三家产品相对性能较弱,核心数仅为8/16核,内存通道、Pcle通道等参数也较弱,影响处理器I/O性能。 从生态角度看,海光、兆芯基于x86指令系统的天生优势,生态适配度最高,当前x86架构仍占据服务器市场90%以上份额,替换空间巨大;以飞腾和鲲鹏为代表的ARM架构近年来生态迁移成本逐渐降低,且两家厂商已分别主导构建“PK生态”与“鲲鹏计算产业生态”,正快速发展成为市场另一极;申威、龙芯由于自研指令集系统,虽然在自主可控方面有其必要性和紧迫性,但其生态成熟度还有待完善。 95 数据来源:西南证券整理 5.1 六大国产服务器CPU格局演绎 综合考虑各项因素: 1)兆芯成立于2013年,获得x86

170、授权较早,在早期安全可控项目中占据一定份额,但其产品主要是桌面端,且x86 IP授权来自威盛电子,架构较为落后使其性能产品受到一定影响,IP内核授权的自主性也较低。 2)海光虽然进入市场较晚且只有AMD服务器授权,但凭借其先进的Zen架构和良好的生态起点,于2020年开始在电信、金融等行业信创领域快速放量,伴随行业信创的爆发,预计海光订单有望持续提升。 3)飞腾老一代产品性能相对落后,在信创前期主要集中在PC端出货,但伴随其新一代产品S2500发布后,性能已跻身国内先进水平,并且公司主导的PK生态正逐步完善,预计后续渗透率将持续提升。 4)鲲鹏920发布之初表现十分亮眼,凭借国际先进的制程工艺

171、与性能,叠加鲲鹏生态的组建完备,快速取得电信、金融等行业订单,但仍需注意美国制裁带来的产量受限等一系列负面影响,预计后续将在行业的选择上有所侧重,限制其爆发式增长。 5)龙芯研发起步最早,在党政市场原始份额较大,其产品集中于桌面PC和工业领域,伴随其新一代产品和全自主的指令集发布,后续在服务器市场的商业应用能力还有待验证。 6)申威主要聚焦军用市场,产品侧重特种超算服务器领域,全可控技术与生态均有独家壁垒,预计后续仍将专注深耕原有领域。 96 数据来源:西南证券整理 5.1 六大国产服务器CPU格局演绎 结合上文分析,当前服务器行业主要有两条主线驱动:1)数字经济新基建:主要为超算中心、智算中

172、心等建设过程中的增量采购;2)信创:党政信创进入常态化模式,行业信创接棒爆发,对国产化率有明确目标。整体而言,服务器行业进入更为市场化发展的阶段,除考虑自主可控的强弱要求和股东背景外,性能、生态、性价比、功耗等均是相关企业衡量的重要指标。 因此,我们认为短期内鲲鹏、海光、飞腾三家最有望受益于行业信创及新基建的爆发节奏。客观来看,当下国产服务器CPU无论在性能还是生态方面都有较大的进步空间,短期订单的爆发是前期“天时、地利、人和”的集中表现,远期格局还存在不确定性;长维度看,各家均有弯道超车的机会,仍然是资金投入、技术团队、迭代能力决定未来的企业核心竞争力。 T0 T1 T2 短期行业信创受益程

173、度推演 生态优势明显,性能得到验证,在手订单充裕 新品性能亮眼,预计后续能够获得部分订单,逐步放量 曾经的桌面王者,服务器领域势微,期待后续迭代 专注军用及特种超算领域,较少参与行业信创 97 5.2 中科曙光数字经济及信创浪潮下的核心标的 数据来源:中科曙光官网,公司公告, 西南证券整理 当前六大CPU厂商均未上市,其中海光信息与龙芯中科已提交招股说明书;与六大CPU厂商相关联的上市主体中,我们认为中科曙光或最为受益。 1993年我国自行研制的第一台基于微处理芯片构成的超级计算机“曙光一号”问世,在操作系统核心代码并行化和多线程技术等方面取得了一系列的突破,同时作为具有市场竞争力的产品,在中

174、国科学院的大力推动下,曙光一号折价2000万人民币知识产权,吸引资金成立曙光信息产业有限公司。 经历20余年发展,公司在高端计算、存储、安全、数据中心等领域拥有深厚的技术沉淀和领先的计算优势,拥有完整的IT基础架构产品线;同时公司积极布局智能计算、云计算、大数据的技术研发和产品服务,在全国50十多个城市部署了云计算中心,并不断延伸上下游产业链合作,参股中科星图及海光信息等业内领先企业,打造完备计算产业生态,为数字经济发展、新型基础设施建设、传统产业转型等提供可信的支撑。 中科曙光产品矩阵 98 5.2 中科曙光“实体名单”事件,倒逼积极转型 数据来源:中科曙光官网,公司公告, 西南证券整理 从

175、业务结构看,公司主要包含高性能计算机(包括服务器和其相关配套产品)、存储产品、以及围绕高端计算机的软件开发、系统集成与技术服务三大类别。自2013年起公司业务结构便整体保持稳定,其中服务器相关产品维持80%左右比重,存储产品、软件开发及技术服务分别占比10%左右。 可以观察到,2014-2018年,公司高性能计算机业务整体保持高速增长,CAGR达到33.7%;自2019年后,该业务增速骤然降低至个位数,2020年该业务实现收入80.5亿元,同比增长7.2%。 同时,公司存储产品和“软件开发、系统集成、技术服务”业务在2014-2018年的复合增速分别为30.4%和42.5%,2019年起增速亦

176、出现明显下滑,2020年两项业务的同比增速分别为4.2%和4.7%。 81.7% 79.8% 80.6% 80.0% 77.1% 80.4% 79.5% 78.8% 79.2% 6.9% 9.4% 10.7% 11.1% 11.1% 9.2% 9.6% 10.1% 9.9% 11.4% 10.8% 8.6% 8.8% 11.8% 10.3% 10.9% 11.1% 10.9% 0%20%40%60%80%100%20001820192020高性能计算机 存储产品 软件开发、系统集成及技术服务 公司业务结构自2013年起保持稳定 13.6 16.0 2

177、2.5 29.3 33.6 50.6 72.0 75.0 80.5 17.6% 41.2% 30.1% 14.7% 50.6% 42.2% 4.2% 7.2% 0%10%20%30%40%50%60%0070809020001820192020高性能计算机(左轴,亿元) 同比增速(右轴) 公司高性能计算机业务营收情况 99 5.2 中科曙光转型成效显著,盈利能力提升 数据来源:中科曙光官网,中科可控官网,公司公告, 西南证券整理 增速下降的主要原因为公司与参股的海光信息在2019年时被美国商务部列入出口管制条例实体清单,公司在集

178、成服务器整机或存储产品整机时,Intel CPU芯片等部分元器件的采购将受到影响;而根据IDC数据,CPU在服务器的成本构成中占比约为1/3。 公司对此积极采取应对措施,重新梳理产品线,调整业务布局。例如,公司于2019年6月发布公告,以3亿元的价格转让中科可控信息产业有限公司30%股权,将部分涉及到限制的元器件采购、集成、销售业务剥离,导致公司营收增速下滑,但仍保留其余不受影响的硬件业务。 若还原制裁之前口径,并假设CPU毛利率为0%,假设80亿元的高性能计算机业务中有60%-70%来自服务器相关硬件产品,宽幅口径下2020年公司营收或可达120亿元左右。 同时,公司积极抓住信创带来的产业机

179、遇,适当降低毛利率低的通用产品销售规模,并积极加大对海光、龙芯等国产CPU服务器的软硬件适配支持,公司利润结构得到大幅改善。观察2019、2020年,公司营收增速仅为个位数的情况下,利润增速仍保持38%左右水平。2020年公司毛利率为22.1%,相较2018年提升3.83pp,公司净利率为8.1%,相较2018年提升3.34pp。 公司总营收情况 公司归母净利润情况 16.6 20.0 28.0 36.6 43.6 62.9 90.6 95.3 101.6 20.5% 39.9% 30.9% 19.1% 44.4% 43.9% 5.2% 6.7% 0%5%10%15%20%25%30%35%4

180、0%45%50%020406080000192020总营业收入(左轴,亿元) 同比增速(右轴) 1.5 1.0 1.2 1.8 2.2 3.1 4.3 5.9 8.2 -36.1% 19.8% 52.7% 26.8% 37.7% 39.4% 37.9% 38.5% -50%-40%-30%-20%-10%0%10%20%30%40%50%60%0001820192020归母净利润(左轴,亿元) 同比增速(右轴) 24.5% 21.4% 20.0% 20.9% 17

181、.4% 18.3% 22.1% 22.1% 4.8% 4.1% 4.8% 5.1% 4.9% 4.8% 6.2% 8.1% 0%5%10%15%20%25%30%2000192020毛利率 净利率 公司盈利能力提升 100 5.2 中科曙光与海光的协同效应 数据来源:中科曙光官网,海光信息招股说明书, 西南证券整理 2018年中科曙光受让海光信息1948亿股股权,成为海光信息第一大股东,当前合计持股比例达到32.1%。 公司与海光信息形成良好协同,海光提供性能优异的国产CPU,为曙光的战略转型提供支点;曙光在计算产业的全面布局已形成优质的客户资源和销

182、售渠道,为海光芯片的放量打下基础。 搭载海光芯片的服务器于2020年伴随行业信创的试点进入放量拐点,海光信息的营收规模已从2018年的4825万元攀升至2021年的23.1亿元,并于2021年首次实现盈利,归母净利润达到3.2亿元。 从近期公布的移动和电信2021-2022年服务器集采结果来看,海光的占比分别达到10.5%和19.2%,其x86架构下优异的性能仍是运营商、金融企业的首选之一。伴随重点行业的国产化率提升,预计1-3年内海光信息仍有望维持高增速成长,曙光的联营企业投资收益有望快速增加。 海光信息营业收入情况 海光信息归母净利润情况 48.25 379.17 1021.97 2310

183、.42 686% 170% 126% 0%100%200%300%400%500%600%700%800%05000250020021营业收入(左轴,百万元) 同比增速(右轴) -124.15 -82.9 -39.14 327.11 33% 53% 936% 0%100%200%300%400%500%600%700%800%900%1000%-150-020025030035020021归母净利润(左轴,百万元) 同比增速(右轴) 国际贸易形势恶化风险; 电信、金融等行业信创国产化率不达预期; 海光

184、芯片出货量不及预期; 行业竞争加剧等。 风险提示 101 西南证券研究发展中心 西南证券投资评级说明西南证券投资评级说明 公司评级 买入:未来6个月内,个股相对沪深300指数涨幅在20%以上 持有:未来6个月内,个股相对沪深300指数涨幅介于10%与20%之间 中性:未来6个月内,个股相对沪深300指数涨幅介于-10%与10%之间 回避:未来6个月内,个股相对沪深300指数涨幅介于-20%与-10%之间 卖出:未来6个月内,个股相对沪深300指数涨幅在-20%以下 行业评级 强于大市:未来6个月内,行业整体回报高于沪深300指数5%以上 跟随大市:未来6个月内,行业整体回报介于沪深300指数-

185、5%与5%之间 弱于大市:未来6个月内,行业整体回报低于沪深300指数-5%以下 分析师承诺分析师承诺 报告署名分析师具有中国证券业协会授予的证券投资咨询执业资格并注册为证券分析师,报告所采用的数据均来自合法合规渠道,分析逻辑基于分析师的职业理解,通过合理判断得出结论,独立、客观地出具本报告。分析师承诺不曾因,不因,也将不会因本报告中的具体推荐意见或观点而直接或间接获取任何形式的补偿。 重要声明重要声明 西南证券股份有限公司(以下简称“本公司”)具有中国证券监督管理委员会核准的证券投资咨询业务资格。 本公司与作者在自身所知情范围内,与本报告中所评价或推荐的证券不存在法律法规要求披露或采取限制、

186、静默措施的利益冲突。 证券期货投资者适当性管理办法于2017年7月1日起正式实施, ,若您并非本公司客户中的专业投资者,为控制投资风险,请取消接收、订阅或使用本报告中的任何信息。本公司也不会因接收人收到、阅读或关注自媒体推送本报告中的内容而视其为客户。本公司或关联机构可能会持有报告中提到的公司所发行的证券并进行交易,还可能为这些公司提供或争取提供投资银行或财务顾问服务。 本报告中的信息均来源于公开资料,本公司对这些信息的准确性、完整性或可靠性不作任何保证。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值及投资收入可升可跌,过往表现不应作为日

187、后的表现依据。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告,本公司不保证本报告所含信息保持在最新状态。同时,本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。 本报告仅供参考之用,不构成出售或购买证券或其他投资标的要约或邀请。在任何情况下,本报告中的信息和意见均不构成对任何个人的投资建议。投资者应结合自己的投资目标和财务状况自行判断是否采用本报告所载内容和信息并自行承担风险,本公司及雇员对投资者使用本报告及其内容而造成的一切后果不承担任何法律责任。 本报告及附录版权为西南证券所有,未经书面许可,任何机构和个人不得以任何形式翻版、复制和

188、发布。如引用须注明出处为“西南证券”,且不得对本报告及附录进行有悖原意的引用、删节和修改。未经授权刊载或者转发本报告及附录的,本公司将保留向其追究法律责任的权利。 西南证券机构销售团队西南证券机构销售团队 区域区域 姓名姓名 职务职务 座机座机 手机手机 邮箱邮箱 上海上海 蒋诗烽 总经理助理 销售总监  黄滢 销售经理 蒋俊洲 销售经理 崔露文 销售经理 陈慧琳 销售经理

189、 王昕宇 销售经理 北京北京 李杨 销售总监 张岚 销售副总监 陈含月 销售经理 王兴 销售经理 来趣儿 销售经理 广深广深 郑龑 广州销售负责人 销售经理 陈慧玲 销售经理

190、 杨新意 销售经理 张文锋 销售经理 龚之涵 销售经理 西南证券研究发展中心 西南证券研究发展中心西南证券研究发展中心 上海上海 深圳深圳 地址:上海市浦东新区陆家嘴东路166号中国保险大厦20楼 地址:深圳市福田区深南大道6023号创建大厦4楼 邮编:200120 邮编:518040 北京北京 重庆重庆 地址:北京市西城区金融大街35号国际企业大厦A座8楼 地址:重庆市江北区金沙门路32号西南证券总部大楼 邮编:100033 邮编:400025

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(计算机行业“数字经济”系列专题(一):国产服务器CPU研究框架-220327(104页).pdf)为本站 (小时候) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部