上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

计算机行业:CPU Intel研究框架-220909(155页).pdf

编号:98623 PDF 155页 15.56MB 下载积分:VIP专享
下载报告请您先登录!

计算机行业:CPU Intel研究框架-220909(155页).pdf

1、请务必阅读末页的免责条款和声明2022年年9月月9日日计算机行业“构筑中国科技基石”系列报告计算机行业“构筑中国科技基石”系列报告21CPU Intel:研究框架:研究框架中信证券研究部中信证券研究部 计算机计算机&电子电子杨泽原杨泽原 徐涛徐涛 丁奇丁奇 马庆刘马庆刘 王子源王子源2核心观点核心观点核心结论:核心结论:CPU的关键在于性能和生态的关键在于性能和生态,其二者是其二者是Intel不断壮大的基石不断壮大的基石。一方面一方面,CPU整个生命周期围绕生态进行建整个生命周期围绕生态进行建设设,Intel长期保持生态的兼容和开放长期保持生态的兼容和开放,进而构建起庞大稳固的生态体系进而构建

2、起庞大稳固的生态体系。另一方面另一方面,性能决定是否性能决定是否“好用好用”,“架构架构+制程制程+先进封装先进封装+总线结构总线结构”为四大技术基石为四大技术基石,Intel长期围绕其进行技术迭代长期围绕其进行技术迭代,构筑性能优势构筑性能优势。借鉴借鉴Intel发展经验发展经验,拥拥抱开放生态抱开放生态、缩小性能缩小性能差距料是差距料是国产厂商崛起的必经之路国产厂商崛起的必经之路,自主可控为国产厂商提供发展良机自主可控为国产厂商提供发展良机。建议关注国产建议关注国产CPU龙头龙头。Intel:成立五十余年的:成立五十余年的CPU龙头龙头,x86架构的开创者架构的开创者公司概述:公司概述:成

3、立于1968年,是全球最大的PC零件与CPU制造商,x86架构开创者,产品包括处理器、FPGA、系统与设备、内存与存储等。创始人Robert Noyce是硅基集成电路发明人,Gordon Moore是摩尔定律提出者,技术背景强大。财务情况:财务情况:公司2021年营收达到790亿美元,创下历史峰值,其中PC端业务占比51.26%,数据中心业务占比32.67%,数据中心业务增速高于PC。当年公司整体毛利率55.45%,净利率25.14%,截至2021年拥有员工人数超过12万,盈利能力较强。发展历程:从存储器转向发展历程:从存储器转向CPU,从桌面端向数据中心从桌面端向数据中心/智能驾驶等领域拓展

4、智能驾驶等领域拓展早期:放弃存储器早期:放弃存储器,发明第一个发明第一个CPU。公司早期团队是集成电路技术的开创者,发明4位/8位处理器使得公司在CPU行业建立领先优势。在面临日本对手的竞争时,公司果断放弃存储器业务,在早期确立专注微处理器的发展战略。中期:奔腾中期:奔腾、Core在桌面端持续胜利在桌面端持续胜利,Xscale换换Atom未能站稳移动端未能站稳移动端。奔腾系列是PC领域经典产品,Core系列延续至今,但在移动浪潮出现时先是出售了Xscale,随后拒绝了苹果的订单,未抓住移动端机遇,推出Atom也未能补救。后期:从移动端转向自动驾驶后期:从移动端转向自动驾驶/FPGA/数据中心数

5、据中心,IDM2.0重建工艺优势重建工艺优势。2016年两款Atom的暂停发布标志着公司逐渐放弃移动市场,接连收购Mobileye、Altera,进行自动驾驶、FPGA领域的布局,建立第二成长曲线。以IDM 2.0与收购高塔半导体为标志,Intel调整自身代工策略,尝试重建工艺领先。3核心观点核心观点微架构微架构/ISA:单核架构基本成熟单核架构基本成熟,异构异构、集成加速发展集成加速发展初期:格局未定初期:格局未定,先发者占据优势先发者占据优势。在行业发展初期,生态尚未形成,微架构尚未固化,先发者具备一定优势,如Intel从4004到8080,产品节奏持续领先于Motorola和MOS等对手

6、,更早争取到用户,为生态规模优势打下基础。中期:生态初成中期:生态初成,兼容性强者为王兼容性强者为王。生态初步形成后,兼容性成核心关键,良好的兼容性持续推动生态发展。如Motorola的MC68010芯片性能不弱于80286,只是与前代的兼容性略差;RISC流派的MIPS R10000曾经在浮点效能方面达到Pentium Pro的3 倍以上,但明显的性能优势也无法抵消用户的切换成本,Intel对Motorola、RISC流派的竞争胜利已经证明商业市场中生态优势的强大逻辑。后期:架构成熟后期:架构成熟,性能引领前进性能引领前进。在同一生态内部主要比拼性能,奔腾和酷睿时代,Intel与AMD的竞争

7、中,性能强者赢得主要市场,K7/K8、Core、Zen等几大关键架构极大改变了性能,对市场格局带来了巨大改变。另一方面,处理器架构已经相对成熟,核心架构理念已经接近十余年没有变化,性能增长放缓,异构集成或将成为未来发展方向。基石技术:基石技术:工艺升级推进性能提升工艺升级推进性能提升,封装封装+片内总线发力后摩尔时代片内总线发力后摩尔时代制程工艺:制程是架构的基础制程工艺:制程是架构的基础,1010nmnm受阻拖慢研发节奏受阻拖慢研发节奏。工艺制程壁垒高,目前先进制程玩家仅剩三家。由于过高的目标与保守的DUV技术路线,英特尔在10nm遭遇困难,失去制程领先地位,产品性能与量产节奏也大受影响。先

8、进封装:先进封装:FoverosFoveros、EMIBEMIB性能优良性能优良,IDMIDM模式下发展领先模式下发展领先。先进封装是后摩尔时代必经之路,Intel在此领域推出的Foveros、EMIB等技术性能良好。相对Foundry与封测厂,公司的IDM模式能更好协同前后段工艺。片内总线:总线发达片内总线:总线发达有利堆核有利堆核,MeshbusMeshbus与与AMDAMD MCMMCM方案各有优势方案各有优势。片内总线结构对于堆核十分重要,公司从环形总线转为网状总线,走出了一条与AMD多芯片堆叠不同的道路,延迟更低,单片性能更好,但AMD的路线更有利于堆核。4核心观点核心观点产品体系:

9、至强产品体系:至强、酷睿酷睿、奔腾奔腾、赛扬赛扬、凌动五大类凌动五大类,覆盖广泛使用场景覆盖广泛使用场景1111类产品与服务类产品与服务,核心是核心是5 5类类CPUCPU(至强至强、酷睿酷睿、奔腾奔腾、赛扬赛扬、凌动凌动)。1 1)至强至强(服务器服务器):多核心低主频无核显,崛起于互联网带来的“PC服务器”浪潮,因低成本与扩展性胜过小型机。2 2)酷睿酷睿(中高端中高端PC):重视能效,取代奔腾成PC高端产品线,12代酷睿异构趋势初现。3 3)奔腾奔腾(中低端中低端PC):早期唯一产品,曾衍生出赛扬和至强,现用于教育/办公。4 4)赛扬赛扬(低端低端PC):性能较奔腾低一级,用于入门级电脑

10、和嵌入式,帮助实现市场下沉。5 5)凌动凌动(低低功耗功耗、物联网物联网):瞄准移动市场,低功耗高能效,现用于异构芯片小核心。行业演变:从行业演变:从Intel引领行业到两家激烈竞争引领行业到两家激烈竞争,奔腾奔腾、K7/K8、Core、Zen是行业重要转折点是行业重要转折点1)奔腾及以前:奔腾及以前:Intel与AMD同根同源,早期为满足IBM第二供应商要求而共存,直到奔腾系列诞生之前一直处于Intel引领,AMD仿制的局面;2)K7/K8时期:时期:后期两家由合作转向竞争,AMD自主研发能力逐渐增强,曾经在K7/K8架构时代对Intel奔腾4构成严峻挑战,并凭借AMD64指令集与Intel

11、平起平坐;3)Core时期:时期:Intel凭借Core架构进行反击,重新扩大领先优势;4)Zen时期:时期:如今AMD凭借Zen系列展现赶超之势,多核性能有优势。目前两公司整体差距较小。行业启示:下游需求引领行业变革行业启示:下游需求引领行业变革,商业模式需适配产业趋势商业模式需适配产业趋势架构先行:架构先行:架构领先是Intel和AMD竞争获胜的核心法宝,目前CPU核心架构理念相对成熟,国产厂商正加速追赶。生态为王:生态为王:x86依靠早期的生态合作与兼容适配取得绝对优势,吸引合作伙伴、培养用户生态是CPU企业壮大的关键。需求引擎:需求引擎:PC、移动市场等不同需求造就行业巨头,重塑行业格

12、局。PC浪潮带动Intel(x86),移动市场带动ARM。产业开放:产业开放:英特尔推出IDM2.0战略,提升自身开放程度,向Fabless+Foundry模式靠拢,对扩大市场有重要成本优势。5核心观点核心观点投资建议:投资建议:从从Intel历史可见的第一核心要素:生态历史可见的第一核心要素:生态-从Intel的发展历程中可以看到,生态扮演着核心的角色,生态的兼容性保障了x86阵营在与摩托罗拉等CISC对手以及诸多RISC流派对手的竞争中胜出。Intel凭借大生态优势,低成本拓展市场,进而增加研发资源,形成正循环。从从Intel历史可见的第二核心要素:性能历史可见的第二核心要素:性能-在生态

13、大局已定后,性能接棒成为核心,架构与工艺制程都是影响性能的关键。Intel凭借领先的集成电路工艺,积极引入大型机、小型机以及RISC流派的先进技术,在相当长的时间内一直是x86派别的性能领先者,而AMD也数次依靠新技术在产品端取得优势,在市场上对Intel构成严峻挑战。建议关注生态建议关注生态、性能端具备竞争力的国产龙头企业性能端具备竞争力的国产龙头企业。借鉴借鉴Intel发展经验发展经验,拥抱开放生态拥抱开放生态、缩小性能缩小性能差距预计是差距预计是国产国产厂商崛起的必经之路厂商崛起的必经之路,自主可控为国产厂商提供发展良机自主可控为国产厂商提供发展良机。建议关注建议关注国产国产x86架构架

14、构CPU龙头和自研架构领军者龙头和自研架构领军者。风险提示:需求减弱风险风险提示:需求减弱风险、市场竞争加剧市场竞争加剧、技术研发失败风险技术研发失败风险、全球供应链波动风险全球供应链波动风险、宏观经济增速下行宏观经济增速下行风险风险。6报告亮点与创新之处报告亮点与创新之处本报告对本报告对Intel发展历程中的成败得失与启示进行了全面梳理发展历程中的成败得失与启示进行了全面梳理,从产品从产品、技术方面进行深入分析技术方面进行深入分析,对于认知国产对于认知国产CPU厂商厂商有所帮助有所帮助。一一、技术层面技术层面,架构架构、工艺制程工艺制程、先进封装先进封装、片内总线架构为片内总线架构为CPU的

15、四大基石技术的四大基石技术,决定决定CPU产品力产品力,影响市场竞争力影响市场竞争力。架构方面架构方面,我们认为我们认为,初期讲速度初期讲速度,中期讲兼容中期讲兼容,后期讲性能后期讲性能,当前架构已经基本成熟当前架构已经基本成熟,有利于国产厂商追赶有利于国产厂商追赶。工艺方面,我们认为工艺是CPU企业的核心竞争力,是引领架构发展的动力。此外英特尔的先进封装与片内总线架构保持领先,两者的重要程度在“后摩尔时代”显著提升。二二、产品层面产品层面,Intel走向细分化走向细分化、广覆盖广覆盖,PC市场摊成本市场摊成本,服务器市场获利润服务器市场获利润。市场需求导致Intel产品线不断分化,AMD性价

16、比战略促使Intel推出赛扬,追求利润促使Intel、AMD先后进军服务器。服务器场景“至强”凭借性能与成本从早期竞争中脱颖而出;制程研发放缓影响“酷睿”系列竞争力提升;“赛扬”成功帮助公司实现市场下沉;“凌动”系列对标移动端,各代产品设计均体现面积与性能的权衡。三三、竞对分析竞对分析,初始禀赋初始禀赋、体量决定英特尔与体量决定英特尔与AMD不同的发展战略不同的发展战略。英特尔科技出身的创始人团队使得公司早期引领技术变革,AMD销售出身的团队与较小的公司体量更适合“模仿跟进”策略。而两家公司的同根同源创始人团队也为日后合作埋下伏笔。同时公司规模、资本充足性差异也使两家公司在IDM、Fables

17、s的选择上出现分化。四四、行业启示行业启示。1)架构:架构:架构领先是Intel和AMD竞争获胜的核心法宝,目前CPU核心架构理念相对成熟,国产厂商正加速追赶。2)生态:生态:具有很强的正反馈效应,强者恒强,尽量拥抱大生态。3)需求:需求:新进者的“发展窗口期”,催生增量市场,重塑产业格局。4)开放:开放:Fabless模式更符合CPU与先进制程的产业特点,更符合当今的分工格局,更符合方兴未艾的国产CPU厂商。目录目录CONTENTS7一一公司概况:全球公司概况:全球CPUCPU龙头,开创龙头,开创X86X86架构架构二二发展历程:早期专注发展历程:早期专注CPUCPU,中期错失移动端机遇,现

18、全方位发力,中期错失移动端机遇,现全方位发力三三处理器架构:单核架构基本成熟,异构、集成继续进步处理器架构:单核架构基本成熟,异构、集成继续进步四四基石技术:工艺推进核心性能,封装基石技术:工艺推进核心性能,封装+片内总线发力后摩尔时代片内总线发力后摩尔时代五五产品体系:产品体系:1111项产品线多维布局,处理器为基本盘项产品线多维布局,处理器为基本盘六六行业演变:多年积累,竞合不断,成就行业两大龙头行业演变:多年积累,竞合不断,成就行业两大龙头七七行业启示:下游需求引领行业变革,商业模式需适配产业趋势行业启示:下游需求引领行业变革,商业模式需适配产业趋势八八投资建议投资建议九九风险因素风险因

19、素8目录目录一、公司概况:全球一、公司概况:全球CPUCPU龙头,开创龙头,开创X86X86架构架构1 1、公司概览:持续创新,领航全球、公司概览:持续创新,领航全球CPUCPU市场市场2 2、行业地位:实力强大,、行业地位:实力强大,CPUCPU行业龙头地位稳固行业龙头地位稳固3 3、财务情况:业务广泛布局,营收增长稳健、财务情况:业务广泛布局,营收增长稳健二、发展历程:早期专注二、发展历程:早期专注CPUCPU,中期未把握移动端机遇,现全方位发力,中期未把握移动端机遇,现全方位发力1 1、早期:持续迭代产品,产品与理念领先时代、早期:持续迭代产品,产品与理念领先时代2 2、中期:锤炼技术禀

20、赋,未把握移动端机遇、中期:锤炼技术禀赋,未把握移动端机遇3 3、后期:舍弃已去的过去,把握即来的未来、后期:舍弃已去的过去,把握即来的未来三、微架构三、微架构/ISA/ISA:单核架构基本成熟,异构、集成继续进步:单核架构基本成熟,异构、集成继续进步1 1、架构发展概况:基础架构十余年来无大改,已接近数学物理极限、架构发展概况:基础架构十余年来无大改,已接近数学物理极限2 2、早期时代:每一代性能提升、早期时代:每一代性能提升1010倍,跑马圈地占据先发优势倍,跑马圈地占据先发优势3 3、x86x86时代:持续兼容保持战略定力,兼容前提下自我革命提升性能时代:持续兼容保持战略定力,兼容前提下

21、自我革命提升性能4 4、奔腾时代:持续创新吸收技术,性能与生态综合领先、奔腾时代:持续创新吸收技术,性能与生态综合领先5 5、多核时代:性能转向能效,市场持续正反馈、多核时代:性能转向能效,市场持续正反馈6 6、减速时代:架构改进取决于工艺,集成与异构成为新趋势、减速时代:架构改进取决于工艺,集成与异构成为新趋势7 7、异构时代:架核心微架构基本成熟,场景优化成为关键、异构时代:架核心微架构基本成熟,场景优化成为关键四、基石技术:工艺推进核心性能,封装四、基石技术:工艺推进核心性能,封装+片内总线发力后摩尔时代片内总线发力后摩尔时代1 1、制程工艺:、制程工艺:10nm10nm受阻拖慢研发节奏

22、,受阻拖慢研发节奏,5 5年年4 4节点公司望王者归来节点公司望王者归来2 2、先进封装:后摩尔时代下的纵向延伸,、先进封装:后摩尔时代下的纵向延伸,IDMIDM模式下发展领先模式下发展领先3 3、片内总线结构:信息传输的通道,多核堆叠的掣肘、片内总线结构:信息传输的通道,多核堆叠的掣肘五、产品体系:产品分化,同步实现广覆盖与高适应性五、产品体系:产品分化,同步实现广覆盖与高适应性1 1、产品总览:、产品总览:CPUCPU为业务基本盘,产品分化为适应细分市场关键为业务基本盘,产品分化为适应细分市场关键2 2、至强(服务器):商业化应用场景,性能与成本为首要考量、至强(服务器):商业化应用场景,

23、性能与成本为首要考量3 3、酷睿(中高端、酷睿(中高端PCPC):取代奔腾成):取代奔腾成PCPC高端产品线,异构趋势初现高端产品线,异构趋势初现4 4、奔腾(中低端、奔腾(中低端PCPC):引领):引领CPUCPU历史变革,现用于教育历史变革,现用于教育/办公场景办公场景5 5、赛扬(低价低端、赛扬(低价低端PCPC):性能较奔腾低一级,帮助实现市场下沉):性能较奔腾低一级,帮助实现市场下沉6 6、凌动(低功耗、物联网):瞄准移动市场,集成化为迭代主线、凌动(低功耗、物联网):瞄准移动市场,集成化为迭代主线7 7、MovidiusMovidius视觉处理器:前瞻布局,针对边缘与视觉处理器:前

24、瞻布局,针对边缘与AIAI设备设备六、行业演变:多年积累,竞合不断,成就行业两大龙头六、行业演变:多年积累,竞合不断,成就行业两大龙头1 1、发展演变:相互竞合,初始禀赋与体量决定不同发展战略、发展演变:相互竞合,初始禀赋与体量决定不同发展战略2 2、竞争格局:差距逐渐缩小,笔记本服务器市场公司优势显著、竞争格局:差距逐渐缩小,笔记本服务器市场公司优势显著七:行业启示:下游需求引领行业变革,商业模式需适配产业趋势七:行业启示:下游需求引领行业变革,商业模式需适配产业趋势1 1、架构先行:、架构先行:CPUCPU竞争的法宝,技术相对成熟,国产厂商加速追赶竞争的法宝,技术相对成熟,国产厂商加速追赶

25、2 2、生态为王:生态是第一竞争力,强者愈强难以颠覆、生态为王:生态是第一竞争力,强者愈强难以颠覆3 3、需求引领:需求迭代催生后浪巨头,把握下游铸就稳固地位、需求引领:需求迭代催生后浪巨头,把握下游铸就稳固地位4 4、商业模式:、商业模式:FablessFabless展现优势,分工合作利用生态规模展现优势,分工合作利用生态规模八、投资建议八、投资建议九、风险因素九、风险因素9一、公司概况:全球一、公司概况:全球CPU龙头,开创龙头,开创X86架构架构1.1 1.1 公司概览:持续创新,领航全球公司概览:持续创新,领航全球CPUCPU市场市场1.2 1.2 行业地位:实力强大,行业地位:实力强

26、大,CPUCPU行业龙头地位稳固行业龙头地位稳固1.3 1.3 财务情况:业务广泛布局,营收增长稳健财务情况:业务广泛布局,营收增长稳健10英特尔是全球最大的英特尔是全球最大的PC零件与零件与CPU制造商制造商。自创立以来自创立以来,公司开创公司开创X86结构结构,并通过多个具有时代意义的产品引领计算并通过多个具有时代意义的产品引领计算机行业与机行业与CPU行业的创新变革行业的创新变革公司成立:公司成立:公司成立于1968年,总部位于美国加利福尼亚州圣克拉拉,由罗伯特 诺伊斯(CEO)与戈登 摩尔(COO)共同创立,后安迪 格鲁夫加入,创始人实力强大创始人实力强大,其中罗伯特 诺伊斯为仙童半导

27、体创始人,被称为“硅谷之父”,“集成电路之父”;戈登 摩尔为“摩尔定律”的提出者;安迪 格鲁夫被誉为“硅谷最伟大的管理者”公司规模:公司规模:目前公司拥有12.1万名员工,产品包括处理器、服务器、FPGA、系统与设备、内存与存储等。2021年公司营收790亿美元,同比+1.5%,创下历史峰值股权结构:股权结构:公司股权结构分散,截至2021年年底公司持股5%以上的股东只有The Vanguard Group(先锋领航集团)与BlackRock,Inc.(贝莱德集团),分别持股8.46%、8.14%1.1公司概览:持续创新,领航全球公司概览:持续创新,领航全球CPU市场市场英特尔股权结构英特尔股

28、权结构资料来源:Wind,中信证券研究部8.46%8.14%83.40%The Vanguard GroupBlackRock,Inc其它英特尔产品组合英特尔产品组合资料来源:公司官网11根据根据IC Insights麦克林报告麦克林报告,英特尔在全球半导体供应商英特尔在全球半导体供应商(不包括纯代工厂不包括纯代工厂)销售额榜单中位居榜首多年销售额榜单中位居榜首多年1993年年,英特尔以9.2%的全球半导体市场份额成为排名第一的供应商,一直到2016年,公司始终为全球半导体市场公司始终为全球半导体市场份额排名第一的厂商份额排名第一的厂商2017年年,公司市场份额为13.9%,略低于三星的14.

29、8%,而后在2019年再次回归榜首再次回归榜首同时,英特尔的主要竞争对手AMD也在快速增长,于2021年成功晋升成为第十名1.2行业地位:实力强大,行业地位:实力强大,CPU行业龙头地位稳固行业龙头地位稳固资料来源:IC insights,中信证券研究部820192021公司公司营收营收份额份额公司公司营收营收份额份额公司公司营收营收份额份额公司公司营收营收份额份额公司公司营收营收份额份额1英特尔英特尔769.2%英特尔英特尔29713.6%英特尔英特尔34513.0%英特尔英特尔70815.9%三星三星82013.3%2NEC 718.6%东芝东芝1195.4%三星三星

30、2037.7%三星三星55712.5%英特尔英特尔76712.5%3东芝东芝637.6%NEC1095.0%德州仪器德州仪器1164.4%SK海力士海力士2325.2%SK海力士海力士3746.1%4摩托罗拉摩托罗拉587.0%三星三星1064.8%东芝东芝1043.9%微芯微芯2024.5%微芯微芯3004.9%5日立日立526.3%TI 964.4%意法半导体意法半导体1033.9%博通博通1723.9%高通高通2934.8%6德州仪器德州仪器404.8%摩托罗拉摩托罗拉793.6%瑞萨电子瑞萨电子702.6%高通高通1443.2%英伟达英伟达2323.8%7三星三星313.8%意法半导体

31、意法半导体793.6%高通高通652.5%德州仪器德州仪器1373.1%博通博通2103.4%8三菱三菱303.6%日立日立743.4%索尼索尼642.4%英飞利英飞利1132.5%联发科联发科1772.9%9富士通富士通293.5%英飞凌英飞凌683.1%海力士海力士622.3%英伟达英伟达1082.4%德州仪器德州仪器1732.8%10松下松下232.8%飞利浦飞利浦632.9%英飞凌英飞凌592.2%意法半导体意法半导体952.1%AMD1642.7%前十大合计前十大合计47157.0%前十大合计前十大合计108149.4%前十大合计前十大合计119144.9%前十大合计前十大合计246

32、955.5%前十大合计前十大合计351257.1%行业合计行业合计826100.0%行业合计行业合计2190100.0%行业合计行业合计2652100.0%行业合计行业合计4445100.0%行业合计行业合计6146100.0%历年半导体行业销售额及其排名(亿美元)历年半导体行业销售额及其排名(亿美元)12营业收入:营业收入:2012-2021年年,公司营收由公司营收由533.4亿美元增长至亿美元增长至790.2亿美元亿美元,CAGR为为4.5%,增长趋势明显增长趋势明显,22Q2同比下滑同比下滑2018年,受数据中心和客户端SSD的强劲需求以及Optane技术产品增长的推动2020年,新冠疫

33、情导致居家办公、在线学习需求提升,PC与服务器市场增长明显2021年,笔记本需求持续强劲、台式需求复苏,抵消数据中心由于竞争加剧带来的ASP下降22年Q2,根据英特尔法说会,由于经济活动快速放缓,DCAI 和 AXG 产品系列存在执行问题,公司营收增长疲软。二季度营收153亿美元,同比下降22%,创1999年以来最大降幅分地区营收:中国市场占据主要营收来源且增长迅速分地区营收:中国市场占据主要营收来源且增长迅速,为为CPU厂商重要战略领域厂商重要战略领域中国市场(中国大陆+中国香港+中国台湾),公司营收由15年的224亿美元增长至21年的346亿美元,营收占比由40%增至44%“中国大陆及中国

34、香港”增长迅速,由15年的117亿美元增至21年的211亿美元,CAGR为10.3%1.3财务分析:营收稳健增长,中国地区需求强劲,财务分析:营收稳健增长,中国地区需求强劲,Q2同比下滑同比下滑资料来源:Wind,中信证券研究部英特尔英特尔2012-2022H1营收情况营收情况英特尔分地区营收情况(亿美元)英特尔分地区营收情况(亿美元)资料来源:公司年报,中信证券研究部0500中国大陆及中国香港中国台湾美洲新加坡其他国家200021-10%-5%0%5%10%15%005006007008009002012

35、2000022H1营业收入(亿美元)YoY(%)131.3财务分析:财务分析:PC客户端与数据中心为主要营收来源客户端与数据中心为主要营收来源资料来源:公司年报,中信证券研究部资料来源:公司季报,中信证券研究部0500300350400450PC客户端数据中心非易失性存储器物联网编程部门其他业务2001920202021-60.0%-40.0%-20.0%0.0%20.0%40.0%60.0%020406080100120PC客户端数据中心与AI网络与边缘加速计算与图像处理Mobile

36、ye代工服务21Q222Q2YoY(%)分业务营收:主要来自分业务营收:主要来自CCG(PC客户端客户端)与与DCG(数据中心数据中心)CCG(PC客户端):21年营收为405亿美元,CAGR为4.2%,占比51%DCG(数据中心):21年营收为258亿美元,CAGR为8.4%,占比33%22Q1业务调整:自业务调整:自22Q1起起,公司结合自身业务变革公司结合自身业务变革,将营收重新划分为将营收重新划分为CCG(PC客户端客户端)、DCAI(数据中心与数据中心与AI)、NEX(网络与边缘网络与边缘)、AXG(加速计算与图像处理加速计算与图像处理)、Mobileye、IFS(代工服务代工服务)

37、几大类几大类其中,PC客户端依旧占比最大,但受需求冲击同比下滑Mobileye业务发展迅速,22Q2营收为4.60亿美元,同比+38.3%;代工业务体量小,增速有较大下滑英特尔分业务营收情况(亿美元)英特尔分业务营收情况(亿美元)2022Q2英特尔营收结构(亿美元)英特尔营收结构(亿美元)14从库存端看从库存端看,英特尔整体库存规模较大英特尔整体库存规模较大,存货周转较慢存货周转较慢;AMD存货周转天数近年来保持稳定存货周转天数近年来保持稳定2006年以来,伴随经营规模的增长,英特尔的存货呈现增长趋势,存货金额由2006年的43.13亿美元增至2020的84.27亿美元2021年,行业“缺芯”

38、态势严重,包括英特尔在内的半导体公司均积极备货,库存明显上升,英特尔21年存货金额为107.76亿美元,同期AMD存货金额也有明显增长英特尔存货周转天数也呈现上升趋势,由2006年的78天增至2021年的98天。但AMD的库存管理较好,除个别年份外,周转天数普遍在80天以下。1.3财务分析:财务分析:Intel存货周转较慢,库存呈上升趋势存货周转较慢,库存呈上升趋势资料来源:Wind,中信证券研究部英特尔库存及其周转天数(百万美元)英特尔库存及其周转天数(百万美元)AMD库存及其周转天数(百万美元)库存及其周转天数(百万美元)资料来源:Wind,中信证券研究部20304050607080901

39、0002006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021存货存货周转天数203040506070809010011002,0004,0006,0008,00010,00012,0002006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021存货存货周转天数15销售销售、行政及一般费用:费用端管控成效显著行政及一般费用:费用端管控成效显著,22H1

40、营收占比提升营收占比提升公司费用端管控成效显著,“销售、行政及一般费用”由2015年的82亿美元降至2021年的65.4亿美元,占营收比重由14.8%降至8.3%22H1费用占营收比重有所提升,主要为企业支出、激励性现金薪酬增加导致研发费用:研发加码研发费用:研发加码,精进大业务精进大业务,建设小业务建设小业务2021年,公司研发费用提升明显,主要用于对CCG(PC客户端)与DCG(数据中心)两大业务的支出同时,公司积极打造Mobileye与代工工艺技术,加大对两者的研发支出1.3财务分析:费用管控成效显著,研发投入持续加码财务分析:费用管控成效显著,研发投入持续加码资料来源:Wind,中信证

41、券研究部英特尔销售、行政及一般费用情况(亿美元)英特尔销售、行政及一般费用情况(亿美元)英特尔研发费用情况英特尔研发费用情况资料来源:Wind,中信证券研究部0%2%4%6%8%10%12%14%16%0070809020020202122H1销售、行政及一般费用占营收比重(%)0%10%20%30%40%50%60%020406080020020202122H1研发费用R&D(亿美元)研发费用率(%)16盈利能力:盈利能力:毛利率呈下降趋势:毛利率呈下降趋势:2

42、016-2018年,因产品定价压力与先进制程不断上升的开发成本,公司毛利率呈现下降趋势,但营收规模快速增长,公司盈利能力大幅加强美国税改大幅影响美国税改大幅影响17年净利润:年净利润:2017年美国实施企业税改,导致公司该年所得税支出为108亿美元(16、18年分别为26、23亿美元),使得该年公司净利润表现不佳22H1,公司盈利表现不佳:公司盈利表现不佳:22H1公司净利润为76.6亿美元,同比-9%,营收下滑为主要影响;净利率为23%,同比-12pcts1.3财务分析:毛净利率呈下降趋势,盈利能力有所减弱财务分析:毛净利率呈下降趋势,盈利能力有所减弱资料来源:公司财报,中信证券研究部英特尔

43、净利润及其增速情况英特尔净利润及其增速情况英特尔毛利率、净利率情况英特尔毛利率、净利率情况资料来源:公司财报,中信证券研究部0%10%20%30%40%50%60%70%20000212022H1毛利率(%)净利率(%)-20%0%20%40%60%80%100%120%140%050020000212022H1净利润(亿美元)YoY(%)17二、发展历程:早期专注二、发展历程:早期专注CPU,中期未把握移动端机遇,现全方位发力,中期未把握移

44、动端机遇,现全方位发力2.1 2.1 早期:持续迭代产品,产品与理念领先时代早期:持续迭代产品,产品与理念领先时代2.2 2.2 中期:锤炼技术禀赋,未把握历史机遇中期:锤炼技术禀赋,未把握历史机遇2.3 2.3 后期:舍弃已去的过去,把握即来的未来后期:舍弃已去的过去,把握即来的未来182.1发展早期:产品与理念领先时代,专注化战略化解危机发展早期:产品与理念领先时代,专注化战略化解危机资料来源:Intel官网,IBM官网,中信证券研究部1965年、年、1968年年 1965年:英特尔创始人戈登年:英特尔创始人戈登 摩摩尔提出“摩尔定律”尔提出“摩尔定律”1968年:戈登年:戈登 摩尔、罗伯

45、特摩尔、罗伯特 诺诺伊斯在硅谷创立英特尔伊斯在硅谷创立英特尔1971年年英特尔开发出第一个商用处理器英特尔开发出第一个商用处理器Intel 4004,集成,集成2250个晶体管,晶个晶体管,晶体管之间的距离是体管之间的距离是10微米微米1978年年英特尔生产出英特尔生产出16位位8086处理器,处理器,集成集成29000个个3微米技术的晶体微米技术的晶体管,开启了管,开启了x86时代时代1981年年IBM首款首款PC 5150使用英特尔的使用英特尔的8088芯片。英特尔芯片。英特尔CPU一举成名一举成名1985年年第一次战略转移第一次战略转移:壮士断腕,放弃壮士断腕,放弃存储器市场存储器市场,

46、专心开发微处理器专心开发微处理器 日本资金雄厚的大电子公司日本资金雄厚的大电子公司的冲击的冲击 英特尔英特尔D-RAM产品质量低、产品质量低、成本高成本高,市场份额不断下降市场份额不断下降,1984年公司年公司40%的营收和的营收和100%的利润来自于微处理的利润来自于微处理器,但器,但80%以上的研发投入以上的研发投入于在存储器上。于在存储器上。1972年年发布世界首款八位处理器发布世界首款八位处理器8008,其指令集成为今日英特尔公司其指令集成为今日英特尔公司X86系列微处理器指令集的基础系列微处理器指令集的基础技术基因强大,引领技术基因强大,引领CPU发展,放弃存储器专注微处理器发展,放

47、弃存储器专注微处理器192.2发展中期:发力服务器与移动互联网,铸就技术禀赋发展中期:发力服务器与移动互联网,铸就技术禀赋1991年年第二次战略转移第二次战略转移:格罗夫将工作的格罗夫将工作的重点从芯片转移到信息网络通信重点从芯片转移到信息网络通信方面上方面上1993年年首次推出奔腾芯片,制程工艺首次首次推出奔腾芯片,制程工艺首次降低到降低到1微米以下,实现微米以下,实现0.8微米水微米水平,晶体管数量超过平,晶体管数量超过300万。万。1998年年首次针对数据中心推出英特尔至强首次针对数据中心推出英特尔至强处理器品牌处理器品牌区分服务器市场和普通区分服务器市场和普通PC市场市场2001年年英

48、特尔的英特尔的64位服务器处理器位服务器处理器Itanium安腾问世,在服务器市场超越安腾问世,在服务器市场超越RISC处处理器的代表理器的代表Sun公司公司2003年、年、2005年年 2003年:英特尔发布迅驰移动年:英特尔发布迅驰移动计算技术,促进无线上网的迅计算技术,促进无线上网的迅猛发展,开启移动计算时代猛发展,开启移动计算时代 2005年:英特尔处理器导入苹年:英特尔处理器导入苹果果Mac,而此前苹果使用的一直,而此前苹果使用的一直是是IBM的的PowerPC架构芯片架构芯片1997年年收购收购StrongARM,并推出,并推出Xscale架架构,强于同时期的主流构,强于同时期的主

49、流ARM处理器处理器逐渐扩展处理器产品系列,技术革新巩固行业地位逐渐扩展处理器产品系列,技术革新巩固行业地位 线上通讯服务业务需求兴起线上通讯服务业务需求兴起 英特尔能够凭依个人电脑的英特尔能够凭依个人电脑的优势,开拓新兴的通讯与多优势,开拓新兴的通讯与多媒体领域。媒体领域。往后,苹果往后,苹果Mac也开始走向自也开始走向自研芯片的道路,有意摆脱对英研芯片的道路,有意摆脱对英特尔的依赖特尔的依赖资料来源:Intel官网,中信证券研究部202.2发展中期:未布局移动端发展中期:未布局移动端CPU,未把握移动端机遇未把握移动端机遇2005、2006年年2005年:苹果希望使用英特尔年:苹果希望使用

50、英特尔内置的内置的Xscale芯片为芯片为iPhone提提供算力,但遭英特尔供算力,但遭英特尔CEO拒绝拒绝2006年:由于财务危机,英特年:由于财务危机,英特尔将尔将Xscale专利与技术卖给专利与技术卖给Marvell,彻底失去移动互联网,彻底失去移动互联网的入场券的入场券2006年年英特尔酷睿处理器诞生,制程工艺英特尔酷睿处理器诞生,制程工艺65纳米,集成晶体管数量实现纳米,集成晶体管数量实现2亿,亿,面向家用和商用面向家用和商用PC2012、2013年年 2012年:英特尔宣布重返移动年:英特尔宣布重返移动终端市场,但是效果不佳终端市场,但是效果不佳 2013年:英特尔推出低功耗、年:

51、英特尔推出低功耗、小尺寸的小尺寸的Quark微处理器,在微处理器,在物联网领域迈出大步物联网领域迈出大步2014年年 英特尔推出酷睿英特尔推出酷睿M处理器,处理处理器,处理器功耗进入个位数(器功耗进入个位数(4.5W)的新)的新纪元纪元2015年年 完成公司史上最大一笔收购交完成公司史上最大一笔收购交易。斥资易。斥资167亿美元收购可编程亿美元收购可编程芯片厂商芯片厂商Altera公司公司 强化在数字中心市场和物联网强化在数字中心市场和物联网的地位,摆脱对的地位,摆脱对PC业务的依赖业务的依赖 在在PC市场不断萎缩且移动市场市场不断萎缩且移动市场迟迟难以打开的背景下,英特迟迟难以打开的背景下,

52、英特尔希望实现尔希望实现CPU和和FPGA硬件规硬件规格深层次结合,布局物联网市格深层次结合,布局物联网市场场2008年、年、2009年年 2008年:推出给予年:推出给予X86架构的架构的低功耗处理器,低功耗处理器,Atom凌动处理凌动处理器器 2009年:四核处理器问世。英年:四核处理器问世。英特尔继续在服务器处理器市场特尔继续在服务器处理器市场占优势占优势公司在移动市场发力较少,没有充分把握历史级别发展机遇公司在移动市场发力较少,没有充分把握历史级别发展机遇资料来源:Intel官网,中信证券研究部212.3发展后期:舍弃已去的过去,把握即来的未来发展后期:舍弃已去的过去,把握即来的未来2

53、016年年由于能耗与软件生态问题,原定由于能耗与软件生态问题,原定在在2016年推出的移动处理器凌动年推出的移动处理器凌动产品线的两个新版本将会取消发产品线的两个新版本将会取消发布,英特尔退出智能手机芯片市布,英特尔退出智能手机芯片市场场2016年年收购计算机视觉公司收购计算机视觉公司Itseez,进一步,进一步加强在汽车和视频等物联网细分市加强在汽车和视频等物联网细分市场的努力场的努力2017年年2017年:收购年:收购Mobileye。英特尔。英特尔宣布将以宣布将以153亿美元收购亿美元收购Mobileye,进一步成为自动驾驶,进一步成为自动驾驶领域的领先技术供应商领域的领先技术供应商20

54、17年:英特尔确立以数据为中年:英特尔确立以数据为中心的转型战略,开拓心的转型战略,开拓3000亿美元亿美元的广阔市场机遇的广阔市场机遇2018年年 英特尔宣布英特尔宣布2019年大规模交付年大规模交付10nm芯片芯片 英特尔宣布收购芯片制造商英特尔宣布收购芯片制造商eASIC,加速,加速FPGA,降低对,降低对CPU的的依赖依赖2021、2022年年 2021年:宣布英特尔年:宣布英特尔IDM2.0战战略,成立代工服务事业部略,成立代工服务事业部(IFS),重返芯片代工领域),重返芯片代工领域 2022年:旗下年:旗下Mobileye 宣布,宣布,计划与合作伙伴在计划与合作伙伴在 2024

55、年推出年推出自动驾驶电动班车自动驾驶电动班车 2022年:以年:以54亿美元收购模拟亿美元收购模拟半导体代工厂高塔半导体;为半导体代工厂高塔半导体;为联发科提供芯片代工服务,采联发科提供芯片代工服务,采用用 16 纳米制程纳米制程2016年年成立名为“自动驾驶集成立名为“自动驾驶集团”团”(ADG)的部门,该部门主要的部门,该部门主要任务是研发无人驾驶解决技术方任务是研发无人驾驶解决技术方案案多维收购拓宽业务边际,着眼新兴领域的尝试多维收购拓宽业务边际,着眼新兴领域的尝试资料来源:Intel官网,中信证券研究部22三、处理器架构:单核架构早已成熟,异构、集成继续进步3.1 3.1 架构发展概况

56、:基础架构十余年来无大改,已接近数学物理极限架构发展概况:基础架构十余年来无大改,已接近数学物理极限3.23.2早期时代:每一代性能提升早期时代:每一代性能提升1010倍,跑马圈地占据先发优势倍,跑马圈地占据先发优势3.33.3x86x86时代:持续兼容保持战略定力,兼容前提下自我革命提升性能时代:持续兼容保持战略定力,兼容前提下自我革命提升性能3.4 3.4 奔腾时代:持续创新吸收技术,性能与生态综合领先奔腾时代:持续创新吸收技术,性能与生态综合领先3.5 3.5 多核时代:性能转向能效,市场持续正反馈多核时代:性能转向能效,市场持续正反馈3.6 3.6 减速时代:架构改进取决于工艺,集成与

57、异构成为新趋势减速时代:架构改进取决于工艺,集成与异构成为新趋势3.7 3.7 异构时代:架核心微架构基本成熟,场景优化成为关键异构时代:架核心微架构基本成熟,场景优化成为关键233.1.什么是架构:如何让计算机少花钱多干活什么是架构:如何让计算机少花钱多干活核心概念指令:告诉计算机该干什么/怎么干核心概念程序:一系列指令,告诉计算机先干什么后干什么用户的目标:花最少的钱,最少的时间,让计算机干最多的活(低功耗、速度快)主人:用户/程序员仆从:计算机计算机是如何按人的需求工作的?计算机是如何按人的需求工作的?指令指令/程程序序、数据结果结果如何达成用户的目标?:计算机提升工作能力,在同样的时间

58、内在同样的时间内执行更多的指令执行更多的指令如何更快执行指令?:架构架构!(计算机物理资源的优化配置计算机物理资源的优化配置)资料来源:中信证券研究部整理243.1.什么是架构:如何在同样物理条件下执行更多任务?并行什么是架构:如何在同样物理条件下执行更多任务?并行/调度调度/缓存缓存如何更快执行指令?:架构架构!(计算机物理资源的优化配置计算机物理资源的优化配置)具体如何配置资源,做何种“架构”?并行并行充分利用,同时做很多任务充分利用,同时做很多任务可否同时执行很多程序?多核多核可否把一个程序拆成几部分同时做?多多线程线程在单个程序内部,可否同时执行一大批指令?超标量超标量可否让指令紧密衔

59、接起来以免闲置资源浪费时间?流水线流水线可否一条指令同时处理一大批数据?单单指令多数据指令多数据(SIMD)调度调度避免卡壳,先做会做的任务避免卡壳,先做会做的任务当前任务卡住了,可否在等待期间做其他任务?乱序执行乱序执行任务产生了分支,可否预判该走哪条路?分支预测分支预测缓存缓存备好材料,免得用时找不到备好材料,免得用时找不到内存中有大量需要用到的数据资料,但内存很慢(由于采用电容存储数据,所以比CPU慢数百倍),相当于资料齐全的图书馆可否在CPU内部放置一个小书架临时储存资料,以免经常往返图书馆浪费时间?高速缓存高速缓存资料来源:中信证券研究部整理253.1.Intel与架构的关系:与架构

60、的关系:微架构并非微架构并非Intel开创,比开创,比CPU诞生更早诞生更早资料来源:TechNews科技新报回顾历史梦幻处理器:计算机结构、商业大型主机与超级计算机的诞生,IBM Archives:IBM Mainframe,中信证券研究部处理器单核微架构的诞生早在处理器单核微架构的诞生早在1960年代年代,此时正是计算机从晶体管转向集成电路的时期此时正是计算机从晶体管转向集成电路的时期,流水线流水线(指令并行指令并行)、乱序执乱序执行行(指令调度指令调度)、高速缓存三大核心技术乃至于微架构和指令集的持续兼容性均在这一时期奠定了基础高速缓存三大核心技术乃至于微架构和指令集的持续兼容性均在这一

61、时期奠定了基础,形成了现代计算形成了现代计算机的基本架构机的基本架构,甚至早于甚至早于Intel公司的诞生公司的诞生,其中其中IBM在此过程中起到核心作用在此过程中起到核心作用。帮助AMD取得市场成功的K7架构,其使用的总线来自DEC Alpha EV6(21264,1998年);2008年初代Core i的Nehalem架构,其中新引入的QPI总线来自于DEC Alpha EV7(21364,2001年)Intel本质是集成电路公司本质是集成电路公司,用集成电路重做微架构用集成电路重做微架构,所以搭载何种微架构更多取决于工艺水平和市场情况所以搭载何种微架构更多取决于工艺水平和市场情况第一台通

62、用型计算机(继电器)第一台电子计算机(电子管)IBM第一个全电子计算机1950年代最受欢迎的计算机,生产了近2000台首次使用硬盘,实现随机读写而非以往的顺序读写引入固态电子技术,晶体管开始取代真空管实现全晶体全晶体管化管化,小型化世界第一台世界第一台引入流水线引入流水线的通用计算的通用计算机机自1952年开发701以来首次基本重组,开启集成电路计算机序幕,首创兼容首创兼容指令集概念指令集概念,发布后一个月就售出1000余台首次引入了指令动首次引入了指令动态调度技术(乱序态调度技术(乱序执行),包括寄存执行),包括寄存器重命名、器重命名、Tomasulo算法等算法等核心技术,指令性核心技术,指

63、令性能达到能达到16.6MIPS,相当于相当于1991年的年的Intel 486SX首次搭载首次搭载高速缓存高速缓存IBM-Harvard Mark IENIACIBM 701IBM 650IBM RAMAC 305IBM 7070/7090IBM 1401IBM 7030 StretchIBM System 360IBM 360/91IBM 360/8528495IntelAMD8028680386奔腾Pro引入流水线主板高速缓存乱序执行大型机与大型机与PC处理器部分关键节点处理器部

64、分关键节点263.1.CPU架构演进:古老学科,主要的架构演进:古老学科,主要的CPU架构革新发生在二十年前架构革新发生在二十年前资料来源:各产品手册,wikichip40048008808080868028680386i486P5-PentiumP6-P ProP5-P MMXP6-P2P6-P3Netburst-WillametteNetburst-NorthwoodNetburst-Prescott年份年份4459200020022004工艺工艺10m10m6m3m1.5m1.5m1m0.8m350n

65、m250nm250nm180nm180nm130nm90nm位数位数4882323232323264主频主频108kHz500kHz2.08MHz5MHz6MHz16MHz25MHz66MHz150MHz133MHz300MHz500MHz1.5GHz3.8GHz流水线流水线BIU/EU分离首次引入流水线,3级3级5级5级12级6级14级10-13级20级20级31级超标量超标量首次支持超标量,双流水线(整型)3流水线(2整1浮点)缓存缓存L1首次引入主板高速缓存首次集成8KB L18KB L1I,8KB L1DL2支持外部L2集成L2L3服务器端集成L3桌面端支持L3T

66、LB首次引入TLBopLoadStore指令队列指令队列首次引入指令队列,6B6B指令分配队列指令分配队列IDQ解码器解码器INT ALU/执行引擎执行引擎乱序执行乱序执行RSROB首次引入乱序执行SIMDMMXSSESSE2SSE3超线程超线程桌面端首次引入超线程Hyper-Threading(分时多线程)P4E支持HT,奔腾D不支持HT多核心多核心奔腾D“胶水双核”异构异构其他集成其他集成集成FPU技术突破持续发展技术退潮CPU架构的发展黄金期在架构的发展黄金期在80-90年代年代,引入了诸多技术革新引入了诸多技术革新(尽管有些是来自尽管有些是来自IBM大型机的老技术大型机的老技术,但也属

67、于首次用在但也属于首次用在CPU上上)273.1.CPU架构演进:最近十余年进展缓慢,以集成和堆核为主架构演进:最近十余年进展缓慢,以集成和堆核为主资料来源:各产品手册,wikichipCoreNehalemSandy BridgeHaswellSkylakeKaby LakeCoffee LakeCoffee Lake RComet LakeIce Lake/Sunny CoveTiger Lake/Willow CoveAlder Lake/Golden Cove年份年份200620082000021工艺工艺65nm45nm

68、32nm22nm14nm14nm14nm14nm14nm10nm10nmintel 7位数位数646464646464646464646464主频主频睿频1.0睿频2.0流水线流水线14级14级14级14级超标量超标量4流水线,6发射6发射8发射8发射8发射8发射8发射8发射10发射10发射12发射缓存缓存L132KB L1I,32KB L1D32KB L1I,32KB L1D32KB L1I,32KB L1D32KB L1I,32KB L1D32KB L1I,32KB L1D32KB L1I,32KB L1D32KB L1I,32KB L1D32KB L1I,32KB L1D32KB L1I

69、,32KB L1D32KB L1I,48KB L1D32KB L1I,48KB L1D32KB L1I,48KB L1DL2双核共享6MB 24way256KB 8way256KB 8way256KB 8way256KB 4way(client);1MB 16way(server)256KB 4way(client);1MB 16way(server)256KB 4way(client);1MB 16way(server)256KB 4way(client);1MB 16way(server)256KB 4way(client);1MB 16way(server)512KB 8way(clie

70、nt);1280KB 20way(server)1.25MB 20way1.25MB(client);2MB(server)L3桌面端集成L3,2MB/c2MB/c2MB/c2MB/c2MB/c2MB/c2MB/c2MB/c2MB/c3MB/c3MB/cTLBop1.5K1.5K1.5K1.5K1.5K1.5K1.5K2.25K2.25K4KLoad64727272727272128Store3642565656565672指令队列指令队列4040505050505050指令分配队列指令分配队列IDQ56568128140解码器解码器444444444446INT ALU

71、/执行引擎执行引擎333444444445乱序执行乱序执行RS3254609797979797160ROB964224224224224352352512SIMDSSE4.1SSE4.2AVXAVX2服务器端AVX512消费端AVX512消费端禁用AVX512超线程超线程不支持超线程支持超线程SMT(同时多线程)SMTSMTSMTSMTSMTSMTSMTSMTSMTP核支持SMT,E核不支持多核心多核心真双核4c4c4c4c4c6c8c10c4c8c16c异构异构首次异构集成其他集成其他集成QPI总线集成核显,ringbus取代QPI集成ISP(IPU),SP 版本Mes

72、hbus集成雷电3(TB3)接口、神经网络加速器(GNA)集成TB4,GNA2,IPU6技术突破持续发展技术退潮从酷睿时代后,单核微架构的发展逐渐减速,鲜有新技术,主要是进行堆料产生性能上的量变,更多的发展体现在核心数的增加和集成283.1.CPU架构发展现状:面临限制提升放缓,堆料边际效用递减架构发展现状:面临限制提升放缓,堆料边际效用递减超标量超标量/超宽架构:超宽架构:苹果M1 8解码8发射;AMD zen3 4解码6发射;Intel Golden Cove 6解码5发射(仅ALU),对于变长指令已经足够高指令融合:指令融合:Intel Macro Fusion已经发展成熟多年,FMA等

73、组合指令只能用在特定场景流水线:流水线:早在4004之前就已用于大型机,目前流水线级数相对稳定,过深流水线在分支预测失败、外部中断等场景下代价高,且指令切分更细就必须采用高主频才能达到相同效果,Netburst已经被证明失败指令级并行指令级并行数据级并行数据级并行SIMD指令集:指令集:Intel/AMD从MMX到SSE再到AVX,最新版本为AVX512,仅有少量应用可用,性价比不佳,后在Golden Cove官方禁用多核心:多核心:目前64/128核心已不罕见,更多核心的并行计算应用较少,通常采用GPU效率更佳超线程:超线程:SMT2已经多年未变,SMT4虽然可用但始终不是主流,因为使用SM

74、T本身也带来功耗和控制复杂度方面的弊端进程进程/线程级并行线程级并行存储器层次体系存储器层次体系高速缓存:高速缓存:SRAM体系无根本变化,高速高成本大面积,L1已经能解决80%-95%需求,AMD 3D V-Cache已经够大,过大反而导致高延迟内存内存/外部存储:外部存储:DRAM/NAND Flash性能不会出现质变,Optane叫好不叫座,需等待基础材料层面技术革新动态执行动态执行乱序执行:乱序执行:不相关指令在程序中的比例不会无限提高,乱序执行的效果是有上限的,经过多年优化基本稳定分支预测:分支预测:目前分支预测准确率已能达到90%以上,部分场景下更高,提高空间已经不大物理限制:物理

75、限制:没有工艺的进展,先进架构想要应用就需要更大面积和更多功耗,降低良率,付出超高成本。硅集成电路微缩有极限,当前工艺制程进展已经明显放缓,成本快速提升,留给架构利用的物理空间增长有限留给架构利用的物理空间增长有限。工艺/架构已成熟后往往采用DSA(专用架构)数学限制:可以并行数学限制:可以并行/乱序执行的指令是有上限的乱序执行的指令是有上限的,有一定比例的指令一定需要按照时间先后执行顺序,这一点永远无法随着架构发展而改变,所以各类并行各类并行/动态调度技术都是有上限的动态调度技术都是有上限的,在这方面堆料的效果将逐渐减弱在这方面堆料的效果将逐渐减弱。资料来源:intel官网,中信证券研究部2

76、9Zen 4 IPC提升平均达到提升平均达到13%3.1.CPU架构发展现状:边际效用递减十分明显,以架构发展现状:边际效用递减十分明显,以zen4为例为例1%3%4%5%5%9%10%11%12%12%12%13%13%14%15%17%17%19%19%24%32%39%CPU-Z 1TFortniteGTA VAdobe Lightroom(Puget Bench)Passmark 1TCinebench R23 1TKrakenAdobe Premier(Puget Bench)Shadow of the Tomb RaiderPOV-RayFar Cry 6CS:GO7-zipGee

77、kbench 5.4 1TV-Ray CPUAssassins Creed:ValhallaMetro ExodusDeus Ex:Mankind DividendF1 2022Watchdogs LegionDolphin BenchwPrime(1024M)资料来源:Puget Systems,中信证券研究部PugetBench Lightroom跑分跑分资料来源:AMD Ryzen 7000发布会2022年8月AMD Ryzen 7000系列发布会上,AMD官方表示其综合IPC提升达到13%。每一代产品IPC测试所用程序中,包含各类不同负载,所用负载不尽相同,并不直接可比。另外此处计算得

78、到的IPC也受内存等外部器件条件的影响。因此,综合来看实际综合来看实际IPC提升应当提升应当小于小于13%同样是Intel Core i9 12900K,选用DDR5内存后,其得分有明显上升30资料来源:AMD 2022财务分析师大会,中信证券研究部Zen 4 IPC提升提升资料来源:AMD Ryzen 7000发布会,中信证券研究部Zen 4 IPC贡献分解贡献分解3.1.CPU架构发展现状:边际效用递减十分明显,以架构发展现状:边际效用递减十分明显,以zen4为例为例Zen 4微架构相比前代变化微架构相比前代变化资料来源:Twitterchiakokhua,中信证券研究部采用AMD在202

79、2财务分析师大会的数据,Zen4有8%-10%的IPC提升为达到如此IPC提升,AMD利用TSMC N5工艺带来的充足物理空间进行了大量硬件配置提升。根据退休工程师Twitterchiakokhua的数据,AMD在微指令缓存、二级缓存、ROB、BTB等方面都有大幅增加根据AMD的数据,L2翻倍带来的提升约1%,BTB增大50%带来IPC提升不到2%,ROB增大25%带来提升1%,微指令缓存增加近70%带来提升约3%,可见效应已效应已经明显下降经明显下降,已经逐步接近数学极限已经逐步接近数学极限。AMD在财务分析师大会上提供的数据为8%-10%IPC提升,可能更接近真实情况31早期早期,由于由于

80、CPU行业刚刚出现行业刚刚出现,生态尚未形成生态尚未形成,决定成败的还是快速推出高性能新产品决定成败的还是快速推出高性能新产品,争取更多用户争取更多用户,获得更多市场获得更多市场。早期CPU并无复杂的微架构,大多架构技术还属于大型机专属,此时主要比较主频、位数、晶体管数量等因素。在早期产品中在早期产品中,Intel几乎一直是最领先的几乎一直是最领先的对于发展早期的芯片类型对于发展早期的芯片类型,关注速度是很重要的关注速度是很重要的,“快鱼吃慢鱼快鱼吃慢鱼”3.2.早期时代:每一代性能提升早期时代:每一代性能提升10倍,跑马圈地占据先发优势倍,跑马圈地占据先发优势公司公司产品产品推出时间推出时间

81、晶体管数量晶体管数量主频主频位数位数引脚数量引脚数量Intel400419712.3k108kHz416Intel800819723.5k500kHz818Intel808019744.5k2.08MHz840Intel808519776.5k3MHz840Intel8086197829k5MHz1640MOS Technology65011975840MOS Technology650219753.51k1MHz840ZilogZ8019768.5k2.5MHz840MotorolaMC680019744.1k1MHz840MotorolaMC68000197968k4MHz1664部分典型

82、早期部分典型早期CPU资料来源:wikichip,中信证券研究部323.2.1.早期时代:早期时代:4004,开创,开创CPU行业,奠定行业,奠定Intel领先地位领先地位4004 1971/11工艺:10m制程,pMOS晶体管,12mm2晶体管数量:2.25k主频:108kHz/750kHzMCS-4芯片组构成芯片组构成资料来源:wikichip 4004,中信证券研究部MCS-4系列的一组系列的一组4种芯片种芯片4004是世界首个微处理器是世界首个微处理器,开创了开创了CPU行业行业,第一次将计算机完全用集成电第一次将计算机完全用集成电路的形式实现路的形式实现,奠定了未来一段时间的奠定了未

83、来一段时间的CPU架构基础以及架构基础以及Intel的领先地位的领先地位。为响应客户需求,Intel设计了一套4个芯片,称为MCS-4,包括CPU 4004,以及存储程序的ROM 4001,存放数据的RAM 4002,用于I/O扩展的移位寄存器(SR)4003;单处理器可支持4KB ROM和640字节RAM。资料来源:wikichip 4004硬盘内存对外接口资料来源:wikichip 4004,中信证券研究部333.2.1.早期时代:早期时代:4004,开创,开创CPU行业,奠定行业,奠定Intel领先地位领先地位4004 1971/114004仅包含基本的状态控制、指令控制、寄存器、ALU

84、等单元,只有1个4位ALU执行数字/逻辑运算,支持46条指令,包含分支、跳转、条件判断、子程序等基础指令资料来源:Intel 4004 datasheet,SciHi,中信证券研究部4004架构框图架构框图ALU:执行加减乘除运算的核心单元时序与控制单元:包含时钟同步单元,以及与内存和“硬盘”的接口等专用寄存器:用来跟踪程序执行进度等,控制程序执行通用寄存器:通常用来存放程序所需的各类数据指令寄存器:存放将要执行的指令Flag:包含CPU的各种状态信息指令解码器:“阅读”指令的单元,可以在“阅读”后知道指令需要做什么、需要几个数据等信息343.2.2.早期时代:早期时代:8008,从计算器到计

85、算机的跨越,从计算器到计算机的跨越8008 1972/4工艺制程:10m,pMOS晶体管数量:3.5k主频:500(8008)/800(8008-1)kHz技术突破:世界首个世界首个8位可编程微处理器,位可编程微处理器,主频提升主频提升8倍,可进行数据倍,可进行数据/字符处理,支持字符处理,支持中断中断资料来源:wikichip,intel 8008 datasheet(1978)8008架构框图架构框图-与与4004变化不大变化不大8008与4004很相似,但4位升级成8位,主频提升8倍,性能极大提升性能极大提升,首次支持算术之外的指令首次支持算术之外的指令,完成了从计算器到计算完成了从计算

86、器到计算机的跨越机的跨越。8008在4004之后5个月推出,架构与4004相似性高,只有1个8位ALU。对比4004,晶体管增加了50%,时钟速度是其8倍,支持16KB RAM/ROM(4倍),支持48条指令以及中断功能,并能够进行数据/字符操作,而4004只能处理算术。与4004相似的数据寄存器组,数据宽度变成8位与4004相似的时序与控制单元,增加了外部中断功能,可以暂时放下当前任务去响应突发事件与4004相似的ALU,只是从4位数据宽度变成8位数据宽度与4004相似的FLAG、指令寄存器、指令解码器与4004相似的地址寄存器组,数量增加,地址宽度变成14位353.2.3.早期时代:早期时

87、代:8080,再强,再强10倍,从理论上的计算机到商业上的计算机倍,从理论上的计算机到商业上的计算机8080 1974/4工艺制程/面积:6m,nMOS,20.1mm2晶体管数量:4.5k主频:2.08MHz技术突破:主频提升4倍,性能比上一代提性能比上一代提升升10倍倍,每秒可执行29万条指令;多种辅助芯片,如8257 DMA控制器、8259中断中断控制器控制器等;支持;支持244条指令条指令资料来源:Intel MCS-80 User Manual(1977),中信证券研究部8080架构框图架构框图-集成多种控制功能集成多种控制功能8080支持的指令数从48提升到244,工艺改善带来主频4

88、倍提升,性能提升性能提升10倍倍,解决了8008时钟频率低、引脚少等问题,实用性大大提高实用性大大提高,用于第一款用于第一款PC Altair 8800,造成电脑销售历史上第一次缺货造成电脑销售历史上第一次缺货增加了更多控制功能,计算机系统更为复杂,走向实用化新增10进制转换电路,可直接用10进制编程基本架构与4004/8008高度相似多种电源电压,比8008更复杂363.2.4.早期时代:早期时代:8085,工艺提升持续集成,从复杂回归简单的计算机,工艺提升持续集成,从复杂回归简单的计算机资料来源:Intel MCS-85 User Manual(1983)8085 1977工艺制程:3m晶

89、体管数量:6.5k主频:3/5/6MHz技术突破:8080后续历经8080A、8085、8085A等改进版,8085进行了大规模集成进行了大规模集成(包括时钟、系统控制、串行通信等芯片),简化了供电,大幅减少了外围元器件数,大幅减少了外围元器件数量;支持量;支持246条指令条指令8085大幅减少外围器件数量大幅减少外围器件数量8080 微处理器微处理器8085 微处理器微处理器8 个专用引脚作为数据总线(D0到 D7)多路复用 8 位数据引脚(AD0到 AD7)存在 16 个地址引脚(A0到A15)8 引脚高位地址总线(A8到A15)和 8 个多路复用地址总线(AD0到 AD7),并存在地址锁

90、存使能(ALE)引脚。电源电压为+5、-5 和+12 伏电源仅为+5 伏。存在单中断引脚(INT)使用INT,还有四个中断引脚(TRAP,RST7.5,RST6.5,RST5.5)串行通信设备不存在串行通信功能提供 SID、SOD 引脚和 RIM、SIM 指令需要用于时钟和系统控制的附加芯片时钟和系统控制任务不需要额外的芯片。资料来源:Comparison of Intel 8080 with Intel 8085,中信证券研究部8080与与8085的主要区别的主要区别8085是8080的改进版,集成大量外部功能集成大量外部功能,减少外部元件减少外部元件,整个计算机系统大幅简化整个计算机系统大

91、幅简化,降低了组成计算机的门槛降低了组成计算机的门槛。373.3x86时代:持续兼容保持战略定力,兼容前提下自我革命提升性能时代:持续兼容保持战略定力,兼容前提下自我革命提升性能资料来源:wind,中信证券研究部1982-1993 Intel与与AMD股价股价8080以后以后,Intel最大的竞争对手是最大的竞争对手是Motorola,其次还有其次还有Zilog、MOS等公司等公司,对手产品性能并不比对手产品性能并不比Intel差差。根据快科技大伟的信息,MC6800接近8080,MC6809/MOS6502接近8085,MC68000接近8086,MC68010接近80286,MC68020

92、接近80386,MC68040接近i486。但后期Zilog的Z280、Z28000,MOS的6500系列等已经无法与Intel和Motorola竞争。让让Intel在与在与Motorola的竞争中取得胜利的关键就在于兼容性的竞争中取得胜利的关键就在于兼容性,而而Motorola因为没有保证兼容性导致客户升级换代成本太因为没有保证兼容性导致客户升级换代成本太高高。架构设计是决定兼容性的主要因素架构设计是决定兼容性的主要因素。051015202500.511.522.----011984-03

93、---------------------031991-0

94、-------091993-11英特尔复权收盘价(左轴)AMD复权收盘价(右轴)8028680386i486383.3x86时代:持续兼容保持战略定力,兼容前提下自我革命提升性能时代:持续兼容保持战略定力,兼容前提下自我革命提升性能资料来源:wind,中信证券研究部1982-1993 Intel与与AMD股价股价在在80286以后以后,Intel逐渐在逐渐在PC处理器市场击败处理器市场击败Motorola,但新的竞争

95、对手接踵而来但新的竞争对手接踵而来,Intel面临面临RISC阵营的严峻挑战阵营的严峻挑战。Intel也意识到RISC的优势十分明显,x86的历史包袱十分沉重,因此多次尝试转型到x86以外的架构,以重新夺取性能制高点,但最终让最终让Intel取胜的取胜的,还是还是x86,兼容性兼容性、生态优势大于技术优势这一逻辑得到反复验证生态优势大于技术优势这一逻辑得到反复验证。根据Technews信息,以1993年上市的IBM PowerPC 601为例,晶体管数目仅280万,采用0.6um制程,面积仅121mm2,却有比310万晶体管的Pentium更高的80MHz主频、更大一倍的32kB指令/数据共用

96、L1,与1.5倍的指令执行能力,而采用0.8um(800nm)制程的初代Pentium是一颗16.717.6mm、294mm2的大芯片,相较于同等级相较于同等级RISC处理器处理器,Pentium有约有约30%晶体管都是为了晶体管都是为了x86指令集的相容性指令集的相容性。同期同期MIPS R10000 的的SPEC fp92 浮点性能还是浮点性能还是Pentium Pro 的的3倍以上倍以上。051015202500.511.522.-----051984-071

97、---------------------071991-09

98、------091993-11英特尔复权收盘价(左轴)AMD复权收盘价(右轴)8028680386i486393.3.1.x86时代:时代:8086/8088,引入指令队列和多处理器,掀起,引入指令队列和多处理器,掀起PC浪潮浪潮80861978/8088-1979工艺:3m晶体管数量:29k主频:5MHz1980推出8087浮点协处理器(FPU);支持多路支持多路处理器系统处理器系统;8086的简配版8088被IBM用于model 5150

99、PC8086比比8080性能提高性能提高10倍倍资料来源:Intel 8086 Family User Manual(1979),中信证券研究部8086支持多处理器支持多处理器8086为起点为起点,开创了著名的开创了著名的x86指令集指令集8088是是8086的减配版的减配版,首次应用于首次应用于IBM PC,开启开启PC时代时代8086为多路处理器系统进行了优化适配相对性能表现403.3.1.x86时代:时代:8086/8088,引入指令队列,微架构初步发展,引入指令队列,微架构初步发展8086 1978/8088-1979技术突破:将单个处理器分为将单个处理器分为BIU(总线接口单元)和(

100、总线接口单元)和EU(执行单元)两部分并独立运行(执行单元)两部分并独立运行,形成当今CPU前后端的雏形;具备具备6字节指令队字节指令队列列提高EU和总线利用率8086将处理器分为将处理器分为BIU和和EU并出现了指令队列并出现了指令队列资料来源:Intel 8086 Family User Manual(1979),中信证券研究部8086的的EU和和BIU独立运行,提高利用率独立运行,提高利用率资料来源:Intel 8086 Family User Manual(1979),中信证券研究部8086首次引入6字节指令队列8086首次将CPU分成总线单元和执行单元,形成前后端分工以往处理器只能顺

101、序执行各个工序,导致资源浪费,每个单元都有大量时间闲置8086/8088实现前后端分离后可以分别独立工作,闲置时间大大减少,总线单元基本实现满负荷工作413.3.2.x86时代:时代:80286,引入流水线并持续兼容,在,引入流水线并持续兼容,在PC行业独步天下行业独步天下80286-1982工艺:1.5m晶体管数量:134k主频:6MHz技术突破:Intel首次采用流水线技术(首次采用流水线技术(3级);在级);在8086基础上,基础上,BIU进一步分为进一步分为AU(地址单元)、(地址单元)、BU(总线单元)、(总线单元)、IU(指令(指令单元)单元),更接近如今处理器前端;6字节预取指令

102、队列,字节预取指令队列,3解码后解码后指令队列指令队列;IPC达到0.21;推出地址保护模式保护模式以同时保持兼容性和大容量内存(24位地址)访问功能;1984年用于IBM PC/AT80286微架构框图微架构框图80286支持流水线技术支持流水线技术资料来源:Intel 80286 Family Hardware Reference Manual(1987),中信证券研究部资料来源:Intel 80286 Family Hardware Reference Manual(1987),中信证券研究部80286是击败主要竞争对手摩托罗拉的关键一代是击败主要竞争对手摩托罗拉的关键一代,最主要因最主

103、要因素在于素在于80286对于前代产品保持兼容对于前代产品保持兼容。80286通过推出实和保护两种模式来实现了与以前处理器的兼容。而摩托罗拉的MC68000系列则对前代并非完全兼容,比如68010(从性能来看与80286相当)虽然与68000(性能相当于8086)引脚兼容,但指令并非全部兼容。前端引入指令预取队列和解码后指令队列,可显著提高性能流水线可以大大增加指令吞吐量(同样时间内执行的指令数量,可用同样宽度内的方块数量代表)资料来源:Intel 80286 Family Hardware Reference Manual(1987),中信证券研究部42自自80年代年代RISC处理器兴起后处

104、理器兴起后,尤其是尤其是80286后的几代产品后的几代产品,CISC阵营的劣势愈发凸显阵营的劣势愈发凸显,其最大的劣势在于其使用长度不定其最大的劣势在于其使用长度不定的指令的指令,且且x86还需要为了保持兼容付出性能代价还需要为了保持兼容付出性能代价,因此因此Intel、AMD、DEC等公司都在做等公司都在做RISC方面的尝试方面的尝试资料来源:AMD64 Architecture Programmers Manual Volume 3,中信证券研究部典型典型x86指令使用的位数示意指令使用的位数示意3.3.3.x86时代的异响:时代的异响:RISC对对CISC展现优势展现优势X86指令构成指

105、令构成资料来源:AMD64 Architecture Programmers Manual Volume 3,中信证券研究部X86等CISC指令集由于历史原因,普遍采用长度不一致的指令,比如x86指令最长可以达到15字节,而最短的指令只有1字节433.3.3.x86时代的异响:时代的异响:i960/i860,CISC的自我怀疑的自我怀疑i960-1985Intel的首个RISC处理器,32位超标量i位位RISC,比,比AMD64早十余年早十余年i860 die shot资料来源:IEEE Micro:Introducing the i860 Microprocessor(1

106、989)资料来源:TechNews科技新报从Pentium回顾x86处理器到底哪里难做,中信证券研究部初代初代Pentium die shot从初代奔腾结构图可以看出,x86 CPU为了处理长短不一的指令,并保持对前代CPU的兼容性,将巨大面积贡献给取指令、指令解码、控制逻辑、复杂指令支持等单元。(由于指令长度可变且较为复杂,CPU很难在瞬间判断出这一串01数字该到哪里结束才是一条完整指令)从Intel自研的i860处理器可见,采用RISC后,指令长度固定,且不需要背负兼容性包袱,前述各类单元大各类单元大大简化大简化,几乎不占据主要面积,在图中已经无需单独划分区域进行标注,性能和成本优势十分明

107、显。性能和成本优势十分明显。资料来源:i860用户手册和i960用户手册,中信证券研究部443.3.3.x86时代的异响:时代的异响:i960/i860,Intel尝试自我革命尝试自我革命i860寄存器配置寄存器配置i860支持的汇编指令支持的汇编指令资料来源:intel i860 Programmers Reference(1989),中信证券研究部资料来源:IEEE Micro:Introducing the i860 Microprocessor(1989),中信证券研究部Intel设计的RISC处理器向主流RISC理念靠拢,采用了大量的寄存器,其中i860具备32个整数寄存器,32个浮

108、点寄存器,以及若干专用寄存器,数量远超x86架构。数据只有读取到寄存器中才能操作,有利于大幅简化指令体系。i860采取全新的汇编指令体系,与x86的汇编指令完全不同。453.3.4.x86时代:时代:80386,引入高速缓存与虚拟地址,步入多任务时代,引入高速缓存与虚拟地址,步入多任务时代80386-1984工艺:1.5m晶体管数量:275k主频:16MHz技术突破:取代1981年推出的失败的iAPX432,成为Intel首个量产的首个量产的32位位CPU;为克服内存墙,引入高高速缓存系统速缓存系统(位于主板上);引入引入TLB,支持页表、内存虚拟地址,支持页表、内存虚拟地址,对每个程序支持对

109、每个程序支持flat内存模型,即内存模型,即支持多任务支持多任务/虚拟机,对微软操作系虚拟机,对微软操作系统发展有重要影响统发展有重要影响;设计团队后来在i386基础上设计P6;开启Compaq的PC克隆时代,大批“IBM兼容机”诞生80386首次引入高速缓存系统首次引入高速缓存系统80386引入引入TLB和页表,开启多任务时代和页表,开启多任务时代资料来源:Intel 80386 Hardware Reference Manual(1986),中信证券研究部资料来源:Intel 80386 Hardware Reference Manual(1986),中信证券研究部80386再次体现兼容性

110、的重要性再次体现兼容性的重要性。Intel此前曾推出过试图领先时代的此前曾推出过试图领先时代的32位处理器位处理器iAPX432,但由于指令集不相容但由于指令集不相容,且性能不足且性能不足,产品未能成功产品未能成功。iAPX(Intel Advanced Processor Architecture)属于CISC,开始于1975年,当时8080刚量产,1981年面世,不仅不与x86共享指令集,且性能只有80286的四分之一。80386作为兼容作为兼容x86的的32位处理器位处理器,在保证兼容前代的产品下在保证兼容前代的产品下,性能优秀性能优秀,获得市场成功获得市场成功。页表(Page Tran

111、slator)和TLB(页表的高速缓存,加快页表运行速度)的引入对于同时运行多个程序十分重要。加入这一机制后,每个程序都认为自己独享内存,而操作系统可以给不同程序灵活分配内存高速缓存Cache采用纯晶体管制作,而内存DRAM采用晶体管和电容,速度很慢,将常用信息存储在Cache中能够显著提高运行速度资料来源:Intel 80386 Hardware Reference Manual(1986),中信证券研究部463.3.5.x86时代:时代:i486,集成缓存与,集成缓存与FPU,解决,解决90%内存读取需求内存读取需求80486-1989工艺:1m晶体管数量:1.2m主频:25MHz技术突破

112、:集成集成8KB片上片上缓存缓存(L1),解决了,解决了90-95%的内存读取需求,减少内的内存读取需求,减少内存访问以缓解内存墙问存访问以缓解内存墙问题题;可使用外部二级缓存,进一步减少内存读取;集成集成FPU,支持浮点,支持浮点运算指令运算指令,无需浮点协处理器;IPC超过超过1;超过100万晶体管资料来源:Intel i486 Hardware Reference Manual(1990),中信证券研究部i486内部微架构内部微架构i486 5级流水线时空图级流水线时空图资料来源:Intel Pentium Processor Users Manual Volume 1(1993)i48

113、6和的流水线技术真正进入较为成熟的阶段,包含5级,PF为指令预取,D1阶段指令解码,D2阶段计算内存操作数地址,EX执行,WB写回。X86的的i486与与RISC的的i860同样同样在在1989推出推出,但但486大获成功大获成功而而i860系列没有延续下来系列没有延续下来,体体现出生态的重要性大于性能现出生态的重要性大于性能。根据Intel在硬件参考手册中的信息,片上一级缓存能够解决90%的读取需求,极大减少内存读写次数,提高系统性能i486集成浮点处理器,更加便于使用,从8087到80387的一系列浮点协处理器退出主流市场资料来源:Intel i486 Hardware Reference

114、 Manual(1990),中信证券研究部473.4 奔腾时代:持续创新吸收技术,性能与生态综合领先奔腾时代:持续创新吸收技术,性能与生态综合领先资料来源:wind,中信证券研究部1993-2006 Intel与与AMD股价股价奔腾时代奔腾时代Intel最大的特点是最大的特点是“高端高端PC芯片芯片”,击败击败Motorola后低端又面临后低端又面临AMD和和Cyrix等公司的竞争等公司的竞争,凭借持续的架构凭借持续的架构技术引进以及工艺领先维持与技术引进以及工艺领先维持与AMD、Cyrix等公司的性能等公司的性能、产品档次差距产品档次差距。Intel在高端在高端PC芯片基础上衍生出低端芯片基

115、础上衍生出低端PC芯片和芯片和PC服务器芯片服务器芯片,与各界竞争对手全面竞争与各界竞争对手全面竞争,并凭借大生态优势在服务器并凭借大生态优势在服务器市场取得胜利市场取得胜利,凭借技术性能优势在凭借技术性能优势在PC市场维持领先地位市场维持领先地位。055404550055404550英特尔复权收盘价(左轴)AMD复权收盘价(右轴)初代奔腾4-Willamette,Netburst架构第二代奔腾4-Northwood,Netburst架构第三代奔腾4-Prescott,Netburst架构末代奔腾4-Cedar Mill,Netburst架构奔腾Pr

116、o,P6架构奔腾MMX,P5架构奔腾,P5架构奔腾2,P6架构奔腾3,P6架构483.4.奔腾时代:从摇摆不定到专注奔腾时代:从摇摆不定到专注x86,造就,造就PC时代经典时代经典资料来源:Ofri Wechsler:Inside Intel Core Microarchitecture,Intel IDF 2006:Stephen L.Smith&Bob Valentine:Intel Core Microarchitecture,wikichip,中信证券研究部奔腾移动端微架构命名为Banias,基于基于P6架构而来架构而来,其中产生了 Pentium III M 的Tualatin等经典

117、核心,成为后来成为后来Core Duo的的核心架构基础核心架构基础Pentium时代时代Intel的四大架构的四大架构Pentium时代,x86指令集暴露的出多种问题仍然存在,因此继继i960/i860后后,Intel也也在在x86之外进行探索之外进行探索,产出了不与此前兼容产出了不与此前兼容的的64位位Itanium系列系列处 理 器处 理 器,并 收 购 了并 收 购 了ARM架构的架构的Xscale处处理器理器,但反而都不如但反而都不如x86 的的 Pentium 系 列系 列成功成功493.4.1.奔腾时代:奔腾时代:P5,双流水线实现超标量,双流水线实现超标量,SIMD强化多媒体强化

118、多媒体P5-1993工艺:0.8/0.6/0.35m晶体管数量:3.1m,4.5m(Pentium MMX)主频:66MHzPentium采用U、V双流水线(双流水线(5级,仅支持整型),实现了多指令发射级,仅支持整型),实现了多指令发射/超标量,其中超标量,其中U流水线可执行任意整型指令,流水线可执行任意整型指令,V流水线只能执行简单指流水线只能执行简单指令;令;L1增大为增大为16KB,并且分成,并且分成L1I和和L1D;引入分支预测,;引入分支预测,1997推出Pentium MMX,其流水线可处理浮点数,级数从,其流水线可处理浮点数,级数从5增加到增加到6(F阶段进行前缀解码等);19

119、98 AMD 3D Now!可处理单精度FPPentium处理器内部架构,双流水线、双处理器内部架构,双流水线、双L1缓存、分支预测缓存、分支预测Pentium与与Pentium MMX超标量流水线时空图超标量流水线时空图资料来源:Intel Pentium Processor Family Developers Manual(1997)资料来源:Intel Pentium Processor Users Manual Volume 1(1993),中信证券研究部503.4.2.奔腾时代:奔腾时代:P6,采用乱序执行,流水线支持浮点,采用乱序执行,流水线支持浮点资料来源:Pentium Pro

120、 Family Developers Manual Volume 2(1996),中信证券研究部P6-1995工艺:350nm(Pentium Pro/P2 Klamath),250nm(P2M Tonga,P2 Deschutes),180nm(P3)晶体管数量:5.5m(Pentium Pro),7.5m(P2 Klamath),9.5m(P3)主频:150MHz(P Pro),300MHz(P2 Klamath),500MHz(P3)1995 Pentium Pro使用12级流水线,每一级比级流水线,每一级比Pentium快快33%;采用超标量设计,共超标量设计,共3条流水线条流水线,其

121、中2条支持整型,1条支持浮点;支持乱序执行乱序执行;集成二级片上缓存集成二级片上缓存1998推出Celeron,在Pentium的基础上去掉片上L2缓存1998年推出Xeon1999年Pentium III增加SSE指令集指令集,支持浮点向量运算Pentium Pro架构框图架构框图P6堪称堪称Intel历史上最重要的架构之一历史上最重要的架构之一,覆盖了奔腾覆盖了奔腾Pro、奔腾奔腾2、奔腾奔腾3三代产品三代产品,并且在并且在P6架构上衍生出架构上衍生出Xeon至至强强、Celeron赛扬赛扬、Centrino迅驰三条著名的产品线迅驰三条著名的产品线,分分别面向服务器别面向服务器、低端桌面级

122、低端桌面级、移动端三大市场移动端三大市场,后续的后续的Core架构也是在架构也是在P6架构的奔腾架构的奔腾3移动版基础上改进而来移动版基础上改进而来奔腾Pro是P6架构的首款处理器,最重要的改变是引入了乱序执行,具体来说包含寄存器重命名、指令重排序等技术资料来源:Pentium Pro Family Developers Manual Volume 2(1996),中信证券研究部513.4.3.奔腾时代:奔腾时代:Netburst超深流水线冲击高频,面临功耗问题超深流水线冲击高频,面临功耗问题整个整个Netburst架构的核心目标就是高频架构的核心目标就是高频,超深流水线为此目标服务超深流水线

123、为此目标服务,最终撞上功耗墙最终撞上功耗墙,实现实现3.8GHz主频主频,对应的奔腾对应的奔腾4产品线也因此失败产品线也因此失败由于效果不佳,原计划推出的Enhanced Netburst架构于2004年取消Netburst-2000工艺:180nm(Willamette),130nm(Northwood),90nm(Prescott)晶体管数量:42m(Willamette),55m(Northwood),169m(Prescott)主频:1.5GHz(Willamette),3.8GHz(Prescott)2002年P4 Northwood引入超线程超线程(Hyper-Threading为

124、分时多线程技术);支持三级三级缓存缓存;超流水线超流水线(双ALU);超深流水线超深流水线,Willamette 20级,级,Prescott 31级级;Prescott AMD64;2005 Pentium D双核21世纪初业内对功耗墙的认知还不够清晰,目标不切实际,认为5年后就能实现10GHz“These clock rates for future IA-32 processor based on the Intel NetBurst micro-architecture is expected to reach 10 GHz.”资料来源:wikichip:Enhanced Netbur

125、st,中信证券研究部处理器频率发展趋势与处理器频率发展趋势与Intel预期预期资料来源:wikichip:Enhanced Netburst,中信证券研究部523.5 多核时代:性能转向能效,市场持续正反馈多核时代:性能转向能效,市场持续正反馈资料来源:wind,中信证券研究部2006-2015年年 Intel与与AMD股价股价奔腾时代末期奔腾时代末期,基本只剩下基本只剩下Intel、AMD两大主流厂商占据两大主流厂商占据PC市场市场,服务器市场的大多数非服务器市场的大多数非x86厂商也已经退出厂商也已经退出。Core架构是架构是Intel、AMD竞争的一个关键转折点竞争的一个关键转折点,In

126、tel在此代产品选择放弃Netburst架构,退回到移动端P6架构,不再单不再单一追求单核性能一追求单核性能,而是转向能效比以及多核性能而是转向能效比以及多核性能,并且接连推出双核与并且接连推出双核与4核产品核产品,产品节奏加快产品节奏加快,迫使迫使AMD再次退守低再次退守低端市场端市场,Intel利用利用Tick-Tock战略持续扩大优势战略持续扩大优势。Intel Tick-Tock能够奏效的一个关键原因是从能够奏效的一个关键原因是从“三轨并行三轨并行”的状态的状态(服务器端Itanium架构/产品线,桌面端Netburst架构/奔腾产品线,笔记本端Pentium M/迅驰产品线)转向统一

127、的酷睿架构转向统一的酷睿架构,研发资源高度集中研发资源高度集中,形成对形成对AMD的资源优势的资源优势。0554045051015202530---------------112011-0

128、--------------092015-11英特尔复权收盘价(左轴)AMD复权收盘价(右轴)Nehalem架构,初代酷睿iCore架构,初代酷睿Sandy Bridge架构,第2代酷睿iHaswell架构,第4代酷睿iSkylake架构

129、,第6代酷睿i53功耗P与电压的三次方成正比,或与频率的三次方成正比,同样工艺下频率与电压成正比随着主频不断提升随着主频不断提升,处理器功耗明显提升处理器功耗明显提升,甚至单个指令的功耗也不断提升甚至单个指令的功耗也不断提升靠单核性能提升不可持续,面临功耗墙,必须采用其他方法提升处理器整体性能多核心资料来源:Intel IDF 2006:Intel DEG CTO Steve Pawlowski:Intel Core Microarchitecture资料来源:Intel IDF 2006:Intel CTO Justin Rattner:Energy:The Next Frontier199

130、0-2005处理器功耗指数级增加处理器功耗指数级增加历代历代Pentium处理器单指令能耗不断增加处理器单指令能耗不断增加3.5.多核时代:单核性能面临功耗墙,多核成为必然选择多核时代:单核性能面临功耗墙,多核成为必然选择54Core架构的诞生也伴随第一代架构的诞生也伴随第一代Core CPU的诞生的诞生,能效大幅提升能效大幅提升,相比相比2005年的奔腾年的奔腾4,2006年的年的Core Duo处理器执行处理器执行一条指令的能耗只有原来的一条指令的能耗只有原来的20%左右左右,同等功率下同等功率下,服务器端服务器端Core处理器性能表现提高处理器性能表现提高80%。优秀的表现让优秀的表现让

131、Intel在在PC与与服务器市场重新获取主动权服务器市场重新获取主动权,在多年内没有受到有力挑战在多年内没有受到有力挑战。资料来源:Intel IDF 2006:Intel CTO Justin Rattner:Energy:The Next Frontier,wikichipCore架构以能效为首要考量,实现单指令功耗大幅下降架构以能效为首要考量,实现单指令功耗大幅下降3.5.1.Core:功耗墙解决方案,能效表现飞跃提升:功耗墙解决方案,能效表现飞跃提升Core架构实现架构实现SPEC整数性能大幅提升整数性能大幅提升资料来源:Intel Software College:Processor

132、 Architecture-Core,wikichip,中信证券研究部(左上图、左下图)Core-2006/4工艺:65nm制程,面积143mm2(Woodcrest)晶体管数量:291m(Woodcrest)技术突破:共享二级缓存共享二级缓存,真正意义上的双核处理器真正意义上的双核处理器,从高主频路线转向多核路线,降低流水线级数降低流水线级数(14),能效成倍提升;SSE酷睿相比前代,同等功率下SPEC跑分甚至可提高80%,性能明显提升55Core架构为何能够如此成功架构为何能够如此成功?主要原因是主要原因是Intel完成了两大战略方向转变完成了两大战略方向转变,第一是产品研发思路转变第一是

133、产品研发思路转变,收缩产品线收缩产品线,集中集中全部研发资源设计全部研发资源设计Core,第二是营销思路转变第二是营销思路转变,从追求极致高频性能转向宁可降低主频从追求极致高频性能转向宁可降低主频,追求综合能效追求综合能效。Intel全面转向全面转向Core架构,全面集中战略资源架构,全面集中战略资源3.5.1.Core:成功源自战略转向,追求高能效与研发资源集中:成功源自战略转向,追求高能效与研发资源集中资料来源:Intel IDF 2006:Intel DEG VP Stephen L.Smith&Intel IAG Architect Bob Valentine:Intel Core M

134、icroarchitecture,中信证券研究部资料来源:Intel IDF 2006:Intel CTO Justin Rattner:Energy:The Next Frontier,中信证券研究部Intel战略思想改变,降频求能效提升战略思想改变,降频求能效提升降频20%,能耗降低49%,性能只降低14%超频20%,性能提升13%,能耗提升73%Woodcrest、Conroe、Merom分别是Core架构的服务器、桌面、移动版本,架构统一化集中研发资源56从更具体的技术层面看,Core的成功有何架构技术基础?Core架构以此前表现优异的的Pentium III-M处理器Tualatin

135、核心为基础,融合Netburst架构新技术创新而成。Core包含五大核心架构创新:宽动态执行(4流水线,深度14级),数字媒体加速(SSE4指令集),智能缓存(共享L2),智能内存访问(改进指令预取,内存消歧),先进功耗调节(降低频率)资料来源:Intel Software College:Processor Architecture-Core,wikichip资料来源:Intel IDF 2006:Intel CTO Justin Rattner:Energy:The Next Frontier,wikichip,中信证券研究部Core架构框图架构框图Core架构五大新技术架构五大新技术3.

136、5.1.Core:Tualatin核心改进为核心改进为Conroe核心,降频融核获取高能效核心,降频融核获取高能效4宽度14级流水线;微指令融合单周期128位SSE(SSE4.1)共享L2缓存先进指令预取;内存消歧先进功耗调节57资料来源:Intel IDF 2008:Steve Gunther&Ronak Singhal:Nehalem Family,中信证券研究部NehalemNehalem增加增加L3L3缓存并且每个核心都有缓存并且每个核心都有QPIQPI高速总线高速总线3.5.2.Nehalem:初代:初代Core i,总线,总线/访存访存/缓存为多核深入优化缓存为多核深入优化Neha

137、lem-2008/8工艺:45nm HKMG,面积263mm2(Bloomfield)晶体管数量:731m(Bloomfield)技术突破:单芯片单芯片4核,三级缓存,核,三级缓存,QPI总线,总线,Ringbus,睿,睿频技术(频技术(Turbo Boost),单核心功耗控制,),单核心功耗控制,SSE4.2资料来源:wikichip:coffee lake,中信证券研究部初代初代CoreCore架构与架构与NehalemNehalem芯片架构的区别芯片架构的区别Nehalem架构对应初代酷睿架构对应初代酷睿i CPU,从此酷睿系列产品线有了比较明确的产品档次划分和命名方式从此酷睿系列产品线

138、有了比较明确的产品档次划分和命名方式,对于营销有利对于营销有利。从架构与技术角度来看从架构与技术角度来看,Nehalem架构扩大了架构扩大了Core的技术优势的技术优势,进一步树立了进一步树立了Core i系列高性能形象系列高性能形象。总线方面,Nehalem用QPI总线取代了原先的FSB总线,每个核心可以单独访问外部,无需像原来一样多个核心竞争FSB总线带宽,在总线方面也做到不输AMD缓存方面,Nehalem架构在芯片内部集成了共享L3,比初代Core只有L2性能更强内存访问方面,Nehalem架构直接在芯片内集成了内存控制器,而不是原先的分立芯片,访存性能大幅提升58资料来源:Intel

139、IDF 2008:Steve Gunther&Ronak Singhal:Nehalem Family超线程技术回归为超线程技术回归为NehalemNehalem架构带来架构带来SPECSPEC性能大幅提升性能大幅提升资料来源:Intel IDF 2008:Steve Gunther&Ronak Singhal:Nehalem FamilyNehalemNehalem首次允许不同核心进入不同工作状态并分别管理功耗首次允许不同核心进入不同工作状态并分别管理功耗3.5.2.Nehalem:允许每个核心单独调节功耗,超线程技术回归:允许每个核心单独调节功耗,超线程技术回归Nehalem架构对应初代酷

140、睿架构对应初代酷睿i CPU,从此酷睿系列产品线有了比较明确的产品档次划分和命名方式从此酷睿系列产品线有了比较明确的产品档次划分和命名方式,对于营销有利对于营销有利。从架构与技术角度来看从架构与技术角度来看,Nehalem架构扩大了架构扩大了Core的技术优势的技术优势,进一步树立了进一步树立了Core i系列高性能形象系列高性能形象。经过几年前奔腾4、Core的市场教育,超线程技术接受度得到提高,更多应用支持超线程;并且Nehalem的总线带宽明显改善。两方面因素为超线程技术回归创造了条件,Nehalem超线程为其带来了明显的性能提升,在部分应用中可达30%以上。由于核心数较多,不同核心负责

141、不同任务,则每个核心单独控制最有利于控制功耗。Nehalem首次能够让不同核心单独控制功耗状态。图中展示了4核心处理器在不同核心执行不同任务时的功耗状态,如果核心闲置,功耗可以非常接近于0。59资料来源:wikichip:Coffee Lake,中信证券研究部Sandy Bridge Sandy Bridge 架构相比前代变化架构相比前代变化资料来源:wikichip:Sandy Bridge(client),中信证券研究部Sandy Bridge 4Sandy Bridge 4核版本核版本 die shotdie shot3.5.3.Sandy Bridge:Netburst后首个全新微架构

142、,重点转向后首个全新微架构,重点转向SoC层面层面2010/9工艺:32nm HKMG,面积216mm2(4核心GT1)晶体管数量:1.16b(4核心GT1)技术突破:融合融合P6衍生系列与衍生系列与Netburst,首次将集显、内存,首次将集显、内存控制器、外部总线控制器集成在核心单芯片,控制器、外部总线控制器集成在核心单芯片,AVX指令集,指令集,Ring bus实现可扩展,睿频实现可扩展,睿频2.0Sandy Bridge对应第二代对应第二代Core i以及第一代至强以及第一代至强E5,集成了集成了GPU和系统代理和系统代理(包含各类对外连接包含各类对外连接),有较明显的性能提有较明显的

143、性能提升升,整体性价比进一步增强整体性价比进一步增强,强化强化Intel市场地位市场地位。Sandy Bridge将DMI总线、PCIe接口、显示控制等外部接口整合到System Agent部分,同时集成核显,提高集成度和性价比。Sandy Bridge用Ring bus取代了QPI总线,不同核心之间的协作更加紧密,延迟降低,带宽提高,对多核性能有提升60资料来源:wikichip:Sandy Bridge(client),中信证券研究部从从P5P5架构到架构到Sandy BridgeSandy Bridge架构的演进,博采众长使架构的演进,博采众长使4 4代代Core Core i i成为经

144、典成为经典3.5.3.Sandy Bridge:Netburst后首个全新微架构,重点转向后首个全新微架构,重点转向SoC层面层面资料来源:AnandTech:Intel Haswell Architecture AnalyzedNehalemNehalem前端前端资料来源:AnandTech:Intel Haswell Architecture Analyzed,中信证券研究部Sandy BridgeSandy Bridge前端前端此前的奔腾M、Core、Nehalem等架构都是基于 P6 改 进 而 来,与Netburst完全独立,而Sandy Bridge经过全新设计,融合了Netbur

145、st相关技术,比如增加了解码后微指令缓存等结构,博采众长,性能优秀。Sandy Bridge新增微指令缓存,近期已经解码过的指令无需再进行解码,能够大大节约前端解码单元功耗Sandy Bridge全新设计分支预测器,提升准确率,提升单核性能613.5.4.Haswell:延续:延续Sandy Bridge架构,针对笔电强化超低功耗表现架构,针对笔电强化超低功耗表现Haswell 2013/6工艺:22nm FinFET,面积177mm2(4核心GT2)晶体管数量:1.4b(4核心GT2)技术改进:能效比达到Nehalem 3.5倍,缓存间带宽翻倍,DDR4,AVX2指令集,BMI1/BMI2指

146、令集,FMA3指令集Sandy BridgeSandy Bridge(上)与(上)与HaswellHaswell(下)(下)SoCSoC结构大体相同结构大体相同资料来源:wikichip前四代前四代Core Core i i核心闲置功耗核心闲置功耗资料来源:IDF2012,AnandTechHaswell深度优化了处理器能耗,调整了睡眠设置,使处理器闲置能耗降低到原来的十分之一以下。自自Core以来以来,Intel就将关注重点从桌面转向笔记本电脑就将关注重点从桌面转向笔记本电脑,因因此功耗控制愈发重要此功耗控制愈发重要,第四代第四代Core i所对应的所对应的Haswell架构对架构对功耗进行

147、了深入优化功耗进行了深入优化,让笔记本电脑续航大幅增加让笔记本电脑续航大幅增加,进一步增进一步增强强Intel在笔电市场的竞争力在笔电市场的竞争力。资料来源:IDF2012,AnandTech,中信证券研究部62Sandy BridgeSandy Bridge核心架构后端核心架构后端3.5.4.Haswell:延续:延续Sandy Bridge架构,更多执行单元,架构,更多执行单元,IPC小幅增强小幅增强HaswellHaswell核心架构后端核心架构后端资料来源:wikichip,real world technologies资料来源:wikichip,中信证券研究部性能方面性能方面Hasw

148、ell架构也比前代有所改进架构也比前代有所改进,全面增强笔记本市场竞争力全面增强笔记本市场竞争力。核心微架构方面,前端部分与Sandy Bridge相差不多,主要改进集中在后端,包括更大的乱序执行相关缓存,更多的指令执行单元,更大的读写缓存等。读写性能增强更多执行单元/发射端口乱序执行增强63资料来源:Intel IDF 15:Intel SPE Julius Mandelblat:Code Name Skylake,wikichip,中信证券研究部SkylakeSkylake架构主要改进架构主要改进3.5.5.Skylake:主要改进在于:主要改进在于SoC层面集成层面集成ISP、eDRAM

149、Skylake client-2015/8工艺:14nm FinFET,面积101.83mm2(2核心GT2)晶体管数量:1.75b(2核心GT2)技术改进:尺寸减小,可扩展性增强,多媒体功耗降低,集成ISP,增强超频能力,核显、内存、ringbus改进,软件防护与内存保护扩展,DMI3.0,同频整数性能提升10%Skylake与上一代架构与上一代架构Haswell乃至再上一代乃至再上一代Sandy Bridge相比相比,单核微架构方面改进并不多单核微架构方面改进并不多,微架构已经开始逐微架构已经开始逐渐饱和渐饱和,主要改进放在了主要改进放在了SoC层面层面,但由于市场缺乏有力竞争者但由于市场

150、缺乏有力竞争者,Intel仍然占据完全主导地位仍然占据完全主导地位。SoC层面改进主要包括集成了相机ISP、嵌入式DRAM控制器、更高分辨率显示支持、输入输出接口集成等。资料来源:Intel IDF 15:Intel SPE Julius Mandelblat:Code Name Skylake64资料来源:wikichip:Skylake(client)Skylake die shotSkylake die shot资料来源:wikichip:Sandy Bridge(client)Sandy Bridge die shotSandy Bridge die shot3.5.5.Skylake

151、:芯片布局更改,通信效率与面积利用率更高:芯片布局更改,通信效率与面积利用率更高Skylake与上一代架构与上一代架构Haswell乃至再上一代乃至再上一代Sandy Bridge相比相比,单核微架构方面改进并不多单核微架构方面改进并不多,微架构已经开始逐渐饱微架构已经开始逐渐饱和和,主要改进放在了主要改进放在了SoC层面层面,但由于市场缺乏有力竞争者但由于市场缺乏有力竞争者,Intel仍然占据完全主导地位仍然占据完全主导地位。SoC布局方面,Skylake将四个核心从Nehalem时代开始的直线布局调整成为田字格布局,核心间距离更短,通信延迟更小,且芯片面积利用率更高。此外核显面积明显加大。

152、653.5.5.Skylake:单核改进不大,以量变为主:单核改进不大,以量变为主SkylakeSkylake消费端核心架构后端消费端核心架构后端资料来源:wikichip,中信证券研究部SkylakeSkylake消费端核心架构前端消费端核心架构前端资料来源:wikichip,中信证券研究部Skylake与上一代架构与上一代架构Haswell乃至再上一代乃至再上一代Sandy Bridge相比相比,单核微架构方面改进并不多单核微架构方面改进并不多,微架构已经开始逐渐饱微架构已经开始逐渐饱和和,主要改进放在了主要改进放在了SoC层面层面,但由于市场缺乏有力竞争者但由于市场缺乏有力竞争者,Int

153、el仍然占据完全主导地位仍然占据完全主导地位。单核前端主要是加大了指令队列、微指令缓存等,后端主要加强乱序执行性能,整体来看并无技术突破整体来看并无技术突破,主要是量变主要是量变。乱序执行增强指令队列增强663.5.5.Skylake:服务器与桌面端首次核心不同,支持:服务器与桌面端首次核心不同,支持SIMD增强增强AI计算计算SkylakeSkylake服务器端核心架构后端服务器端核心架构后端资料来源:wikichip:Skylake(Server),中信证券研究部Skylake SP/X/W-2017/5工艺:14nm FinFET,面积694mm2(28核)此前从此前从Celeron到到

154、Xeon都使用相同核都使用相同核心架构心架构,Skylake首次为桌面端和服首次为桌面端和服务器端构建不同核心务器端构建不同核心。服务器端主要服务器端主要强化强化SIMD,有向有向AI迈进的趋势迈进的趋势,其其对应产品为第一代至强可扩展对应产品为第一代至强可扩展,命名命名方式也从方式也从E3/5/7更换为更换为Platinum、Gold、Silver、Bronze。服务器端核心相比桌面端改进主要在后端,强化了SIMD性能,前端基本保持一致首次支持AVX-512,port 0/1可融合支持512位指令,port 4/5直接支持512位操作67资料来源:wikichip:Skylake(Serve

155、r)SkylakeSkylake SPSP XCC die shotXCC die shot3.5.5.Skylake:服务器端使用可扩展设计方便堆核:服务器端使用可扩展设计方便堆核SkylakeSkylake SPSP XCC XCC 架构图与架构图与MeshbusMeshbus资料来源:wikichip:Skylake(Server)服务器端在服务器端在SoC层面的改进:核心间互联从层面的改进:核心间互联从ringbus改为改为meshbus,采用高度可扩展设计采用高度可扩展设计,可便捷组成不同核心数的可便捷组成不同核心数的设计设计,处理器间使用处理器间使用UPI互联互联。这一类改进主要方

156、便堆核这一类改进主要方便堆核。Mesh架构主要构成要素包括Mesh(横向与纵向的半个ringbus构成的网),Tile(模块化可复制的核心IP块,其中又分为Core Tile和IMC Tile,即integrated memory controller Tile),CHA(Caching/Home Agent,用于维持缓存一致性),CMS(Converged/Common Mesh Stop)683.6 减速时代:架构改进取决于工艺,集成与异构成为新趋势减速时代:架构改进取决于工艺,集成与异构成为新趋势资料来源:wind,中信证券研究部2016-2022 Intel与与AMD股价股价Skyla

157、ke架构后架构后,Intel工艺进展不顺工艺进展不顺,连带架构也难以迭代连带架构也难以迭代,导致产品性能逐渐被赶超导致产品性能逐渐被赶超,AMD利用开放大生态是一个关利用开放大生态是一个关键原因键原因。官方宣布Tick-Tock两年周期变为PAO(工艺,架构,优化)三年周期,实际周期明显超过三年工艺放缓与单核架构成熟已成为明显趋势工艺放缓与单核架构成熟已成为明显趋势,通过增加核心通过增加核心、异构集成等方式提升系统整体性能成为不得不走的道路异构集成等方式提升系统整体性能成为不得不走的道路。02040608000506070英特尔复权收盘价(左轴)AM

158、D复权收盘价(右轴)Coffee Lake架构,8代酷睿iKaby Lake架构,7代酷睿iCoffee Lake R架构,9代酷睿iComet Lake架构,10代酷睿i桌面端693.6.1.多核时代的停滞:多核时代的停滞:Skylake后,工艺停滞,架构基本不变后,工艺停滞,架构基本不变更先进的微架构需要晶体管来实现,更多晶体管势必要求更大的面积,更大的面积带来更低的良率与更高的成本工艺的停滞导致面积无法缩小工艺的停滞导致面积无法缩小,对架构的提升有明显制约作用对架构的提升有明显制约作用原计划接替Skylake的第一代第一代10nm处理器处理器Cannon Lake由于制程延迟而未真正大规

159、模量产由于制程延迟而未真正大规模量产,对应的对应的Palm Cove核心也被核心也被取消取消,仅有一款Core i3-8121U双核芯片在2017年底进行了少量生产,并应用在一款面向教育市场的联想笔记本Ideapad330和Intel Crimson Canyon NUC等极少数产品,且该芯片无法使用核显,2020年Linux中上万行服务Cannon Lake核显的代码被删除2019年量产年量产10nm产品产品,直到直到2021年年7月月Intel才官方证实才官方证实10nm晶圆产量超过晶圆产量超过14nm,期间期间Intel为保持产品节奏临时增加为保持产品节奏临时增加了了Kaby Lake、

160、Coffee Lake(包含包含Amber Lake、Whiskey Lake两款低功耗核心两款低功耗核心)、Comet Lake三代三代14nm产品产品,而而架构层面几乎没有变化架构层面几乎没有变化,均维持着与均维持着与Skylake相同的相同的IPC,仅有主频、内存频率、chipset、核心数量、核显等方面提升IntelIntel临时增加的临时增加的14nm14nm架构架构资料来源:wikichip:Sunny CoveIntelIntel历代历代14nm14nm工艺主要增强了驱动电流,有利于提高频率并降低同频功耗工艺主要增强了驱动电流,有利于提高频率并降低同频功耗资料来源:wikichi

161、p:Coffee Lake703.6.1.多核时代的停滞:多核时代的停滞:Skylake后,工艺停滞,架构基本不变后,工艺停滞,架构基本不变Kaby Lake 2016/8工艺:14nm+,126mm2(4核GT2,24EU)变动:沿用沿用Skylake核心架构核心架构,核显从Gen9升级为Gen9.5,主频提升主频提升15%,内存频率从2133升级到2400,增加Optane支持,台式奔腾增加超线程支持Coffee Lake 2017/10工艺:14nm+,126mm2(4核GT2,24EU)变动:沿用沿用Skylake核心架核心架构构,沿用Gen9.5核显,相比上代4核心,增加增加6核产品

162、核产品,LLC相应从8MB增加到12MB,(i3从2c到4c,i5/i7从4c到6c),chipset升级USB/WiFi工艺停滞时代的产品受到面积限制,为维持良率和成本,给新架构提供新空间较为困难,如果只是堆核心,则成本比较可控,可屏蔽损坏的核心,将产品放到下一档次出售Comet Lake 2019/8工艺:14nm+变动:沿用沿用Skylake核心架核心架构构,沿用Gen9.5核显,核心核心数从数从8增加到增加到10,LLC相应从16MB增加到20MB,chipset升级2.5G以太网与WiFi6支持,芯片减薄以增加散热Coffee Lake Refresh 2018/10工艺:14nm+

163、,174mm2(8核)变动:沿用沿用Skylake核心架核心架构构,增加增加8核产品核产品,LLC相应从12MB增加到16MB资料来源:wikichip:Coffee Lake,中信证券研究部713.6.1.多核时代的停滞:多核时代的停滞:Skylake后,工艺停滞,架构基本不变后,工艺停滞,架构基本不变资料来源:Intel 2019 Investor Meeting,wikichip,中信证券研究部Intel服务器服务器CPU路线图路线图服务器端,随着工艺制程的停滞,架构也随之停滞,Skylake SP后两代产品Cascade Lake和Copper Lake均沿用Skylake架构,导致产

164、品性能提升缓慢,相对AMD的原有优势逐渐减弱,乃至被反超Cascade Lake 2019/4工艺:14nm FinFET变化:沿用沿用Skylake SP内核,芯片产品与内核,芯片产品与Skylake引脚兼容(引脚兼容(LGA-3647),增加),增加9200系列(系列(Cascade Lake AP,核心数量增加,最多可达,核心数量增加,最多可达56核以及核以及12个个DDR4通通道)道),继续使用UPI连接,主频提升,内存频率与容量提升,增加Optane支持Copper Lake 2020/6工艺:14nm FinFET变化:单CPU支持UPI连接数从连接数从3提升到提升到6,内存频率升

165、高,封装变为LGA-4189,支持支持BFloat16数据格式以增强数据格式以增强AI性能性能三代产品架构本质上都是Skylake,四年内性能提升较小723.6.1.多核时代的停滞:多核时代的停滞:Skylake后,工艺停滞,架构基本不变后,工艺停滞,架构基本不变服务器端,随着工艺制程的停滞,架构也随之停滞,Skylake SP后两代产品均沿用Skylake架构,Intel开始采用集成和堆核的方式提高产品性能,比如至强9200系列是由2个8200封装而成,达到核心数翻倍的效果。两个两个8200封装成一个封装成一个9200,并可采用,并可采用UPI互联互联资料来源:wikichip:Cascad

166、e Lake AP,中信证券研究部每个9200内部都是两个8200CPU73资料来源:wikichip:Ice Lake(client),中信证券研究部集成集成TB3TB3前(上)与集成后(下)外部布线情况前(上)与集成后(下)外部布线情况资料来源:wikichip:Ice Lake(client)Ice LakeIce Lake SoCSoC架构架构3.6.2.Ice Lake:工艺重启带动架构迭代,:工艺重启带动架构迭代,CPU集成雷电接口集成雷电接口2019/5工艺:10nm,122.52mm2(4核)技术突破:采用全新采用全新Sunny Cove核心,核心,IPC大幅提升,集成大幅提升

167、,集成Thunder Bolt 3控制器,集成神经网络处理器控制器,集成神经网络处理器GNA、第四代、第四代IPU,与与PCH共封装,采用共封装,采用OPI互联互联工艺提升带动集成度和架构再次提升工艺提升带动集成度和架构再次提升。Ice Lake集成雷电集成雷电3(TB3)接口和神经网络加速器接口和神经网络加速器(GNA),为近年来最大规模集为近年来最大规模集成成,同时核心提升也是近年来最大同时核心提升也是近年来最大,可见工艺对架构的重要性可见工艺对架构的重要性集成雷电3接口前,外部需要配置Titan Ridge专用芯片来接入外部设备集成雷电3接口后,外部布线大幅简化743.6.2.Sunny

168、 Cove:工艺重启带动架构迭代,:工艺重启带动架构迭代,IPC提升提升18-20%资料来源:wikichip:Sunny Cove,中信证券研究部Sunny Cove微架构前端微架构前端Sunny Cove用于用于Ice Lake架构的架构的10代移动端酷睿代移动端酷睿,工艺制程提升带来充足的架构升级空间工艺制程提升带来充足的架构升级空间,为为Skylake后第一次大改后第一次大改,SPEC测试中测试中IPC提升提升18-20%,10代酷睿暂时在一定程度上缓解了来自代酷睿暂时在一定程度上缓解了来自AMD的进攻势头的进攻势头指令集方面推出SHA指令与AVX-512扩展,支持神经网络计算,服务器

169、端还包含内存加密指令等相比Skylake微架构全方位提升,从前端来看,解码缓存和指令队列增加,能够让后端利用率更高SkylakeSkylake消费端核心架构前端消费端核心架构前端资料来源:wikichip753.6.2.Sunny Cove:工艺重启带动架构迭代,:工艺重启带动架构迭代,IPC提升提升18-20%资料来源:wikichip:Sunny Cove,中信证券研究部Sunny Cove微架构后端微架构后端Sunny Cove用于用于Ice Lake架构的架构的10代移动端酷睿代移动端酷睿,工艺制程提升带来充足的架构升级空间工艺制程提升带来充足的架构升级空间,为为Skylake后第一次

170、大改后第一次大改,SPEC测试中测试中IPC提升提升18-20%,10代酷睿暂时在一定程度上缓解了来自代酷睿暂时在一定程度上缓解了来自AMD的进攻势头的进攻势头相比Skylake微架构全方位提升,后端发射端口数量增加到10个,分支预测与乱序执行相关缓存也大幅增加,LSU、AGU增加SkylakeSkylake消费端核心架构后端消费端核心架构后端资料来源:wikichip发射端口增加乱序执行强化各类缓存增加读写性能强化执行单元增加分支预测强化763.6.3.Rocket Lake/Tiger Lake:Sunny Cove基础上小改,提升不大基础上小改,提升不大资料来源:Intel 2019 I

171、nvestor MeetingIce Lake到到Tiger Lake路线图路线图Rocket Lake 2021/3工艺:14nm变化:采用Cypress Cove核心,核心,该核心实际为Sunny Cove的14nm放大版,用于桌面端Tiger Lake 2020/9工艺:10nm变化:换用Willow Cove核心核心,该核心在Sunny Cove基础上扩大了L2/L3缓存,增加了LPDDR5支持,提高内存带宽,增加内存加密功能Tiger Lake和Rocket Lake分别用于11代酷睿的移动端和桌面端,本质上都是Sunny Cove的小改版,性能提升不明显,因此在市面上也未能取得良好

172、进展,市场进一步被AMD占据。资料来源:Intel 2019 Investor Meeting,中信证券研究部资料来源:wikichip,中信证券研究部773.7.异构时代:核心微架构基本成熟,场景优化成为关键异构时代:核心微架构基本成熟,场景优化成为关键资料来源:Intel Architecture Day 2018(含预测),wikichip,中信证券研究部Intel异构核心路线图异构核心路线图自Sandy Bridge后,SoC架构演架构演进有所放缓进有所放缓,Skylake后进一步放缓单核微架构主要单核微架构主要技术在多年前就技术在多年前就已成熟已成熟指令集发展也较指令集发展也较为成熟

173、为成熟,边际效用递减,AVX-512等新指令集在大多数场景未收到良好效果借鉴借鉴ARM领域,领域,异构集成提高能异构集成提高能效成为下一步的效成为下一步的合理选择合理选择LakeFieldAlder Lake783.7.1.Lakefield:1 Sunny Cove+4 Tremont,异构集成牛刀初试,异构集成牛刀初试资料来源:Intel 2019 Investor Meeting,wikichip,中信证券研究部Intel Lakefield产品主要特点产品主要特点Sunny Cove大核提升单核性能大核提升单核性能4个个Tremont小核心有更好的多线程表现小核心有更好的多线程表现La

174、kefield 2019工艺:10nm计算核心+22nm基础电路变化:采用采用1 Sunny Cove+4 Tremont的一大四小异构集成设计,能够针对不同应用发的一大四小异构集成设计,能够针对不同应用发挥最佳效果,能效比显著提升,采用挥最佳效果,能效比显著提升,采用Foveros先进封装,先进封装,10nm和和22nm共同封装降低成共同封装降低成本本根据2020架构日,混合架构给混合架构给LakeField降低降低91%待机功耗,提高待机功耗,提高24%高功率能效比,操高功率能效比,操作系统优化可进一步提高作系统优化可进一步提高33%网络表现,提高网络表现,提高17%能效能效资料来源:IE

175、EE Hot chips 2019,wikichip资料来源:IEEE Hot chips 2019,wikichip作为Intel首款异构集成产品,初步验证了异构集成的可行性和优越性资料来源:Intel 2019 Investor Meeting,Intel architecture day 2020,wikichip,中信证券研究部79英特尔为异构处理器同步开发线程调度器英特尔为异构处理器同步开发线程调度器ITD(Intel ThreadDirector),调度协调两类核心调度协调两类核心,并与微软合作并与微软合作,优化了优化了ITD在在Windows 11上的性能上的性能ITD应用全新的

176、EcoQoS分类,使调度程序能够判断线程是更倾向于能效还是性能,决定线程是否会被调度到能效核。优先任务使用P核,后台任务使用E核,AI线程使用P核,循环等待线程使用E核。资料来源:Intel Architecture Day 2021资料来源:Intel Architecture Day 2021Alder Lake 模块化设计模块化设计Intel线程调度器逻辑线程调度器逻辑3.7.2.Alder Lake:深度改进大小核异构,模块化设计便于扩展:深度改进大小核异构,模块化设计便于扩展Alder Lake 2021工艺:Intel 7(10nm Enhanced SuperFin)技术突破:异

177、构集成,同时具备大核心(异构集成,同时具备大核心(P Core)和小核心()和小核心(E Core);采用模块化可扩展设计方式,不同功能单元可灵活拼);采用模块化可扩展设计方式,不同功能单元可灵活拼装,装,1个P核与4个E核面积相当;采用全新设计的全新设计的Golden Cove大大核心核心(微架构大幅改进,IPC+19%)和和Gracemont小核心小核心(能效比显著提升);开发线程调度器开发线程调度器ITD,使程序能够灵活使用大小核资料来源:Intel Architecture Day 2021,中信证券研究部80性能核代号为性能核代号为Golden Cove,将单线程性能推向极致将单线程

178、性能推向极致Golden Cove核心采用超深前端+超宽后端+智能分支预测设计,前端解码器数量从4增加到6,微指令缓存从2.25K增加到4K条;指令调度部分,重排序缓存ROB容量从352增加到512,发射端口数量从10增加到12,整数ALU从4个到5个;新增向量加法单元FADD,向量乘加单元支持FP16数据格式资料来源:Intel Architecture Day 2021资料来源:Intel Architecture Day 2021Golden Cove性能核心具有性能核心具有12发射、发射、5整数整数ALU超宽后端,超宽后端,512指令指令ROB超深前端超深前端Golden Cove比上

179、一代比上一代 IPC提升提升19%3.7.2.Golden Cove:Sunny Cove后又一力作,超宽架构后又一力作,超宽架构IPC+19%Performance(性 能性 能):GoldenCove在结构上具有巨大变化,依据SPEC rate 2017测试得到的IPC较上一代大核心WillowCove提升约19%Golden Cove核心新增矩阵运核心新增矩阵运算扩展单元算扩展单元(Intel AdvancedMatrix Extensions,AMX),适用于数据中心等场景,可大幅增强AI等任务表现81E核属于核属于Atom系列:系列:BonnellSaltwellSilvermont

180、AirmontGoldmontTremontGracemontPower(功耗功耗):单线程方面,Gracemont在同性能下可节约40%功耗;多线程下,比4核4线程的Gracemont 可比2核4线程的Skylake,同功耗性能提升80%,同性能功耗降低80%Area(尺寸尺寸):Gracemont微架构的核心非常小,在1个Golden Cove大核心的空间里可以塞进4个Gracemont小核心资料来源:Intel Architecture Day 2021资料来源:Intel Architecture Day 2021Gracemont能效核具有能效核具有6解码解码17发射的超宽架构,甚至

181、比苹果的发射的超宽架构,甚至比苹果的Fire Storm核心架构更宽核心架构更宽E核能效表现出色核能效表现出色3.7.2.Gracemont:17发射超宽设计,小核心能效翻倍提升发射超宽设计,小核心能效翻倍提升82四、基石技术:工艺推进核心性能,封装+片内总线发力后摩尔时代4.14.1制程工艺:制程工艺:10nm10nm受阻拖慢研发节奏,受阻拖慢研发节奏,5 5年年4 4节点公司望王者归来节点公司望王者归来4.24.2先进封装:后摩尔时代焦点,先进封装:后摩尔时代焦点,IDMIDM模式下发展领先模式下发展领先4.3 4.3 片内总线结构:信息传输的通道,多核堆叠的关键片内总线结构:信息传输的通

182、道,多核堆叠的关键834.1.制程工艺:技术路线复杂,投入巨大,供给极其有限制程工艺:技术路线复杂,投入巨大,供给极其有限先进制程研发投入巨大先进制程研发投入巨大,各各IDM/代工厂陆续放弃推进代工厂陆续放弃推进,前沿玩家仅剩三家前沿玩家仅剩三家。随着晶体管尺寸的缩小,发热与漏电问题愈加显著,先进制程的推进成本大幅上升,联电与格罗方德等厂商宣布放弃先进制程的推进,转而专注于45-14nm制程中。目前仍在局的玩家仅剩英特尔目前仍在局的玩家仅剩英特尔、台积电与三星台积电与三星,行业供给极其有限行业供给极其有限各制程供给格局图各制程供给格局图资料来源:Wikichip,Digitimes,半导体在线

183、(微信公众号),中信证券研究部索尼索尼英飞凌英飞凌夏普夏普飞思卡尔飞思卡尔瑞萨瑞萨东芝东芝富士通富士通德州仪器德州仪器松下松下STM联电联电IBM中芯国际中芯国际AMD三星三星台积电台积电英特尔英特尔上海华力上海华力上海华力上海华力上海华力上海华力上海华力上海华力瑞萨瑞萨东芝东芝富士通富士通德州仪器德州仪器松下松下STM联电联电IBM中芯国际中芯国际格罗方德格罗方德三星三星台积电台积电英特尔英特尔瑞萨瑞萨东芝东芝富士通富士通德州仪器德州仪器松下松下STM联电联电IBM中芯国际中芯国际格罗方德格罗方德三星三星台积电台积电英特尔英特尔松下松下STM联电联电IBM中芯国际中芯国际格罗方德格罗方德三星

184、三星台积电台积电英特尔英特尔IBM格罗方德格罗方德三星三星台积电台积电英特尔英特尔联电联电中芯国际中芯国际格罗方德格罗方德三星三星台积电台积电英特尔英特尔三星三星台积电台积电英特尔英特尔三星三星台积电台积电英特尔英特尔三星三星台积电台积电英特尔英特尔1865nm45/40nm32/28nm22/20nm16/14nm10nm7nm5nm90nm024610nm7nm5nm3nm英特尔台积电三星在同代的对比上;在同代的对比上;各家厂商出于营销考虑,制程命名标准已不一致各家厂商出于营销考虑,制程命名标准已不一致英特尔节点推进速度较慢,但其性能基本等同于英特尔节点推进速度较慢,

185、但其性能基本等同于另外两家的下一代制程产品另外两家的下一代制程产品晶体管密度同代对比(亿个晶体管密度同代对比(亿个/平方毫米)平方毫米)844.1.制程工艺:公司工艺迭代缓而持续,制程工艺:公司工艺迭代缓而持续,2025年望重回巅峰年望重回巅峰作为作为IDM厂商与摩尔定律开创者厂商与摩尔定律开创者,自有工艺制程革新是英特尔与自有工艺制程革新是英特尔与AMD之间的显著差异之间的显著差异工艺革新是晶体管密度提升的关键工艺革新是晶体管密度提升的关键。由90nm到如今的Intel 7(10nm),英特尔在制程工艺上经过了“应变硅、增强型应变硅技术、HKMG(High-K值绝缘层/金属栅极)、增强型HK

186、MG、FinFET、增强型FinFET、”等工艺升级英特尔工艺路线图英特尔工艺路线图资料来源:Intel官网854.1.1.制程工艺:制程工艺:90、65nm应变硅技术,提升载流子迁移率应变硅技术,提升载流子迁移率应变硅技术应变硅技术(2003年年)90nm:利用一层仅为几纳米的超薄应变层:利用一层仅为几纳米的超薄应变层,替代原本的高纯硅制造晶体管内部的通道替代原本的高纯硅制造晶体管内部的通道资料来源:Intel65nm工艺实现与45nm工艺预览-濮元恺应变硅应变硅增强型应变硅技术增强型应变硅技术(2005年年)65nm:而后英特尔首次在:而后英特尔首次在65nm制程制程,300mm晶圆上使用

187、增强改进后的应变硅技术晶圆上使用增强改进后的应变硅技术,特别有利于多内核处理器的制造特别有利于多内核处理器的制造使用使用超薄应变层进行替代超薄应变层进行替代晶体管内原子距离拉长,单数长度数量减少晶体管内原子距离拉长,单数长度数量减少减小有效质量,降低散射概率减小有效质量,降低散射概率增强载流子迁移率增强载流子迁移率1.提供超过“第一代应变硅技术”10%-15%的驱动电流,提升性能。2.晶体管门长度为35nm,门和通道间的氧化物绝缘层度为1.2nm,提升集成度3.在晶体管顶部使用NiSi化合物,进一步降低电阻4.继续使用了Low K互连层技术,让Low K材料担任金属互联线路间使用的主要绝缘材料

188、。互联线路使用了8层铜互连。5.使用了晶体管睡眠技术,大幅减少电能浪费。6.继续坚持没有使用SOI技术,而是使用耗尽型衬底晶体管(depleted substrate transistor,DST)代替。双轴应变的形成双轴应变的形成应变硅经典器件结构应变硅经典器件结构65nm增强型应变硅显微图增强型应变硅显微图增强型应变硅技术主要改进维度增强型应变硅技术主要改进维度资料来源:深亚微米应变硅器件的模拟研究-施昊,中信证券研究部资料来源:Intel65nm工艺实现与45nm工艺预览-濮元恺,中信证券研究部86HKMG(High-K值绝缘层值绝缘层+金属栅极金属栅极)(2008年年)45nm:应变硅

189、没有引入新的革命性材料:应变硅没有引入新的革命性材料,栅极介质厚度已达极限栅极介质厚度已达极限,“更换材料以突破介电常数更换材料以突破介电常数”成为成为45nm工艺的关键工艺的关键4.1.2.制程工艺:制程工艺:45、32nm材料革命,材料革命,HKMG突破硅材料参数限制突破硅材料参数限制资料来源:中关村在线-刘坎抛开表面看本质 32nm移动处理器全解析,中信证券研究部增强型增强型HKMG(2010年年)32nm:第二代:第二代High-K值绝缘层值绝缘层+金属栅极金属栅极,采用第四代应变硅技术采用第四代应变硅技术,针对漏电电流进行针对漏电电流进行进进一步优化一步优化SiO 氧化层氧化层替换为

190、替换为High K绝缘层绝缘层栅极介质厚度需要不断缩小,但栅极介质厚度需要不断缩小,但SiO 氧化层在氧化层在2nm以下时,会出现以下时,会出现明显的遂穿泄露,明显的遂穿泄露,HfO2为英特尔使用的(为英特尔使用的(High K材材料,高介电常数材料),其介电常料,高介电常数材料),其介电常数为数为25(SiO 为为4),减少栅泄露),减少栅泄露硅材料栅极硅材料栅极替换替换为为金属材料栅极金属材料栅极High K的晶体管栅电场更强,若搭的晶体管栅电场更强,若搭配多晶硅栅极,会使“栅极耗尽”配多晶硅栅极,会使“栅极耗尽”问题更为严重问题更为严重在技术路线上,英特尔选择了性能在技术路线上,英特尔选

191、择了性能更优,难度更大的更优,难度更大的Gate-last,而,而IBM等厂商选择更可行的等厂商选择更可行的Gate-first1.与与45nm工艺相比,工艺相比,32nm工艺由于首次使用沉浸式光刻技工艺由于首次使用沉浸式光刻技术,等效氧化层厚度仅为术,等效氧化层厚度仅为0.9nm(45nm技术为技术为1nm)2.金属栅级工艺流程更新,金属栅级工艺流程更新,3.30nm栅极长度,第四代应变硅栅极长度,第四代应变硅4.当时业内最紧凑的栅极间距(当时业内最紧凑的栅极间距(112.5nm)5.晶体管性能提升晶体管性能提升22%6.同比封装尺寸将是同比封装尺寸将是45nm工艺产品的工艺产品的70%增强

192、型增强型HKMG主要改进维度主要改进维度英特尔英特尔32nm Core i5520M处理器实物图处理器实物图资料来源:中关村在线-刘坎抛开表面看本质 32nm移动处理器全解析87FinFET(2011年年)22nm:随着制程的不断缩小:随着制程的不断缩小,“短沟道效应短沟道效应”愈加明显愈加明显,采用立体式的采用立体式的FinFET工艺工艺,能够有效能够有效扩大沟道宽度扩大沟道宽度,减少漏电流与降低短沟道效应减少漏电流与降低短沟道效应4.1.3.制程工艺:制程工艺:22nm结构由平面变立体,结构由平面变立体,FinFET经久不衰经久不衰资料来源:英锐恩官网,中信证券研究部平面架构下:平面架构下

193、:有效沟道宽度有效沟道宽度=w制程缩小与沟道宽度相悖制程缩小与沟道宽度相悖立体结构下:立体结构下:有效沟道宽度有效沟道宽度=w+h*2有效沟道宽度由有效沟道宽度由Fin(鳍)的高度决定(鳍)的高度决定优点:优点:1.1.更好的渠道控制更好的渠道控制2.2.抑制短通道效应抑制短通道效应3.3.更快的切换速度更快的切换速度4.4.更高的漏极电流更高的漏极电流5.5.较低的开关电压较低的开关电压6.6.更低的功耗更低的功耗平面晶体管与平面晶体管与FinFET结构对比结构对比FinFET工艺优缺点及应用场景工艺优缺点及应用场景缺点:缺点:1.1.电压阈值难以电压阈值难以控制控制2.2.三维轮廓导致三维

194、轮廓导致更高的寄生效更高的寄生效应应3.3.电容高电容高4.4.造价高造价高适合适合高投入高投入高价值高价值高性能高性能领域领域22nm22FFL14nm晶体管FinFETFinFETFinFET鳍片间距(nm)604542栅极间距(nm)9010870金属间距(nm)809052逻辑单元高度(nm)840630399晶体管密度(百万个/mm)15.317.837.5SRAM单元(nm)0.0920.0880.05FinFET后续工艺寿命长,经久不衰后续工艺寿命长,经久不衰资料来源:Lam Research,半导体行业观察-李晨光资料来源:英特尔官网,中信证券研究部88激进的高目标激进的高目标

195、在原先摩尔定律的假定下,每一个节点的推进将使得晶体管密度提升两倍左右。然而,英特尔在10nm工艺上的规划是14nm的2.7倍,目标过于激进,即使后期将目标密度下调至2.4倍,效果仍不理想英特尔CEO布莱恩 科再奇也承认该目标“略有些激进”DUV+SAQP(2019年年)10nm:英特尔:英特尔10nm工艺原定工艺原定2016年量产年量产,但最终至但最终至2019年方量产年方量产,使得公司在制程端的优使得公司在制程端的优势被逐渐追平势被逐渐追平,甚至被超越甚至被超越4.1.4.制程工艺:目标激进技术保守,制程工艺:目标激进技术保守,10nm研发多年终突破研发多年终突破资料来源:WikiChip,

196、中信证券研究部图案化技术图案化技术标准化晶圆成标准化晶圆成本本193i 单次曝光(单次曝光(SE)1193i LELE(DP)2.5193i LELELE(TP)3.5193i SADP 2193i SAQP 3EUV 单次曝光(单次曝光(SE)4EUV SADP 6保守的技术保守的技术选择选择DUV,而非而非EUV光刻设备:光刻设备:英特尔的10nm性能接近于台积电与三星的7nm工艺,但英特尔采用的是190nm的深紫外光刻技术(DUV)结合四重图案曝光(SAQP)的技术路径,而非像台积电与三星一样,采用波长13nm的深紫外光刻技术(EUV)的方案。英特尔选择英特尔选择DUV的原因:的原因:技

197、术考量,英特尔的10nm工艺开始较早,当时EUV技术尚未成熟,可见在制程推进上,先发不一定有优势。成本考量,根据东京电子测算,DUV+SAQP方案的曝光工艺标准化晶圆成本约是EUV+单次曝光的3/4,约是EUV+SADP的1/2各曝光工艺标准化晶圆成本对比(相对各曝光工艺标准化晶圆成本对比(相对值)值)SADP与与SAQP:SADP将所需要将所需要刻蚀的图案分解成两次曝光利用刻蚀的图案分解成两次曝光利用图形的叠加来实现更小的分辨率,图形的叠加来实现更小的分辨率,SAQP则是连续使用两次则是连续使用两次SADP以以实现四重图像曝光与更小分辨率。实现四重图像曝光与更小分辨率。SAQPSADP英特尔

198、各节点晶体管密度提升对比英特尔各节点晶体管密度提升对比资料来源:英特尔官网资料来源:A.Raley et al.,Proc.SPIE 9782,97820F(2016),Wikiwand,中信证券研究部894.1.4.制程工艺:目标激进技术保守,制程工艺:目标激进技术保守,10nm研发多年终突破研发多年终突破资料来源:Hiroshige,中信证券研究部多重图案化:多重图案化:传统传统LELE、LELELE 与更为先进的与更为先进的SADP、SAQP工序示意图工序示意图保守的技术保守的技术选择选择DUV,而非而非EUVDUV的波长更长,光源更容易发生衍射,使得Pattern图形无法做得更小,因此

199、在英特尔10nm工艺上,选择了选择了DUV就需要搭配就需要搭配SAQP,从而提高分辨率从而提高分辨率LELELELELESADPSAQP 90保守的技术保守的技术后段多重曝光的良率低后段多重曝光的良率低通过对英特尔10nm,台积电7nm与三星7nm的工艺对比我们可以发现,三者的前段工艺相似三者的前段工艺相似,主要差别在后段工艺主要差别在后段工艺中中前段工艺中前段工艺中,鳍片的形成三家均采用多重四图案曝光(SAQP),栅极形成均采用多重双图案曝光(SADP),Contact 层英特尔与台积电采用LE/LE2/LE3/LE4等方法,三星则采用EUV方法。但在后段的金属层形成上但在后段的金属层形成上

200、,三家厂商技术路线有明显区别,台积电7nm采用多重双图案曝光(SADP)、三星采用EUV 方法,而英特尔选择了多重四图案曝光(SAQP)的方法。由于后段 M1 金属层是光刻中尺寸最小的瓶颈,SAQP较SADP的难度大幅加大同时多技术同时代入导致量产良率低同时多技术同时代入导致量产良率低。英特尔还在 Contact 层和M1金属层首次采用金属Co。在10nm上,英特尔引入了多种技术(COAG+SDB+Co+SAQP),最终良率仅为50%60%,无法满足量产要求,使得量产推迟4.1.4.制程工艺:目标激进技术保守,制程工艺:目标激进技术保守,10nm研发多年终突破研发多年终突破资料来源:Wikiw

201、and,中信证券研究部英特尔与台积电、三星多重图案曝光工艺比较英特尔与台积电、三星多重图案曝光工艺比较公司公司逻辑制程逻辑制程最小金属间距最小金属间距曝光工艺对比曝光工艺对比量产时间量产时间英特尔14nm52 nmSADP+切割2014英特尔10nm36 nmSAQP+LELE2019台积电7FF40 nmSADP+切割2017初三星8LPP;7LPP44 nmLELELELE2018末91Intel 7(2021年年)原原10nm Enhanced SuperFin:从:从Intel 7开始开始,公司将采用全新的命名方式公司将采用全新的命名方式,而后的而后的“7nm”也更也更名为名为inte

202、l 4。事实上,英特尔10nm性能与台积电7nm性能接近,英特尔7nm性能与台积电4nm性能接近,此次更名,意在消除营销对比上的劣势Intel 7能耗比相对于能耗比相对于10nm SuperFin提升约提升约10%15,首次应用于21年年底的Alder Lake 12代酷睿以及22年第一季度的Sapphire Rapids四代可扩展至强Intel 7 同样导入SAQP与COAG(Contact Over Active Gate)技术,以提升晶体管密度以提升晶体管密度4.1.5.制程工艺:制程工艺:Intel7后命名规则对标友商,消除营销劣势后命名规则对标友商,消除营销劣势资料来源:电子工程专辑

203、-欧阳洋葱,英特尔官网,中信证券研究部COAGCOAG:栅接触点(栅接触点(Contact Contact)是源极)是源极(SourceSource)到漏极()到漏极(DrainDrain)电)电流的控制点。流的控制点。COAGCOAG将栅接触点直接设在栅极的将栅接触点直接设在栅极的上方,而非栅极的一侧,节省约上方,而非栅极的一侧,节省约10%10%的空间,进而提升组件密的空间,进而提升组件密度。度。英特尔英特尔COAG技术介绍及其示意图技术介绍及其示意图Intel 4(2022年年)7nm:拥抱:拥抱EUV,使用使用EUV,大幅减少光罩数量和制程步骤大幅减少光罩数量和制程步骤,降低工艺复杂性

204、降低工艺复杂性,相比相比Intel 7,Intel4 预计可达成预计可达成20%的每瓦性能提升的每瓦性能提升,成为公司推进先进制程的又一里程碑成为公司推进先进制程的又一里程碑将应用于PC端的Meteor Lake 处理器与数据中心的 Granite Rapids英特尔表示,Intel 4 在Fin的间距、接触点间距以及低层金属间距等关键尺寸都持续朝着微缩方向前进,并导入设计技术协同优化(DTCO)Intel 4采用新金属强化铜(Enhanced Cu),取代Intel 7的钴,外层用钴、钽包覆。因此兼具铜的低电阻特性,并降低自由电子撞击原子使其移位的情况92英特尔英特尔23H2量产量产Inte

205、l 3 工艺芯片工艺芯片24H1量产量产20A(埃米)(埃米)工艺芯片工艺芯片24H2量产量产18A(埃米)工艺芯片(埃米)工艺芯片台积电台积电计划计划22H2量产量产3nm FinFET工艺工艺计划计划25年量产年量产2nm GAA芯片芯片三星三星22年年6月月30日,宣布量产日,宣布量产3nm GAA芯片,芯片,成为首家量产成为首家量产3nm的厂商的厂商Intel 3(23年年H2)对应此前对应此前7nm+工艺:同样基于工艺:同样基于EUV光刻光刻,每瓦性能提升约每瓦性能提升约18%对EUV技术的使用将进一步优化,并在芯片面积上改进,公司预计在2023年下半年投产Intel 3工艺节点仍将

206、使用FinFET技术。三家厂商中,仅三星在“3nm”节点上选择GAAFET结构晶体管(三星称其为MCBFET)Intel 20A(24年年H1)对应此前对应此前5nm工艺:应用工艺:应用RibbonFET和和PowerVia两大突破性技术两大突破性技术,芯片制造进入埃米时代芯片制造进入埃米时代RibbonFET是英特尔对于自家GAA FET晶体管的命名。其与FinFET结构相似,能沿用此前设备与技术,并扩大了栅极与通道的接触面积从而实现对通道更好的控制。PowerVia为英特尔独有技术,其将电源线由晶体管顶部移至底部,消除晶圆正面供电布线需求,优化信号传输。Intel 18A(24年年H2):

207、若如期完成:若如期完成,Intel 18A将成为英特尔重回领导者地位的标志性节点将成为英特尔重回领导者地位的标志性节点继续改进RibbonFET及PowerVia技术可能会采用 ASML 最新的 high-NA(高数值孔径)EUV 光刻机4.1.6.制程工艺:未来制程工艺:未来4年年5节点,重回芯片制造巅峰节点,重回芯片制造巅峰FinFET与与GAAFET结构示意图结构示意图三巨头未来路线规划对比三巨头未来路线规划对比FinFETGAAFET资料来源:英特尔官网,中信证券研究部资料来源:芯智讯(微信公众号),中信证券研究部93Foveros属于3D技术(纵向),其最下边是封装基底,基底之上为底

208、层芯片(Bottom Chip),底层芯片之上则放置着各种不同的芯片或模块,两者通过Face-to-Face的方式连,而上层芯片和模块则通过TSV3D硅穿孔与系统其他部分连通。优点:优点:降低制造成本并降低能耗;充分利用纵向空间缺点:缺点:硅穿孔(TSV)电阻大,顶层供电困难;散热难度大先进封装先进封装,后摩尔时代焦点:后摩尔时代焦点:进入后摩尔时代,制程推进难度变大,研发成本升高。2.5D/3D等先进封装成为半导体“超越摩尔”的重要路径。其为芯片提供纵向维度的扩张其为芯片提供纵向维度的扩张,进一步提升晶体管数量进一步提升晶体管数量,降低生产成本降低生产成本。英特尔先进封装技术全球领先:英特尔

209、先进封装技术全球领先:在先进封装领域,英特尔与台积电等厂商进行了较早的布局,因此在量产、应用及技术上都占据领先地位。目前英特尔的先进封装主要主要供自家使用,已具备EMIB、Foveros、Co-EMIB、ODI、MDIO等技术。4.2.先进封装:后摩尔时代下的纵向延伸,先进封装:后摩尔时代下的纵向延伸,IDM模式下发展领先模式下发展领先资料来源:SiP与先进封装技术-Suny Li,英特尔官网EMIB为高密度的2D平面式封装技术,其结构类似SoC。英特尔于2017 年发布,其嵌入在封装基板内、用来连接裸晶的硅桥(Silicon Bridge)优点:优点:高带宽;低功耗;对裸片尺寸无要求;成本经

210、济缺点:缺点:影响性能;不利于互连要求高的产品英特尔英特尔EMIB结构示意图结构示意图Foveros结构示意图结构示意图EMIBFoveros资料来源:Wikichip94基于高级接口总线(AIB)物理层互连技术,英特尔发布了MDIOMDIO(多裸片输入输出)技术,(多裸片输入输出)技术,能为EMIB提供标准化的SiP PHY级接口,可互连多个芯粒。MDIOMDIO推出于推出于20202020年,其较年,其较AIBAIB技术在各个维度均有明显提升。技术在各个维度均有明显提升。英特尔表示,与同时期台积电的LIPINCON相比,MDIO仍具有竞争力优点:优点:其响应速度和带宽密度是AIB 技术的两

211、倍以上;能效提升缺点:缺点:技术难度大4.2.先进封装:后摩尔时代下的纵向延伸,先进封装:后摩尔时代下的纵向延伸,IDM模式下发展领先模式下发展领先资料来源:硬件世界-上方文Q,中信证券研究部ODI全称Omni-Directional Interconnect,即Omni方向性互连技术,方向性指其能支持中小芯片之间实现全方位(水平+垂直)的相互链接。顶部的芯片可以像EMIB一样,与其他小芯片进行水平通信,还可以像Foveros-样,通过TSV 与下方的底部裸片进行垂直通信。优点:优点:互连通孔更大带宽高于传统TSV;电阻和延迟更低;供电稳定缺点:缺点:技术难度大英特尔英特尔ODI结构示意图结构

212、示意图英特尔英特尔MOIO相关性能参数比较相关性能参数比较类似类似EMIB的互的互连直接供电连直接供电类似类似Foveros的互连的互连裸片间裸片间IOIO界面对界面对比比单位单位AIB-第一代第一代(DARPA芯片)芯片)MDIO第一代第一代台积电台积电LIPINCON落地时间落地时间2002020202020针速针速Gbps2 25.45.48 8Shoreline带宽密度带宽密度GBps/mm63632002006767Areal带宽密度带宽密度GBps/mm8198198IO电压摆幅电压摆幅V0.90.90.50.50.30.3PHY功率效率

213、功率效率pJ/b0.850.850.50.50.560.56ODIMDIO资料来源:硬件世界-上方文Q,中信证券研究部95公司地区定位先进封装日月光中国台湾封测厂(OSAT)SiP、2.5D/3D、晶圆级封装等均有涵盖,具量产能力,为封测厂中技术涵盖最全且能力最强的厂商安靠美国封测厂(OSAT)SiP、2.5D/3D、晶圆级封装等均有涵盖,具量产能力,SiP封装在消费及汽车电子大放异彩长电科技中国大陆封测厂(OSAT)SiP、2.5D/3D、晶圆级封装等均有涵盖,具量产能力,SiP封装及2.5/3D为其重点发展目标力成科技中国台湾封测厂(OSAT)SiP、2.5D/3D、晶圆级封装等均有涵盖,

214、具量产能力,以存储器封装为主通富微电中国大陆封测厂(OSAT)SiP、2.5D/3D、晶圆级封装等均有涵盖,以CPU/GPU/服务器等为主华天科技中国大陆封测厂(OSAT)SiP、2.5D/3D、晶圆级封装等均有涵盖,以SiP、Fan-Out、Flip-Chip技术为主晶方科技中国大陆封测厂(OSAT)SiP、2.5D/3D、晶圆级封装等均有涵盖,以TSV技术为基础的CIS封装为主台积电中国台湾晶圆代工厂(Foundry)以2.5D、3D、晶圆级封装为主,对3D IC技术平台进行整合成3D Fabric,有全球最顶尖立体结构封测技术三星韩国IDM以2.5D、3D、晶圆级封装为主,设立SAFE主

215、攻先进封装技术,以3D-TSV技术为核心开发一系列技术英特尔美国IDM以2.5D、3D、晶圆级封装为主,推出混合键合(Hybrid bonding)概念,围绕异质整合及堆叠开发技术IDM便于协同:便于协同:目前IDM、Foundry、封测厂商均有参与先进封装的布局。Foundry与封测厂各有优势,但但IDM能更好协同能更好协同前后段工艺前后段工艺,在先进封装中兼具在先进封装中兼具Foundry与封测厂优势与封测厂优势,并进行紧密协同并进行紧密协同Foundry:熟悉前段流程,具有自有工艺,方便后期集成封测厂:熟悉芯片摆放布局、硅中介层设计IDM:兼具前两者有点,并能更好得完成前后段工艺的协同公

216、司先进封装资本支出巨大,技术领先持续卡位:根据公司先进封装资本支出巨大,技术领先持续卡位:根据Yole数据,英特尔数据,英特尔2021在先进封装领域的资本支出为在先进封装领域的资本支出为35亿美元,投亿美元,投入规模占全球第一入规模占全球第一英特尔21年先进封装资本支出主要投入Foveros及EMIB等先进封装技术的研发及产能扩建4.2.先进封装:后摩尔时代下的纵向延伸,先进封装:后摩尔时代下的纵向延伸,IDM模式下发展领先模式下发展领先全球先进封装主要玩家全球先进封装主要玩家21年全球先进封装资本支出排名年全球先进封装资本支出排名资料来源:Yole,芯智讯,中信证券研究部先进封装资本支出先进

217、封装资本支出(亿美元)(亿美元)市占市占份额份额英特尔英特尔353529%29%台积电台积电30.4930.4926%26%日月光日月光202017%17%三星三星151513%13%安靠安靠7.87.87%7%长电科技长电科技5.935.935%5%通富微电通富微电4.874.874%4%合计合计119.09119.09100%100%资料来源:各公司公告,中信证券研究部96片内总线主要负责链接片内总线主要负责链接CPU内的各个模块内的各个模块,并负责互连通信的作用并负责互连通信的作用。这里的模块主要指计算核心(Core),此外还包括外部控制器等,不同的时期与不同的核心数对应不同的片内总线结

218、构。早期:核心数较少早期:核心数较少,主要为星状架构与全连接架构主要为星状架构与全连接架构星状架构:星状架构:早期由于模块较少,CPU内部采用星状结构,以Core核心位于中央,其他模块与之链接,各模块之间不直接交互,而是通过Core中转。全连接架构:全连接架构:在核心数(stop)达到4-6个,采用全连接的形式,具更高的互联性能,包括带宽和延迟,更高设计复杂度、更高成本和更高功耗4.3.片内总线结构:信息传输的通道,多核堆叠的关键片内总线结构:信息传输的通道,多核堆叠的关键星状总线结构星状总线结构全连接总线结构全连接总线结构主要应用于单核CPU,结构简单。周围的不同模块信息靠中央核心中转适合核

219、心数较少的(4-6核),实现点对点链接,延迟低。但随着核心数的提升,设计复杂程度迅速增加。资料来源:知乎老狼各类总线结构类型总览各类总线结构类型总览97环状总线环状总线(Ring):进入多核时代后:进入多核时代后,星形结构就不再适用星形结构就不再适用,Ring总线应运而生总线应运而生。在Ring总线中,通常有两个闭环,分别为顺时针与逆时针,负责不同方向的通信。8核Ring总线结构,也可称作8C Ring bus相比早期的Star总线,ring总线具有更低的通信延迟,各处模块之间交互的效率也大大提升4.3.片内总线结构:信息传输的通道,多核堆叠的关键片内总线结构:信息传输的通道,多核堆叠的关键资

220、料来源:知乎超合金彩虹糖,中信证券研究部Ring总线架构结构示意图总线架构结构示意图顺时针+逆时针设计,使得核心间的数据交互距离不会超过连接节点的一半环内为L3缓存L1L2缓存集成在核心模块中单ring下,核心数一般为4-8,最高做至10-12核。为适应后摩尔时代核心数的增多,1.5ring与2ring诞生981.5Ring与与2Ring,环状总线环状总线(Ring)同结构下的拓展:同结构下的拓展:通过外扩总线的方式,在ring的外部增加核心(stop),并将不同的ring利用双向的缓冲交换器并联起来。随着核心数量的增加,Ring总线不断拉长,且经过的核心多导致存在更多的“中断”,跨核延迟将不

221、断上升,内部堆核的方法已与瓶颈。因此,技术路线上采用在外部新设1条或0.5条Ring,并利用缓冲交换器在两条Ring间进行交换数据。此方案能进一步提升核心数,但缺点是数据通过缓冲交换器的时间较长4.3.片内总线结构:信息传输的通道,多核堆叠的关键片内总线结构:信息传输的通道,多核堆叠的关键资料来源:知乎超合金彩虹糖,中信证券研究部1.5 Ring总线架构结构示意图总线架构结构示意图2 Ring总线架构结构示意图总线架构结构示意图缓冲交换器缓冲交换器缓冲交换器资料来源:知乎超合金彩虹糖,中信证券研究部991.5Ring与与2Ring,环状总线环状总线(Ring)同结构下的拓展:同结构下的拓展:R

222、ing架构适应于多核场景,主要应用于服务器(至强产品系列)与高性能PC处理器(酷睿产品系列)服务器:服务器:以至强E5 V4 MCC版本为例,其内部在1.5个Ring中包含了15个核心(Core)并通过双向缓冲交换器链接,从而突破单条ring中12个核心的上限,模块访问另一条Ring中的模块延迟会显著高于访问同Ring模块PC:以酷睿12代为例,其同样采用Ring结构,但不同的是,由于其采用P核(大核)与E核(小核),其4个E核构成一簇,作为一个stop。因此16核的酷睿12代仅有10个stop。4.3.片内总线结构:信息传输的通道,多核堆叠的关键片内总线结构:信息传输的通道,多核堆叠的关键资

223、料来源:wikichip-Meshbus至强至强E5 V4 MCC版本片内架构图版本片内架构图i9-12900K 4个个E-core构成一簇总线架构结构示意图构成一簇总线架构结构示意图资料来源:电子工程专辑-黄烨峰,中信证券研究部4个E核构成一个Stop1个P核构成一个Stop100网状总线网状总线(Mesh):1.5Ring与与2Ring只是小幅提高只是小幅提高ring总线结构的上限总线结构的上限,高核心数下依然存在通信延迟高核心数下依然存在通信延迟。因此因此,网状结网状结构诞生构诞生,其其是介于环形总线和全连接的方案是介于环形总线和全连接的方案,其能其能帮助更好地进行信息交互帮助更好地进行

224、信息交互Mesh总线更复杂,所以当核心数较少时,Mesh总线延迟比单Ring高。但随着核心数的增多,Mesh总线的低延迟优势将逐渐显现相比Ring 总线,Mesh总线连接的layout简单,而且灵活性、可扩展性强英特尔在SkylakeX、Skylake SP等产品线中引入了Mesh总线4.3.片内总线结构:信息传输的通道,多核堆叠的关键片内总线结构:信息传输的通道,多核堆叠的关键资料来源:电子工程专辑-黄烨峰,中信证券研究部Skylake SP中的中的Mesh总线架构结构示意图总线架构结构示意图66 Mesh技术类似井字结构每个核心与周围的四个核心相连,边缘处核心则与周围2、3个核心相连同时,

225、若是实现2行1列的core与6行6列的core之间的互联,Mesh总线并不需要经过经过5个(横向)+4个(纵向)=9个Stop,而是直接跳至2行6列,再“跳”至6行6列因此,Ring架构更像是“逢站必停”的“高铁”,而Mesh架构更像是“极少中转”的“飞机”,效率更高101同业比较:同业比较:在多核心堆叠上,竞争对手AMD则选择的是更接近于“弱化版全连接”的MCM技术,其在核心数上更容易突破其在核心数上更容易突破上限上限,更节约成本更节约成本,但也容易造成延时问题但也容易造成延时问题在Zen架构上,四个核心通过全连接的方式形成一个CCX,四个核心均有自己独立的L1与L2缓存,并与另外三个核心共

226、享8MB L3缓存。CCX之间通过高速Infinity Fabric通信,以实现8核、16核、32核处理器的设计而Zen2则是由两个CCX组成一个CCD,将多个CCD与作为通讯中心(cIOD)的I/O die进行连接,形成多核心的互联4.3.片内总线结构:信息传输的通道,多核堆叠的关键片内总线结构:信息传输的通道,多核堆叠的关键资料来源:中信证券研究部绘制AMD Zen2 内部多核心互联架构内部多核心互联架构小核心小核心CoreCore小核心小核心CoreCore小核心小核心CoreCore小核心小核心CoreCoreCCXCCXCCD部分为7nm工艺,cIOD部分则为12nm工艺体现chip

227、let/MCM技术节约成本的优越性资料来源:expreview102同业比较:同业比较:在多核心堆叠上,竞争对手AMD则选择的是更接近于“弱化版全连接”的MCM技术,其在核心数上更容易突破其在核心数上更容易突破上限上限,更节约成本更节约成本,但也容易造成延时问题但也容易造成延时问题而在Zen 3上,一个CCX中包含8个小核心,8个Core共享32MB L3缓存,Zen与Zen 2中一个CCX仅包含4个小核心AMD表示其8个小核心的链接方式“没有完全连接(全连接),但已经足够接近了”,这一近似于“全连接”的方式使得Zen 3中核心之间的延迟将进一步降低4.3.片内总线结构:信息传输的通道,多核堆

228、叠的关键片内总线结构:信息传输的通道,多核堆叠的关键资料来源:hexus,AMD官网AMD Zen 2 与与Zen 3内部结构对比内部结构对比英特尔与英特尔与AMD不同结构导致性能差异不同结构导致性能差异1、延迟性:、延迟性:英特尔的Mesh技术更为简单,原生核心的延迟更低。2、功耗:、功耗:AMD更多的核心数意味着其功耗相对更大,同时要求更好的散热条件3、成本:、成本:小核心对单片晶圆面积的利用率更高,良率也更高,从而降低成本4、灵活性:、灵活性:Chiplet/MCM技术能够对不同的结构使用不同的制程工艺,进一步降低制造成本英特尔与英特尔与AMD各维度性能差异各维度性能差异资料来源:各公司

229、官网,中信证券研究部103五、产品体系:产品分化,同步实现广覆盖与高适应性五、产品体系:产品分化,同步实现广覆盖与高适应性5.1 5.1 产品总览:产品总览:CPUCPU为业务基本盘,产品分化为适应细分市场关键为业务基本盘,产品分化为适应细分市场关键5.2 5.2 至强(服务器):商业化应用场景,性能与成本为首要考量至强(服务器):商业化应用场景,性能与成本为首要考量5.3 5.3 酷睿(中高端酷睿(中高端PCPC):取代奔腾成):取代奔腾成PCPC核心高端产品线核心高端产品线5.4 5.4 奔腾(中低端奔腾(中低端PCPC):引领):引领CPUCPU历史变革,现用于教育历史变革,现用于教育/

230、办公场景办公场景5.5 5.5 赛扬(低价低端赛扬(低价低端PCPC):性能较奔腾低一级,帮助实现市场下沉):性能较奔腾低一级,帮助实现市场下沉5.6 5.6 凌动(低功耗、物联网):瞄准移动市场,集成化为迭代主线凌动(低功耗、物联网):瞄准移动市场,集成化为迭代主线5.7 5.7 MovidiusMovidius视觉处理器:前瞻布局,针对边缘与视觉处理器:前瞻布局,针对边缘与AIAI设备设备1045.1.产品体系:技术孕育多维产品线,处理器为基本盘产品体系:技术孕育多维产品线,处理器为基本盘处理器为公司业务的核心处理器为公司业务的核心,但除处理器外但除处理器外,公司产品已延伸至至数字芯片领域

231、的多个应用场景公司产品已延伸至至数字芯片领域的多个应用场景,包括系统和设备包括系统和设备、服务器服务器产品产品、FPGA和可编程设备和可编程设备(来自收购的来自收购的Altera)、结构化结构化ASIC等等11类产品与服务类产品与服务英特尔各产品线业务情况英特尔各产品线业务情况资料来源:英特尔官网,中信证券研究部1055.1.产品体系:技术孕育多维产品线,处理器为基本盘产品体系:技术孕育多维产品线,处理器为基本盘公司的处理器产品已形成了极强的技术壁垒公司的处理器产品已形成了极强的技术壁垒,拥有针对不同应用场景的不同处理器家族拥有针对不同应用场景的不同处理器家族各处理器家族能为笔记本电脑、台式机

232、、工作站和服务器提供支持,包括企业和个人用途、沉浸式游戏、内容创作、物联网、人工智能等英特尔处理器产品系列情况英特尔处理器产品系列情况资料来源:英特尔官网,中信证券研究部产品名称产品名称具体功能具体功能应用场景应用场景至强至强 可扩展处理器可扩展处理器英特尔 至强 可扩展处理器家族在计算、存储、网络和安全方面提供不同凡响的扩展能力和性能。服务器至强至强 处理器处理器专为数据中心和工作站打造,可处理云、大数据、建模、人工智能等的繁重处理需求。服务器酷睿酷睿 处理器处理器英特尔面向笔记本电脑和台式机推出的性能最高的 CPU,提供先进的响应能力、连接性和显卡。中高端PC奔腾奔腾 处理器处理器结合速度

233、、功耗和价值,用于在笔记本电脑、台式机和迷你电脑上的日常计算。中低端PC赛扬赛扬 处理器处理器为入门级笔记本电脑和台式电脑提供经济的CPU性能,支持强连通性和长电池续航。低价低端PC凌动凌动 处理器处理器适合移动和物联网设备,以及高密度、低能耗的数据中心应用程序。低功耗、物联网、工控机Movidius 视觉处理器视觉处理器能够高效完成要求苛刻的计算机视觉和边缘人工智能工作负载。通过在将数据移动最小化的独特架构中,将高度并行的可编程计算与面向特定工作负载的硬件加速相结合人工智能面向物联网和嵌入式应面向物联网和嵌入式应用的处理器用的处理器借助英特尔边缘就绪计算和连接技术产品系列,快速部署边缘应用程

234、序,可支持边缘处理物联网1065.1.产品迭代历程:产品分化适应各细分市场,性能依托架构制程升级产品迭代历程:产品分化适应各细分市场,性能依托架构制程升级而从时间维度上看而从时间维度上看,90年代与年代与21世纪初为英特尔处理器产品线的扩展时期世纪初为英特尔处理器产品线的扩展时期,其将产品线进一步分化以提高对不同应用场景的适应性,各大产品系列均在此期间推出1993年年,第一代第一代“奔腾奔腾”:世界上第一款超标量处理器超标量处理器(每时钟至少执行2条指令),具更高的CPU吞吐量1998年年,第一代第一代“至强至强”:第一代至强名为“Pentium II Xeon”,由于面向服务器市场,所以其具

235、更大的缓存具更大的缓存与支持与支持4路或路或8路的路的SMP(对称多CPU处理功能)。同年同年,第一代第一代“赛扬赛扬”:其为“奔腾”的低价简化版。由于去除了片外二级缓存去除了片外二级缓存,因此整数性能低下,影响商业场景表现;但其浮点性能未受明显影响,适合游戏等家庭应用场景。2006年年,“酷睿酷睿”推出:推出:其面向高端消费者、硬件爱好者与工作站,以替代“奔腾”在中高端市场的应用。首代酷睿为两核心两核心,无超线程无超线程,并共享并共享L2缓存缓存,因此具有较高的能耗比。2008年年,第一代第一代“凌动凌动”:针对移动端场景,因此采用顺序执行设计顺序执行设计以减少晶体管数量,从而控制面积大小C

236、PU代号DrakeP6250nm1998核心微架构年份工艺制程第一代至强 支持4路或8路的SMP 动态执行技术各产品线开拓时期 关键技术变化80501P50.8m1993第一代奔腾 第一款超标量处理器CovingtonP6250nm1998第一代赛扬 去除片外二级缓存SilverthorneBonnell45nm2008第一代凌动 采用顺序执行设计ConroeCore65nm2006第一代酷睿 取消超线程技术英特尔各产品系列初代诞生时间线英特尔各产品系列初代诞生时间线资料来源:Intel官网、中信证券研究部1075.1.产品迭代历程:产品分化适应各细分市场,性能依托架构制程升级产品迭代历程:产

237、品分化适应各细分市场,性能依托架构制程升级2006年公司启动年公司启动“Tick-Tock”战略后战略后,发力于架构与制程的快速迭代发力于架构与制程的快速迭代,实现产品性能的提升实现产品性能的提升。在Tick-Tock战略前期,可以明显看到公司保持2年一个迭代周期,Tick年改善工艺,Tock年改善架构,两者交替进行公司沿着Tick-Tock的步伐,内部进行“架构+制程”的革新,这些技术最终都将表现为产品性能的持续升级以2008年的第1代Core i为例,其发布于Tock年,因此工艺仅作优化,架构则全面革新至“Nehalem”架构。此架构将北桥集成至CPU中,提高集成度与交互速度;内置L3缓存

238、,每一个处理器共享最小4MB至最大12MB;重新采用超线程技术,处理器性能提升30%+。微架构CorePenrynNehalemWestmereSandy BridgeIvy BridgeHaswellBroadwellCoreNehalemSandy BridgeHaswell65nm45nm32nm22nm14nm200620072008200920014TockTickTockTickTockTickTockTick核心微架构年份改进战略工艺制程第一代Core/Core 2 取消超线程技术第1代Core i 首次量产HKMG工艺 增加三级缓存 采用超线程 初代睿频

239、初代Ringbus桌面CPU产品 关键技术变化第2代Core i 首次集成核显 第二代睿频 256位环形总线Core2 制程改进版第1代Core i工艺改进版 第二代HKMG工艺第3代Core i 首次采用三栅极晶体管(FinFET)工艺第5代Core i 首次采用14nm FinFET第4代Core i 支持DDR3 首次为SoC架构进行专门优化第1代Xeon E7第1代Xeon E5第2代Xeon E第3代Xeon E第4代Xeon E服务器CPU产品英特尔架构、制程、产品迭代时间线英特尔架构、制程、产品迭代时间线(Tick-Tock战略时期)战略时期)资料来源:Chenfan Blog-

240、Jcf94,Wikichip,中信证券研究部1085.1.产品迭代历程:产品分化适应各细分市场,性能依托架构制程升级产品迭代历程:产品分化适应各细分市场,性能依托架构制程升级此后此后,制程推进受阻不但影响晶体管密度的提升制程推进受阻不但影响晶体管密度的提升,同时也使架构长期停滞于同时也使架构长期停滞于Skylake,导致公司产品迭代速度放缓导致公司产品迭代速度放缓公司长期停留在14nm中,使得架构开发受限,第7、8/9、10代Core i,虽然分别使用Kaby Lake、Coffee Lake、Comet Lake架构,但其仅在第6代的Skylake进行改进,虽有性能的优化与提升,但实际差异较

241、小因此第7、8/9、10代Core i系列在市场竞争中无明显优势,从而导致公司在CPU市场的份额出现一定程度的下降微架构SkylakeKaby LakeCoffee LakeComet LakeIce LakeTiger LakeAlder LakeSkylakeGolden Cove14nmIntel 72000212022核心微架构年份工艺制程Sunny Cove14+nm14+nm14+nm10nm10+nmIntel 7Willow Cove微架构Sky LakeCascade LakeCopper LakeIce LakeRaptor La

242、keGolden Cove14+nm工艺制程14+nm14+nm10nmSunny CoveSkylake核心微架构第6代Core i 第三代DMI总线桌面CPU产品 关键技术变化第5代Xeon E3服务器CPU产品 关键技术变化第7代Core i 提高主频与内存频率第8/9代Core i 提高主频与内存频率 增加缓存与核心数第10代Core i 增加缓存与核心数第10代Core i 增加新指令 核显大幅增强第11代Core i 缓存增加 核显大幅增强第12代Core i 使用大小核混合架构 支持DDR5第1代Xeon Platinum等 Mesh总线第2代新Xeon 最大核心数从28增加到5

243、6第3代新Xeon第3代新Xeon 工艺换代 PCIe 4.0架构优化优化优化工艺架构架构优化改进战略Sapphire RapidsIntel 7Golden Cove英特尔架构、制程、产品迭代时间线英特尔架构、制程、产品迭代时间线(PAO战略至今战略至今后)后)资料来源:Chenfan Blog-Jcf94,Wikichip,中信证券研究部1095.2.处理器至强(服务器):商业化应用场景,性能与成本为首要考量处理器至强(服务器):商业化应用场景,性能与成本为首要考量至强:设计针对服务器市场至强:设计针对服务器市场,商业化应用场景中商业化应用场景中,对于性能的优先级远高于其他应用场景对于性能

244、的优先级远高于其他应用场景相比用于PC端的酷睿处理器,“至强”并不注重个人游戏,影音等娱乐需求,因此通常无集成核心显卡通常无集成核心显卡“至强”注重稳定性与数据处理,因此主频通常不会太高主频通常不会太高,但具有更高的核心数与线程数更高的核心数与线程数,更适合服务器场景。例如,英特尔19Q2发布的至强铂金9282处理器可拥有56个核心与112线程“至强”支持CPU多路互联多路互联,在单块主板上安装多块互相连接的处理器,多颗CPU同时工作,提升处理器运算能力资料来源:英特尔官网,中信证券研究部电脑CPU服务器CPU指令集差异通常为CISC,追求指令集的大而全通常为RISC,调用速度和命中率高,针对

245、性强,能效高缓存差异近年才用缓存技术配一二三级缓存,运算能力强接口差异有显卡卡槽配备的主板通常没有显卡卡槽稳定性差异连续工作72小时365天开机运行多路互联支持差异一块主板一个CPU单主板可安装多个CPU价格差异基本在千元左右千、万元以上,甚至几十万酷睿酷睿i9-9900至强铂金至强铂金9282上市时间19Q219Q2制程工艺14nm14nm内核856线程16112基率3.10 GHz2.60 GHz最大睿频5.00 GHz3.80 GHz缓存16 MB77 MBTDP65 W400 W核心显卡HD 630无核心数高线程数高主频低无核显散热要求高缓存技术强PC CPU与服务器与服务器CPU差异

246、差异“至强”支持“至强”支持CPU多路互联多路互联同期酷睿与至强产品参数对比同期酷睿与至强产品参数对比资料来源:英特尔官网资料来源:国科科技,中信证券研究部1105.2.处理器至强(服务器):处理器至强(服务器):Pentium II Xeon低价策略赢得市场低价策略赢得市场第一代第一代“至强至强”Pentium II Xeon,明确以独立产品线对标不同应用场景的策略明确以独立产品线对标不同应用场景的策略,低价策略从早期服务器竞争脱颖低价策略从早期服务器竞争脱颖而出而出Pentium II Xeon是英特尔第一代“至强”系列产品,其CPU架构为英特尔的P6架构,采用250nm制程同时,其支持4

247、路或路或8路的路的SMP(对称多对称多CPU处理功能处理功能),即一台设备同时使用多个处理器,各处理器之间共享内存系统、总线系统等资源,提高数据处理能力。其采用P6架构,因此具有动态执行技术动态执行技术,能通过预测分析程序流程与数据流,选择最佳的指令执行顺序,提高运行效率。在至强系列推出之前,服务器行业竞争已激烈,DEC、Sun、MIPS、IBM均已布局该领域,英特尔利用其PC电脑业务的成本管控经验与规模效应,成功以低价策略逐渐获得市场而后发布的而后发布的Pentium III Xeon则进一步补全性能则进一步补全性能,巩固英特尔在服务器端的地位巩固英特尔在服务器端的地位采用P6架构,0.18

248、微米工艺制造,Slot 2架构和SECC封装形式新增70条指令集,提高多媒体、流媒体软件执行速度,在缓存速度与系统总线结构上,也有同步改进资料来源:CPU-world,中信证券研究部Pentium II Xeon与与Pentium III Xeon性能参数对比性能参数对比架构架构工艺制程工艺制程缓存缓存频率频率接口接口指令集指令集位数位数Pentium II XeonP60.25微米2MB二级缓存450MHzSlot 2MMX32Pentium III XeonP60.25、0.18微米2MB二级缓存1GHzSlot 2MMX,SSE321115.2.处理器至强(服务器):跟进位数兼容竞争,步

249、入多核时代处理器至强(服务器):跟进位数兼容竞争,步入多核时代英特尔于英特尔于2005年推出年推出Nocona至强处理器至强处理器,其是一款其是一款32、64位混合模式计算平台位混合模式计算平台,打破公司打破公司32与与64位不兼容情况位不兼容情况。AMD于2003年推出Opteron皓龙处理器,兼容32位与64位计算,英特尔于2005年推出具同样功能的NoconaNocona采用EM64T技术使其能够同时支持32位和64位计算,并集成DBS,实现CPU运行频率与功耗的动态调节根据ZDNet China,Opteron通过超传输(Hyper Transport)技术与计算机的其余组件相联系,而

250、Nocona依赖PCIExpress。同时Nocona的速度更快,而Opteron在每一时钟周期可以处理更多任务。Opteron配置有集成的内存控制器,而Nocona的控制器是独立的芯片。2005年年10月月,公司推出公司推出Paxville DP双核处理器双核处理器,早期便体现公司封装技术优势早期便体现公司封装技术优势,从而步入多核时代从而步入多核时代Paxville DP同样采用NetBurst架构,制程为90nm,缓存为22MB二级缓存,频率为2.80 GHz,频率的运行速度由于两颗内核均配置高速缓存,大大减少了系统总线上的数据量,并加快内核存取数据的速度。此后至强产品的核心数跟随架构的

251、革新不断上升此后至强产品的核心数跟随架构的革新不断上升资料来源:中关村在线-范平,中关村在线-蔺晓峰,中信证券研究部Nocona性能参数性能参数架构架构工艺工艺制程制程核心核心数数缓存缓存频率频率位数位数NoconaNetBurst90nm11MB L2缓存2.8/3.0/3.2/3.4/3.6GHz等32、64PaxvilleDPNetBurst90nm222MB L2缓存2.8GHz32至强系列多核处理器发展历程至强系列多核处理器发展历程首颗单核Pentium II Xeon(P6 250nm)1998年首颗双核Paxville DP(NetBurst 90nm)2005年首颗四核Clov

252、ertownClovertown(Core 65nm)2006年首颗十二核Ivy Bridge(Sandy Bridge 22nm)2013年首颗十核Westmere(Nehalem 32nm)2011年首颗六核DunningtonDunnington(Nehalem 45nm)2008年首颗八核BecktonBeckton(Nehalem 45nm)2010年资料来源:英特尔官网,中信证券研究部1125.2.处理器至强(服务器):产品矩阵完备,实现高低端全覆盖处理器至强(服务器):产品矩阵完备,实现高低端全覆盖从目前的产品布局看从目前的产品布局看,至强系列针对服务器市场至强系列针对服务器市场

253、,可分为可分为“至强至强”与与“至强可扩展至强可扩展”两个子系列两个子系列“至强”系列性能由低到高分为至强D、至强E、至强W“至强可扩展”于2017年发布,在技术、规格上面进行了全面的更新,分为青铜、白银、黄金、铂金至强可扩展处理器拥有多达28颗内核,并能针对数据中心和通信网络中各种需求进行优化可提供2插槽到8插槽及更多插槽配置支持和充足的扩展空间资料来源:英特尔官网,中信证券研究部至强产品命名规则至强产品命名规则品牌修饰符品牌修饰符+处理器架构处理器架构+性能等级性能等级+物理核心数量物理核心数量+产品线后缀产品线后缀品牌修饰符品牌修饰符+SKU 数值数值+代次指示符代次指示符+产品线后缀产

254、品线后缀至强系列分类情况至强系列分类情况产品系列产品系列具体应用具体应用至强至强D适应于空间和功耗非常宝贵的场景适应于空间和功耗非常宝贵的场景至强至强E为入门级服务器提供必要的业务。为入门级服务器提供必要的业务。至强至强W专为创意专业人士设计,可在工作站上提供专为创意专业人士设计,可在工作站上提供 VFX、3D 渲染和渲染和 3D CAD 所需的性能。所需的性能。至强青铜至强青铜针对小型企业和存储服务器,具可靠性和可维护性。针对小型企业和存储服务器,具可靠性和可维护性。至强白银至强白银面向入门级计算、网络和存储,提升性能与能效。面向入门级计算、网络和存储,提升性能与能效。至强黄金至强黄金多达多

255、达 4 个插槽的可扩展性能,先进的可靠性,以及高个插槽的可扩展性能,先进的可靠性,以及高级安全解决方案。级安全解决方案。至强铂金至强铂金具先进的具先进的2、4、8 路处理器性能,专为从边缘到云的路处理器性能,专为从边缘到云的要求苛刻的工作负载和服务而设计。要求苛刻的工作负载和服务而设计。资料来源:英特尔官网,中信证券研究部1135.2.至强可扩展处理器至强可扩展处理器Sapphire Rapids:专为数据中心而生:专为数据中心而生Sapphire Rapids:下一代数据中心处理器的标准下一代数据中心处理器的标准,采用采用Intel 7制程技术制程技术,结合结合性能核与全新加速器引擎性能核与

256、全新加速器引擎,突破低时延和突破低时延和单线程性能极限单线程性能极限Sapphire Rapids核心为一个分区块、模块化的SoC架构,同时采用嵌入式多芯片互连桥接(EMIB)封装技术和先进的网格架构(Mesh),在保有单晶片CPU接口优势的同时,具有显著的可扩展性该处理器能够提供单一、平衡的统一内存访问架构,每个线程都能够完全访问缓存、内存和I/O等所有单元上的全部资源,使得整个SoC具有一致的低时延与高横向带宽。Sapphire Rapids同时提供多类针对数据中心的加速器,包括新指令集架构和集成IP。资料来源:Intel Architecture Day 2021至强可扩展处理器至强可扩

257、展处理器Sapphire RapidsIntel加速器接口架构指令集(加速器接口架构指令集(AiA):):可以进行加速器调度,便于使用。Intel高级矩阵扩展(高级矩阵扩展(AMX):):张量计算,加速深度学习类任务。INT8算力达到AVX-512的8倍,BFP16算力达到AVX-512的16倍Intel数据流加速器(数据流加速器(DSA):):将数据流处理/移动任务从CPU剥离出来,使CPU增加39%的可利用时间。Intel加解密加解密/压缩解压引擎(压缩解压引擎(QAT):可解放98%的加密/解密/压缩/解压算力。资料来源:Intel Architecture Day 2021,中信证券研

258、究部Sapphire Rapids与数据中心相关的各类加速器与数据中心相关的各类加速器1145.3.酷睿(中高端酷睿(中高端PC):取代奔腾成):取代奔腾成PC核心高端产品线核心高端产品线微架构CorePenrynNehalemWestmereSandy BridgeIvy BridgeHaswellBroadwellCoreNehalemSandy BridgeHaswell65nm45nm32nm22nm14nm200620072008200920014TockTickTockTickTockTickTockTick核心微架构年份改进战略工艺制程第一代Core/Cor

259、e 2 取消超线程技术第1代Core i 首次量产HKMG工艺 增加三级缓存 采用超线程 初代睿频 初代Ringbus桌面CPU产品 关键技术变化第2代Core i 首次集成核显 第二代睿频 256位环形总线Core2 制程改进版第1代Core i工艺改进版 第二代HKMG工艺第3代Core i 首次采用三栅极晶体管(FinFET)工艺第5代Core i 首次采用14nm FinFET第4代Core i 支持DDR3 首次为SoC架构进行专门优化微架构SkylakeKaby LakeCoffee LakeComet LakeIce LakeTiger LakeAlder LakeSkylake

260、Golden Cove14nmIntel 72000212022核心微架构年份工艺制程Sunny Cove14+nm14+nm14+nm10nm10+nmIntel 7Willow CoveRaptor LakeGolden Cove第6代Core i 第三代DMI总线桌面CPU产品 关键技术变化第7代Core i 提高主频与内存频率第8/9代Core i 提高主频与内存频率 增加缓存与核心数第10代Core i 增加缓存与核心数第10代Core i 增加新指令 核显大幅增强第11代Core i 缓存增加 核显大幅增强第12代Core i 使用大小核

261、混合架构 支持DDR5架构优化优化优化工艺架构架构优化改进战略历代酷睿发展历程历代酷睿发展历程与与Tick-tock与与PAO战略下快速成长战略下快速成长资料来源:Chenfan Blog-Jcf94,Wikichip,中信证券研究部1155.3.酷睿(中高端酷睿(中高端PC):取代奔腾成):取代奔腾成PC核心高端产品线核心高端产品线自自2006年第一代酷睿推出后年第一代酷睿推出后,公司又于公司又于2008年推出第一代年推出第一代Core i系列系列,从此酷睿系列便以从此酷睿系列便以i3、i5、i7、i9划分产品性能划分产品性能,方便消费者进行选购与对比方便消费者进行选购与对比Core i7

262、965E/920为第一代酷睿为第一代酷睿,其进行大量革新其进行大量革新,成为一代经典成为一代经典采用Nehalem架构,45nm制程,并采用原生四核以提高芯片性能超线程技术(hyper-threading technology)重新回归,多任务处理能力提升使用QuickPath Interface(英特尔智能互连技术(QPI))取代此前的FSB(前端总线),将北桥整合进CPU中,使得CPU与芯片组具更快的连接速度FSB(Front side bus)前端总线结构及与)前端总线结构及与QPI对比对比资料来源:电脑吧评测室,中信证券研究部FSBFSB总线结构下,总线结构下,北桥位于CPU与内存、显

263、卡、南桥芯片之间,负责数据交换,各部分呈现“CPU-北桥-内存/显卡/南桥芯片”排列,FSB总线用于连接CPU与北桥芯片,内存/显卡/南桥芯片上的数据传输必须经过FSB这一条总线,因此因此FSBFSB的传输速度将直接的传输速度将直接影响影响CPUCPU的数据处理速度。的数据处理速度。而而QPIQPI结构,结构,则是将北桥整合进CPU中,系统总线也将会被分成多条连接,各条总线的频率、速度可以不同,大大提升数据传输速度大大提升数据传输速度。1165.3.酷睿(中高端酷睿(中高端PC):取代奔腾成):取代奔腾成PC核心高端产品线核心高端产品线二代酷睿:二代酷睿:使用Sandy Bridge架构,并全

264、线加入核显全线加入核显,大幅提高内存的兼容性。五代酷睿:首次尝试五代酷睿:首次尝试14纳米制程纳米制程,指令集指令集Bug使其产品寿使其产品寿命短暂命短暂五代酷睿使用Broadwell架构,并使用可与入门级独显媲美的P系列核显,开始支持DDR4;其在桌面端只有5775C和5675C两款产品CPU,更多的是应用于OEM及移动市场。根 据 电 科 技,五 代 酷 睿 由 于 指 令 集 Bug 问 题(BDM101/BDM86错误),使其会出现MCE(机器异常检查)错误,用户在使用时会出现崩溃、蓝屏等状况。因此其也成为酷睿系列产品寿命最短的处理器此后此后,AMD发布发布Zen架构架构,英特尔与英特

265、尔与AMD在在PC市场竞争市场竞争日益激烈日益激烈八代酷睿与ZEN+架构的二代锐龙同期发布;九代酷睿与ZEN2架构的三代锐龙同期发布;十代酷睿与ZEN3架构的5000系列锐龙同期发布十代酷睿的架构主体依旧是Skylake,仅在其基础上稍作修改。面对AMD的堆核设计与大缓存设计,十代酷睿开始出现降价,竞争日益激烈资料来源:知乎-(作者:老狼),Anandtech十代架构十代架构Sunnny Cove与前代、与前代、AMD架构对比架构对比1175.3.酷睿(中高端酷睿(中高端PC):取代奔腾成):取代奔腾成PC核心高端产品线核心高端产品线目前目前,酷睿为英特尔面向笔记本电脑和台式机推出的性能最高的

266、酷睿为英特尔面向笔记本电脑和台式机推出的性能最高的CPU产品性能由低端到高端分别为酷睿i3、i5、i7、i9四个系列,适应于商务、创意、游戏等场景X系列具有更高的核心数系列具有更高的核心数,因此能够迅速响应多个CPU的密集型任务。如:开发CG游戏人物;图像处理、3D渲染、视频剪辑;电影级的3D渲染与性能类似的至强系列相比,酷睿酷睿X更多应用于个人更多应用于个人PC平台平台,而非服务器等企业级场景酷睿系列产品命名规则:酷睿系列产品命名规则:品牌修饰符+代次指示符+SKU 数值+产品线后缀酷睿系列分类情况酷睿系列分类情况资料来源:英特尔官网,中信证券研究部产品系列具体应用酷睿i3高性价比的处理器为

267、日常任务提供出色的性能。酷睿i5专为数据中心和工作站打造,可处理云、大数据、建模、人工智能等的繁重处理需求。酷睿i7这款 CPU 集合了多达 14 个核心的能力来加速计算,支持高端游戏、连接性和安全性。酷睿i9为家用电脑和商用电脑提供卓越性能,用于游戏、创意和多任务处理。酷睿X处理器未锁频的CPU可提供多达18个内核,用于最极端的游戏、创意制作和多任务处理。品牌修饰符:品牌修饰符:数字越大表示其提供的性能级别更高代次指示符:代次指示符:第一或第二位数字表示第X代产品,通常越大性能越高SKU 数值:数值:按照代次和产品线中的处理器开发顺序分配(同等级同代下,绝对性能差距不大)后缀:后缀:用于区分

268、其它性能区别,比如E代表“嵌入式”、F代表“需要独立显卡”、K代表“未锁频”等酷睿产品命名规则酷睿产品命名规则资料来源:英特尔官网,中信证券研究部1185.3.处理器酷睿:异构趋势初现处理器酷睿:异构趋势初现最新一代酷睿已发展到第最新一代酷睿已发展到第12代处理器代处理器Alder Lake采用intel 7(10nm)制程工艺内存支持DDR5和LPDDR5十年最大的构转型(性能混合架构),16核心24线程,内置性能核性能核(P核核)与能效核能效核(E核核)两种内核,充分平衡性能与能效其中,性能核(P核)采用Golden Cove架构,IPC提升约19%;能效核采用Gracemont架构,性能

269、接近Skylake,能效比高资料来源:英特尔官网,中信证券研究部12代酷睿主要产品性能代酷睿主要产品性能专业软件性能优于专业软件性能优于11980HK、Ryzen 9 5900HX、M1 Max资料来源:英特尔官网,中信证券研究部1195.4.奔腾(中低端奔腾(中低端PC):引领):引领CPU历史变革,现用于教育历史变革,现用于教育/办公场景办公场景在在8086等处理器取得成功后等处理器取得成功后,英特尔于英特尔于1993年发布第一代奔腾年发布第一代奔腾,其非数字形式的名字是为了申请商标其非数字形式的名字是为了申请商标,防止友商模仿式命防止友商模仿式命名名,从而强化自身品牌从而强化自身品牌英特

270、尔的8086、80286、80386产品取得成功后,为防止竞争对手使用相似的命名(如AMD的Am386、Am486等),便希望将80586申请商标,而由于数字无法申请商标,因此公司将80586取名为“Pentium”,由此“奔腾”诞生奔腾为英特尔早期的唯一产品奔腾为英特尔早期的唯一产品,而后由其衍生出至强而后由其衍生出至强、赛扬等系列赛扬等系列P5P6NetBurst350nm250nm250nm65nm65nm5020052003核心微架构年份工艺制程Pentium 第一款超标量处理器Pentium Pro 16KB L1缓存 256KB L2缓存

271、CPU产品 关键技术变化Pentium III 扩充SSE指令Pentium MMX 使用MMX指令Pentium II 改进16位数处理能力Pentium 4 前端总线频率达800MHzPentium M低功耗,高性能,为笔电而生架构更接近Pentium III的短流水线设计Pentium D 具两个奔腾4处理核心早期奔腾迭代历史早期奔腾迭代历史45nm2006Pentium Dual-Core 双核双线程,功耗低,处理能力更强350nmP5、P54CSTillamookP6DeschutesTualatinCedar MillPreslerDothanCPU代号Wolfdale-3MP6C

272、ore130nm65nm资料来源:英特尔官网,wikichip,中信证券研究部1205.4.奔腾(中低端奔腾(中低端PC):引领):引领CPU历史变革,现用于教育历史变革,现用于教育/办公场景办公场景随着处理器性能要求的提升随着处理器性能要求的提升,在英特尔在英特尔2006年推出酷睿系列后年推出酷睿系列后,奔腾推出产品的市场定位逐渐转向中低端奔腾推出产品的市场定位逐渐转向中低端PC从目前的产品特点看从目前的产品特点看,奔腾的特点为性价比高奔腾的特点为性价比高。注重性能注重性能、体验和价值的平衡体验和价值的平衡,适用于从笔记本电脑适用于从笔记本电脑、台式机和迷你电脑台式机和迷你电脑的多种设备的多

273、种设备,下分奔腾金牌与奔腾银牌下分奔腾金牌与奔腾银牌,老版命名方式可分为老版命名方式可分为G、D、J系列系列金牌:适用于日常计算,例如基本办公任务和浏览视觉效果丰富的网页,同时可进行轻量照片编辑、视频编辑和多任务处理银牌:为入门级电脑市场带来经济实惠的解决方案,提供出色的视频会议功能、更快的无线连接和较长的电池续航时间。教师和学生可以快速完成日常任务并节约宝贵时间早期:初代奔腾与奔腾早期:初代奔腾与奔腾Pro,分别面向个人与服务器市场,分别面向个人与服务器市场资料来源:wikichip,中信证券研究部第一代奔腾处理器第一代奔腾处理器发布于1993年,采用0.60 微米工艺,晶体管数量为320

274、万8505于22Q1推出,是英特尔最新一代的奔腾处理器。现如今,奔腾处理主要应用于办公场景。所应用的机型价格相对较低现为入门级应用:搭载奔腾金牌现为入门级应用:搭载奔腾金牌8505的的DELL灵越灵越5411一体机一体机奔腾奔腾pro发布于1995年,32位,面向服务器与工作站,晶体管数量550万地址总线扩展至36位,增加PAE技术,能够支持64GB的RAM资料来源:京东商城,中信证券研究部1215.5.赛扬(低价低端赛扬(低价低端PC):性能较奔腾低一级,帮助实现市场下沉):性能较奔腾低一级,帮助实现市场下沉第一代第一代“赛扬赛扬”Covington与与“至强至强”同年同年(1998年年)推

275、出推出,但其无但其无L2缓存等设计缓存等设计,旨在进一步做出差异化旨在进一步做出差异化与Pentium II Xeon一样,Covington同样采用P6架构与250nm制程,但其不配备L2缓存,因此对硬件的保护需求,散热需求较低。由于缺少二级缓存,第一代“赛扬”的整数性能受影响较大,浮点性能影响较小但结构简化使得Covington具有更低的价格与更强的超频能力,能够更适应低端市场第二代第二代“赛扬赛扬”Mendocino设计则带有设计则带有L2缓存缓存,其成功夺回大量市场其成功夺回大量市场,竞争力强大竞争力强大第二代“赛扬”Mendocino配备128KB片内全速L2缓存,因此频率由300M

276、Hz升至533MHz其SLOT 1也改为专用于低成本处理器的Socket 370接口其成功的设计快速抢占亚洲各国PC组装市场,与同代对手AMD的K6-2相比依旧保有竞争力Covington是个人电脑普及是个人电脑普及,低端低端CPU价格战的产物价格战的产物,有效帮助公司早期实现市场下沉有效帮助公司早期实现市场下沉1998年前后,个人电脑渗透率快速提升,大量的低价CPU需求使得各厂商在低端领域展开激烈的价格战,英特尔推出赛扬系列与AMD的K6-2系列在该领域展开激烈竞争,并打击了Cyrix、Centaur、Rise等一众CPU厂商资料来源:CPU-world,中信证券研究部Covington与与

277、Mendocino性能参数对比性能参数对比架构架构工艺制程工艺制程核心数核心数缓存缓存频率频率(MHz)总线频率总线频率(MHz)接口接口指令集指令集位数位数CovingtonP6250nm1无266-30066Slot 1/SC242MMX32MendocinoP6250nm1128 KB L253366Slot 1/Socket 370MMX321225.5.赛扬(低价低端赛扬(低价低端PC):性能较奔腾低一级,帮助实现市场下沉):性能较奔腾低一级,帮助实现市场下沉目前低端目前低端、低价低价、较强稳定性的赛扬系列较强稳定性的赛扬系列,主要用于入门级电脑主要用于入门级电脑赛扬系列性能较低,适

278、用于入门级电脑、嵌入式应用,核心数普遍为2,部分为4,且为单线程。其性能较奔腾更低一级,主要可分为G、J、N系列但其价格普遍较低但其价格普遍较低,例如例如22Q1推出的赛扬推出的赛扬G6900,价格区间为价格区间为42-52美元美元,较酷睿较酷睿、奔腾系列经济实惠奔腾系列经济实惠英特尔部分新品参数、价格对比英特尔部分新品参数、价格对比资料来源:英特尔官网,中信证券研究部i9i9-1290012900i3i3-1210012100G7400G7400D1702D1702D1739D5G6900G6900G6900TEG6900TE系列系列酷睿i9酷睿i9奔腾金牌至强D至强D

279、奔腾金牌赛扬赛扬赛扬赛扬发行日期发行日期Q122Q122Q122Q122Q122Q122Q122Q122垂直市场垂直市场DesktopDesktopDesktopServerServerMobileDesktopEmbedded光刻光刻Intel 7Intel 7Intel 7Intel 7Intel 7Intel 7Intel 7Intel 7使用条件使用条件PC/Client/Tablet WorkstationPC/Client/TabletPC/Client/TabletServer/EnterpriseServer/Enterprise/PC/Client/TabletEmbedde

280、d Broad Market Commercial Temp内核数内核数16422852 22 2性能核数性能核数8422812 22 2能效核数能效核数8000040 00 0线程数线程数248441662 22 2缓存缓存30 MB Intel Smart Cache12 MB Intel Smart Cache6 MB Intel Smart Cache5 MB15 MB8 MB Intel Smart Cache4 MB Intel Smart Cache4 MB Intel Smart Cache提供嵌入式提供嵌入式方案方案是是否否否否否否是是最大内存最大内存大小大小128 GB12

281、8 GB128 GB256 GB384 GB64 GB128 GB128 GB美元价格美元价格22-61135.6.处理器凌动(低功耗、物联网):瞄准移动市场,集成化为迭代主线处理器凌动(低功耗、物联网):瞄准移动市场,集成化为迭代主线凌动为英特尔的超低电压处理器凌动为英特尔的超低电压处理器,其主要应用场景为其主要应用场景为智能手机智能手机、平板电脑和低成本平板电脑和低成本PC凌动于2008年首次发布,一开始的Z系列全为单核第一代第一代“凌动凌动”:产品针对上网本移动市场

282、:产品针对上网本移动市场,面积与面积与功耗成为设计的重要考量功耗成为设计的重要考量。第一代凌动采用Bonnell微处理器架构,45nm制程。其放弃乱序执行单元,而采用顺序执行设计。此举牺牲了部分处理器性能,但减少大量的晶体管数量,从而大幅减小芯片体积。同时,45nm制程工艺也有助于进一步缩小产品面积虽然其能耗比出色,但性能相对孱弱,一定程度上影响第一代“凌动”的销量第二代第二代“凌动凌动”:尝试同步提升性能与减少面积的设:尝试同步提升性能与减少面积的设计计,弥补一代缺陷弥补一代缺陷2009Q4,英特尔推出第二代“凌动”Pine Trail,其架构同样为Bonnell,制程为45nm。但相较于一

283、代凌动,其采用双芯片设计将北桥芯片整合进CPU中,此举既能大幅降低内存延迟,提升运算速度;又能将芯片体积减小60%-70%。资料来源:Intel官网,unwire一代“凌动”与二代“凌动”结构对比一代“凌动”与二代“凌动”结构对比整合北桥整合北桥1245.6.处理器凌动(低功耗、物联网):瞄准移动市场,集成化为迭代主线处理器凌动(低功耗、物联网):瞄准移动市场,集成化为迭代主线第三代第三代“凌动凌动”:面对手机市场的巨大机遇与:面对手机市场的巨大机遇与ARMARM的强大地位的强大地位,英特尔推出新一代产品英特尔推出新一代产品MedfieldMedfield,成效显著成效显著Medfield由M

284、enlow迭代而来,其微架构为Saltwell,但制程升级至32nm,处理器频率达1.80GHz或1.86GHz其将处理器与芯片整合为其将处理器与芯片整合为SoCSoC(名为名为PenwellPenwell)进一步提升集成度进一步提升集成度,整个SoC的尺寸为12mm x 12mm,较前代缩小一半;同时其功耗表现也普遍由于同期产品,根据Anandtech数据,与苹果三星同期手机相比,Medfield在待机、通话、浏览等应用场景功耗均表现优异资料来源:Intel 2009投资者会Medfield迭代历程迭代历程待机待机(3G)谈话谈话(3G)浏览浏览(3G)视频播放视频播放720p苹果苹果 iP

285、hone 4S38mW800mW1.3W500mW英特尔英特尔 Medfield 参考参考18mW700mW1.0W850mW三星盖乐世三星盖乐世 S II19mW675mW1.2W650mWPenwell SoC 内部结构框架图内部结构框架图资料来源:AnandtechMedfield与同期产品功耗对比与同期产品功耗对比资料来源:Anandtech,中信证券研究部1255.6.处理器凌动(低功耗、物联网):瞄准移动市场,集成化为迭代主线处理器凌动(低功耗、物联网):瞄准移动市场,集成化为迭代主线此后此后,“凌动凌动”陆续推出多代处理器陆续推出多代处理器,但在智能手机市场依旧不敌但在智能手机市

286、场依旧不敌ARMARM在Medfield之后,“凌动”推出了Baytrail、Braswell、Apollo Lake等平台,并投资约100亿美元用于产品折扣、联合营销、设备商补贴等。根据21IC,补贴结束后,凌动出货量同比下降44%,巨额投资让利并未强化客户粘性与提升市场地位巨额投资让利并未强化客户粘性与提升市场地位我们认为我们认为,生态生态、兼容性兼容性、X X8686适配性不足等因素是英特尔在移动端市场开拓不顺的主要原因适配性不足等因素是英特尔在移动端市场开拓不顺的主要原因生态:生态:“凌动”入局较晚,ARM生态已初步建立兼容性:兼容性:“凌动”对安卓系统的兼容性问题始终存在,生态突破难

287、度提升功耗与能效:功耗与能效:英特尔的功耗高于ARM,在移动端竞争中劣势大资料来源:各公司官网,中信证券研究部“凌动”系列在移动端发展阻碍“凌动”系列在移动端发展阻碍阻碍维度阻碍维度具体内容具体内容生态生态“凌动”入局较晚,“凌动”入局较晚,ARMARM生态已初步建立。生态已初步建立。“凌动”产品线2008年方成立,彼时ARM已成功铸造自己的生态壁垒,大量的开发商与软件已与ARM形成深度绑定,Arm+Android的合作一如当年的“Wintel”联盟,先到先得、赢者通吃兼容性兼容性“凌动”对安卓系统的兼容性问题,使得生态突破难度提升。“凌动”对安卓系统的兼容性问题,使得生态突破难度提升。“凌动

288、”系列依旧为X86架构,而大多数移动端应用开发者不愿意为X86手机提供针对性的安装包。无论英特尔如何优化,其由于架构不同产生的兼容性问题依旧存在功耗与能效功耗与能效英特尔的功耗高于英特尔的功耗高于ARMARM,在移动端竞争中劣势大。,在移动端竞争中劣势大。应用于PC端的英特尔处理器具有更高的功耗,无法满足移动端的功耗需求,需要重新设计,其设计方案往往以牺牲性能为代价实现功耗的降低,但其能耗比依旧低于ARM1265.6.处理器凌动(低功耗、物联网):瞄准移动市场,集成化为迭代主线处理器凌动(低功耗、物联网):瞄准移动市场,集成化为迭代主线目前目前,“凌动凌动”系列逐渐边缘化系列逐渐边缘化,但相关

289、架构应用于但相关架构应用于12代酷睿的能效核中代酷睿的能效核中2016年4月底,英特尔公司发言人证实原定在2016年推出的移动处理器凌动产品线的两个新版本将会取消发布,换言之英特尔将会退出智能手机芯片市场英特尔将会退出智能手机芯片市场而后由于公司布局调整,其Atom的N系列被并入奔腾与赛扬中;目前所保留的C系列、P系列主要针对服务器、基站等应用领域;后整个系列的核心数跨度也逐渐变大,最小为2核,最大为24核(如凌动P5900系列的P5962B)智能手机市场逐渐被ARM所占据,Atom系列不再更新,但在12代酷睿中,Atom则作为高能效比的“小核”(能效核),再次出现,在“大小核”时代发挥其作用

290、。凌动凌动P5900系列产品特点系列产品特点资料来源:英特尔官网,中信证券研究部英特尔第一款为英特尔第一款为5G基站打造的基站打造的SoC单颗芯片,专为单颗芯片,专为 5G 的高带的高带宽和低延迟而设计。宽和低延迟而设计。功耗完全满足基站要求功耗完全满足基站要求将计算、连接、加速器集成到单将计算、连接、加速器集成到单颗颗SoC片上系统中。采用英特尔片上系统中。采用英特尔10纳米纳米延续英特尔的专长,拥有极强的延续英特尔的专长,拥有极强的计算能力;在连接上,具有内置计算能力;在连接上,具有内置的交换,速度高达的交换,速度高达 440T。P5962BP5962B系列系列凌动P发行日期发行日期Q12

291、0垂直市场垂直市场Server光刻光刻10 nm使用条件使用条件Base Transceiver Station内核数内核数24基本频率基本频率2.20 GHz线程数线程数24缓存缓存27 MB L2 Cache提供嵌入式方案提供嵌入式方案是UPI UPI 链接数链接数0QPI QPI 链接数链接数0最大内存大小最大内存大小128 GB凌动凌动P5962B性能参数性能参数资料来源:英特尔官网,中信证券研究部12代酷睿大小核设计代酷睿大小核设计能效核能效核*4隶属凌动系列资料来源:IAD 2021,中信证券研究部1275.7.Movidius视觉处理器:前瞻布局,针对边缘与视觉处理器:前瞻布局,

292、针对边缘与AI设备设备Movidius视觉处理器视觉处理器(VPU)用于计算机视觉和边缘人工智能工作负载用于计算机视觉和边缘人工智能工作负载通过独特架构,将高度并行的可编程计算与面向特定工作负载的硬件加速相结合,并可实现电源效率和计算性能之间的平衡借助深度神经网络和基于计算机视觉的应用程序,为智能摄像头、边缘服务器和人工智能设备提供支持目前,英特尔官网仅子公司Movidius推出的Myriad X一颗VPU产品Movidius Myriad X性能参数性能参数资料来源:Anandtech,中信证券研究部 工艺制程为16nm FinFET 引入了被称为神经计算引擎(Neural Compute

293、Engine)的片上 DNN 加速器,在 Myriad X 的理论 4+TOPS 计算能力的基础下,可以实现每秒超过1 万亿次操作(TOPS)的峰值 DNN 推理吞吐量 拥有四个 C 编程 128 位 VLIW 失量处理器 支持 30 Hz(H.264/H.265)和60 Hz(M/JPEG)的 4K 硬件编码。在接口方面,支持 USB 3.1 和 PCIe 3.0128六、行业演变:多年积累,竞合不断,成就行业两大龙头六、行业演变:多年积累,竞合不断,成就行业两大龙头6.1 6.1 发展演变:相互竞合,初始禀赋与体量决定不同发展战略发展演变:相互竞合,初始禀赋与体量决定不同发展战略6.2 6

294、.2 竞争格局:差距逐渐缩小,笔记本服务器市场公司优势显著竞争格局:差距逐渐缩小,笔记本服务器市场公司优势显著129仙童半导体仙童半导体英特尔在英特尔在CPU上主要竞争对手是上主要竞争对手是AMD,两者在各个发展阶段联系紧密两者在各个发展阶段联系紧密,竞合不断竞合不断公司创立公司创立英特尔与英特尔与AMD的创始人均来自的创始人均来自“仙童半导体仙童半导体”。“英特尔”创立后,仙童半导体销售部主管杰里 桑德斯加入无果,便与其它7名仙童半导体员工共同创立了“AMD”6.1.发展演变:发展演变:AMD,同根同源的对手,竞合不断,同根同源的对手,竞合不断资料来源:Wikichip,中信证券研究部;注:

295、Logo来自各公司官网罗伯特罗伯特 诺伊斯诺伊斯戈登戈登 摩尔摩尔安迪安迪 格鲁夫格鲁夫杰里杰里 桑德斯桑德斯7名仙童员工名仙童员工 同根同源,拥有相似的产业资源、趋势研判 罗伯特 诺伊斯曾以个人信用为AMD做担保,帮助解决前期筹资问题 相似且紧密的关系为后续的竞合埋下伏笔错位成长错位成长作为英特尔的作为英特尔的“第二供应商第二供应商”,重学习追赶重学习追赶,轻正面对抗轻正面对抗。AMD推出的第一款CPU AM9080,实质是对Intel8080A的逆向参考,并具有增强的电气特性和更低的功耗 AMD不与英特尔竞争,而是通过产品性能打败其余竞争对手,成为“第二供应商”符合当时下游厂商的“多供应商

296、”需求,避免正面对抗 苹果等公司如今依旧采用“多供应商”的策略模仿逆向于模仿逆向于AMD AM9080Intel 8080A资料来源:cpu-world,中信证券研究部130共同发展共同发展AMD作为作为“第二供应商第二供应商”,与英特尔共同进入与英特尔共同进入IBM供应链供应链,收获收获X86架构架构。为满足IBM“第二供应商”要求及打入IBM供应链,英特尔同意授权AMD生产X86处理器,同时AMD放弃自有产品,成为第二供应商6.1.发展演变:由发展演变:由AMD追随模仿,到双方各展所长追随模仿,到双方各展所长 英特尔:逐渐意识到微处理器的重要性,并调整自身业务核心 AMD:成功进入X86架

297、构,并在后续以此为蓝本推出Am286处理器产权对抗产权对抗“第二供应商第二供应商”策略带来的知识产权风险:策略带来的知识产权风险:模仿追随下,AMD迅速发展。英特尔开始对AMD“专利侵权”展开诉讼,最终英特尔败诉。AMD获得80386的任何知识产权(包括X86指令集)各显神通各显神通英特尔加快产品研发英特尔加快产品研发,并推出并推出“Intel inside”运动运动,强化品牌强化品牌。AMD基于X86架构下的内研外并,构筑自有产品力,主打性价比IBM英特尔英特尔AMD第一供应商第一供应商第二供应商第二供应商相互授权相互授权英特尔英特尔AMD 双方开始根据自身行业地位制定市场战略 英特尔旨在提

298、高品牌辨识度,做出品牌差异 AMD瞄准中端市场,提升性价比 双方均重视CPU性能的提升,开始在产品迭代上进行竞争。陆续推出386、486、以及具有跨时代意义的奔腾(586)处理器推出Intel inside:只要下游客户在其相关产品广告中打出Intel inside的标志,就能获得英特尔的“广告报销”推出Am386,与intel的386兼容,性价比高而后收购NexGen,推出“速龙”处理器,前于英特尔发布全球首款1GHZ的处理器资料来源:自各公司官网,中信证券研究部131英特尔英特尔Tick-Tock策略策略2006年年,英特尔提出英特尔提出“Tick-Tock”战略战略。公司以两年一个周期进

299、行工艺与架构的交替更新,从而保证产品性能的持续提升“Tick-Tock”“PAO”:技术无法跟上迭代节奏,延长为三年一周期,多添加“优化”环节6.1.发展演变:英特尔发展演变:英特尔加速研发,拉开差距加速研发,拉开差距 保证产品迭代速度:保证产品迭代速度:使得AMD无法跟随英特尔快速的产品迭代速度,有效拉开与AMD的差距。更具稳定性:更具稳定性:将工艺与架构交错升级,避免工艺与架构同时更新失败的风险工艺年(Tick):使用新的制程,架构方面仅做微小调整架构年(Tock):主要针对架构进行较大改进,并优化前一年线程资料来源:CSDN-CHENG Jian,英特尔官网,中信证券研究部2016年,由

300、于14nm、10nm工艺进展不顺,英特尔放弃“Tick-Tock”战略,而采用PAO”战略采用“PAO”战略,以三年为一周期,进行“工艺-架构-优化”的交替迭代英特尔英特尔“Tick-Tock”战略产品规划图战略产品规划图英特尔英特尔“PAO”战略产品规划图战略产品规划图资料来源:CSDN-CHENG Jian,英特尔官网132AMD由由IDM转为转为Fabless:2009年,由于AMD资金紧张,无法继续在代工方面投入大量的资金,其将自有的代工厂“格罗方德”分拆出售,由IDM转为Fabless,专注于芯片的研发环节借力于台积电借力于台积电,实现赶超:实现赶超:英特尔10nm制程进展不顺,而A

301、MD选择台积电进行代工,首次实现在制程维度的反超。借助台积电先进工艺,结合自身研发多年的Zen架构,AMD CPU性能提升明显,迅速抢占市场6.1.发展演变:发展演变:AMD内研架构,外寻工艺,实现追赶内研架构,外寻工艺,实现追赶AMD Zen架构架构CPU路线图路线图资料来源:知乎半导体行业观察,tomshardware 架构+制程:CPU性能提升的两大关键 无论是英特尔还是AMD,CPU厂商在进行向上突破时,都极大依赖于架构与制程的革新 专注研发的Fabless模式,更适合体量较小的CPU厂商 17年,AMD推出了耗时4年研发的“Zen”架构,EPYC霄龙服务器处理器性能大幅提升 19年,

302、推出“Zen2”架构的第二代霄龙,为首颗7nm制程的服务器处理器,由台积电代工 21年推出“Zen3”架构的第三代霄龙服务器处理器,同为7nm,实现19%的代际 IPC 提升AMD Zen霄龙服务器产品历程霄龙服务器产品历程资料来源:AMD官网,中信证券研究部133AMD与英特尔在同频下与英特尔在同频下Cinebench R15单核跑分对比单核跑分对比050020001820192020AMD单核得分英特尔单核得分在架构上在架构上,Zen架构快速提升单核性能架构快速提升单核性能,弥补自身产品长期以来的劣势;此后弥补自身产品长期以

303、来的劣势;此后,Zen2实现性能反超实现性能反超一直以来,AMD的CPU都存在单核性能羸弱的特点,单核性能始终弱于同期同等级的英特尔产品,只能依靠“堆核”的策略缩小两者的差距根据Cinebench R15数据,AMD在2019年凭借其Zen 2架构,成功实现CPU单核跑分的超越6.1.发展演变:发展演变:AMD内研架构,外寻工艺,实现追赶内研架构,外寻工艺,实现追赶资料来源:Cinebench R15,前瞻产业研究院,中信证券研究部AMDAMD单核性能明显弱单核性能明显弱于同期英特尔产品于同期英特尔产品注:2018年及以前为(4.0GHz),2019年为4.1GHz20192019年年5 5月

304、,月,AMDAMD发布搭载发布搭载Zen2Zen2架构架构的锐龙的锐龙3000CPU3000CPU,实现,实现21%21%的代际性的代际性能提升,能提升,IPCIPC部分提升部分提升+60%+60%,单核性,单核性能反超英特尔能反超英特尔AMD ZenAMD Zen架构诞生,显架构诞生,显著缩小与英特尔差距著缩小与英特尔差距134同时同时,Foundry厂商台积电专注于代工制造厂商台积电专注于代工制造,能够具有充足的资本投入于制程的推进能够具有充足的资本投入于制程的推进,因此能帮助因此能帮助AMD迅速补足工艺制程迅速补足工艺制程的不足的不足2017年以前,AMD的各代产品在制程上都落后于英特尔

305、的同期产品,英特尔在2013年已成功量产14nm产品,而同期AMD仍停留在32nm制程而在17年后,AMD借助台积电成功实现制程上的反超,率先量产7nm CPU6.1.发展演变:发展演变:AMD内研架构,外寻工艺,实现追赶内研架构,外寻工艺,实现追赶2008-2021 英特尔与英特尔与AMD处理器架构与制程对比处理器架构与制程对比资料来源:前瞻产业研究院,英特尔官网,AMD官网,中信证券研究部英特尔英特尔AMDAMD年份年份架构架构工艺工艺架构架构工艺工艺20082008Corei7(Nehalem)45nmPhenom FX(Agena)65nm20102010Corei7(Westmere

306、)32nmPhenom II(Thuban)45nm20112011Sandy Bridge32nmFX(Bulldozer)APU(Liano)32nm20122012lvy Bridge22nmFX(Piledriver)APU(Trinity)32nm20132013Haswell14nmFX(Piledriver)APU(Richard)32nm20142014Broadwell14nmFX(Pildriver)28nm20152015Skywell14nmAPU(Godavri,Carrizo)28nm20162016Kabylake14nm+FX(Zen)14nm20172017C

307、annonlake14nm+APU(Zen)14nm20182018Cannonlake/Coffeelake14nm+Zen+12nm20192019Icelake10nmZen 27nm20202020Tigerlake10nmZen 37nm20212021Alderlake7nmAMDAMD制程落后,产品制程落后,产品性能不足,市场份额性能不足,市场份额日益减少日益减少AMD+AMD+台积电台积电Fabless+FoundryFabless+Foundry各自聚焦架构与工艺各自聚焦架构与工艺实现反超实现反超135在在CPU市场市场,两者分别在不同时期凭借自身正确的发展战略迅速提升份额两

308、者分别在不同时期凭借自身正确的发展战略迅速提升份额06年以前,英特尔与AMD在CPU市场中的份额逐渐接近,而后英特尔发挥技术累积优势,利用“Tick-Tock”战略快速提升产品研发速度,市场份额再次拉开。15年以后,AMD逐渐注重非PC市场,加强与三大游戏厂商微软、索尼、任天堂的合作同时AMD开始注重高性能市场,与17年推出全新Zen架构,搭配台积电10nm、7nm先进制程,份额快速提升6.2.竞争格局:竞争格局:CPU市场英特尔优势明显,市场英特尔优势明显,AMD奋起追赶奋起追赶推出自有研发的推出自有研发的Zen架构,架构,性能远超同期竞品性能远超同期竞品推行推行Tick-Tock战略,加战

309、略,加速产业研发速度,持续迭速产业研发速度,持续迭代代借助借助Zen、Zen2、Zen3的架构的架构改进及改进及台积电台积电10nm、7nm的先进制的先进制程工艺,提升份额程工艺,提升份额与三大游戏厂商微软、索尼、任天堂与三大游戏厂商微软、索尼、任天堂持续深化合作持续深化合作AMD的双核速龙芯片的双核速龙芯片性能优于同期英特尔性能优于同期英特尔的双核处理器奔腾的双核处理器奔腾D资料来源:PassMark,中信证券研究部注:Passmark市场份额数据来自于运行测试软件的主机,故不反应实际市场份额,但可反应趋势。英特尔与英特尔与AMD CPU市场份额变化情况市场份额变化情况136其中其中,桌面端

310、电脑为桌面端电脑为CPU的主要战场的主要战场,竞争相对激烈竞争相对激烈,AMD凭借凭借Zen架构一度实现反超架构一度实现反超作为CPU的主要竞争市场,两家公司均在桌面端持续发力,份额也相对接近16Q1,AMD市场份额为53.9%,首度超过英特尔,虽只维持了一个季度,但也使得英特尔意识到自身主业的竞争危机21Q1,疫情换机需求+半导体历史级行情使得桌面端需求与ASP迅速提升,锐龙4000的持续需求与锐龙5000系列的推出帮助AMD迅速成长。6.2.竞争格局:桌面端竞争格局:桌面端AMD发展迅速,差距明显缩小发展迅速,差距明显缩小7nm制程制程定义存在问题定义存在问题宣布延期宣布延期AMD份额首度

311、份额首度超过英特尔超过英特尔Tick-Tock战略战略英特尔黄金发展期英特尔黄金发展期Zen+台积电,台积电,AMD黄金发展期黄金发展期疫情换机需求驱动疫情换机需求驱动锐龙锐龙 4000、5000系列推出系列推出AMD份额再度超过英特尔份额再度超过英特尔收购收购GPU厂商厂商ATIGPU+CPU双线发展双线发展分身乏术分身乏术英特尔与英特尔与AMD 桌面端桌面端CPU市场份额变化情况市场份额变化情况资料来源:PassMark,中信证券研究部注:Passmark市场份额数据来自于运行测试软件的主机,故不反应实际市场份额,但可反应趋势。137由于功耗由于功耗、稳定性稳定性、单核性能等优势单核性能等

312、优势,英特尔在笔记本电脑市场一直表现强势英特尔在笔记本电脑市场一直表现强势。近年来公司份额有所下降近年来公司份额有所下降,但优势不减但优势不减笔记本电脑对功耗、发热均更敏感,要求更为苛刻,而这些维度又恰是AMD的相对弱项,因此AMD在笔记本市场一直无法撼动英特尔的市场地位AMD在笔记本端一直发力不足,份额一直在20%左右徘徊;相反,英特尔在笔记本市场投入不断,相继推出“超极本”、“雅典娜计划”的方案,实现续航、性能、重量的同步提升6.2.竞争格局:笔记本端格局稳定,英特尔优势明显竞争格局:笔记本端格局稳定,英特尔优势明显锐龙系列在性能和功耗控制锐龙系列在性能和功耗控制上有明显改善,推高份额上有

313、明显改善,推高份额Zen3架构大幅架构大幅优化电源管理优化电源管理推出超极本,推出超极本,主打完备、便携、长续航主打完备、便携、长续航满足市场的需求迭代满足市场的需求迭代AMDAMD在功耗、能效上的劣势被笔在功耗、能效上的劣势被笔记本市场进一步放大。记本市场进一步放大。同时英特尔同时英特尔CPUCPU更为稳定,更适更为稳定,更适合移动、微撞击、微震动的笔合移动、微撞击、微震动的笔记本场景记本场景两者差距在笔记本端更为明显两者差距在笔记本端更为明显英特尔与英特尔与AMD 笔记本笔记本CPU市场份额变化情况市场份额变化情况资料来源:PassMark,中信证券研究部注:Passmark市场份额数据来

314、自于运行测试软件的主机,故不反应实际市场份额,但可反应趋势。138服务器市场更加强调性能服务器市场更加强调性能,因此英特尔的龙头地位更加显著因此英特尔的龙头地位更加显著,呈现呈现“强者恒强强者恒强”格局格局英特尔08年Q1在服务器市场的份额为70.8%,此后份额迅速提升,15Q1英特尔在服务器市场的份额已达98.1%。成为该市场的绝对龙头2019年3月,基于Zen3架构的霄龙第三代服务器处理器推出,帮助AMD迅速抢占市场份额。根据PassMark数据,AMD市场份额由21Q1的2.4%增至21Q3的8.4%。而后英特尔10nm的Ice Lake出货,又逐渐夺回部分市场份额6.2.竞争格局:服务

315、器端差距扩大,性能导向致使强者恒强竞争格局:服务器端差距扩大,性能导向致使强者恒强推出基于推出基于Zen架构的架构的14nm霄龙处理器霄龙处理器英特尔英特尔14nm Cascade Lake服务器处理器上市服务器处理器上市19年年8月,推出基于月,推出基于Zen2架构架构的的7nm霄龙二代处理器霄龙二代处理器19年年8月,推出基于月,推出基于Zen3架构的架构的7nm霄龙三代处理霄龙三代处理器,器,IPC+19%10nm的的Ice Lake处理器出货处理器出货英特尔与英特尔与AMD 服务器服务器CPU市场份额变化情况市场份额变化情况资料来源:PassMark,中信证券研究部注:Passmark

316、市场份额数据来自于运行测试软件的主机,故不反应实际市场份额,但可反应趋势。139七:行业启示:下游需求引领行业变革,商业模式需适配产业趋势7.1 7.1 架构先行:微架构是架构先行:微架构是CPUCPU竞争的核心法宝,相对成熟利于追赶竞争的核心法宝,相对成熟利于追赶7.2 7.2 生态为王:生态是企业壮大的关键,强者愈强地位稳固生态为王:生态是企业壮大的关键,强者愈强地位稳固7.37.3需求引领:需求迭代催生后浪巨头,把握下游打开新兴市场需求引领:需求迭代催生后浪巨头,把握下游打开新兴市场7.47.4商业模式:商业模式:FablessFabless展现优势,分工合作利于规模扩张展现优势,分工合

317、作利于规模扩张1401407.1 架构先行:架构先行:CPU竞争的核心法宝,技术相对成熟,国产厂商加速追赶竞争的核心法宝,技术相对成熟,国产厂商加速追赶国际上来看国际上来看,微架构是微架构是CPU竞争的核心法宝竞争的核心法宝,目前主要的架构技术已经相对成熟目前主要的架构技术已经相对成熟。指令集架构方面,主要的发展集中于SIMD,到AVX512已经面临GPU等芯片挑战,且应用场景有限。微架构方面,流水、缓存、乱序等都已经出现数十年,现在边际效用已经出现明显递减。微架构是国产微架构是国产CPU最主要的发力点最主要的发力点,不断缩小与海外龙头差距不断缩小与海外龙头差距。工艺制程、先进封装等影响性能的

318、关键因素受限于国产半导体产业链的技术水平,CPU企业自身难以独立决定,对于CPU企业自身而言,微架构的持续创新迭代成为竞争的重点。主要技术主要技术 首次出现首次出现在在CPU上首次出现上首次出现流水线1960,IBM 7030 Stretch1982,Intel 80286高速缓存1969,IBM 360/851984,Intel 80386乱序执行1967,IBM 360/911995,Intel Pentium ProSIMD1997,Intel Pentium MMX架构改进幅度架构改进幅度IPC提升幅度提升幅度微指令缓存+68.75%约3%L2缓存+100%约1%分支预测缓存+50%约

319、2%乱序执行缓存+25%约1%指令集架构指令集架构/微架构的核心思想在数十年前就已经出现微架构的核心思想在数十年前就已经出现架构改进的效用已经明显缩小架构改进的效用已经明显缩小资料来源:TechNews科技新报回顾历史梦幻处理器:计算机结构、商业大型主机与超级计算机的诞生(handymantw),IBM Archives:IBM Mainframe,中信证券研究部资料来源:AMD Ryzen 7000系列发布会,Twitterchiakokhua,中信证券研究部测算1411417.2.生态为王:生态是第一竞争力,强者愈强难以颠覆生态为王:生态是第一竞争力,强者愈强难以颠覆中国部分主流中国部分主

320、流APP活跃用户数(亿)活跃用户数(亿)软件生态圈通常总是越来越稳固,难以颠覆,其依赖的指令集也因而难以颠覆软件生态圈通常总是越来越稳固,难以颠覆,其依赖的指令集也因而难以颠覆指令集相当于语言,则软件相当于书籍,语言为书籍提供建立基础,书籍为语言带来大量用户在大规模生态中在大规模生态中,大批用户能够吸引大批开发者大批用户能够吸引大批开发者,进而产生大批量应用程序进而产生大批量应用程序,进一步吸引用户进一步吸引用户,形成正反馈形成正反馈。生态文化圈用户粘性不断增强,可以在各APP的活跃用户数体现开放环境中,生态对于市场的影响力远超技术水平、自主程度,其他因素难以颠覆生态0.02.04.06.08

321、.010.012.--------------------012021-03微信美

322、团腾讯视频京东拼多多淘宝QQ微博资料来源:wind,中信证券研究部1421427.2.生态为王:生态是第一竞争力,强者愈强难以颠覆生态为王:生态是第一竞争力,强者愈强难以颠覆资料来源:各公司官网中信证券研究部Arm架构生态日益壮大,逐渐蚕食架构生态日益壮大,逐渐蚕食X86架构生态,架构生态,Windows 11已增加已增加ARM支持支持目前目前CPU主要的两大生态分别是:主要的两大生态分别是:1、以英特尔以英特尔、AMD为代表的为代表的X86架构生态架构生态。2、以以ARM授权公司授权公司(高通高通、苹果苹果、华为华为)为代表的为代表的Arm架构生态架构生态同时,ARM生态发展正逐渐壮大,有逐

323、渐蚕食X86架构生态的趋势对于一些国产自研架构对于一些国产自研架构,除技术外除技术外,生态也是亟待处理解决的问题生态也是亟待处理解决的问题。如若架构上没有丰富的软件生态,架构则会“空有骨架,缺乏灵魂”解决方法解决方法指令翻译:指令翻译:利用类似于苹果Rosetta 2的指令翻译程序,将其他架构上的程序进行指令集转译,从而迁移到目标架构上,但这一做法不能保证软件的完整运行Windows Windows 7/8/107/8/10X86/X64AndroidiOS/iPadOS/MacOSARMWindows Windows 1111X86/X64Windows 11AndroidiOS/iPadO

324、S/MacOSARM143143成熟生态壁垒过高成熟生态壁垒过高,难以颠覆难以颠覆,要开辟新的市场机会则必须有新的市场需求要开辟新的市场机会则必须有新的市场需求。新的市场需求会创造原有生态不能满足的空白市场,使新生态得以产生要充分利用尚未被满足的需求要充分利用尚未被满足的需求,其中其中,速度至关重要速度至关重要。尽早推出产品才能占据先发优势,尽早产生正反馈,培植自身生态圈,对后发者产生压制作用IBM model 5150是开放式PC商业模式的鼻祖,采用Intel 8086/8088处理器,并且可以选择MS-DOS操作系统摩托罗拉MC68000处理器性能优于Intel 8086,但诞生时间晚了1

325、5个月,刚发布便面临劣势,最终没能成功获得IBM订单,摩托罗拉也进一步失去了PC市场微软购买了QDOS并在几个月内改为MS-DOS,卖给IBM,取代了此前主流的CP/M操作系统IBM model 5150采用采用Intel 8086/8088处理器处理器摩托罗拉摩托罗拉MC68000处理器处理器7.3.需求引领:需求引领:PC成就成就wintel,快速抢占生态位至关重要,快速抢占生态位至关重要资料来源:中关村在线-刘亮PC发展史3:个人PC开山鼻祖的前世今生资料来源:中关村在线-刘亮PC发展史3:个人PC开山鼻祖的前世今生144144资料来源:wind,IDC,中信证券研究部全球智能终端出货量

326、(亿台)全球智能终端出货量(亿台)7.3.需求引领:移动端铸就需求引领:移动端铸就ARM护城河,护城河,Intel亦难撼动亦难撼动高通历年营收(亿美元)高通历年营收(亿美元)ARM低功耗优势明显,随着移动通信而崛低功耗优势明显,随着移动通信而崛起。早期手机大量采用起。早期手机大量采用ARM处理器,但也未处理器,但也未必采用必采用ARM早期处理器例如TI的OMAP、Intel的Xscale等都是ARM架构2000年摩托罗拉天拓A6188手机采用自研的龙珠(DragonBall)处理器,其最早的型号MC68328出现于1995年,基于MC68000内核开发智能手机的兴起带动了智能手机的兴起带动了A

327、RM生态生态手机智能化促进移动端软件发展,迫使硬件指令集统一高通与智能手机高增速时期重合Intel也无法打破也无法打破ARM一家独大一家独大2008年Intel推出Atom,2010收购英飞凌基带部门,2012年Atom手机联想K800面世,2016年放弃Broxton和SoFIA开发,实质上放弃移动端。用户缺乏对x86/Windows平板的需求56.7375.2688.71111.42104.16109.91149.57191.21248.66264.87252.81235.54222.91227.32242.73235.31335.660500300350400200

328、5200620072008200920000552006200720082009200001920202021PC平板电脑手机智能手机资料来源:wind,中信证券研究部145145云原生趋势推动了软件架构的变革云原生趋势推动了软件架构的变革,对硬件提出了新需求对硬件提出了新需求云原生条件下的新软件往往采用微服务架构,对单核性能需求减弱,因此多核性能、网络性能、低能耗等因素更为重要。云原生需求带动了多核心数的ARM服务器C

329、PU数据中心业务占据Intel约三分之一营收,云原生趋势对其业绩潜在影响较大原有生态并未覆盖物联网生态原有生态并未覆盖物联网生态,为新架构为新架构、新生态提供了机会新生态提供了机会物联网成为RISC-V的突破口,为应对开源的RISC-V,ARM免去M0-M3授权费。变革往往在不起眼的地方发生,正如液晶在电视屏幕上的早期应用失败,其真正的成功是从手表屏幕开始的AWS实例中不同处理器占比与新增占比实例中不同处理器占比与新增占比全球全球IaaS实例数量按处理器分类实例数量按处理器分类7.3.需求引领:云原生助推自研需求引领:云原生助推自研ARM,物联网助力新架构,物联网助力新架构资料来源:Anand

330、Tech,Liftr Insights资料来源:Liftr Insights146146随着摩尔定律走向终结随着摩尔定律走向终结,先进制程成本过高先进制程成本过高,迫切需要大规模生产摊薄成本迫切需要大规模生产摊薄成本先进制程晶圆价格增长明显,据Twitterchiakokhua(前TSMC工程师)测算,从2018Q3至2020Q1,5nm晶圆价格比7nm提升80%以上Fabless+Foundry模式能够整合各个生态圈需求模式能够整合各个生态圈需求,有效扩大生产规模有效扩大生产规模,降成本促迭代降成本促迭代仅苹果手机全球出货量就与全球PC总出货量较为接近,加上其余大量客户,能够大幅增加台积电生

331、产规模,摊薄固定成本,增加报价吸引力,有利于获取更多利润并进行研发投入,保持领先优势。Fabless模式展现出比Intel IDM模式更强的生存、进化能力每每5万片晶圆产能设备投资(亿美元)万片晶圆产能设备投资(亿美元)2020年年TSMC不同制程节点成本不同制程节点成本拆分测算拆分测算7.4.商业模式:商业模式:Fabless展现优势,分工合作利于规模扩张展现优势,分工合作利于规模扩张21.3425.0430.8239.547.4662.7284.49114.2155.57214.950500906545282016/1410753资料来源:IBS(转引自中芯国际科创板

332、招股说明书),中信证券研究部资料来源:Twitterchiakokhua(前TSMC工程师)147147CPU芯 片依赖不 断推进的 先进 制程芯 片依赖不 断推进的 先进 制程,且 每一 节点停留 时间 短且 每一 节点停留 时间 短,使得使得 IDM厂 商对旧 节点的 利用率较低厂 商对旧 节点的 利用率较低,而而Fabless+Foundry模式则能有效利用模式则能有效利用CPU等数字芯片性能依赖晶体管密度的提升,相较于模拟芯片,其产品更新迭代快,寿命普遍较短,因此每代产品在相应制程上的停留时间短,对相应制程节点的利用率不足如果采用Fabless+Foundry模式,则可利用较为老旧的制

333、程进行其它芯片的代工服务。以台积电为例,其5nm、7nm占营收占不断提高,但其16nm及以上制程依然保有较高且稳定的营收占比。22Q2,台积电16nm及以上制程的营收占比为49%资料来源:思瑞浦招股说明书,中信证券研究部资料来源:台积电官网,中信证券研究部数字芯片(数字芯片(CPU)与模拟芯片维度比较)与模拟芯片维度比较台积电各制程节点营收占比台积电各制程节点营收占比7.4.商业模式:商业模式:Fabless展现优势,分工合作利于规模扩张展现优势,分工合作利于规模扩张0%10%20%30%40%50%60%70%80%90%100%20Q120Q220Q320Q421Q121Q221Q321Q422Q122Q25nm7nm10nm16/20nm28nm40/45nm65nm90nm0.11/0.13m0.15/0.18m0.25m and above项目项目模拟芯片模拟芯片数字芯片数字芯

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(计算机行业:CPU Intel研究框架-220909(155页).pdf)为本站 (小时候) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部