《电子行业专题报告:AI专题AI巨轮滚滚向前-240218(65页).pdf》由会员分享,可在线阅读,更多相关《电子行业专题报告:AI专题AI巨轮滚滚向前-240218(65页).pdf(65页珍藏版)》请在三个皮匠报告上搜索。
1、行 业 研 究 2024.02.18 1 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 电 子 行 业 专 题 报 告 AI 专题:AI 巨轮滚滚向前 分析师 郑震湘 登记编号:S04 佘凌星 登记编号:S05 钟琳 登记编号:S06 刘嘉元 登记编号:S01 行 业 评 级:推 荐 公 司 信 息 上市公司总家数 504 总股本(亿股)4,966.92 销售收入(亿元)45,300.27 利润总额(亿元)3,462.59 行业平均 PE 49.50 平均股价(元)24.03 行 业 相 对
2、指 数 表 现 数据来源:wind 方正证券研究所 相 关 研 究 CES 2024:Mini/Micro LED 应用多点开花,新品大放光彩2024.01.20 半导体显示专题三:供给与需求下的价格周期2024.01.15 CES 2024:科技春晚精彩纷呈,硬件创新闪耀舞台2024.01.14 晶圆厂扩产&先进封装,国产设备做大做强2024.01.09 文生视频大模型文生视频大模型 SoraSora 震撼登场,震撼登场,AIGCAIGC 新时代已至新时代已至。OpenAI 在 2024 年 2 月16 日发布文生视频模型 Sora,该模型为基于 transform 架构的扩散模型,完美继承
3、 DALLE 3 的画质和遵循指令能力,并利用了 GPT 扩写,具备超长生成时间(60s)、单视频多角度镜头、理解物理世界三大突出优势。我们认为,从 Runway、Pika 到 Sora,文生视频大模型频出,视频长度从表情包长度的 3s-4s 到主流短视频长度的 60s,模型对物理世界的理解愈加接近现实,已具备商业化落地价值,创作内容产业革命来临,AIGC 新时代已至。除此之外,2024 年 2 月 15 日谷歌发布 Gemini 1.5 Pro,支持 100 万 token上下文长度,Gemini 1.5 Pro 性能显著增强,技术进步显著。英伟达正式发布英伟达正式发布 Chat With
4、RTXChat With RTX,A AI I 加速普及。加速普及。这款应用适用于 Windows平台,由 TensorRT-LLM 提供支持,并完全在本地运行。用户可以利用 Chat With RTX 以自己的内容定制一个聊天机器人,从而体验独特的本地化系统设计和强大的功能。此次 Chat With RTX 的发布不断加速人工智能的发展,加速了 AI 的普及和应用。同时此款应用改变人与 AI 的交互方式,用户可以根据自己的需求定制聊天机器人,这使得 AI的使用更加灵活和便捷。Chat With RTX 也代表了大型语言模型技术发展的一个重要方向,即为本地化、个性化、隐私保护的 AI 应用提供
5、了新的可能。我们认为,AI 正逐渐普及,通用人工智能时代加速来临。CESCES 百花齐放,百花齐放,AI+AI+终端终端智能化加速智能化加速。英伟达、AMD、高通分别推出 GeForce RTX 40 SUPER 系列、锐龙 8000G 系列、骁龙 XR2+Gen 2 等高性能处理器,性能水平实现跃升,助力 AI 加速渗透 PC、汽车、智能家居等终端场景。我们看到,三星大力布局人车互联生态;英特尔在发布 AI PC 平台的同时,推出 SDV SoC 赋能 AI+汽车;戴尔灵越系列搭载英特尔酷睿 Ultra 7,AI 能效再度提升;联想十余款 AI PC 产品发布,规模化落地逐步推进;华硕搭载酷
6、睿 Ultra 9,各系列产品针对不同的目标客户进行性能或配置上的优化,满足差异化需求。我们认为,在高性能 AI 处理器的加持下,AI+N 类终端的时代浪潮已至,AI 改变的不只是 PC 与手机,科技赋能将全方位渗透,消费电子也将迎来全新的增长机遇。MRMR 为为 AIAI 最佳落地终端,高度赋能最佳落地终端,高度赋能 MRMR 内容与硬件。内容与硬件。AnyMAL 于 2023 年 9 月28 日发布,而 Meta Quest 3 于同日发布,两者在时间上相近,且 Meta Quest 3 可收集多模态数据,将真实世界和虚拟世界无缝融合,实现 Meta Reality体验,我们认为 AnyM
7、AL 相关研究成果有望为 Meta 的元宇宙产品线提供支持并应用到消费者市场。我们认为 MR 是 AI 最佳落地终端,泛社交、B 端应用拓展也拥有想象空间。英伟达:英伟达:H H200200 出货在即,出货在即,B B100100 在路上。在路上。2023 年 11 月 13 日,英伟达发布首款搭载 HBM3e 的 GPU H200,借助 HBM3e,H200 能以每秒 4.8 TB 的速度提供141GB 内存,与 NVIDIA A100 相比,容量几乎翻倍,带宽增加 2.4 倍。搭载HBM3e 的 H200 在处理 700 亿参数的大模型时,推理速度较 H100 快了整整一倍,能耗降低了一半
8、。受 HBM3E 供应限制,预计 H200 将于 24Q2 实现出货。英伟达 B100 原计划发布时间为 2024Q4,但由于 AI 需求的火爆,已经提前至 2024Q2,目前已经进入供应链认证阶段,B100 将能够轻松应对 1730 亿参数的大语言模型,比当前型号 H200 的两倍还要强大。此外,B100 将采用方 正 证 券 研 究 所 证 券 研 究 报 告-31%-23%-15%-7%1%9%23/2/1823/5/223/7/14 23/9/25 23/12/7 24/2/18电子沪深300电子 行业专题报告 2 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 更高级
9、的 HBM 高带宽内存规格,有望在堆叠容量和带宽上继续突破,超越现有的 4.8TB/s。根据英伟达产品路线图,预计 2025 年将推出 X100,进一步丰富 GPU 产品矩阵,巩固英伟达 AI 芯片龙头地位。AMDAMD:MI300MI300 正式发布,正式发布,CoWoS+SoICCoWoS+SoIC 赋能赋能 3.5D3.5D 封封装。装。2023 年 12 月 6 日,AMD 在 Advancing AI 活动上宣布推出 Instinct MI300X,采用了 AMD CDNA3架构,搭载了 8 块 HBM3,容量达 192GB。与 MI250X 相比,计算单元增加了约 40%、内存容量
10、增加 1.5 倍、峰值理论内存带宽 3 增加 1.7 倍。在某些工作环境中,性能可达 H100 的 1.3 倍。MI300X 采用 3.5D 封装,即通过混合键合技术实现 XCD、I/Odie 的 3D 堆叠,其次在硅中介层上实现与 HBM 的集成,从而实现了超过 1500 亿个晶体管的高密度封装。该封装方案由台积电提供,搭配 SoIC 技术与 CoWoS 技术共同实现。CoherentCoherent:8 80000G G 产品产品环比持续高增环比持续高增,2 2025025 年顺应年顺应 AIAI 发展推进发展推进 1 1.6.6T T 商业商业化化。2023Q4 Coherent 实现收
11、入 11.31 亿美元,高于指引中值,yoy-17.45%,qoq+7.41%。受益于人工智能的蓬勃发展,AI/ML 相关数据收发器连续第三季获得强劲订单,800G 产品季度收入突破 1 亿美元,环比增长超 100%,800G出货量持续强劲增长,FY2024 公司预计超 50%的数据通信收发器收入将来自人工智能相关应用,2025 年向 1.6T 产品商业化发展前进以顺应 AI 发展。AristaArista:云、:云、AIAI 和数据中心核心业务发展势头迅猛和数据中心核心业务发展势头迅猛。Arista 在 2023 年的核心业务由云、Al 和数据中心产品组成,建立在高度差异化的 Arista
12、可扩展操作软件系统堆栈上,部署了 10G、25G、100G、200G 和 400G 的速度。Arista 云网络产品提供了节能、高可用的区域,而不会增加冗余成本,因为数据中心对前端、后端存储和计算集群的带宽容量和网络速度都有很高需求。Arista 预计 400 和 800 千兆以太网将成为 Al 后端 GPU 集群的重要试点,预计 2025 年实现 Al 网络收入至少 7.5 亿美元。国产算力把握机遇国产算力把握机遇乘势而上乘势而上。通过梳理 IC 先进算力公司公告及业务进展近况我们发现:目前国内 IC 先进算力公司在产品迭代、产能建设、斩获大额订单进展迅猛,其中产品迭代以及产能建设主要集中在
13、算力核心硬件以及AI 相关芯片中,同时从部分公司目前斩获的订单来看,主要集中在国产化算力相关项目中。我们认为,核心公司业务进展近况进一步印证了现阶段板块发展两个核心要素:AI 方向的持续产品迭代、庞大的国产化算力需求。我们看好在 AI 算力需求高景气的背景下,国内 AI 算力产业链将在 2024 年迎来更加快速的发展。HBM4HBM4 实现逻辑存储垂直堆叠,混合键合助力带宽提升。实现逻辑存储垂直堆叠,混合键合助力带宽提升。HPC 功耗问题突出,HBM 打破内存带宽及功耗瓶颈,已成为 HPC 军备竞赛的核心。海力士凭借其先进封装技术如 MR-MUF、混合键合和 2.5D FOWLP 技术,保持性
14、能领先,预计 HBM4 将于 2026 年面世,届时将实现逻辑和存储的垂直堆叠,对于键合、TSV 和散热环节的需求将大幅提升。混合键合是 HBM4 的关键技术,助力凸点间距缩小至 10um 以内,对应键合设备的单价将提升 3-5 倍,对控制精度和工作效率都提出了新的要求。投资建议:投资建议:见第八章详细信息 风险提示:风险提示:AI 进展不及预期,研发进度不及预期,海外贸易摩擦影响。电子 行业专题报告 3 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 正文目录 1 Sora、Gemini 1.5 Pro 相继发布,AIGC 新时代已至.7 1.1 大模型 Sora 震撼登场,
15、AI 生成视频领域里程碑.7 1.2 Gemini 1.5 Pro 性能显著增强,长上下文理解取得突破.14 1.3 AI 生产力革命如火如荼,产业链上下游协同发展.16 2“AI+终端”智能化加速,手机、MR、机器人等新品迭出.19 2.1 三星 S24 系列引入 Galaxy AI,开启移动 AI 新时代.19 2.2 大模型厂商创新不断,AI 加持多种应用场景.21 2.3 英伟达正式发布 AI 聊天机器人.24 2.4 诸多新品亮相 CES,AI 终端时代来临.25 2.5 MR 是 AI 的最佳落地形式,高度赋能内容生态.29 3 AI 驱动全球算力硬件环节创新与需求共振.35 3.
16、1 英伟达:H200 出货在即,定制芯片业务储备中.35 3.2 AMD:MI300 正式发布,2024 年销售收入上调.39 3.3 AI 浪潮推动光模块、交换机配套升级.41 4 国产算力把握机遇进展迅速.46 5 HBM4 实现逻辑存储垂直堆叠,混合键合助力带宽提升.51 5.1 SK 海力士:携手台积电合作开发 HBM4,资本开支回升.54 5.2 三星电子:DRAM 业务转盈,TSV 产能加速扩张.55 5.3 美光:HBM3E 验证进入尾声,有望于 2024 年初量产.56 6 SK 海力士先进封装持续发力,助力 HBM 性能领先.57 7 HBM4 或与处理器 3D 堆叠,混合键
17、合、TSV、散热需求提升.60 8 投资建议.64 9 风险提示.64 电子 行业专题报告 4 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 图表目录 图表 1:Sora 可生成 60s 视频.7 图表 2:Sora 单视频多角度镜头.7 图表 3:Sora 可以模拟影响世界状况的动作.8 图表 4:Sora 光影变换与物理世界相符.8 图表 5:Sora 可通过图片与提示一起生成视频.9 图表 6:Sora 可扩展生成的视频.9 图表 7:Patche 训练 Sora.9 图表 8:Sora 训练中具有采样的灵活性.10 图表 9:不同训练路径生成的视频效果对比.10 图表
18、 10:Runway 支持文生视频.10 图表 11:运动笔刷支持独立控制多达 5 个选定的区域.11 图表 12:子弹分别控制可达到很强的空间立体感.11 图表 13:运动笔刷控制面部运动与更复杂的躯体运动.11 图表 14:运动笔刷控制多个角色.11 图表 15:Pika 文生 3D 动画.12 图表 16:Pika“Expand canvas”扩展画布功能.12 图表 17:Pika 比例可调整.12 图表 18:DreamPropeller 与其他可视化模型对比.13 图表 19:Gemini 1.5 Pro 支持 100 万 token 上下文长度.14 图表 20:中型模型 Gem
19、ini 1.5 Pro 性能与 1.0 Ultra 相当.14 图表 21:Gemini 1.5 Pro 在所有模式下“needle”召回99.7%.14 图表 22:Gemini 1.5 Pro 可以识别核心自动区分方法的特定位置.15 图表 23:Gemini 1.5 Pro 具有回答图像查询的能力.15 图表 24:Gemini 1.5 Pro 可回答电影相关问题.15 图表 25:Gemini 1.5 Pro 可以快速学习一门新的语言.16 图表 26:MTOB 上 Kalamang英语翻译的定量结果.16 图表 27:Kalamang英语翻译的定性例子.16 图表 28:AI 产业图
20、谱.17 图表 29:服务器产业链图谱.17 图表 30:光通信产业链图谱.18 图表 31:交换机产业链图谱.18 图表 32:三星 Galaxy S24 系列.19 图表 33:第三代骁龙 8(for Galaxy).19 图表 34:通话实时翻译功能.19 图表 35:即圈即搜功能.20 图表 36:超视觉夜拍功能.20 图表 37:生成式编辑.20 图表 38:小米 AI 图像生成功能.21 图表 39:小米“人车家全生态”.21 图表 40:AI 消除.21 图表 41:AI 通话摘要.21 图表 42:联想 Yoga Pro 9i.22 图表 43:IdeaPad Pro 5i.2
21、2 图表 44:华硕灵耀 14 双屏.23 图表 45:雷鸟 X2 Lite AR 眼镜.23 电子 行业专题报告 5 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 图表 46:奔驰 MBUX 虚拟助理示意图.24 图表 47:宝马智能个人助理示意图.24 图表 48:Chat With RTX.24 图表 49:GeForce RTX 40 SUPER 系列显卡.25 图表 50:基于 AI 技术性能升级.25 图表 51:GeForce RTX 4080 SUPER 配置升级.26 图表 52:与 Convai 合作开发生成式 AI.26 图表 53:ACE 微服务.26
22、 图表 54:锐龙 8000G 系列性能升级.27 图表 55:全新 AMD 锐龙 5000 系列台式机处理器.27 图表 56:锐龙 8040 系列处理器.28 图表 57:AMD Radeon RX 7600 XT.28 图表 58:骁龙 XR2+Gen2.29 图表 59:高通 XR 参考设计.29 图表 60:骁龙汽车智联平台.29 图表 61:骁龙座舱平台.29 图表 62:AnyMAL 输出示例.30 图表 63:图像标题生成表现优于基线.31 图表 64:多模态推理任务人工评估胜率优于基线.31 图表 65:VQA 基准、视频 QA 基准.31 图表 66:AudioCaps 基
23、准数据集上的音频字幕生成结果.31 图表 67:音频字幕生成能力优秀.32 图表 68:Meta AI.32 图表 69:Workrooms 截图.33 图表 70:首尔市政府开展元宇宙服务.34 图表 71:工商银行虚拟营业厅.34 图表 72:AR 眼镜用于医疗教学.35 图表 73:英伟达 H200 性能.36 图表 74:英伟达 H200 能耗降低.36 图表 75:H200 大模型运行效果.37 图表 76:H200 高速内存性能.37 图表 77:A100/H100/H200/B100 性能.38 图表 78:英伟达产品路线图.38 图表 79:最新款 Google Cloud T
24、PU v5p 性能提升显著.39 图表 80:AMD Instinct MI300X 与 H100 规格比较.39 图表 81:AMD Instinct MI300X 配置.40 图表 82:AMD Instinct MI300X 采用 3.5D 封装.40 图表 83:AMD Instinct MI300 截面图.40 图表 84:AMD 在多个 AI 领域产品线丰富.41 图表 85:主要下游市场发展趋势.41 图表 86:数据通信收发器市场发展情况.42 图表 87:2023 年数据通信收发器市场细分.42 图表 88:2028 年数据通信收发器市场细分.42 图表 89:不同传输速度的
25、数据中心以太网交换机细分市场潜力.43 图表 90:以太网交换机以及 IB 交换机市场销售预测.43 图表 91:近五季度 Coherent 三大业务营收(亿美元).44 图表 92:FY2024Q2 Coherent 三大业务营收占比.44 电子 行业专题报告 6 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 图表 93:数据中心以太网交换机收入预测.44 图表 94:校园以太网交换机收入预测.44 图表 95:数据中心高速以太网端口季度数据(百万个).45 图表 96:数据中心高速以太网端口年度数据(百万个).45 图表 97:部分国产芯片性能参数对比英伟达产品.46 图
26、表 98:昇腾 910 与英伟达部分产品参数对比(TFLOPS,W).46 图表 99:昇腾全栈 AI 软硬件平台结构.47 图表 100:昇腾 CANN 异构计算架构.47 图表 101:昇腾人工智能计算中心建设方案.47 图表 102:燧原科技部分产品简介.48 图表 103:景嘉微 JM9-1 和 JM9-2 部分性能参数.48 图表 104:寒武纪思元 370 系列智能加速卡参数.49 图表 105:曦云 C500 仅用 5 小时完成功能测试.49 图表 106:壁仞科技产品:壁砺 100P.50 图表 107:壁仞科技产品:壁砺 104.50 图表 108:摩尔线程 MTT S300
27、0.50 图表 109:IC 先进算力部分公司重要公告&业务进展情况.51 图表 110:存储功耗限制整体性能表现.51 图表 111:HBM 与 GDDR 结构对比.52 图表 112:TSV 工艺带来尺寸、功耗及带宽优势.52 图表 113:英伟达 GPU 内存带宽不断提升.52 图表 114:AMD Instinct MI300X.52 图表 115:英伟达 GH200 GPU 首发 HBM3E.53 图表 116:HBM3E 部分参数对比.53 图表 117:HBM 产业链.53 图表 118:海力士营收结构(十亿韩元).54 图表 119:SK 海力士 DRAM 分应用营收占比.54
28、 图表 120:SK 海力士 NAND 分应用营收占比.54 图表 121:HBM 供应时间线.55 图表 122:美光 HBM3E 结构.56 图表 123:海力士、三星、美光业绩情况.56 图表 124:SK 海力士 HBM 产品时间线.57 图表 125:HBM 市场规模变动预估.57 图表 126:SK 海力士 HBM 技术升级.58 图表 127:MR-MUF 处理流程.58 图表 128:MR-MUF 对比 TC-NCF 连接温度下降 14.58 图表 129:LMC 与晶圆热收缩差异造成翘曲问题.59 图表 130:EMC 不同对齐方式的空气流动.59 图表 131:FOWLP
29、方案.59 图表 132:HBM4 结构示意图.60 图表 133:不同凸点间距(Bump Pitch)对应的技术(单位:um).61 图表 134:混合键合进展.61 图表 135:混合键合工艺流程及对应供应商.62 图表 136:混合键合推动键合步骤和设备单价增加(单位:万美元).62 图表 137:封装形式升级对键合机要求提高.63 图表 138:混合键合系统累计需求(2023 年 6 月预测).63 电子 行业专题报告 7 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 1 1 SoraSora、GeGemini 1.5mini 1.5 P Proro 相继相继发布,发
30、布,AIGCAIGC 新时代已至新时代已至 1.11.1 大模型大模型 SoraSora 震撼震撼登场登场,AIAI 生成视频领域里程碑生成视频领域里程碑 OpenAI 在 2024 年 2 月 16 日发布文生视频模型 Sora,突破了 AIGC 的高地,该模型完美继承 DALLE 3 的画质和遵循指令能力,并利用了 GPT 扩写,具备超长生成时间(60s,Pika 1.0 为 3s)、单视频多角度镜头、理解物理世界三大突出优势。除文生视频外,该模型还能支持通过现有的静态图像生成视频,并能准确、细致地对图像内容进行动画处理;提取现有视频,对其进行扩展或填充缺失的帧。优势优势 1 1#超长生成
31、时间。超长生成时间。Sora 支持 60s 视频生成,一镜到底,不仅主人物稳定,背景中的人物表现也十分稳定,可实现从大中景无缝切换到脸部特写。相比之下,Pika 1.0 的视频生成时间为 3s(可通过 Add 4s 功能增加 4s),Sora 支持时长远超目前市场上已有的文生视频模型。图表1:Sora 可生成 60s 视频 资料来源:OpenAI,数字生命卡兹克,方正证券研究所 优势优势 2#2#单视频多角度镜头。单视频多角度镜头。Sora 生成的视频中,在有多角度镜头的情况下仍然能保证一致性,即使主体暂时离开视野也可保持不变。OpenAI 展示了如下提示词的生成的视频:一个美丽的剪影动画展示
32、了一只狼对着月亮嚎叫,感到孤独,直到它找到狼群,该视频实现了多镜头无缝切换且保持了主体的一致。图表2:Sora 单视频多角度镜头 资料来源:OpenAI,数字生命卡兹克,方正证券研究所 电子 行业专题报告 8 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 优势优势 3 3#理解物理世界理解物理世界。目前 Sora 已经能生成具有多个角色、包含特定运动的复杂场景,不仅能理解用户在提示中提出的要求,还了解这些物体在物理世界中的存在方式。我们看到 Sora 生成的视频与世界互动,例如,画家可以在画布上留下新的笔触,并随着时间的推移而持续存在,一个人可以吃汉堡并留下咬痕。在汽车在山路
33、上行驶的视频中,其汽车的阴影、树影等随镜头变化带来的光影变换也符合物理世界。我们认为 Sora 已具备理解物理世界的能力。图表3:Sora 可以模拟影响世界状况的动作 资料来源:OpenAI,方正证券研究所 图表4:Sora 光影变换与物理世界相符 资料来源:OpenAI,数字生命卡兹克,方正证券研究所 SoraSora 不仅能通过文字来生成视频,还支持图片生成视频、扩展生成的视频、视频不仅能通过文字来生成视频,还支持图片生成视频、扩展生成的视频、视频编辑以及视频连接。编辑以及视频连接。1)图片生成视频:Sora 能够生成提供图像和提示作为输入的视频;2)扩展生成的视频:Sora 还能够在时间
34、上向前或向后扩展视频,虽然视频的结局都是相同的,但起始视频并不相同;3)视频编辑:扩散模型启用了多种根据文本提示编辑图像和视频的方法,使 Sora 能够零镜头地改变输入视频的风格和环境;4)视频连接:Sora 可以在两个输入视频之间逐帧进行插值,从而在具有完全不同主题和场景构成的视频之间创建无缝过渡。SoraSora光影光影变换与物理世界相符变换与物理世界相符提示:镜头跟随一辆带有黑色车顶行李架的白色老式SUV,它在陡峭的山坡上一条被松树环绕的陡峭土路上加速行驶,轮胎扬起灰尘,阳光照在SUV上飞驰。土路,给整个场景投射出温暖的光芒。土路缓缓地蜿蜒延伸至远方,看不到其他汽车或车辆。道路两旁都是红
35、杉树,零星散落着一片片绿意。从后面看,这辆车轻松地沿着曲线行驶,看起来就像是在崎岖的地形上行驶。土路周围是陡峭的丘陵和山脉,上面是清澈的蓝天和缕缕云彩。电子 行业专题报告 9 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 图表5:Sora 可通过图片与提示一起生成视频 图表6:Sora 可扩展生成的视频 资料来源:OpenAI,方正证券研究所 资料来源:OpenAI,方正证券研究所 我们认为 Sora 震撼效果的原因主要有:1)训练端:基于 Transformer 架构的扩散模型,降维并通过 Patche 进行训练;采样的灵活性与独特的训练路径(原始尺寸、时长训练);利用 D
36、ALLE 3 re-captioning 功能,给训练用的视频素材都加上高质量文本描述;2)输入端:利用 GPT 先将用户输入的提示词精准详尽扩写,再将扩写后的提示词交给 Sora。基于基于 TransformerTransformer 架构的架构的扩散模型扩散模型,降维并通过,降维并通过 PatchePatche 进行训练。进行训练。Sora 是一种扩散模型,可在学习大量先作的时候,学会图像内涵与图像之间的关系,采用Transformer 架构(主流视频生成扩散模型较多采用 U-Net 架构),OpenAI 认为之前在大语言模型上的成功得益于 Token,Token 可以把代码、数学以及各种
37、不同的自然语言进行统一,进而方便规模巨大的训练,因此 OpenAI 创造了对应Token 的 Patche,用于训练 Sora。为减少 Transformer 带来的计算量压力,OpenAI开发了一个视频压缩网络,把视频先降维到潜空间(latent,用更少的信息去表达信息的本质),然后再去拿这些压缩过的视频数据去生成 Patche,这样就能使输入的信息变少。图表7:Patche 训练 Sora 资料来源:OpenAI,方正证券研究所 训练中具有采样的灵活性,并通过训练中具有采样的灵活性,并通过原始尺寸、时长训练原始尺寸、时长训练。Sora 可以采样宽屏1920 x1080p 视频、垂直 108
38、0 x1920 视频以及介于两者之间的所有视频,这使得Sora 可以直接以其原生宽高比为不同设备创建内容。与业内常用的把视频截取成预设标准尺寸、时长后再训练的路径不同,OpenAI 选择了原始尺寸、时长训练,这使得 Sora 生成的视频能更好地自定义时长、更好地自定义视频尺寸、视频会有更好的取景和构图。提示:一只戴着贝雷帽和黑色高领毛衣的柴犬。图片与提示生成的图片与提示生成的8s8s视频视频电子 行业专题报告 10 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 图表8:Sora 训练中具有采样的灵活性 图表9:不同训练路径生成的视频效果对比 资料来源:OpenAI,方正证券研
39、究所 资料来源:OpenAI,方正证券研究所 注:左侧为截取尺寸视频训练后模型生成的视频,右侧为原始尺寸视频训练后模型生成的视频 SoraSora 是是技术与路径技术与路径迭代的成果迭代的成果。从语言理解来看,在训练端,OpenAI 利用 DALLE 3 re-captioning 功能,给训练用的视频素材都加上了高质量文本描述,在输入端,通过 GPT 先将用户输入的提示词精准详尽扩写,再将扩写后的提示词交给Sora。我们认为,该模型完美继承 DALLE 3 的画质和遵循指令能力,并利用了GPT 扩写,Sora 震撼效果得益于 OpenAI 过去的工作,均具有很强的继承性与延展性,是技术与路径
40、迭代的成果。除 Sora 之外,Runway、Pika 等也可支持文生视频:1 1)R Runwayunway:支持文生视频,运动笔刷控制多物体运动支持文生视频,运动笔刷控制多物体运动 R Runwayunway 支持文生视频,时长为支持文生视频,时长为 4 4s s。用“爆炸的宇宙 exploding universe”等简单的提示词,点击 Generate 等待生成 4 秒视频,可以写视频脚本,把不同的视频短画面合成长视频,点击 Extend 4s 按钮,在原视频上可以延长 4 秒;也可以把图片直接拖进来,或者单击图片上传区域,在本地选择图片,通过图片来生成视频。除此之外,Runway 还
41、具有 Green Screen 绿幕去背、Blur Faces 模糊人脸、Inpainting 移除影片物件等功能。图表10:Runway 支持文生视频 资料来源:觉醒 AI 绘画,方正证券研究所 电子 行业专题报告 11 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s RunwayRunway GenGen-2 2 视频模型的运动笔刷(视频模型的运动笔刷(Motion BrushMotion Brush)再进化)再进化,支持独立控制多达,支持独立控制多达5 5 个选定的区域。个选定的区域。升级后的运动笔刷支持复杂空间运镜、人物表情控制、人物躯体控制与多个角色控制,最多可独立控
42、制 5 个选定的区域。通过分别控制黑客帝国子弹瞬间的不同对象,可达到很强的立体空间感。除此之外,橡皮擦可对选错的区域进一步微调,增加了易用性。图表11:运动笔刷支持独立控制多达 5 个选定的区域 图表12:子弹分别控制可达到很强的空间立体感 资料来源:AI 奇点网,方正证券研究所 资料来源:AI 奇点网,方正证券研究所 图表13:运动笔刷控制面部运动与更复杂的躯体运动 图表14:运动笔刷控制多个角色 资料来源:AI 奇点网,方正证券研究所 资料来源:AI 奇点网,方正证券研究所 2 2)PikaPika:动画领域优势显著,:动画领域优势显著,DreamPropellerDreamPropell
43、er 提速提速 3D3D 生成生成 PikaPika 可单次生成可单次生成 7272 帧视频,成立迄今已有帧视频,成立迄今已有 7070 多万用户。多万用户。Pika 可以实现文生和图生视频,一键最多生成长度为 3 秒的 24 帧视频,此外对于现有视频,可以支持风格转换、幕布扩展(expand)、内容编辑、扩展剪辑长度(extend)等功能,针对 Runway 短板进行升级。Pika 在单帧画面拟真程度上具有出色的表现,具备良好的文生和图生视频能力,特别是在 2D、3D 动画领域。电子 行业专题报告 12 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 图表15:Pika 文生
44、 3D 动画 资料来源:新智元,方正证券研究所 图表16:Pika“Expand canvas”扩展画布功能 资料来源:AI 科技评论,方正证券研究所 分辨率比例、帧数可调整,视频输出灵活。分辨率比例、帧数可调整,视频输出灵活。“Aspect ratio”和“Farmes per second”功能可调整视频的分辨率比例、帧数。可选择的分辨率包括 16:9、9:16、1:1、5:2、4:5、4:3,最高可生成 24 帧的视频,视频输出灵活。图表17:Pika 比例可调整 资料来源:AI 科技评论,方正证券研究所 电子 行业专题报告 13 敬 请 关 注 文 后 特 别 声 明 与 免 责 条
45、款 s DreamPropellerDreamPropeller 基于分数蒸馏,助力文本到基于分数蒸馏,助力文本到 3D3D 生成速度提高生成速度提高 4.74.7 倍。倍。Pika 官方账号披露了公司产品的技术细节,DreamPropeller 能够在几乎不损失生成质量的情况下,将文本到 3D 的生成速度提升 4.7 倍。实验根据对 DreamFusion 图库中的 30 个提示进行测试评估,新模型速度均提高了 4 倍以上。在算力需求大、高质量数据集短缺、可控性较差等挑战下,文生视频是 AIGC 的高地,除 Runway、Pika 之外,Stability AI 也发布了 Stable Vi
46、deo Diffusion视频模型,用户可根据需要调整各种参数,如迭代步数、重绘幅度等,以协助创作者精确掌控画面生成过程,Meta 推出了两项基于 AI 的视频编辑新功能;在开源上,AnimateDiff、MAKEAVIDEO、MagicAnimate 等也在布局 AI 视频生成赛道。我们认为,从 Runway、Pika 到 Sora,文生视频大模型频出,视频长度从表情包长度的 3s、4s 到主流短视频长度的 60s,模型对物理世界的理解愈加接近现实,已具备强大的商业化落地价值,创作内容产业革命来临,AIGC 新时代已至。图表18:DreamPropeller 与其他可视化模型对比 资料来源:
47、新智元,方正证券研究所 电子 行业专题报告 14 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 1.21.2 G Geminiemini 1.51.5 ProPro 性能显著增强,长上下文理解取得突破性能显著增强,长上下文理解取得突破 GeminiGemini 1.51.5 ProPro 性能显著增强,支持性能显著增强,支持 100100 万万 tokentoken 上下文上下文长度长度。2024 年 2 月 15日谷歌发布 Gemini 1.5 Pro,支持 100 万 token 上下文长度,谷歌透露内部研究版本已直冲 1000 万。Gemini 1.5 Pro 性能显著
48、增强,在长上下文理解方面取得突破,能仅靠提示词学会训练数据中没有的新语言,其性能与谷歌迄今为止最大的模型 1.0 Ultra 相当,在对文本、代码、图像、音频和视频的综合评估面板上进行测试时,在用于开发大语言模型的 87%的基准测试中,Gemini 1.5 Pro 优于1.0 Pro。图表19:Gemini 1.5 Pro 支持 100 万 token 上下文长度 图表20:中型模型 Gemini 1.5 Pro 性能与 1.0 Ultra 相当 资料来源:谷歌,量子位,方正证券研究所 资料来源:谷歌,方正证券研究所 图表21:Gemini 1.5 Pro 在所有模式下“needle”召回99
49、.7%资料来源:谷歌,方正证券研究所 注:结果以颜色编码表示,绿色表示成功检索,红色表示不成功检索 电子 行业专题报告 15 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s Gemini 1.5 ProGemini 1.5 Pro 代码、文本和视频代码、文本和视频交互能力卓越。交互能力卓越。Gemini 1.5 Pro 能够摄取整个大型代码库,如 JAX(746,152 个 token),并回答关于它们非常具体的查询。除此之外,在给定 Les missamrables 全文的情况下具有回答图像查询的能力,原生的多模式允许它从手绘草图中定位一个著名的场景,另外,Gemini 1.
50、5 Pro 可回答电影相关问题,如输入 45 分钟的整部电影,该模型在检索时刻和时间戳精确到一秒的同时可无缝回答问题。图表22:Gemini 1.5 Pro 可以识别核心自动区分方法的特定位置 资料来源:谷歌,方正证券研究所 图表23:Gemini 1.5 Pro 具有回答图像查询的能力 资料来源:谷歌,方正证券研究所 图表24:Gemini 1.5 Pro 可回答电影相关问题 资料来源:谷歌,方正证券研究所 电子 行业专题报告 16 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s Gemini 1.5 ProGemini 1.5 Pro 新技能学习能力强大,有望提升稀有语言的
51、翻译质量。新技能学习能力强大,有望提升稀有语言的翻译质量。Gemini 1.5 Pro 仅基于其输入中给出的参考材料学习新语言的能力,输入一整本语法书,Gemini 1.5 Pro 就能在翻译全球不到 200 人使用的卡拉曼语上达到人类水平,在英语到卡拉曼语的翻译中,Gemini Pro 1.5 的 ChrF 达到了 58.3,略高于 MTOB论文报告的 57.0 ChrF 人类基准。而 GPT-4 Turbo 和 Claude 2.1 一次只能看完半本书,必须要微调或者使用外部工具。图表25:Gemini 1.5 Pro 可以快速学习一门新的语言 资料来源:谷歌,方正证券研究所 图表26:M
52、TOB 上 Kalamang英语翻译的定量结果 图表27:Kalamang英语翻译的定性例子 资料来源:谷歌,方正证券研究所 资料来源:谷歌,方正证券研究所 1.31.3 AIAI 生产力革命如火如荼,产业链上下游协同发展生产力革命如火如荼,产业链上下游协同发展 A AI I 生产力革命生产力革命如火如荼,产业链上下游协同发展。如火如荼,产业链上下游协同发展。我们看到,AI 大模型的发展正在不断加速 AGI 通用人工智能的到来,纵观整个 AI 产业链,硬件和软件的配合才能更好地实现多种终端应用的价值化落地,其中上游的基础层包括 AI 模型生产工具(AI 算法框架+AI 开发平台+AI 开放平台
53、+预训练大模型)、AI 算力基础(AI 芯片+服务器+智算中心+云服务)、AI 数据资源(AI 基础数据服务+数据治理),中游的技术层包括计算机视觉、智能语音、自然语言处理、知识图谱和机器学习,下游的应用层则是百花齐放,以 AI+泛安防/泛互联网/媒体/金融/医疗/工业/零售/政务为代表,还包括对话式 AI、机器人、自动驾驶、无人机等。可以预见的是,未来的 AI 时代又是生产力的爆发式革命。就硬件层面而言,我们针对性梳理了数据中心三大核心硬件产业链(服务器、光模块、交换机),AI 的进步将促使硬件参数不断提升,相关产业链有望充分受益。电子 行业专题报告 17 敬 请 关 注 文 后 特 别 声
54、 明 与 免 责 条 款 s 图表28:AI 产业图谱 资料来源:艾瑞咨询,方正证券研究所;注:展示为不完全列举,公司 logo 大小及顺序并不代表排名,下同 图表29:服务器产业链图谱 资料来源:电子发烧友,超微电脑官网,方正证券研究所 人工智能基础层人工智能基础层AI模型生产工具模型生产工具AI算法框架算法框架AI开放平台开放平台AI开发平台开发平台预训练大模型预训练大模型AI芯片芯片智能服务器智能服务器智算中心智算中心智能云服务智能云服务AI算算力基础力基础AI基础数据服务基础数据服务数据治理数据治理AI数据资源数据资源人工智能技术层人工智能技术层计算机视觉计算机视觉智能语音智能语音自然
55、语言处理自然语言处理知识图谱知识图谱机器学习机器学习人工智能应用层人工智能应用层AI+泛安防泛安防计算机视觉计算机视觉大数据智能大数据智能AI+泛互联网泛互联网智能智能搜索搜索内容审核内容审核图像处理图像处理人机交互人机交互对话式对话式AI消费级硬件消费级硬件自主无人系统自主无人系统智能智能机器人机器人智能驾驶智能驾驶无人机无人机上上游游中中游游下下游游服务器厂商服务器厂商互联网厂商互联网厂商运营商运营商CPU电源电源GPU散热散热内存内存PCBSSD光模块光模块主板主板/集成商集成商电子 行业专题报告 18 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 图表30:光通信产业
56、链图谱 资料来源:头豹研究院,方正证券研究所 图表31:交换机产业链图谱 资料来源:头豹研究院,方正证券研究所 10G及以下及以下上上游游中中游游下下游游光芯片光芯片100G硅光芯片硅光芯片25G及以上及以上无源芯片无源芯片有源光器件有源光器件无无源源光器件光器件光模块光模块电芯片电芯片光通信设备光通信设备电信市场电信市场数通市场数通市场交换芯片交换芯片CPU/PHY芯片芯片电子元器件电子元器件上上游游交换机交换机中中游游应用领域应用领域下下游游电子 行业专题报告 19 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 2 2“AIAI+终端”智能化加速,手机、终端”智能化加速,
57、手机、M MR R、机器人等新品迭出、机器人等新品迭出 2.12.1 三星三星 S24S24 系列系列引入引入 GalaxyGalaxy AIAI,开启移动,开启移动 AIAI 新时代新时代 S S2424 系列系列引入引入 GalaxyGalaxy AIAI,搭载骁龙,搭载骁龙 8 8 G Gen3en3。2024 年 1 月 18 日,三星电子正式推出新一代高端旗舰 Galaxy S24 系列,产品包括 Galaxy S24 Ultra、Galaxy S24+和 Galaxy S24。该系列搭载第三代骁龙 8(for Galaxy)高通首个专为生成式 AI 而打造的移动平台,赋能 Gala
58、xy AI,相比上一代 CPU 和 GPU 性能分别提升 20%和 30%,NPU 性能显著提升。此外,三星在国内携手百度智能云,Galaxy AI 深度集成了百度文心大模型,而海外版建立在谷歌 AI 模型之上,均在智能文本、通话翻译等方面提升用户体验。图表32:三星 Galaxy S24 系列 图表33:第三代骁龙 8(for Galaxy)资料来源:三星,方正证券研究所 资料来源:高通,方正证券研究所 A AI I 增强通话功能,增强通话功能,为用户提供为用户提供个人翻译。个人翻译。在沟通层面,S24 系列带来 Galaxy AI全新通话实时翻译功能,通话时点击“通话辅助”,无需第三方应用
59、即可实现双向语音和文字翻译。实时翻译的过程基于完全离线的 AI 技术,效率高、稳定性强,还保障了通话的隐私与安全。AI 驱动支持 13 种语言(17 个地区)的互译,除了中英文,还包括法语、德语、日语、韩语等,也在短信与其他应用上通过写作助手、转录助手进行翻译、转录等生成文本的工作。图表34:通话实时翻译功能 资料来源:三星,方正证券研究所 电子 行业专题报告 20 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s“即圈即搜即圈即搜”颠覆传统在线搜索模式。颠覆传统在线搜索模式。在搜索层面,即圈即搜功能使得用户能够圈选屏幕上的内容,包括视频、图像及文字,在无需离开当前页面的情况下,
60、立即获取更多相关信息。该功能不仅适用于网络浏览器和相册等应用,还可以在相机应用的实时取景画面中使用。图表35:即圈即搜功能 资料来源:三星,方正证券研究所 超视觉影像超视觉影像、智能修图建议、智能修图建议提升出片率。提升出片率。在影像拍摄上,搭载全新 AI 影像工具套件超视觉影像,超视觉夜拍功能升级,Galaxy S24 Ultra 的像素尺寸达到1.4m,相比前代机型提升了 60%,能够在昏暗环境下捕捉到更多光线;在影像处理上,借助 Galaxy AI,可对照片进行清除、重新构图和重录等多种编辑。例如,利用第三代骁龙 8(for Galaxy)认知 ISP 的强大算力,能自由移动被选中的人物
61、或物体的位置,通过生成式 AI 在原位智能生成自然、协调的背景。图表36:超视觉夜拍功能 图表37:生成式编辑 资料来源:三星,方正证券研究所 资料来源:三星,方正证券研究所 电子 行业专题报告 21 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 2.22.2 大模型大模型厂商厂商创新创新不断不断,A AI I 加持多加持多种种应用应用场景场景 小米迈入“人车家全生态”小米迈入“人车家全生态”,M MWCWC 亮相在即亮相在即。2023 年 10 月,小米推出了新系统小米澎湃 OS,使 AI 大模型深入“人-车-家”整个生态系统。小米 14 系列的两款新旗舰搭载该系统,是国内
62、第一款能够在端侧运行 AI 大模型的智能手机,搭载了小米自研的 60 亿参数级大模型,能够在手机上离线进行“文生图”、“AI 扩图”与“AI 去除路人”。此外,小米“影像旗舰”14 Ultra 以及首款电动车小米 SU7 将亮相 MWC 2024,展示其“人车家全生态”操作系统。图表38:小米 AI 图像生成功能 图表39:小米“人车家全生态”资料来源:AI 奇点网,方正证券研究所 资料来源:芯语,方正证券研究所 O OPPOPPO 进入进入 AIAI 手机时代手机时代,推出,推出 ColorOS AIColorOS AI 新春版新春版。OPPO 在 2024 年 2 月 9 日的发布会上,宣
63、布正式进入 AI 手机时代,开启“千万用户 AI 尝鲜计划”。推出 ColorOS AI 新春版,可应用在 OPPO 的 16 款机型上,包括 OPPO Find X7 系列、Find X6系列、Reno10 及 11 系列、一加 12 等。ColorOS AI 新春版带来 AI 消除、AI 通话摘要、新小布助手、小布照相馆、小布 AI 贺卡等重大更新。其中,AI 通话摘要可智能识别通话内容,生成重点信息摘要。图表40:AI 消除 图表41:AI 通话摘要 资料来源:OPPO,方正证券研究所 资料来源:OPPO,方正证券研究所 电子 行业专题报告 22 敬 请 关 注 文 后 特 别 声 明
64、与 免 责 条 款 s 苹果全力加码人工智能苹果全力加码人工智能,iPhoneiPhone 1616 有望包括有望包括 A AI I 功能功能。在主流手机厂商中,苹果还未推出 AI 手机,正在全力加码人工智能,下一代 iPhone 和 iPad 软件更新有望包括一系列新的 AI 功能。在最近的季度电话会议上,苹果 CEO 表示在 AI 计划上投入大量时间与努力。苹果正接近完成 AI 软件开发工具,将作为其旗舰编程软件 Xcode 新版本的一部分。联想联想 A AI PCI PC 规模化落地。规模化落地。在 CES2024 上联想推出 AI PC:1)两款旗舰产品 Yoga Pro 9i 和 Y
65、oga 9i,配备 Yoga Creator Zone 生成式 AI软件,可将基于文本的描述或草图转换为图像;2)ThinkPad X1 Carbon AI、ThinkPad X1 二合一以及 IdeaPad Pro 5i 三款 AI PC 均搭载最新的英特尔酷睿 Ultra 处理器和 Windows 11 系统,作为英特尔 Evo笔记本系列,兼具高效的电源管理、强大的性能以及深度沉浸的使用体验;3)联想 LA AI 芯片是全新游戏阵容的关键核心,助力游戏本实现更流畅、自由的游戏体验。图表42:联想 Yoga Pro 9i 图表43:IdeaPad Pro 5i 资料来源:联想,方正证券研究所
66、 资料来源:联想,方正证券研究所 联想将在联想将在 M MWCWC 上展示新款上展示新款 A AI PCI PC。我们看到,联想针对不同产品定位进行 AI 赋能。面向消费者的 Yoga 系列通过配备生成式 AI 软件协助创作;B 端产品则更注重性能、体验、算力方面;游戏本方面则通过 AI 芯片助力体验。在即将举行的MWC 上,联想将推出最新的人工智能设备和基础设施及解决方案组合,并展示两款挑战传统个人电脑和智能手机外形的新概念产品。华硕灵耀华硕灵耀 14 14 双屏双屏端侧端侧 AIAI 性能性能出色。出色。“灵耀 14 双屏”于 2024 年 2 月开售,配备主副两块 2.8K 分辨率可触控
67、的 OLED 屏。内置英特尔酷睿 Ultra9 处理器,借助其三大 AI 引擎,能够本地运行 AI 工具应用,通过内置的上百亿参数大语言模型,高效地完成文章总结、故事创作、文案翻译等繁琐任务。在视频编辑上,NPU 的强大性能让剪映智能抠像处理的速度提升了 2.6 倍。电子 行业专题报告 23 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 图表44:华硕灵耀 14 双屏 资料来源:华硕,方正证券研究所 AIAI+ARAR 深度融合,雷鸟深度融合,雷鸟 X X2 2 LiteLite 问世。问世。雷鸟 X2 Lite 搭载业内领先的双目全彩MicroLED+光波导方案,支持全场景
68、高透光、高亮度的全彩显示。此外,雷鸟 X2 Lite 配备了高通骁龙 AR1 平台,该芯片集成高通第三代 NPU,提供强大的 AI 处理能力,为大模型应用提供了重要的运算基础。其内置的雷鸟自研大模型语音助手 Rayneo AI(Beta 版),可实现多轮自然语言对话、行程规划、便捷百科问答、头脑风暴等多项能力,给用户带来全新的“AI+AR”体验。图表45:雷鸟 X2 Lite AR 眼镜 资料来源:雷鸟 XR,方正证券研究所 奔驰发布奔驰发布 MBUXMBUX 虚拟助理,宝马发布基于亚马逊大模型的智能个人助理。虚拟助理,宝马发布基于亚马逊大模型的智能个人助理。奔驰 MBUX运用生成式 AI 和
69、 3D 图形技术,实现更加自然、直观且高度个性化的人车互动;宝马发布基于亚马逊Alexa大语言模型提供的生成式人工智能技术而打造的全新一代 BMW 智能个人助理。智能助理化身一位宝马汽车专家,为驾乘人员提供更人性化的帮助,及时解答有关车辆的疑问。电子 行业专题报告 24 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 图表46:奔驰 MBUX 虚拟助理示意图 图表47:宝马智能个人助理示意图 资料来源:Forbes,方正证券研究所 资料来源:汽车之家,方正证券研究所 2.32.3 英伟达英伟达正式发布正式发布 AIAI 聊天机器人聊天机器人 近日英伟达正式发布Chat With
70、 RTX,这款应用适用于Windows平台,由TensorRT-LLM 提供支持,并完全在本地运行。用户可以利用 Chat With RTX 以自己的内容定制一个聊天机器人,从而体验独特的本地化系统设计和强大的功能。我们看到,Chat With RTX 的功能主要包括:1)文件处理:支持多种文件格式,如文本、pdf、doc/docx 和 xml 等。用户只需将包含所需文件的文件夹指向给定目录,Chat with RTX 会在几秒钟内将其加载到数据库中。2)视频内容处理:能够加载 YouTube 播放列表的 URL,并提供视频转录服务,以便用户快速查询视频内容。3)个性化 AI 对话:允许用户以
71、自己的资料(如文档、笔记、视频或其他数据)定制聊天机器人,使 AI 对话更具个性化。用户可以与这个自定义的聊天机器人进行对话,快速灵活地获得聊天机器人根据用户内容给出的见解。图表48:Chat With RTX 资料来源:NVIDIA,方正证券研究所 电子 行业专题报告 25 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 此次 Chat With RTX 的发布具有重要的意义,加速了 AI 的普及和应用。同时此款应用改变人与 AI 的交互方式,用户可以根据自己的需求定制聊天机器人,这使得 AI 的使用更加灵活和便捷。Chat With RTX 也代表了大型语言模型技术发展的一
72、个重要方向,即为本地化、个性化、隐私保护的 AI 应用提供了新的可能。2.42.4 诸多新品亮相诸多新品亮相 CESCES,AIAI 终端时代来临终端时代来临 2.4.1 英伟达:AI 技术加持新显卡,生成式 AI 改造游戏 NPC A AI I 技术加持,技术加持,G GPUPU 性能更胜一筹。性能更胜一筹。英伟达发布了全新的 GeForce RTX 40 SUPER系列显卡,包含了 GeForce RTX 4080 SUPER、GeForce RTX 4070 Ti SUPER 和GeForce RTX 4070 SUPER 三款芯片,其中 Ti SUPER 的组合第一次出现在 GeFor
73、ce的命名规则中。RTX 40 SUPER 系列借助深度学习超级采样技术(DLSS),游戏画面中八分之七的像素都可以由 AI 生成,有效地降低了 GPU 渲染压力、提升了游戏帧率。图表49:GeForce RTX 40 SUPER 系列显卡 图表50:基于 AI 技术性能升级 资料来源:NVIDIA,方正证券研究所 资料来源:NVIDIA,方正证券研究所 1 1)RTX 4070 SUPERRTX 4070 SUPER:以进阶级价格获得超越旗舰的性能。与以进阶级价格获得超越旗舰的性能。与 RTX 4070 比较,该芯片增加 20%的 CUDA 核心。与上代旗舰 RTX 3090 相比,在图形密
74、集度最高的游戏中,其运行速度更快,而功耗却只有几分之一,在开启 DLSS 3 的情况下速度更是快了 1.5 倍。RTX 4070 SUPER 于 2024 年 1 月 17 日开售,售价人民币 4899元起,以进阶级价格获得超越旗舰的性能。2 2)RTX 4070 Ti SUPERRTX 4070 Ti SUPER:更多更多 CUDACUDA 核心和更多内存,核心和更多内存,存储扩增至 256-bit 的 16GB GDDR6X。该芯片能将高刷新率 1440p 面板性能发挥到极致,甚至可以在 4K 分辨率下游戏。此外,创作者也会乐于用它来编辑视频和渲染大型 3D 场景。与 RTX 3070 T
75、i 相比,速度快 1.6 倍,配合 DLSS 3 时速度快 2.5 倍。RTX 4070 Ti SUPER于 2024 年 1 月 24 日开售,售价人民币 6499 元起。3 3)RTX 4080 SUPERRTX 4080 SUPER:配备了更多 CUDA 核心,以及运行速度高达 23Gbps 的全球最快 GDDR6X 视频内存(VRAM),是 4K 光追游戏和要求最苛刻的生成式 AI 应用的完美选择。与 RTX 3080 Ti 相比:在对图形性能要求非常高的游戏中,速度快 1.4倍;凭借 836TOPs 的 AI 算力,速度快 2 倍;生成视频的速度快 1.5 倍,生成 AI图像的速度快
76、 1.7 倍。RTX 4080 SUPER 售价人民币 8099 元起,于 2024 年 1 月31 日开售。电子 行业专题报告 26 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 图表51:GeForce RTX 4080 SUPER 配置升级 资料来源:NVIDIA,方正证券研究所 A ACECE 微服务使虚拟角色栩栩如生。微服务使虚拟角色栩栩如生。英伟达推出 ACE(Avatar Cloud Engine)微服务,将 A2F 和 RIVA ASR 这些 AI 模型融入游戏,前者使玩家能够通过麦克风与 AI角色对话,后者通过音频源为游戏角色生成丰富的面部动画。在此次活动中
77、,英伟达展示了与开发平台Convai 的最新合作成果:玩家与新一代 AI NPC 之间动态对话等交互能力。ACE 微服务不仅可以应用在游戏领域,也可用于虚拟客服等通过虚拟化身提供服务的领域。现已开始采用 ACE 的开发者除了 Convai,还有Charisma.AI、Inworld、米哈游、网易游戏、掌趣科技、腾讯游戏、育碧和 UneeQ。图表52:与 Convai 合作开发生成式 AI 图表53:ACE 微服务 资料来源:NVIDIA,方正证券研究所 资料来源:NVIDIA,方正证券研究所 可以看到,英伟达如今正处于最新技术变革的中心:生成式人工智能(Generative AI),在 CES
78、 2024 上发布了从 RTX GPU 到软件应用、开发工具等一系列重磅新品,均与高性能生成式 AI 功能相关,未来将继续挖掘出 AI 驱动的生产潜力。电子 行业专题报告 27 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 2.4.2 AMD:全新桌面 APU 发布,推动高性能计算发展 锐龙锐龙 8000G8000G 系列系列开辟台式机开辟台式机 A AI I 新时代。新时代。上一代桌面 APU 锐龙 5000G 系列发布于2021 年,时隔两年九个月,AMD 终于更新了桌面 APU 处理器锐龙 8000G 系列。锐龙 8000G 系列结合了独立显卡的强大性能与 Zen4 C
79、PU 核心,实现了高能效比。其中,锐龙 7 8700G 和锐龙 5 8600G 集成锐龙 AI 引擎,是首款搭载 NPU 的台式电脑处理器,在台式机领域率先具备加速 AI 软件,优化 AI 工作负载,提高 AI 处理效率,并开启了 AI 降噪等多项功能。图表54:锐龙 8000G 系列性能升级 资料来源:AMD,方正证券研究所 新型号锐龙新型号锐龙 50005000 处理器处理器延长延长 AM4AM4 平台平台寿命。寿命。AMD 继续推出新型号锐龙 5000 处理器,延长基于 AM4 架构非凡的平台使用寿命,为用户在构建生产力、游戏或内容创作的个人电脑系统时提供更多选择。新产品包括新的锐龙 7
80、 5700X3D,利用强大的 3D V-Cache 技术,在游戏性能方面有巨大提升。图表55:全新 AMD 锐龙 5000 系列台式机处理器 资料来源:STH,方正证券研究所 全新锐龙全新锐龙 80408040 系列处理器带来个人系列处理器带来个人 A AI I 处理的飞跃。处理的飞跃。AMD 在上个月 Advancing AI大会上发布锐龙8040系列移动处理器,该系列将人工智能置于前沿和中心位置,在部分机型上集成了锐龙 AI NPU,带来个人 AI 处理的下一个飞跃。其中 AI 性能算力从10TOPS提升至16TOPS,升幅高达60%,并使总算力从30TOPS增至39TOPS。宏碁、华硕、
81、联想、惠普和雷蛇等 AMD 合作伙伴将推出更多搭载 Windows 11 的笔记本电脑和手持游戏系统,这些产品均采用 Ryzen 8040 系列处理器。电子 行业专题报告 28 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 图表56:锐龙 8040 系列处理器 资料来源:ars technica,方正证券研究所 A AMDMD 新款新款 RX 7600 XTRX 7600 XT 显卡显卡 1616GBGB 大显存可处理大显存可处理 1440p1440p 游戏。游戏。AMD 还推出新款 Radeon RX 7600 XT 显卡,配备 16GB 高速 GDDR6 显存,适用于 1
82、440p 游戏或带有光追的1080p 游戏。与 RX 7600 相比,显存从 8GB 提升至 16GB,时脉从 2.25GHz-2.66GHz提升至 2.47GHz-2.76GHz,为此整卡功耗从 165W 提高至 190W。预计 2024 年 1 月24 日上市,售价 329 美元(2353 元人民币)。图表57:AMD Radeon RX 7600 XT 资料来源:ars technica,方正证券研究所 综上产品可以看到,AMD 一直致力于推动高性能计算的发展边界,全新锐龙 8000G系列处理器将高性能计算带入下一个层次:游戏、AIPC 和超小型设备。AMD 未来将继续与整个 AI 生态
83、系统深度合作,助力生成式 AI。2.4.3 高通:AI 处理器赋予 XR 新体验,开启出行全新时代 骁龙骁龙 X XR2+GR2+Gen2en2 支持超支持超 4 4K K 分辨率,大大提升画面精细度。分辨率,大大提升画面精细度。在 XR 方面,高通发布了骁龙 XR2+Gen 2 芯片,与上一代骁龙 XR2 Gen 2 相比,从支持单眼 3K 分辨率提升至单眼 4.3K,每秒传输帧数达到 90 帧,CPU 频率、GPU 频率分别提升了 20%电子 行业专题报告 29 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 和 15%,带来了 25%的性能提升以及 50%的能效提升,同时
84、 AI 性能提升了 8 倍。其中,最关键的提升在于超 4K 分辨率,带来画面精细度提高,将一定程度上提高整个智能头戴设备行业的水平。歌尔宣布与高通合作,三星和谷歌也计划在将骁龙 XR2+Gen 2 应用在安卓系统上运行的虚拟现实产品上。图表58:骁龙 XR2+Gen2 图表59:高通 XR 参考设计 资料来源:高通,方正证券研究所 资料来源:TechRepublic,方正证券研究所 骁龙数字底盘为下一代生成式骁龙数字底盘为下一代生成式 A AI I 赋能。赋能。在汽车领域,高通展示了骁龙数字底盘解决方案的突破创新,该组合产品为下一代生成式 AI 提供赋能,涵盖数字座舱、车联网技术、网联服务、先
85、进驾驶辅助与自动驾驶系统等多个方面。其中一项升级是“下一代生成式 AI 的数字座舱”,用于边缘生成人工智能,这意味着根据不同的品牌和应用产品,汽车可以运行生成式 AI 应用程序,动态更新与驾驶员在路上相关的信息。博世基于高通的 Ride Flex SoC,以单颗 SoC 同时支持数字座舱、ADAS 和 AD 功能,实现下一代软件定义汽车。图表60:骁龙汽车智联平台 图表61:骁龙座舱平台 资料来源:高通,方正证券研究所 资料来源:高通,方正证券研究所 2.52.5 M MR R 是是 A AI I 的最佳落地形式,高度赋能的最佳落地形式,高度赋能内容内容生态生态 2.5.1 Meta 发布 A
86、nyMAL,研究成果有望整合入元宇宙产品线 AnyMALAnyMAL 实现图像实现图像/视频视频/音频音频/IMUIMU 运动传感器数据运动传感器数据等多模态数据转换,创造新的等多模态数据转换,创造新的S SOTAOTA。Meta 推出经过训练的多模态编码器集合 AnyMAL(Any-Modality Augmented Language Model),可实现各种模态(包括图像、视频、音频和 IMU 运动传感器电子 行业专题报告 30 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 数据)的数据转换至 LLM 的文本嵌入空间,数据集包含包含 2 亿张图像、220 万段音频、50
87、 万 IMU 时间序列、2800 万段视频等多种模态数据,利用图像、视频、音频跨三种模式的多模态指令集对模型进行微调。AnyMAL 创造了新的 SOTA:在VQAv2 上提高了 7.0%的相对准确率,在零误差 COCO 图像字幕上提高了 8.4%的CIDEr,在 AudioCaps 上提高了 14.5%的 CIDEr。从 AnyMAL 的输出示例来看,除了简单的 QA 外,还能很好的解决灵感与建议、创新写作、图像字幕、隔行扫描形式、音频信号推理、运动传感器推理等多种不受拘束的任务。图像标题生成表现、多模态推理任务人工评估胜率优于基线图像标题生成表现、多模态推理任务人工评估胜率优于基线。我们看到
88、 AnyMAL-13B 和 AnyMAL-70B 性能差距较小,底层 LLM 能力对图像标题生成任务影响较小,两个变体在 COCO 和标有详细描述任务(MM-IT-Cap)的 MM-IT 数据集上表现均明显优于基线。在多模态推理任务的人工评估中,AnyMAL 性能强劲,与人工标注的实际样本的差距较小,完整指令集微调的模型表现出最高的优先胜率。图表62:AnyMAL 输出示例 资料来源:机器之心,方正证券研究所 AnyMAL输出示例:该模型理解各种输入信号(即视觉、音频、运动传感器信号),并响应自由形式的用户查询。当多个模态交错并作为输入(例如最右边图像+IMU运动传感器信号)时,模型将对它们进
89、行联合推理。灵感与建议灵感与建议创新写作QA图像字幕隔行扫描的形式(图像+运动传感器)音频信号推理运动传感器推理电子 行业专题报告 31 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 图表63:图像标题生成表现优于基线 图表64:多模态推理任务人工评估胜率优于基线 资料来源:机器之心,方正证券研究所 资料来源:机器之心,方正证券研究所 VQAv2VQAv2 提高提高 7.0%7.0%的相对准确率的相对准确率,音频字幕生成能力优秀,音频字幕生成能力优秀。我们看到 AnyMA 在 6 个不同的 VQA 数据集(H-Meme:hate Meme,S-QA:Science QA)上基
90、于 Zeroshot image 的 QA 结果,与基线视觉语言模型相比,AnyMAL 展示了具有竞争力的多模态推理能力,VQAv2 提高 7.0%的相对准确率,在视频 QA 中的 STAR 中 AnyMA 表现也较为优秀。从 AnyMAL 的音频字幕生成能力来看,AnyMAL 的表现明显优于 CIDEr+10.9pp,SPICE+5.8pp,支持多音道音频字幕生成能力,如婴儿哭泣和女性说话同时进行。图表65:VQA 基准、视频 QA 基准 图表66:AudioCaps 基准数据集上的音频字幕生成结果 资料来源:机器之心,方正证券研究所 资料来源:机器之心,方正证券研究所 视频视频 QA QA
91、 基准基准VQA VQA 基准基准电子 行业专题报告 32 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 图表67:音频字幕生成能力优秀 资料来源:机器之心,方正证券研究所 MetaMeta 还推出测试版的聊天机器人还推出测试版的聊天机器人 Meta AIMeta AI,可以支持在可以支持在 QuestQuest 3 3 上面使用。上面使用。Meta AI 利用了 Llama 2 的技术和最新的大型语言模型研究,能生成文本回复及图像,可以通过与微软必应搜索引擎的合作获得实时信息。可以使用的 App 包括 Whats App、Messenger 和 Instagram 等。图表
92、68:Meta AI 资料来源:澎湃网,方正证券研究所 MetaMeta 发布发布 AnyMALAnyMAL,研究成果有望整合入元宇宙产品线。,研究成果有望整合入元宇宙产品线。AnyMAL 于 2023 年 9 月28 日发布,而 Meta Quest 3 于同日发布,两者在时间上相近,且 Meta Quest 3可收集多模态数据,将真实世界和虚拟世界无缝融合,实现 Meta Reality 体验,我们认为 AnyMAL相关研究成果有望为Meta的元宇宙产品线提供支持并应用到消费者市场。说明说明:在安静的环境中敲击键盘提示提示:你能猜出我的位置吗?用一两句话回答回答回答:根据打字的声音,我猜你
93、是在一个安静的室内环境,可能在办公室或书房。打字的声音清晰而清脆,带有轻微的回声或混响,表明这是一个天花板很高的房间或一个大而开放的空间说明说明:风很大,海浪沙沙作响提示提示:根据天气,我应该穿什么?用一两句话回答回答:回答:从风浪声来看,暴风雨就要来了。最好多穿几层,穿一些防水和保暖的衣服,以保持舒适和安全说明说明:一个婴儿在电子语音的背景下哭泣,一个成年女性说话,打喷嚏,然后一个成年女性再次说话提示提示:用一到两个句子描述这个声音回应回应:这个声音是一个孩子大声的、高音调的尖叫,带着一点呜咽,好像孩子在哭和尖叫的同时。伴随着这种声音的背景是成年人低沉的声音,可能是孩子的父母或看护人,他们用
94、安慰的语气说话电子 行业专题报告 33 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 2.5.2 MR 为 AI 最佳落地终端,高度赋能 MR 内容与硬件 MRMR 为为 AIAI 最佳落地终端,高度赋能最佳落地终端,高度赋能 MRMR 内容与硬件。内容与硬件。近期 intiny 开发的完蛋!我被美女包围了火速霸榜 Steam 国区热销第一名、全球第四,销量破百万,真人互动游戏爆火下,我们认为 MR 是 AI 最佳落地终端,泛社交、B 端应用拓展也拥有想象空间:1)办公场景:Workrooms 是一个身临其境的虚拟办公室,无论是戴着 Meta Quest 头戴式耳机,还是从
95、2D 屏幕上加入,都可以在这里与队友会面、集思广益、分享演示文稿并完成工作。同时,Workrooms 还支持 Zoom,让连接更方便。表情丰富的虚拟化身:让虚拟的形象看起来、行动起来和表现得与参会者一模一样,并通过自然的面部表情和手势丰富非语言交流。定制环境:用图像和徽标定制办公室。无论是在海滩边破冰,还是在城市上空进行协作,都能为会议营造合适的氛围。持久白板:在会议室或虚拟个人办公室使用虚拟白板,勾画想法或附加便笺,下次签到时,白板上的内容依然存在。图表69:Workrooms 截图 资料来源:Meta 官网,方正证券研究所 2)政府服务:首尔市政府正式开展元宇宙服务,建立涵盖经济、教育、税
96、务和行政等领域的行政服务平台。该市还打算在接下来的五年里陆续推出更多涉及政府、商业、旅游和文化的服务。首尔市政府向媒体透露,社会正在经历巨大的变革,非接触式服务日益普及,信息通讯技术不断进步,数字世代成为主导力量,首尔市政府就是基于这样的形势,提出了“元宇宙首尔”这一创新的行政服务理念。该平台以自由、同行、联接为核心价值,旨在包含各种公共服务,创建创意与沟通空间、平等的超现实空间、融合现实空间。电子 行业专题报告 34 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 图表70:首尔市政府开展元宇宙服务 资料来源:澎湃,方正证券研究所 3)金融服务:中国工商银行虚拟营业厅率先构建
97、“VR 智能眼镜+元宇宙+智慧金融”场景。在虚拟营业厅中,用户仿佛置身于真实的全景环境,不仅能体验行走的空间感、纵深感,对网点的格局、设施、产品展示、展品细节、空间的大小也都能一目了然。工商银行虚拟营业厅融合了虚拟数字人技术,客户在虚拟空间中以第一人称视角参观虚拟网点,与人工智能虚拟数字人客服进行交互通过看、听、说等多维度交互方式获得更直接丰富的全新体验。图表71:工商银行虚拟营业厅 资料来源:元宇宙界网站,方正证券研究所 4)医疗场景:内置 AI 医疗系统的 AR 眼镜可以用于病情诊断、远程会诊和医疗教学:病情诊断:利用内置 AI 医疗系统的 AR 眼镜,医生可以直观地观察患者身体的状况,并
98、实时获取患者的生命体征分析,从而做出更加精准的病情诊断。这种技术的应用,不仅可以提升医生的诊断水平,也可以节约医生的时间和精力。AR 眼镜能够支持远程会诊的功能。电子 行业专题报告 35 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 远程会诊:通过 AR 眼镜,患者和医生可以进行实时的视频交流,同时 AR 眼镜可以传送患者身体的数据和医生的指导建议。这种技术可以增强患者和医生之间的沟通效果和效率,同时也可以让医生更深入地了解患者的病情,从而更好地进行诊断和治疗。医疗教学领域也可以利用 AR 眼镜的技术。医疗教学:医生可以通过 AR 眼镜向学生实时传达指导和建议,同时学生可以通
99、过 AR 眼镜观察患者的身体情况和医生的操作过程。这种方式可以让学生更加深入地了解患者的病情和治疗方法,同时也可以让医生更好地进行指导和教学。图表72:AR 眼镜用于医疗教学 资料来源:搜狐新闻,方正证券研究所 3 3 AIAI 驱动全球算力硬件环节创新与需求共振驱动全球算力硬件环节创新与需求共振 3.13.1 英伟达:英伟达:H H200200 出货在即,定制芯片业务储备中出货在即,定制芯片业务储备中 首款搭载首款搭载 H HBM3EBM3E 的的 GPU H200GPU H200 于于 2 2023023 年年 1 11 1 月发布,预计月发布,预计 2 24Q24Q2 实现出货。实现出货
100、。2023年 11 月 13 日,英伟达发布首款提供 HBM3e 的 GPU,作为一种更快、更大的内存,HBM3e 可加速生成式 AI 和大型语言模型,同时能推进 HPC 工作负载的科学计算。借助 HBM3e,NVIDIA H200 能以每秒 4.8 TB 的速度提供 141GB 内存,与前前一代的 NVIDIA A100 相比,容量几乎翻倍,带宽增加 2.4 倍,在用于推理或生成问题答案时,性能较 H100 提高了 60%至 90%,采用 HBM3e 内存技术的H200 在处理 700 亿参数的大模型时,推理速度较 H100 快了整整一倍,能耗降低了一半。受 HBM3E 供应限制,预计 H2
101、00 将于 24Q2 实现出货。电子 行业专题报告 36 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 图表73:英伟达 H200 性能 资料来源:半导体行业观察,NVIDIA,方正证券研究所 图表74:英伟达 H200 能耗降低 资料来源:半导体行业观察,NVIDIA,方正证券研究所 H200 具备超过 460 万亿次的浮点运算能力,可支持大规模的 AI 模型训练和复杂计算任务。HGX H200 采用了 NVIDIA NVLink 和 NV Switch 高速互连技术,为各种应用工作负载提供最高性能,包括对超过 1750 亿个参数的最大模型进行的 LLM训练和推理。借助 H
102、BM3e 技术的支持,H200 能够显著提升性能。在 HBM3e 的加持下,H200 能够将 Llama-70B 推理性能提升近两倍,并将运行 GPT3-175B 模型的性能提高了 60%。对于具有 700 亿参数的 Llama2 大模型,H200 的推理速度比 H100快一倍,并且推理能耗降低了一半。此外,H200 在 Llama2 和 GPT-3.5 大模型上的输出速度分别是 H100 的 1.9 倍和 1.6 倍。电子 行业专题报告 37 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 图表75:H200 大模型运行效果 资料来源:半导体行业观察,NVIDIA,方正证券研
103、究所 H200 芯片支持高达 48GB 的 GDDR6X 内存,其内存带宽可达 936GB/s,有效提高了数据传输速度并降低了延迟。对比 H100 的 SXM 版本,显存从 80GB 提升 76%,带宽从每秒 3.35TB 提升了 43%。对于模拟、科学研究和人工智能等内存密集型 HPC应用,H200 的更高内存带宽可以确保高效地访问和操作数据。与传统的与传统的 CPUCPU 相相比,使用比,使用 H200H200 芯片可以将获取结果的时间加速多达芯片可以将获取结果的时间加速多达 110110 倍。倍。图表76:H200 高速内存性能 资料来源:半导体行业观察,NVIDIA,方正证券研究所 静
104、待静待 B B100100 发布,展望发布,展望 X X100100。英伟达 B100 的原计划发布时间为 2024 年第四季度,但由于 AI 需求的火爆,已经提前至第二季度,目前已经进入供应链认证阶段,B100 将能够轻松应对 1730 亿参数的大语言模型,比当前型号 H200 的两倍还要强大。此外,B100 将采用更高级的 HBM 高带宽内存规格,有望在堆叠容量和带宽上继续突破,超越现有的 4.8TB/s。根据英伟达产品路线图,预计 2025 年将推出X100,进一步丰富 GPU 产品矩阵,巩固英伟达 AI 芯片龙头地位。电子 行业专题报告 38 敬 请 关 注 文 后 特 别 声 明 与
105、 免 责 条 款 s 图表77:A100/H100/H200/B100 性能 资料来源:半导体行业观察,NVIDIA,方正证券研究所 图表78:英伟达产品路线图 资料来源:36Kr,NVIDIA,方正证券研究所 英伟达进军定制英伟达进军定制 A AI I 芯片领域。芯片领域。根据 CNBC,英伟达目前正在策划建立全新部门旨在为云计算企业和其企业提供定制化芯片业务。根据 CNBC,定制化芯片或将专注于满足特定设备或者系统的性能和功耗要求,其中或将包含特定的处理单元,传感器集成、专用硬件加速器,以满足特定领域的需求。目前根据 CNBC,英伟达已经和亚马逊、Meta、微软、谷歌和 OpenAI 商议
106、定制 AI 芯片的相关合作。在定制化 AI 芯片领域,谷歌旗下 TPU 已经实现多次迭代,目前迭代至 Cloud TPU v5 系列,其中 Cloud TPU v5p 为系列中性能最强 TPU,含有 8960 个芯片,芯片互联速度可达4800 Gbps,在训练LLM模型时速度相较于上一代TPU v4快1.92.8倍。电子 行业专题报告 39 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 图表79:最新款 Google Cloud TPU v5p 性能提升显著 资料来源:格隆汇,半导体行业观察,方正证券研究所 3.23.2 A AMDMD:MI300MI300 正式发布,正式发
107、布,20242024 年销售收入上调年销售收入上调 2023 年 12 月 6 日,AMD 在 Advancing AI 活动上宣布推出 Instinct MI300X,采用了 AMD CDNA3 架构,搭载了 8 块 HBM3,容量达 192GB。与 MI250X 相比,计算单元增加了约 40%、内存容量增加 1.5 倍、峰值理论内存带宽 3 增加 1.7 倍。在某些工作环境中,性能可达 H100 的 1.3 倍。图表80:AMD Instinct MI300X 与 H100 规格比较 资料来源:AMD,方正证券研究所 MI300MI300 采用采用 3.5D3.5D 封装,封装,I/OI/
108、O 密度进一步提升。密度进一步提升。MI300X 采用 3.5D 封装,即通过混合键合技术实现 XCD、I/Odie 的 3D 堆叠,其次在硅中介层上实现与 HBM 的集成,从而实现了超过 1500 亿个晶体管的高密度封装。该封装方案由台积电提供,搭配 SoIC 技术与 CoWoS 技术共同实现。电子 行业专题报告 40 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 图表81:AMD Instinct MI300X 配置 图表82:AMD Instinct MI300X 采用 3.5D 封装 资料来源:AMD,方正证券研究所 资料来源:AMD,方正证券研究所 SoICSoIC
109、 技术升级,技术升级,MI300MI300 带宽升至带宽升至 V V-CacheCache 的的 7 7 倍。倍。AMD 3D V-Cache 中的 SoIC 尺寸大小约为 7x10mm,逻辑芯片放置在垂直结构的下方;CCD 为 5nm 节点,X3D 为7nm 节点,通过 SoIC 可提供高达 2.5 TB/s 的垂直带宽。在 MI300 中,SoIC 技术迎来进一步升级,尺寸扩大至 13x29mm(面积约为此前的 5 倍),逻辑芯片放置在了垂直结构的顶部以更好的散热,5nm 的 XCD/CCD 堆叠在 6nm 节点的 IOD 上,垂直带宽提升至 17TB/s(为 3D V-Cache 的 7
110、 倍)。图表83:AMD Instinct MI300 截面图 资料来源:AMD,方正证券研究所 根据 AMD 2023Q4 法说会,目前 MI300 已经成为 AMD 历史产品中收入增速最快的产品,同时 AMD 法说会中表示,2024 年 MI 芯片销售收入超过 35 亿美金,高于此前预测 20 亿美金。电子 行业专题报告 41 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 图表84:AMD 在多个 AI 领域产品线丰富 资料来源:AMD 官网,方正证券研究所 3.33.3 A AI I 浪潮推动光模块、交换机配套升级浪潮推动光模块、交换机配套升级 根据 Coherent,
111、2023 年主要下游应用市场规模达 640 亿美元。公司产品主要下游应用市场包括工业、通信、电子、使用仪器,2023 年通信市场规模达 230 亿美元,2023-2028 年 CARG 为 14%,其次为工业市场,2023 年工业市场规模达 220 亿美元,2023-2028 年 CARG 为 9%,电子器件市场规模达 140 亿美元,CARG 为 20%,使用仪器市场规模为 50 亿美元,CARG 为 8%,四大主要市场合计市场规模将达 640亿美元,2023-2028 年 CARG 为 14%,其中通信方面 AI 将为主要驱动力。图表85:主要下游市场发展趋势 资料来源:Coherent,
112、方正证券研究所 数据通信收发器向高传输速率演进,数据通信收发器向高传输速率演进,2 2028028年年8 800G00G及以上产品市场占比将超及以上产品市场占比将超6 65%5%。根据 LightCounting 数据,数据通信收发器市场规模将由 2023 年的 51 亿美元增长至 2028 年 153 亿美元,2023-2028 年 CARG 为 24.6%,其中 800G 产品自 2023年起进入高速发展阶段,800G 及以上产品预计 2028 年占数据通信收发器市场 65%以上份额,2023-2028 年 CARG 将达 65%。从细分产品来看,EML 产品占比快速提升,其中 AI 用
113、EML 产品 2028 年预计占整个市场 33%,市场规模达 50 亿美元,较2023 年的 6 亿美元较大提升,且市场占比由 12%提升至 33%。电子 行业专题报告 42 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 图表86:数据通信收发器市场发展情况 资料来源:Coherent,LightCounting,Internal Estimates,方正证券研究所 图表87:2023 年数据通信收发器市场细分 图表88:2028 年数据通信收发器市场细分 资料来源:Coherent,LightCounting,方正证券研究所 资料来源:Coherent,LightCount
114、ing,方正证券研究所 以太网交换机市场潜力巨大。以太网交换机市场潜力巨大。Arista 于 2023Q4 宣布推出下一代 7130 系列交换机,用于超低延迟切换,加速 25G 网络。凭借三个新的 25G 优化系统、增强的光学性能、25G 就绪 FPGA 应用程序和 FDK(FPGA 开发套件)更新,Arista 满足了25G 市场数据分发和高频交易(HFT)环境的需求。对于 400G,客户群已从 2022年的 600 名增加到 2023 年的约 800 名。电子 行业专题报告 43 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 图表89:不同传输速度的数据中心以太网交换机细
115、分市场潜力 资料来源:Arista,方正证券研究所 IBIB 交换机交换机 2 2024024 年有望持续高增。年有望持续高增。对 AI 应用的聚焦推动了英伟达 2023 年数据中心产品的销售。与 2022 年相比,2023 年 IB 交换机的 ASIC 销量增长预计近三倍,同时 LIGHT COUNTING 预计 2024 年 IB 交换机仍将维持强劲增长,预计 2023-2028年均复合增长率将达 24%,对应 2028 年 IB 交换机市场销售规模将超 30 亿美元。图表90:以太网交换机以及 IB 交换机市场销售预测 资料来源:LightCounting,云深知网络,方正证券研究所 作
116、为全球光模块、交换机代表企业,Coherent 和 Arista 业绩向好,其中:Coherent:AI 驱动 800G 环比持续高增,1.6T 有望于 2025 年商业化 CoherentCoherent FYFY2 24 4Q Q2 2 收入环比增长超预期,收入环比增长超预期,AI/MLAI/ML 产品需求强劲。产品需求强劲。FY2024Q2 Coherent实现收入 11.31 亿美元,高于指引中值,yoy-17.45%,qoq+7.41%;毛利润 3.51亿美元,yoy-14.60%,qoq+14.33%。分部门看,激光器部门收入 3.54 亿美元,yoy-6.60%,qoq+5.36
117、%;网络部门收入 5.24 亿美元,yoy-13.96%,qoq+10.78%;材料部门收入 2.54 亿美元,yoy-33.51%,qoq+3.67%。受益于人工智能的蓬勃发电子 行业专题报告 44 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 展,AI/ML 相关数据收发器连续第三季获得强劲订单,800G 产品季度收入突破1 亿美元,环比增长超 100%,800G 出货量持续强劲增长,FY2024 年公司预计超过 50%的数据通信收发器收入将来自人工智能相关应用,2025 年向 1.6T 产品商业化发展前进以顺应 AI 发展,公司数据通信收发器龙头地位稳定。图表91:近五
118、季度 Coherent 三大业务营收(亿美元)图表92:FY2024Q2 Coherent 三大业务营收占比 资料来源:Coherent,方正证券研究所 资料来源:Coherent,方正证券研究所 Arista:云、数据中心业务发展迅猛 AristaArista公司季度营收向好。公司季度营收向好。2023Q4 Arista公司营收15.4亿美元,环比增长2.1%,同比增长 20.8%。GAAP 毛利率为 64.9%,环比提升 2.5pcts,同比提升 4.6pcts。GAAP 净收入为 6.1 亿美元,同比提升 43.7%。分产品来看,云、人工智能和数据中心产品组成的核心业务占营收 65%,公
119、司交换机产品占 100、200 和 400G 端口交换领域 40%以上的份额,位居第一,预计 400G 和 800G 比特以太网将成为 AI 后端 GPU 集群的重要试点,公司作为交换机龙头,有望深度受益于 AI 驱动下,数据中心以太网交换机市场的增长,实现营收进一步上升。图表93:数据中心以太网交换机收入预测 图表94:校园以太网交换机收入预测 资料来源:Arista,方正证券研究所 资料来源:Arista,方正证券研究所 云、云、A AI I 和数据中心核心业务发展势头迅猛。和数据中心核心业务发展势头迅猛。Arista 在 2023 年的核心业务由云、Al 和数据中心产品组成,建立在高度差
120、异化的 Arista 可扩展操作软件系统堆栈上,部署了 10G、25G、100G、200G 和 400G 的速度。Arista 云网络产品提供了节能、高可用的区域,而不会增加冗余成本,因为数据中心对前端、后端存储和计0246810121416FY23 Q2FY23 Q3FY23 Q4FY24 Q1FY24 Q2激光器网络材料激光器网络材料电子 行业专题报告 45 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 算集群的带宽容量和网络速度都有很高需求。Arista 预计 400 和 800 千兆以太网将成为 Al 后端 GPU 集群的重要试点,预计 2025 年实现 Al 网络收
121、入至少 7.5亿美元。图表95:数据中心高速以太网端口季度数据(百万个)图表96:数据中心高速以太网端口年度数据(百万个)资料来源:Arista,方正证券研究所 资料来源:Arista,方正证券研究所 012345678CiscoROMArista05020212022CiscoROMArista电子 行业专题报告 46 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 4 4 国产算力把握机遇进展迅速国产算力把握机遇进展迅速 全球 AI 产业快速发展背景下,算力芯片重要性日益凸显,英伟达等行业巨头公司持续进行新品迭代,国产厂商同样把握机遇快速发展。我们梳理
122、了英伟达及部分国内主流 AI 芯片厂商产品参数,从产品性能来看,尽管国内厂商由于起步较晚,产品性能整体落后于英伟达当前主流料号,但我们也看到如华为昇腾 910B 等产品性能已可比肩英伟达 A100 的参数性能。我们看好随着国内厂商产品持续迭代,国内 AI 芯片与海外的差距将逐步缩小。图表97:部分国产芯片性能参数对比英伟达产品 资料来源:公开资料整理,方正证券研究所 1 1)华为昇腾:)华为昇腾:目前昇腾产品线共有两个系列产品:昇腾 310 和昇腾 910,其中昇腾 910 是基于自研华为达芬奇架构 3D Cube 技术,在算力方面完全达到设计规格,半精度(FP16)算力 320 TFLOPS
123、,整数精度(INT8)算力 640 TOPS,功耗310W。同时根据科大讯飞公告,目前昇腾同时根据科大讯飞公告,目前昇腾 910B910B 能力已经基本做到可对标英伟达能力已经基本做到可对标英伟达A100A100。图表98:昇腾 910 与英伟达部分产品参数对比(TFLOPS,W)资料来源:海思半导体官网,Nvidia 官网,TechPowerUp,方正证券研究所 昇腾昇腾 A AI I 平台:平台:昇腾全栈 AI 软硬件平台可以分为硬件层、架构层、框架层、应用层,其中硬件层涵盖开发者套件、加速模块、加速卡等产品;架构层核心为 CANN异构计算架构;框架层则以昇思 MindSpore 为核心。
124、公司名称公司名称产品料号产品料号用途用途发布/推出时间发布/推出时间制程制程INT8算力(TOPS)INT8算力(TOPS)FP16算力(TFLOPS)FP16算力(TFLOPS)FP32算力(TFLOPS)FP32算力(TFLOPS)H200训练2023年11月4nm-197967H100训练2023年9月4nm4000160060A100训练2020年5月7nm62431219.5昇腾310推理2018年10月12nm168-昇腾910训练2019年8月7nm640320-云燧T20训练2021年7月12nm25612832云燧i20推理2021年12月12nm25612832寒武纪思元3
125、70训推一体2021年11月7nm2569624海光信息深算二号训练2023年11月-壁仞科技BR100训推一体2022年8月7nm2048-256英伟达华为燧原科技昇腾910昇腾910Nvidia A100Nvidia L40Nvidia L40S架构架构HUAWEI Da VinciNVIDIA AmpereNVIDIA Ada LovelaceNVIDIA Ada Lovelace FP.05362.05IINT8640624362733功耗功耗3制程制程N7+N75 nm5 nm电子 行业专题报告 47 敬 请 关 注 文 后 特 别 声 明
126、 与 免 责 条 款 s 图表99:昇腾全栈 AI 软硬件平台结构 图表100:昇腾 CANN 异构计算架构 资料来源:昇腾官网,方正证券研究所 资料来源:昇腾官网,方正证券研究所 昇腾赋能计算中心。昇腾赋能计算中心。在建设计算中心方面,昇腾 AI 提供了从底层硬件到顶层应用使能的人工智能全栈能力,以“1 中心+4 平台”赋能产业发展。在硬件层面主要由 Atlas 900 AI 集群构成,其涵盖数千颗昇腾 910 处理器,总算力最大可拓展至 3.2 EFLOPS。图表101:昇腾人工智能计算中心建设方案 资料来源:昇腾官网,方正证券研究所 2 2)燧原科技:燧原科技:燧原科技成立于 2018
127、年 3 月,专注于 AI 云端算力产品,涵盖芯片、板卡、智算一体机、液冷算力集群以及配套的软件系统。2019 年 12 月,公司成功发布第一代训练产品“云燧 T10”;2020 年 12 月,公司发布第一代推理产品“云燧 i10”;2021 年 7 月,公司发布第二代训练产品“云燧 T20/T21”,并于同年的 12 月发布第二代推理产品“云燧 i20”。云燧 T20 和 i20 均基于邃思 2.0 打造,邃思 2.0 是同期国内最大的 AI 计算芯片,采用日月光 2.5D 封装,在国内率先支持 TF32 精度,单精度张量 TF32 算力可达160TFLOPS。同时,邃思 2.0 也是国内同期
128、首个支持 HBM2E 的产品,最高容量达64GB,传输速率达 1.8TB/s。电子 行业专题报告 48 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 燧原科技产品历经成熟商业化打磨。燧原科技产品历经成熟商业化打磨。根据燧原科技,公司的芯片在出货后就已应用于腾讯不同的业务部门、产品线上。同时,燧原科技还联合之江实验室,共同构建了超千卡规模的 AI 液冷集群。2023 年 10 月 25 日,弘信电子向燧原科技下发 9152 片芯片采购订单,计划于 2023 年底前完成全部芯片的交付,快速形成国产算力落地。图表102:燧原科技部分产品简介 资料来源:燧原科技官网,方正证券研究所
129、3 3)景嘉微:景嘉微:景嘉微是国内首家成功研制国产 GPU 芯片并实施大规模工程应用的公司。景嘉微掌握了一系列关键技术,包括芯片底层逻辑/物理设计、超大规模电路集成验证、模拟接口设计、GPU 驱动程序设计等。在 GPU 体系结构、图形绘制高效处理算法、高速浮点运算器设计、可复用模块设计、快速大容量存储器接口设计、低功耗设计等方面拥有丰富的技术积累。景嘉微先后成功研制出具有自主知识产权的高性能 GPU 芯片,如 JM5 系列、JM7 系列、JM9 系列等,为国内 GPU 技术的突破和发展做出了杰出的贡献。图表103:景嘉微 JM9-1 和 JM9-2 部分性能参数 型号型号 JM9JM9-1
130、1 JM9JM9-2 2 显存容量 8GB 8GB 显存带宽 128GB/s 25.6GB/s 总线接口 PCIe 4.0 X8 PCIe 4.0 X8 FP32 性能 1.5 TFLOPS 512 GFLOPS 像素填充率 32G Pixels/s 8G Pixels/s 数据来源:景嘉微公告,方正证券研究所 4 4)寒武纪:寒武纪:成立于 2016 年,提供云边端一体、软硬件协同、训练推理融合、具备统一生态的系列化智能芯片产品和平台化基础系统软件。根据寒武纪官网,目前寒武纪具有智能加速卡、智能加速系统、智能边缘计算模组、终端智能处理器IP、软件开发平台共 5 大业务。其中公司智能加速卡思元
131、 370 系列采用 7nm 制程,使用 chiplet 技术,集成 390 亿个晶体管,最大算力高达 256TOPS(INT8)。电子 行业专题报告 49 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 图表104:寒武纪思元 370 系列智能加速卡参数 资料来源:寒武纪官网,方正证券研究所 5 5)沐曦集成电路:沐曦集成电路:成立于 2020 年 9 月,其核心成员平均拥有近 20 年的高性能GPU 产品端到端研发经验,并曾主导开发和量产了多款世界主流的高性能 GPU 产品。沐曦推出了曦思 N 系列 GPU 产品,专为 AI 推理而设计;曦云 C 系列 GPU 产品,用于千亿
132、参数的 AI 大模型训练和通用计算;以及曦彩 G 系列 GPU 产品,用于图形渲染,以满足数据中心对于高能效和高通用性算力需求的要求。沐曦的产品采用完全自主研发的 GPU IP,拥有完全自主知识产权的指令集和架构,并配备与主流 GPU 生态兼容的完整软件栈,具备高能效和高通用性的天然优势。根据沐曦官微,2023 年 6 月,旗下产品曦云 C500 仅用 5 小时便完成功能测试。图表105:曦云 C500 仅用 5 小时完成功能测试 资料来源:沐曦官微,方正证券研究所 6 6)壁仞科技:壁仞科技:成立于 2019 年,专注于开发独创的通用计算体系,并构建高效的软硬件平台,同时提供智能计算领域的一
133、体化解决方案。公司的发展路径首先聚焦于云端通用智能计算,并逐步超越现有解决方案,在人工智能训练、推理和图MLU370-S4MLU370-X4MLU370-X8计算架构计算架构Cambricon MLUarch03Cambricon MLUarch03Cambricon MLUarch03制程工艺制程工艺7nm7nm7nmFP16FP1672 TFLOPS96 TFLOPS96 TFLOPSFP32FP3218 TFLOPS24 TFLOPS24 TFLOPS内存容量内存容量24GB24GB48GB内存带宽内存带宽307.2 GB/s307.2 GB/s614.4 GB/s最大热功耗最大热功耗7
134、5W150W250W电子 行业专题报告 50 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 形渲染等多个领域实现国产高端通用智能计算芯片的突破。在 2022 年,壁仞科技推出了旗下的首款旗舰 GPU 芯片:BR100。该芯片采用了 7nm 制程,并支持 PCIe 5.0 接口。根据壁仞科技发布会的介绍,BR100 的 16 位浮点算力超过 1000T,8 位定点算力超过 2000T,单芯片的峰值算力达到了 PFLOPS 级别。图表106:壁仞科技产品:壁砺 100P 图表107:壁仞科技产品:壁砺 104 资料来源:壁仞科技官网,方正证券研究所 资料来源:壁仞科技官网,方正证
135、券研究所 7 7)摩尔线程:摩尔线程:成立于 2020 年 10 月,专注于研发设计全功能 GPU 芯片及相关产品。他们的产品支持多种组合工作负载,包括 3D 图形渲染、AI 训练与推理加速、超高清视频编解码、物理仿真与科学计算等。摩尔线程注重算力与算效的平衡,旨在为中国科技生态合作伙伴提供强大的计算加速能力,并在数字经济的多个领域广泛发挥作用。根据摩尔线程官网的信息,旗下的 MTT S3000 产品具有 GPU 核心频率 1.9GHz,32GB 容量的 DDR6 显存,支持 FP32、FP16、INT8 等多种计算精度同时其 FP32 算力达到了 15.2TFLOPS。图表108:摩尔线程
136、MTT S3000 资料来源:摩尔线程官网,方正证券研究所 产品迭代与国产化需求催生优质先进算力企业。产品迭代与国产化需求催生优质先进算力企业。通过梳理 2023 年 IC 先进算力公司公告及业务进展近况我们发现:目前国内 IC 先进算力公司在产品迭代、产能建设、斩获大额订单进展迅猛,其中产品迭代以及产能建设主要集中在算力核心硬件以及 AI 相关芯片中,同时从部分公司目前斩获的订单来看,主要集中在国产化算力相关项目中。我们认为,核心公司业务进展近况进一步印证了现阶段板块发展两个核心要素:AI 方向的持续产品迭代、庞大的国产化算力需求。电子 行业专题报告 51 敬 请 关 注 文 后 特 别 声
137、 明 与 免 责 条 款 s 图表109:IC 先进算力部分公司重要公告&业务进展情况 资料来源:各公司公告,全国公共资源交易平台,方正证券研究所 5 5 HBM4HBM4 实现逻辑存储垂直堆叠,混合键合助力带宽提升实现逻辑存储垂直堆叠,混合键合助力带宽提升 高性能计算功耗问题突出。高性能计算功耗问题突出。最开始数据中心通过提高 CPU、GPU 的性能进而提高算力,但处理器与存储器的工艺、封装、需求不同,导致二者之间的性能差距逐步加大。英伟达创始人黄仁勋曾表示计算性能扩展的最大弱点就是内存带宽。以谷歌第一代 TPU 为例,其理论算力值为 90TFOPS,但最差真实值仅 1/9,即 10TFOP
138、S算力,因为其相应内存带宽仅 34GB/s。此外,在传统架构下,数据从内存到计算单元的传输功耗是计算本身能耗的约200倍,仅用于计算的能耗和时间占比很低,数据在内存与处理器之间的频繁迁移带来严重的功耗问题。图表110:存储功耗限制整体性能表现 资料来源:AMD,方正证券研究所 公司公司相关公告及业务进展相关公告及业务进展景嘉微2023/8/2定增项目通过:拟定增募集资金不超过39.74亿元,计划投向高性能通用GPU芯片研发及产业化项目约30.30亿、投向通用 GPU 先进架构研发中心建设项目约9.45亿。同时高性能通用GPU芯片项目将与第三方先进芯片封装厂共建专用封测线。2023/8/17公告
139、:公司与中国移动、浙江信息组成的联合体中标“浙东南数字经济产业园数字基础设施提升工程(一期)”项目,合计金额约7.53亿,公司所占金额约5.28亿。预计收到相应开工报告后40日内供货、安装调试完毕。2023/6/30日,公司中标沈阳市大东区城市建设局的“沈阳市汽车城新型基础设施建设项目-智能计算中心”项目,中标金额约1.55亿元,同时合同规定产品交付时间不得晚于2023年9月30日。海光信息2023H1海光三号为CPU主力销售产品,海光四号、海光五号处于研发阶段;DCU主力销售产品为深算一号,深算二号已发布,深算三号研发进展顺利。龙芯中科发展目标:到2025年开放市场的营收占公司营收比达到30
140、%。同时在2023年11月已发布3A6000产品,3A6000整机产品也已有小批量出货。2023年7月公告,拟向不特定对象发行可转债募资不超过20.0亿,主要投向新一代 FPGA平台开发及产业化、智能化可重构 SoC 平台开发及产业化、新工艺平台存储器开发及产业化等多个项目中。2023年世界人工智能大会中,公司展出了第二款 FPAI芯片-FMQL100TAI,可搭载多种人工智能算法,同时兼具可重构性。紫光国微 在特种集成电路领域,相关图像AI智能芯片也已在2023H1完成研发,开始进行推广。复旦微电寒武纪-U电子 行业专题报告 52 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款
141、s HBMHBM 打破内存带宽及功耗瓶颈。打破内存带宽及功耗瓶颈。不同于传统的内存与处理器基于 PCB 互联的形式,HBM 是基于与处理器相同的“Interposer”中介层互联实现近存计算,从而显著减少数据传输时间,节省布线空间。而基于 TSV 工艺的 DRAM 堆叠技术则显著提升了带宽,并降低功耗和封装尺寸。根据 SAMSUNG,3D TSV 工艺较传统 POP封装形式节省了 35%的封装尺寸,降低了 50%的功耗,并且带来了 8 倍带宽提升。图表111:HBM 与 GDDR 结构对比 图表112:TSV 工艺带来尺寸、功耗及带宽优势 资料来源:AMD,方正证券研究所 资料来源:SAMSU
142、NG,方正证券研究所 HBMHBM 正成为正成为 HPCHPC 军备竞赛的核心。军备竞赛的核心。英伟达早在 2019 年便已推出针对数据中心和HPC 场景的专业级 GPU Tesla P100,当时号称“地表最强”的并行计算处理器,DGX-1 服务器就是基于单机 8 卡 Tesla P100 GPU 互连构成。得益于采用搭载 16GB的 HBM2 内存,Tesla P100 带宽达到 720GB/s,而同一时间推出的同样基于 Pascal架构的 GTX 1080 则使用 GDDR5X 内存,带宽为 320GB/s。此后英伟达数据中心加速计算 GPU V100、A100、H100 均搭载 HBM
143、 显存。最新的 H100 GPU 搭载 HBM3 内存,容量 80Gb,带宽超 3Tb/s,为上一代基于 HBM2 内存 A100 GPU 的两倍。而作为加速计算领域追赶者的 AMD 对于 HBM 的使用更为激进,其最新发布的 MI300X GPU搭载容量高达192GB的HBM3显存,为H100的2.4倍,其内存带宽达5.2TB/s,为 H100 的 1.6 倍,HBM 正成为 HPC 军备竞赛的核心。图表113:英伟达 GPU 内存带宽不断提升 图表114:AMD Instinct MI300X 资料来源:英伟达,方正证券研究所 资料来源:AMD,方正证券研究所 高性能计算驱动高性能计算驱动
144、 HBMHBM 加速迭代,加速迭代,HBMHBM3 3 升级,升级,HBMHBM3 3E E 已在路上。已在路上。高性能计算驱动数据中心 HBM 需求井喷,HBM 升级速度近年明显加快。SK 海力士于 2021 年 10 月宣电子 行业专题报告 53 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 布成功开发出容量为 16GB 的 HBM3 DRAM,2022 年 6 月初即宣布量产。仅过去 10个月,SK 海力士官网再次宣布已成功开发出垂直堆叠 12 个颗 DRAM 芯片、容量高达 24GB 的 HBM3 新品,并正在接受客户公司的性能验证。与此同时,海力士第五代 HBM 内
145、存 HBM3E 已在路上。英伟达于 2023 年 8 月 8 日发布的最新 GH200 预计将搭载 HBM3E 内存,并将于 2024 年 Q2 出货。根据公开信息披露,该 HBM3E 芯片单 pin 最大带宽达 8Gb/s,单栈最大带宽达 1Tb/s,较上一代 HBM3 提升 25%。图表115:英伟达 GH200 GPU 首发 HBM3E 图表116:HBM3E 部分参数对比 HBM3E HBM3 HBM2E HBM2 Max Capacity 36GB 24GB 16GB 8GB Max Bandwidth Per Pin 9.2Gb/s 6.4Gb/s 3.6Gb/s 2.0Gb/s
146、Number of DRAM ICs per Stack 12 12 8 8 Effective Bus Width 1024-bit Voltage?1.1V 1.2V 1.2V Bandwidth per Stack 1.18TB/s 819.2GB/s 460.8GB/s 256GB/s 资料来源:英伟达,方正证券研究所 资料来源:半导体行业观察,方正证券研究所 HBM 通过 TSV 技术垂直堆叠多个 DRAM,与 GPU 通过中介层互联封装在一起,已成为数据中心新一代内存解决方案。HBM 制造商主要包括 SK 海力士、三星和美光,XPU 由英伟达、AMD、博通等设计后交由台积电、三星、
147、英特尔等 Foundry 厂商生产,再通过 2.5D 封装技术如 CoWoS 进行封装整合。图表117:HBM 产业链 资料来源:SK Hynix,方正证券研究所 电子 行业专题报告 54 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 5.15.1 SKSK 海力士:海力士:携手台积电合作开发携手台积电合作开发 H HBM4BM4,资本开支回升,资本开支回升 S SK K 海力士海力士 2 23Q43Q4 单季收入同环比改善明显,单季收入同环比改善明显,D DRAM/NANDRAM/NAND 产品产品 A ASPSP 环比提升。环比提升。SK 海力士2023Q4实现收入11.
148、3万亿韩元,YoY+47%,QoQ+25%;毛利率20%,QoQ+17pcts;净利率-12%,QoQ+12pcts。分产品看,DRAM 收入占比 65%,ASP QoQ+18-19%,NAND 收入占比 27%,ASP QoQ+40%。DRAM 方面,公司聚焦扩大销售 HBM 和高密度DDR5 等高附加值产品以提高盈利能力,NAND 方面,公司减少了低毛利产品的销售,扩大了移动存储和 eSSD 产品的销售。2023 年 DDR5 销量同比增长了 4 倍以上,HBM3 销量同比增长了 5 倍以上,受供需情况改善及下游 AI 产品复苏驱动,23Q4 营收同环比改善。图表118:海力士营收结构(十
149、亿韩元)资料来源:SK Hynix,方正证券研究所 展望展望 2 2024024 年,年,A AI I 应用驱动存储需求上升,供需格局进一步优化。应用驱动存储需求上升,供需格局进一步优化。P PC C 端端受换机及Windows 系统升级,叠加 AI PC 后续大规模量产,PC 出货量有望以中个位数百分比增长,且 AI PC DRAM 容量比普通 PC 高一倍以上,将长期推动 PC 出货量和容量增长。智能手机方面智能手机方面,随着搭载 AI 应用的智能手机的普及与消费者购买力的恢复,预计高密度与性能存储产品需求强劲。服务器方面服务器方面,AI 厂商 Capex 的恢复及推理模型的持续演进,AI
150、 服务器出货量持续上升,AI 投资 24 年有望复苏。综上,SK 海力士预计 2024 年 DRAM/NAND 位同比增长有望达 15%-18%,DRAMDRAM 库存于库存于24H124H1 达到正常水平,达到正常水平,NANDNAND 于于 24H224H2 实现实现供需格局优化。图表119:SK 海力士 DRAM 分应用营收占比 图表120:SK 海力士 NAND 分应用营收占比 资料来源:SK Hynix,方正证券研究所 资料来源:SK Hynix,方正证券研究所 020004000600080002Q423Q323Q4DRAMNANDOthers电子 行业专题报
151、告 55 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s H HBM3EBM3E 已实现量产,资本开支同比回升。已实现量产,资本开支同比回升。海力士预计 2025 年 HBM市场将增长 40%,预计预计 HBMHBM 长期需求增长率超长期需求增长率超 60%60%,立足需求可见性,海力士已量产 2024 年需求有望大幅增长的 HBM3E 产品,预计 2024 年 TSV 同比产能翻倍,同时拓展 AI 服务器模组如 MCR DIMM 产品。2023 年公司资本开支同比下降 50%以上,2024 年资本开支同比回升,重点关注 HBM 等先进工艺的高需求高附加值产品,保障产品扩产及研
152、发动作顺利进行,优先考虑扩大先进工艺产品量产及 TSV 与基础设施建设。S SK K 海力士携手台积电,合作开发海力士携手台积电,合作开发 H HBM4BM4。SK 海力士制定“一个团队战略”,其重要组成部分是与台积电建立 AI 芯片联盟,合作开发第六代 HBM 芯片(HBM4),HBM4拟升级到更宽的 2048 位内存接口,以解决 1024 位内存接口“宽但慢”的问题,需要台积电先进封装技术验证HBM4的布局和速度,预计台积电将负责封装工艺,以提升产品兼容性。根据目前规划及进展,海力士将于 2026 年实现 HBM4 量产。同时 SK 海力士计划在美国印第安纳州建立 HBM 内存封装工厂,届
153、时有望与台积电亚利桑那州工厂合作,助力英伟达实现在美国生产 GPU。图表121:HBM 供应时间线 资料来源:Trendforce,方正证券研究所 5.25.2 三星电子:三星电子:DRAMDRAM 业务转盈,业务转盈,TSVTSV 产能加速扩张产能加速扩张 存储业务复苏,三星电子存储业务复苏,三星电子 2 23Q4 DRAM3Q4 DRAM 业务转盈。业务转盈。三星电子 23Q4 合计营收 67.8 万亿韩元,环比增长 0.6%,同比下降 3.8%;营业利润为 2.8 万亿韩元,同比-34.6%,环比+16.7%。单季度毛利率 32%,同比+1.0pct,环比+1.1pcts;营业利润率 4
154、.2%,同比-1.9pcts,环比+0.6pct。Q4 存储业务营收为 15.71 万亿韩元,环比+49%,同比+29%。四季度期间,三星重点扩大 HBM、DDR5、UFS 4.0 等高附加值产品销售,推动 DRAM 和 NAND 的库存加速正常化,DRAM 业务在 23Q4 恢复盈利。高端产品供给有限,客户端需求持续强劲拉动内存市场进一步复苏。高端产品供给有限,客户端需求持续强劲拉动内存市场进一步复苏。服务器长期以来相对低迷需求已出现复苏迹象,2023 年因预算紧缩导致的服务器更换推迟需求恢复。AI 驱动,商用 PC 和旗舰智能手机单机价值增长,且产品更换周期临近,换货需求促进出货量上升。产
155、品 ASP 上涨及库存情况改善下,预计公司 24Q1 内存业务恢复盈利,其中其中 DRAMDRAM 库存于库存于 24Q224Q2 回归正常,回归正常,NANDNAND 于于 24H124H1 实现正常化实现正常化,2024 年内存业务持续复苏。电子 行业专题报告 56 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 扩大扩大 T TSVSV 产量,加速推出产量,加速推出 H HBMBM 产品。产品。三星通过推出业界首个基于 1Bnm 的行业最高容量 32G DDR5,增强公司在高密度 DDR5 市场的领导地位。生成式 AI 的普及拉动市场对先进 HBM 性能和容量需求的不断增
156、长,公司计划利用 TSV 产能的竞争力,进一步扩产以巩固公司 HBM 的竞争力。此外,公司将适时推出新一代 HBM3E,并于 24H2 加速向 3E12i 过渡。5.35.3 美光:美光:HBM3EHBM3E 验证进入尾声,有望于验证进入尾声,有望于 2 2024024 年初量产年初量产 D DRAM/NANDRAM/NAND 价格走强,价格走强,A AI I 及数据中心业务驱动美光业绩增长。及数据中心业务驱动美光业绩增长。美光 FY24Q1 收入47.3 亿美元,QoQ+18%,YoY+16%;NON-GAAP 毛利率 1%,QoQ+10pcts,YoY-22pcts,业绩增长受 DRAM/
157、NAND 价格回升影响,预计伴随搭载 AI 的智能手机、PC 等产品的大规模生产,终端存储库存进一步调整,2024 年 DRAM/NAND 价格将持续走强,供需结构进一步健康化。公司利用业界领先的数据中心解决方案组合来把握人工智能激增带来的机遇,其中包括 HBM3E、D5、多种类型的高容量服务器内存模块、LPDRAM 和数据中心 SSD,其中其中 H HBM3EBM3E 目前处于在目前处于在 NVIDIANVIDIA 下一代下一代 Grace Hopper Grace Hopper GH200GH200 和和 H200H200 平台验证的最后阶段平台验证的最后阶段,有望在有望在 2024202
158、4 年初量产年初量产,预计 2024 年 Capex位于 75-80 亿美金,以支撑 HBM3E 产量提升。图表122:美光 HBM3E 结构 资料来源:美光官网,方正证券研究所 图表123:海力士、三星、美光业绩情况 CY23Q4 业绩 业绩展望 SK 海力士 收 入 11.3 万 亿 韩 元,YoY+47%,QoQ+25%;毛利率 20%,QoQ+17pcts;净利率-12%,QoQ+12pcts,库存环比改善,ASP 环比增长十位数百分点 预计 24 年 DRAM 和 NAND 同比位增 15%-18%,资本开支同比增长,分终端应用,1)PC:24 年出货量个位数增长,驱动因素为替换需求
159、及微软系统升级(AIPC 的内存需求是 PC 的两倍);2)Mobile:24 年智能手机出货量增长约 5-8%,AI 手机以及不断增多的 AI应用案例驱动了长期的替代需求;3)服务器:预计 24 年复苏 三星电子 收入 67.78 万亿韩元,YoY-3.8%,QoQ+0.6%;毛 利 率 为 32.0%,YoY+1.0pct,QoQ+1.2pcts;营业利润率为4.2%,YoY-1.9pcts,QoQ+0.6pct 预计 24Q1PC 和移动设备市场将延续 Q4 的复苏趋势,服务器市场出现复苏迹象,高端服务器产品将保持强劲需求;公司将通过32GDDR5、新一代 HBM3E 和 Gen5 SS
160、D 等新产品增强竞争力 美光科技 营收 47 亿美元,YoY+16%,QoQ+18%,超指引上限(42-46 亿美元);GAAP 毛收入预计 51-55 亿美元,中值 53 亿美元,YoY+43.5%,QoQ+12.2%;GAAP 毛利率预计 10.5%13.5%,中值 12%,YoY+44.7pcts,电子 行业专题报告 57 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 利率-0.7%(指引 为-8%-4%),QoQ+10.1pcts,YoY-22.6pcts QoQ+12.7pcts;预计数据中心客户的存储库存将在 2024 年上半年接近正常;预计预计 20242024
161、 年初开始年初开始 HBM3EHBM3E 量产量产,并在 FY24 产生数亿美金 HBM 收入,FY24FY24 资本支出预计在资本支出预计在 7575-8080 亿亿美金美金 资料来源:各公司业绩说明会,方正证券研究所 6 6 SKSK 海力士先进封装持续发力,助力海力士先进封装持续发力,助力 HBMHBM 性能领先性能领先 SKSK 海力士海力士引领引领 HBMHBM 市场市场,HBMHBM4 4 将于将于 2 2026026 年问世。年问世。SK 海力士于 2015 年推出首代HBM,对应 2GB 的容量和 1.0Gbps 的带宽;于 2022 年推出 HBM3,是全球第一家且是唯一一家
162、实现量产的公司,可实现 12 层的堆叠和 5.6Gbps 的带宽;2024 年预计将量产 HBM3E,容量、带宽、散热性能和能耗进一步优化。下一代 HBM4 将搭载混合键合技术,并与 Foundry 厂进行合作,预计将于 2026 年问世。图表124:SK 海力士 HBM 产品时间线 资料来源:SK Hynix,方正证券研究所 HBMHBM 市场格局:三分天下,海力士领先。市场格局:三分天下,海力士领先。从市场格局来看,HBM 的市场份额仍由三大家所主导。根据 TrendForce,2022 年全年 SK 海力士占据了 HBM 全球市场规模的 50%。其次是三星,占 40%,美光占 10%。T
163、rendForce 预测,2023 年海力士和三星的 HBM 份额占比约为 46-49%,而美光的份额将下降至 4%-6%,并在 2024年进一步压缩至 3%-5%。图表125:HBM 市场规模变动预估 公司 2022 2023E 2024E SK hynix 50%46%-49%47%-49%Samsung 40%46%-49%47%-49%Micron 10%4%-6%3%-5%资料来源:TrendForce,方正证券研究所 电子 行业专题报告 58 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s SKSK 海力士深耕先进封装技术,海力士深耕先进封装技术,HBMHBM 性能
164、领先。性能领先。SK 海力士 HBM 产品的升级主要体现在:更多层数 DRAM 的堆叠、更高的带宽以及更好的散热性能。SK 海力士引领HBM 产品性能不断升级,HBM3/3E的散热性能相较于 HBM2 实现了一倍的性能提升,背后是公司精细的 DRAM 层间高度控制、热性能更好的塑封技术和凸点密度最大化等先进封装技术的持续迭代。图表126:SK 海力士 HBM 技术升级 资料来源:SK Hynix,方正证券研究所 取代取代 TCTC-NCFNCF,MRMR-MUFMUF 提高散热性能。提高散热性能。传统的 HBM 芯片堆叠多数通过 TC-NCF(the thermo-compression bo
165、nding with non-conductive film,非导电膜的热压缩键接)工艺完成,但受限于材料流动性以及 bump 数量限制,存在导热以及其他工艺缺陷等问题。MR-MUF(Mass reflow bonding with molded underfill,批量回流模制底部填充)是海力士的高端封装工艺,通过将芯片贴附在电路上,在堆叠时,在芯片和芯片之间使用一种称为在芯片和芯片之间使用一种称为液态环氧液态环氧树脂树脂塑封(塑封(L Liquid iquid e epoxy poxy M Molding olding C Compoundompound,LMCLMC)的物质填充的物质填充
166、并并粘贴粘贴。对比 NCF,MR-MUF 能有效提高导热率,并改善工艺速度和良率。图表127:MR-MUF 处理流程 图表128:MR-MUF 对比 TC-NCF 连接温度下降 14 资料来源:A Study on the Advanced Chip to Wafer Stack for Better Thermal Dissipation of High Bandwidth Memory,方正证券研究所 资料来源:A Study on the Advanced Chip to Wafer Stack for Better Thermal Dissipation of High Bandwid
167、th Memory,方正证券研究所 MRMR-MUFMUF 工艺的核心难点工艺的核心难点在于堆叠芯片过程中产生的热翘曲问题(LMC 与硅片之间的热收缩差异导致),以及芯片中间部位的空隙难以填充。LMCLMC 是是 SKSK 海力士海力士 HBMHBM电子 行业专题报告 59 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 产品的核心材料产品的核心材料,本身具备可中低温固化、低翘曲、模塑过程无粉尘、低吸水率以及高可靠性等优点,通过大量的材料配方调试及热力学验证解决热收缩差异问题。另一方面,公司通过改变 EMC 与芯片的初始对齐方式以及图案形状有效解决了填充存在缝隙的问题。图表12
168、9:LMC 与晶圆热收缩差异造成翘曲问题 图表130:EMC 不同对齐方式的空气流动 资料来源:A Study on the Advanced Chip to Wafer Stack for Better Thermal Dissipation of High Bandwidth Memory,方正证券研究所 资料来源:A Study on the Advanced Chip to Wafer Stack for Better Thermal Dissipation of High Bandwidth Memory,方正证券研究所 SKSK 海力士海力士亦亦考虑在内存产品考虑在内存产品中采用中
169、采用 FOFO-WLPWLP,2.5D2.5D 扇出方案提供扇出方案提供高高性价比性价比。通过将两个 DRAM 器件并排放置,该方案不再使用基板和中介层,预计将显著缩小封装尺寸和减薄封装厚度,从而堆叠更多的芯片。FO-WLP 也省略了 TSV 工艺,从而大大降低成本。随着布线长度的减少,电气特性同样得到改善。SK 海力士预计将FOWLP 方案用于图形或移动应用,与 HBM 方案相比,FO-WLP 的成本优势更大。图表131:FOWLP 方案 资料来源:SK Hynix,方正证券研究所 电子 行业专题报告 60 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 7 7 H HBM4
170、BM4 或与处理器或与处理器 3 3D D 堆叠,混合键合、堆叠,混合键合、T TSVSV、散热需求提升、散热需求提升 据Joongang.co.kr报道,SK海力士已开始招聘CPU和GPU等逻辑芯片设计人员,或希望将高带宽内存 HBM4 直接堆叠在处理器上。KAIST 电气与电子系教授 Kim Jung-ho 表示这种存储器与处理器的直接堆叠会对散热带来挑战,如果散热问题能够比目前晚两到三代得到解决,HBM 和 GPU 将能够在没有中介层的情况下进行堆叠。我们认为。从结构上看这一方案的核心变化在于去掉目前 CoWoS-S 结构中的硅 interposer(中介层),由目前的 GPU/CPU/
171、ASIC 处理器与 HBM 在 xy 轴放置的这种 2.5D 结构,向二者在 z 轴直接堆叠的 3D 结构升级。图表132:HBM4 结构示意图 资料来源:Techspace,方正证券研究所 从增量环节来看,我们认为:1 1)混合键合混合键合 hybridhybrid-bondingbonding 设备用量提升:设备用量提升:先进封装升级的一项核心指标就是凸显尺寸/间距的不断缩小,目前的倒装技术回流焊技术最小可实现 40-50um 左右的凸点间距,当凸点间距进一步缩小到 20um 时,目前部分龙头厂商采用 TCB 热压键合设备解决应力与热循环方面的问题,当凸点间距达到 10um 甚至无凸点(b
172、umpless)的情况下,则需要用到混合键合设备。2 2)TSVTSV 工艺难度和工序提升:工艺难度和工序提升:硅通孔技术(TSV)是通过在芯片和芯片之间、晶圆和晶圆之间制作垂直导通,实现芯片之间互连的技术,通过垂直互联减小互联长度、信号延迟,降低电容、电感,实现芯片间的低功耗、高速通讯。在集成度提升的过程中,TSV 的密度、孔径的深宽比会进一步提高,从而带来 TSV 制造工艺难度和工序数的提升。电镀填孔环节是 TSV 制造中难度较大的环节,TSV 填充效果直接关系到后续器件的电学性能和可靠性,因此我们认为对相关的电镀设备、电镀液材料都会带来更多的挑战和机遇。3 3)散热需求提升:)散热需求提
173、升:高性能算力芯片、高带宽内存的堆叠可能需要更复杂的方式解决散热问题,由于新技术、新产品目前还没有明确方案细则,但是从逻辑上推演电子 行业专题报告 61 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 我们认为芯片层间材料 EMC(特种环氧树脂),以及芯片间(液冷/浸润)整体电源管理方案(PMIC)具有潜在升级空间。综上,我们看到未来随着封装集成度进一步提升,HPC 领域算力芯片由当前主流的 2.5D 封装形式向 3D 升级是目前台积电、SK 海力士、三星等龙头半导体厂商积极布局的方向。在节省中介层成本的情况下,对混合键合、TSV、散热等环节带来更高要求,从而有望驱动相关环节供
174、应链升级。混合键合成为趋势,可实现混合键合成为趋势,可实现 1 10 0umum 以内的凸点间距。以内的凸点间距。随着芯片制造节点不断缩小,封装尺寸和凸点间距也需要相应缩小。目前主流倒装技术为回流焊,最小可实现40-50um 左右的凸点间距,若进一步缩小凸点间距会带来翘曲和精度问题,回流焊不再适用,而是转用热压键合(TCB)的方式。当凸点间距缩小至 10um 时,TCB工艺中会产生金属间化合物,导致导电性能下滑。为了在高集成度(凸点间距 10um以内)的芯片封装中解决这些问题,混合键合技术正在得到越来越多的青睐。图表133:不同凸点间距(Bump Pitch)对应的技术(单位:um)资料来源:
175、Semi engineering,IDTechEx,方正证券研究所整理 混合键合是一种永久键合工艺,其将介电键合(SiOx)与嵌入式金属(Cu)结合起来形成互连,在业界被称为直接键合互连(DBI)。混合键合通过键合界面中的嵌入式金属焊盘扩展了熔合键合,从而允许晶圆面对面连接。混合键合可分为芯片到晶圆(Die to Wafer,D2W)以及晶圆到晶圆(Wafer to Wafer,W2W)的键合。目前来看 W2W 量产进度更快(良率更高),但上下晶圆尺寸和节点要求一致,适用于高产量的小芯片。而 D2W 更为灵活,在芯片尺寸较大时反而具有成本效益。图表134:混合键合进展 资料来源:EVG,方正证
176、券研究所整理 电子 行业专题报告 62 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 混合键合工艺流程可分为焊盘形成、键合和键合后工艺三个部分。混合键合工艺流程可分为焊盘形成、键合和键合后工艺三个部分。键合后工艺包括减薄、划片、塑封等,与其他封装的工艺较为类似。而焊盘形成相关工艺则与前道工艺较为类似,设备供应商主要为应用材料、北方华创等平台型公司。键合过程相较于倒装等技术对精度的要求更高,除了 BESI、ASMPT、Shibaura 等后道设备供应商以外,TEL、EVG 等公司也有相关设备可以提供。图表135:混合键合工艺流程及对应供应商 资料来源:AMAT,方正证券研究所整
177、理 混合键合推动键合步骤和设备单价增加混合键合推动键合步骤和设备单价增加。以 AMD 的 EPYC 为例,从 2017 年的第一代霄龙处理器到 2023 年最新发布的第四代产品,生产过程中所需键合步骤从 4次提升到了超 50 次。键合技术从倒装迭代至混合键合+倒装,对键合设备也提出了更高的要求,Besi 相应开发了 8800 Ultra 以提供混合键合的键合功能,相比原来的倒装键合机单价提升了 3-5 倍。图表136:混合键合推动键合步骤和设备单价增加(单位:万美元)2017 2019 2023 AMD 产品 第一代 GEN EPYC 第二代 GEN EPYC 第四代 GEN EPYC 所需固
178、晶步骤 4 9 50 固晶技术 倒装 倒装 混合键合+倒装 Besi 设备型号 8800 FC Quantum 8800 Ultra 设备单价 50 150-250 UPH 9000 1500-2000 资料来源:Besi 官网,方正证券研究所 封装形式演变封装形式演变下,键合机需要更高的精度和更精细的能量控制下,键合机需要更高的精度和更精细的能量控制。封装技术经历了引线框架到倒装(FC)、热压粘合(TCB)、扇出封装(Fan-out)、混合封装(Hybrid Bonding)的演变,以集成更多的 I/O,实现更薄厚度,从而承载更多复杂的芯片功能和适应更轻薄的移动设备。在最新的混合键合技术下,
179、键合密度从 5-10/mm2电子 行业专题报告 63 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 提升到 10k+/mm2,精度从 20-10um 提升至 0.5-0.1um,与此同时,能量/Bit 则进一步缩小至 0.05pJ/Bit,键合设备的控制精度和工作效率都需达到新高度。图表137:封装形式升级对键合机要求提高 引线键合引线键合 (19751975)倒装封装倒装封装(19951995)热压粘合热压粘合 (20122012)扇出封装扇出封装 (20152015)混合混合键合键合 (20182018)封装形式 连接类型 引线 锡球/铜柱 铜柱 RDL/铜柱 铜-铜 连
180、接密度 5-10/mm2 25-400/mm2 156-625/mm2 500+/mm2 10k+/mm2 基板 有机物/引线 有机物/引线 有机物/硅 无 无 精度(um)20-10 10-5 5-1 5-1 0.5-0.1 能量/Bit(pJ/Bit)10 0.5 0.1 0.5 0.05 资料来源:Besi,方正证券研究所 混合键合拉动键合设备需求,存储应用爆发值得期待混合键合拉动键合设备需求,存储应用爆发值得期待。根据华卓精科招股书,1万片晶圆/月的产能需要配置 4-5 台晶圆级键合设备。Besi 预计 2024 年混合键合系统累计需求达 100 套,预计 2025 年后随着混合键合技
181、术在存储中的应用,2026 年累计需求将超 200 套(保守口径)。图表138:混合键合系统累计需求(2023 年 6 月预测)资料来源:Besi,方正证券研究所 电子 行业专题报告 64 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款 s 8 8 投资建议投资建议 建议关注:算力芯片:英伟达、AMD、英特尔、谷歌、博通、景嘉微、寒武纪-U、海光信息、弘信电子(燧原科技)HBM:SK 海力士、三星、美光 服务器:超微电脑、工业富联、浪潮信息、中科曙光、联想集团 交换机:CISCO、ARISTA、Juniper、中兴通讯、新华三、锐捷网络、菲菱科思、盛科通信 PCB:ttmi、金像电
182、、沪电股份、胜宏科技、生益科技、南亚新材、光模块:Coherent、Lumentum、中际旭创、新易盛、天孚通信、华工科技 交换芯片及光芯片:博通、Coherent、Lumentum、长光华芯、源杰科技、光迅科技、盛科通信 封测厂:日月光、安靠、长电科技、通富微电、甬矽电子、华天科技 封测设备:Besi、Shibaura、EBARA、DISCO、SUSS、新益昌、长川科技、中科飞测、芯碁微装 封测材料:IBIDEN、欣兴、SHINKO、陶氏、安美特、JSR、旭化成、法液空、Namics、兴森科技、雅克科技、天承科技、艾森股份、华海诚科、德邦科技 9 9 风险提示风险提示 AI 进展不及预期:如
183、果未来 AI 应用产业化不及预期,则会对相关公司需求产生一定不利影响。研发进度不及预期:AI 芯片研发难度高,同时下游需求迭代快速,对芯片性能持续提出较高要求,如果相关公司无法持续跟进研发最新产品,存在市场份额丢失风险。海外贸易摩擦影响:受地缘政治影响,如果未来海外持续加大对国内半导体核心制造环节的制裁,则可能会对国内相关公司产业生产销售产生不利影响。电子 行业专题报告 65 敬 请 关 注 文 后 特 别 声 明 与 免 责 条 款s分析师声明分析师声明 作者具有中国证券业协会授予的证券投资咨询执业资格,保证报告所采用的数据和信息均来自公开合规渠道,分析逻辑基于作者的职业理解,本报告清晰准确
184、地反映了作者的研究观点,力求独立、客观和公正,结论不受任何第三方的授意或影响。研究报告对所涉及的证券或发行人的评价是分析师本人通过财务分析预测、数量化方法、或行业比较分析所得出的结论,但使用以上信息和分析方法存在局限性。特此声明。免责声明免责声明 本研究报告由方正证券制作及在中国(香港和澳门特别行政区、台湾省除外)发布。根据证券期货投资者适当性管理办法,本报告内容仅供我公司适当性评级为 C3 及以上等级的投资者使用,本公司不会因接收人收到本报告而视其为本公司的当然客户。若您并非前述等级的投资者,为保证服务质量、控制风险,请勿订阅本报告中的信息,本资料难以设置访问权限,若给您造成不便,敬请谅解。
185、在任何情况下,本报告的内容不构成对任何人的投资建议,也没有考虑到个别客户特殊的投资目标、财务状况或需求,方正证券不对任何人因使用本报告所载任何内容所引致的任何损失负任何责任,投资者需自行承担风险。本报告版权仅为方正证券所有,本公司对本报告保留一切法律权利。未经本公司事先书面授权,任何机构或个人不得以任何形式复制、转发或公开传播本报告的全部或部分内容,不得将报告内容作为诉讼、仲裁、传媒所引用之证明或依据,不得用于营利或用于未经允许的其它用途。如需引用、刊发或转载本报告,需注明出处且不得进行任何有悖原意的引用、删节和修改。评级评级说明:说明:类别类别 评级评级 说明说明 公司评级 强烈推荐 分析师
186、预测未来12个月内相对同期基准指数有20%以上的涨幅。推荐 分析师预测未来12个月内相对同期基准指数有10%以上的涨幅。中性 分析师预测未来12个月内相对同期基准指数在-10%和10%之间波动。减持 分析师预测未来12个月内相对同期基准指数有10%以上的跌幅。行业评级 推荐 分析师预测未来12个月内行业表现强于同期基准指数。中性 分析师预测未来12个月内行业表现与同期基准指数持平。减持 分析师预测未来12个月内行业表现弱于同期基准指数。基准指数说明 A股市场以沪深300 指数为基准;香港市场以恒生指数为基准,美股市场以标普500指数为基准。方正证券研究所联系方式:方正证券研究所联系方式:北京:西城区展览馆路 48 号新联写字楼 6 层 上海:静安区延平路71号延平大厦2楼 深圳:福田区竹子林紫竹七道光大银行大厦31层 广州:天河区兴盛路12号楼隽峰苑2期3层方正证券 长沙:天心区湘江中路二段36号华远国际中心37层 E-mail: