报告预览

AIGC行业深度报告（15）：端侧AI爆发元年软硬架构全面升级-240626（50页）.pdf

编号：166160

PDF PPTX 50页 4.46MB 下载积分：VIP专享

下载报告请您先登录！

AIGC行业深度报告（15）：端侧AI爆发元年软硬架构全面升级-240626（50页）.pdf

1、华西计算机团队华西计算机团队2024年6月26日端侧AI爆发元年，软硬架构全面升级请仔细阅读在本报告尾部的重要法律声明请仔细阅读在本报告尾部的重要法律声明仅供机构投资者使用证券研究报告|行业深度研究报告分析师：刘泽晶分析师：孟令儒奇SAC NO：S01邮箱：SAC NO：S02邮箱：AIGC行业深度报告(15)核心逻辑:终端AI爆发元年，AI的Iphone时刻已到来：英特尔、AMD、高通、英伟达相继或即将发布AIPC产品，端侧AI争夺战已打响，以“CPU+GPU”为主的芯片组竞争格局更加明确。整机端，联想、戴尔、惠普、华硕等全力支持AI 电脑。手机端

2、，苹果正式宣布人工智能计划，苹果智能有望引领端侧AI全面爆发，原因是AI赋能Siri，深度联接多个APP，从而生成量身定做的生成式人工智能助手，类似于“钢铁侠”中的个人助理“贾维斯”。我们判断，AI的Iphone时刻已到来，AI需求有望带动换机潮。AI促使软硬件架构全面升级，端云协同成为必选项：云端AI与终端AI缺一不可，端云协同成为必选项，短期来看，端侧AI对硬件规格革新要求较小。长期来看，端侧大模型的爆发有望呈现指数级别增长，相关零部件有望升级。原因是未来端侧AI算力升级的逻辑与英伟达架构升级的逻辑相似，高算力与高功耗相匹配。AI深度融入操作系统，已成产业趋势，例如安卓15携手Gemini

3、、Copilot融入Windows 11、Apple Intelligence 深度集成于苹果操作系统中。盘古+鸿蒙星河+麒麟+昇腾+鲲鹏打造国产最强生态：我们判断AI端侧爆发为产业趋势，AI应用离落地更进一步，因此国产领域中华为拥有最完整的生态，软件端，盘古可赋能千行百业，鸿蒙可实现万物互联，例如，智慧屏、穿戴设备、车机、音箱、手机等，硬件端，端侧，麒麟已重回巅峰，鲲鹏+昇腾有望构筑全球算力体系的第二极，因此我们判断在终端爆发元年，华为有望凭借盘古+鸿蒙星河+麒麟+昇腾+鲲鹏最强生态领衔演绎国产软硬件生态崛起。投资建议:受益标的为：零部件：飞荣达、芯海科技、泰嘉股份等；鸿蒙：软通动力、九联科

4、技、润和软件、芯海科技、智微智能等；国产终端厂商：华勤技术、软通动力、神州数码等；应用：金山办公、万兴科技、润达医疗等；技术开发：中科创达等。苹果产业链及相关零部件厂商、全球终端厂商等。风险提示:核心技术水平升级不及预期的风险、AI伦理风险、政策推进不及预期的风险、中美贸易摩擦升级的风险。2aVbUdXcWfY9WdXdX7NcMbRtRrRtRtPjMmMtNjMpNwO6MpOnMNZtRpRMYoMoQ目录301终端AI爆发元年，AI的Iphone时刻已到来02 AI硬件升级趋势愈发明显03 AI重塑操作系统04 软硬件全面自主可控，华为领衔演绎国产生态崛起05 投资建议:梳理AIGC相

5、关受益厂商06 风险提示01终端AI爆发元年，AI的Iphone时刻已到来41.1.1 AIPC芯片侧：英特尔发布酷睿Ultra 处理器英特尔于2023正式推出AIPC处理器：继2023年10月19日宣布启动AI PC加速计划后，英特尔将奉上AI硬件大戏：在2023年12月14日的“AI Everywhere”发布会上正式推出AI PC处理器代号Meteor Lake的酷睿Ultra处理器。据英特尔介绍，Meteor Lake处理器“代表着英特尔40年来最重大的架构转变，为未来10年的PC创新奠定基础”，旨在“为AI PC时代铺平道路”：该芯片采用分离式模块架构，由计算模块、SoC模块、图形模

6、块以及IO模块这4个独立模块组成，并通过Foveros 3D封装技术连接。英特尔酷睿 Ultra 处理器为端侧AI而生：采用 3D 性能混合架构，支持高级 AI 功能，AI功能包括办公、写作、创作等功能。英特尔酷睿 Ultra 处理器都能利用三个专用引擎（CPU、GPU 和 NPU）解锁 AI 能量，创造沉浸式显卡体验，并保持高性能、低功耗运行。英特尔 AI Boost 是专为低功耗 AI 加速和 CPU/GPU 分载打造的集成式 AI 引擎，而英特尔 Gaussian&Neural Accelerator 可在处理 AI 语音和音频应用的同时解放 CPU 资源，以便保证系统整体的性能和响

7、应速度。5 英特尔AIPC Ultra示意图英特尔Ultra 处理器与其他处理器对比1.1.2 AIPC芯片侧：AMD锐龙AI 300为AIPC赋予强劲算力2024年AMD发布新一代处理器和芯片组产品：根据中关村在线消息，2024年中国台北电脑展上，AMD发布了全新的锐龙9000系列桌面级处理器、X870/X870E系列芯片组以及面向AI PC的Ryzen AI 300系列移动级处理器平台，这也标志着新一轮硬件“竞赛”正式拉开帷幕。锐龙AI 300系列为AI PC赋予强劲AI算力：基本规格方面，AMD Ryzen AI 9 HX 370处理器采用12核24线程设计，加速频率最高5.1GHz，总

8、缓存36MB，NPU算力提升到了50TOPS，iGPU升级到了Radeon 890M，Ryzen AI 9 365则是一颗10核20线程处理器，加速频率最高为5GHz，总缓存34MB，NPU算力同样为50TOPS，iGPU型号为Radeon 880M。规格大升级，其目的是赋予强劲算力：全新的锐龙AI 300系列两款首发型号的升级包含三个方面，首先，基于XDNA 2架构打造的全新NPU，其算力提升到了50TOPS，而现役的8040系列算力仅为16TOPS，同时在能效表现上更加出色。其次，基于Zen 5架构设计的CPU核心数量最高达到了12核24线程，多线程性能进一步提升。其三，基于RDNA 3.

9、5架构打造的iGPU，其计算单元提升到16个，图形性能进一步增强。6 AMD锐龙AI 300规格示意图AMD锐龙AI 300架构示意图1.1.3 AIPC芯片侧：高通骁龙X系列全面助力AIPC2024年COMPUTEX大会上，高通展示了其最新的AI PC产品，标志着PC产业正进入一个新的时代：高通的骁龙X系列平台是此次展会的核心亮点，搭载这一平台的PC产品将具备强大的AI功能，如实时翻译、智能助理和多模态交互等。这些功能展示了AI PC在办公、创作和生活中的广泛应用前景。高通骁龙X及骁龙Xplus专为人工智能构建：Snapdragon X Elite 能够以极快的速度在设备上运行超过 130

10、亿个参数的生成式 AI LLM 模型。它还包括超低功耗 Qualcomm Sensing Hub 内部的更新双微型 NPU，以增强安全性、登录体验和隐私，包括在睡眠模式下唤醒设备的能力。敏感数据可以保留在用户的笔记本电脑上，以通过边缘智能提高安全性。Qualcomm AI Engine 支持 Windows Studio Effects 和许多其他 AI 加速应用程序和体验。7 高通骁龙X Elite及X plus相关参数一览1.1.4 AIPC芯片侧：英伟达计划推出Blackwell内核的AI PC芯片英伟达持续加码AIAI，为世界构筑算力基石:NVIDIA在CES 2024发布3款全新Ge

11、Force RTX 40 SUPER系列显卡，其中包括GeForce RTX 4080SUPER、GeForce RTX 4070 Ti SUPER、GeForce RTX 4070 SUPER，它们是AIPC的核心，为最新游戏提供超强动力，为用户带来全新升级和体验。英伟达计划推出Blackwell内核的AI PC芯片：英伟达正在准备推出一款将下一代ARM内核与其Blackwell GPU架构相结合的芯片，根据C114消息，英伟达正在准备一款片上系统（SoC），将Arm的Cortex-X5核心设计与基于其最近推出的Blackwell架构的GPU相结合。以“CPU+GPU”CPU+GPU”为主的

12、芯片组竞争格局更加明确：目前，芯片厂商的竞争格局不再割裂，过去，CPU的龙头企业为AMD、Intel，GPU的龙头企业为英伟达，而如今芯片厂商已经逐步补强自身“短板”，其目的在于维持自身在应用场景中的龙头地位，例如英伟达自身的Grace CPU，亦或者是Intel 发布自身酷睿 Ultra AIPC处理器，此款处理器为集中式显卡，此显卡集成了CPU、GPU、NPU、IO芯片。8 英伟达RTX 4080 SUPER架构参数一览英伟达RTX 4080 SUPER架构参数一览1.2.1 AIPC整机侧：联想正式推出AIPC产品，个人电脑进入全新时代联想AIPCAIPC具有五大特征：其中包括，自然语言

13、交互的个人智能体、内嵌个人大模型、标配本地混合AI 算力、开放的 AI 应用生态、设备级个人数据&隐私安全保护。今年世界通信大会上，联想已经推出四款AIPCAIPC产品:根据腾讯网消息，2 月 27 日，2024 年世界移动通信大会(MWC 2024)上，联想集团推出全新的 ThinkPad 商务 AI PC。此次发布的最新一代 ThinkPad 共有四款产品：ThinkPad T14 第 5 代、ThinkPad T14s 第 5 代、ThinkPad T16 第 3 代以及 ThinkPad X12 Detachable 第 2 代。这些产品均配备了新一代英特尔酷睿 Ultra 处理器，内

14、嵌AI软件工具。联想创新科技大会，联想发布多款AIPCAIPC产品:其中包括Yoga Book AI元启版、Yoga Pro 16s AI元启版、ThinkPad T14p AI元启版、ThinkBook 16p AI元启版、Yoga Air 14 AI元启版、小新 Pro 16 AI元启版六款AI PC新品。售价为5999元起步，AIPC价格比普通PC略微昂贵。9 ThinkBook Plus Gen 5 Hybrid示意图联想Yoga Book 9i示意图1.2.2 AIPC整机侧：戴尔、微软、惠普等全面加入AIPC争夺战戴尔已经发布多款AIPCAIPC产品：2023年12月19日，全球P

15、C巨头戴尔发布AI PC新品灵越13 Pro，搭载全新英特尔AI PC处理器酷睿Ultra，率先开启AIPC时代。灵越13 Pro能够本地流畅运行200亿大语言模型，支持Stable Diffusion文生图/图生图等功能。此外，5月21日，戴尔科技公司在微软的年度会议上宣布推出五款全新增强型AI电脑，其全系列产品均搭载高通骁龙 X系列芯片。宏碁、华硕、惠普、联想和三星也都“全力支持”AIAI电脑：微软在年初发布新品发布会，微软CEO Satya Nadella宣布，微软将AI助手Copilot全面融入Windows系统，发布了首批AI个人电脑（AI PC）。新的AI PC被称为“Copilo

16、t+PC”，号称是“有史以来速度最快、最适合AI的PC”。主要的OEM合作伙伴有宏碁、华硕、戴尔、惠普、联想和三星。我们认为AIPCAIPC为大势所趋，AIPCAIPC争夺战已开启，AIAI应用落地的场景更加明确。10 戴尔灵越13 Pro产品示意图Copilot+PC 示意图1.3.1 手机侧+其他：苹果智能引领端侧AI全面爆发苹果正式宣布人工智能计划苹果智能：在2024WWDC大会上，苹果宣布了备受期待的人工智能计划-苹果智能。CEO蒂姆库克强调了隐私和个性化的必要性，目标是“超越人工智能”，进入“个人智能”的领域。苹果的克雷格费德里吉表示，苹果智能背后的生成模型将在iOS、iPadOS和

17、macOS上可用。苹果智能包括多种功能，从通知摘要到AI生成的表情符号。它还将增强新版Siri，使苹果的AI助手在自然语言处理方面更加功能强大和出色。苹果宣布Siri在需要时可以利用OpenAI的ChatGPT：苹果机器学习官网公布了Apple Intelligence的详细信息，Apple Intelligence总体来说分成三个部分来实现：自研端侧模型、自研云端模型，再加上OpenAI的GPT大模型这三套系统。苹果智能包括五部分能力，AI能力强大：五大能力分别是大模型能力、直观的用户体验、深度集成、个性化上下文、隐私设计等等，AI能力包括智能写作、图像生成、文本摘要、情感表达能力等等。11

18、 Apple Intelligence由三部分组成苹果Apple Intelligence 五大特点1.3.2 苹果与Open AI合作，ChatGPT深度融合进苹果设备通用模型厂商与终端厂商的合作大于竞争：我们判断通用大模型厂商，需要借助终端厂商的庞大设备生态，作为大模型落地的土壤，回收基座模型的庞大投入。借助端侧的设备数据，更好地解决大模型的相关问题，推动模型进化。而终端厂商，需要通用大模型（尤其是尖端版本的云端大模型）作为体验支撑，为用户提供最先进的AIGC应用和体验，避免在基座模型上投入太高的研发成本，也避免在AI体验上被其他终端厂商拉大。ChatGPT 已集成到 Apple 各个平台

19、：Apple 正在将 ChatGPT 访问集成到 iOS 18、iPadOS 18 和 macOS Sequoia 中的体验中，让用户无需在工具之间切换即可访问其专业知识以及图像和文档理解功能。在需要帮助时，Siri 可以利用 ChatGPT 的专业知识。在将任何问题以及任何文档或照片发送到 ChatGPT 之前，Siri 都会询问用户，然后直接显示答案。此外，ChatGPT 还将在 Apple 的系统级写作工具中提供，该工具可帮助用户生成他们所写内容。借助 Compose，用户还可以访问 ChatGPT 图像工具，以各种样式生成图像来补充客户所写的内容。12 Siri使用ChatGPT示意图

20、Compose允许用户访问ChatGPT图像工具1.3.3 苹果展示了应用+系统的AI功能，整体生态实现领先文本端，苹果文本可以实现理解和创造语言的新功能：重点在于邮件、通知、信息的优化和总结，重点功能在于生成摘要、文本矫正、个性化重写等功能。图像端，加入自主表达能力：在于文生图、图生图标定的更新，并在相册中添加AI回忆、搜图、消除等功能，例如在备忘录中，用户可以通过 Apple Pencil 工具面板中的新 Image Wand 访问 Image Playground，让笔记更具视觉吸引力、给好友添加个性化图片信息等。13 文本摘要，重点提示示意图使用 Summarise，生成图表表达形式个

21、性化Genmoji示意图草图生精图示意图根据照片生成自主化电影示意图1.3.3 苹果与Open AI合作，ChatGPT深度融合进苹果设备Siri进入新时代：1、Siri融入丰富的语言能力理解，更加自然化；2、Siri 现在可以为用户提供设备支持、3、Siri 现在可以在应用程序内和跨应用程序执行数百项新操作；4、Siri 将能够提供针对用户及其设备上的信息量身定制的智能。隐私安全问题无需担心：Apple Intelligence 依赖于理解深层个人背景，同时保护用户隐私，借助私有云计算，Apple Intelligence 可以灵活调整和扩展其计算能力，并利用更大的基于服务器的模型来处理更复

22、杂的请求。这些模型在搭载 Apple 芯片的服务器上运行，为 Apple 确保数据永远不会被保留或泄露奠定了基础。苹果智能的核心逻辑是，AI赋能Siri，深度联接多个APP，从而生成量身定做的生成式人工智能助手：过去各个APP之间独立运行，生态和数据互不连通，而现在，通过AI赋能苹果系统，可以实现打通APP之间的信息壁垒，通过对个人的学习，从而为客户实现量身定做的生成式人工智能助手，好比“钢铁侠”中的个人助力“贾维斯”，为AI应用提供更多可能。14 Siri跨应用程序操作示意图Siri提供量身定做的智能示意图1.4 端侧AI爆发带动换机潮，AI的Iphone时刻已到来2008-2012Ipho

23、ne 销量势如破竹：苹果Iphone4、4s、分别于2010年、2011年推出，其卓越设计和超群性能引领手机浪潮，同时期4g网络开始正式推出，相较于3G网络只能支持一般的网页浏览、语音聊天以及2D网络游戏等，4G网络的社交属性被明显提升，包括视频聊天、3D网络游戏等被大众广为接受，苹果4和4S以封闭生态系统、高质量的硬件和软件,以及简约而不简单的设计理念被广泛人接受，至此引领了智能手机的浪潮，可以看到从2010年到2013年苹果手机销量从3999万部跨越到1.5亿部。AI的Iphone时刻已到来，AI需求有望带动换机潮：受益于硬件算力条件等制约，端侧AI需配备较高算力需求，老版PC或手机并不支

24、持AI功能，比如，苹果表示，Apple智能将在iPhone 15 Pro系列、配备M1的iPad和Mac，以及后续机型上提供。这是因为Apple智能需要强大的端侧处理能力，必须要A17 Pro或M系列全系SoC才可以运行。因此，我们判断AI需求有望带动换机潮，AI的Iphone时刻已到来，同时，AI端侧应用落地场景更加明确。15 苹果2007年到2018年销量(百万）苹果智能融入苹果产品效果示意图1.3911.6320.7339.9972.29125.05150.26169.22231.22211.88216.76 217.72-100%0%100%200%300%400%500%600%70

25、0%800%05002007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018苹果销量(百万)同比增速02AI硬件升级趋势愈发明显162.1 AIPC的大模型可以分成在线模式和离线模式AIPC的大模型可以分成在线模式和离线模式：在线模式，即在移动端进行简单的预处理之后，然后上传用户数据(图片、文字、语音、视频等)至云端服务器，通过服务器强大的算力得到推理结果，随后将推理结果下发至端设备。离线模式，即服务器上训练好的模型经过移动端深度学习框架(TensorFlow Lite、NCNN、TNN、MNN、CoreML等

26、)量化压缩、转化后，在移动端设备上进行预测。这种方式在无网络连接的情况下即可实现，保证用户的隐私性。以苹果为例，Apple Intelligence可简单分为此两部分。云端大模型注重功能强大，端侧大模型注重低延时：在线模式和离线模式的推理平台有所不同，离线模式(端侧模型)注重低延时和实施体验，而在线模式(云端模型)注重功能强大，具体差异如右图所示。17 在线模式和离线模式差异云端模型和端侧模型差异问题维度问题维度基于端设备推断基于端设备推断基于云端服务器推断基于云端服务器推断延迟性低延时，实时体验由于存在异步通信和传输带宽的影响，有一定的延迟资源能力cpu/gpu处理能力，设备的算力有限，存储

27、空间受限云端服务器的算力强大，储存空间充足网络连接网络不佳的或者没有的情况下，可以离线运行需要网络连接才可以运行成本问题电池电量、下载模型所需要的时间数据传输带宽，公司云端服务器的运营和服务成本隐私问题不需要上传用户数据(图片、视频、语音、文字等)到云端服务器用户数据上传云端服务器，隐私性无法保障2.1.2 云端AI与终端AI缺一不可，端云协同成为必选项我们判断端云协同是必选项：终端AI算力相较于云端AI算力需求较小，原因是1、终端AI应用更偏向于推理；2、终端AI相较于云端AI的模型更偏向于“压缩”。从目前来看，很流行的“手机拍照一键擦除背景人物”，仅靠端侧大模型的计算能力是无法实现的，需要

28、端云协同来完成。而终端AI更像是流量入口，好比智能手机、PC与之前的手机、PC相比，此外，终端AI也是终端厂商的必选，原因有二，第一是自身产品力，可以提高自身的品牌力；第二是增加自身的技术优势，从而增强产品对消费者的产品力。联想发布联想个人云端协同智能体“联想小天”：联想小天具备云端大模型的高性能、泛化能力和端侧大模型的低成本、数据隐私、高可靠可以相结合。在体验会现场的演示中，联想小天展现出了较为出众的自然语言交互功能，可以用拟人化的语音和语气进行对话，为用户解决诸多问题，如日常对话、信息查找、设备操控、文件处理等多种需求。根据智东西消息，联想小天高智商的背后是abab6.5模型，其为MoE架

29、构，参数量达到了万亿级，上下文窗口为20万tokens。小天高情商的背后则是联想通过百亿条高质量对话数据训练其情绪反馈。18资料来源：全球物联网观察，智东西，华西证券研究所联想小天发布会示意图2.1.3 苹果重磅升级，端云协同成为必需品Apple Intelligence包括自研端侧模型、自研云端模型，再加上OpenAI的GPT大模型这三套系统：此外，苹果的重大动作还包括Siri，它将让您更好地控制您的应用程序，允许您要求语音助手在特定电子邮件中查找信息，甚至显示用户的朋友的照片。苹果依靠AI来帮助Siri 更好地理解用户语义并跟踪后续请求和问题。苹果在 iOS 18 中为其应用程序推出了一系

30、列新的 AI 功能，包括一种汇总电子邮件和生成回复的方法。苹果还将人工智能引入照片应用，用户你能够使用自然语言搜索照片。苹果端侧模型需硬件加持：设备上约30 亿参数的语言模型，测试得分高于诸多70亿参数的开源模型（右图所示）；根据官网这次的介绍，苹果在模型框架上用到了“grouped-query-attention”（分组查询注意力）和LoRA框架，可以压缩推理过程，有效降低内存占用。这样需要在本地运行的端模型在硬件上的要求，需要iPhone 15 Pro和iPhone 15 Pro Max，以及配置M1芯片以上的平板和苹果电脑。19 苹果智能写作功能示意图苹果端侧AI大模型测试示意图2.2.

31、1 短期来看，端侧AI对硬件规格革新要求较小短期来看，端侧AI对硬件规格革新要求较小：AIPC的增量在于TPU，而TPU的本质是ASIC芯片，ASIC芯片的优势在于体积更小、功耗更低、可靠性提高、性能提高、保密性增强、成本降低等优点，与传统GPU所需功耗相差甚远，因此，我们判断短期来看PC由于AI增量并对热管理的需求提升并不高，同时由于端侧AI模型参数量较小，目前对内存需求提升并不高。下图为同时期发布的英特尔酷睿 Ultra 9 处理器 185H、英特尔酷睿 i9 处理器 14900K与近期发布英特尔 Core Ultra 7 处理器 155UL的SOC规格比对。20 英特尔三款SOC比对

32、产品概览产品概览英特尔英特尔酷睿酷睿 i9 i9 处理器（第处理器（第 14 14 代）代）英特尔英特尔酷睿酷睿 Ultra 9 Ultra 9 处理器处理器 185185H H英特尔英特尔 CoreCore Ultra 7 Ultra 7 处理器处理器 155155ULUL处理器编号i9-14900K185H155UL客户建议价格$589.00-$599.00$640.00$426.00 CPU总核心数241612CPU性能核心数1662发布时间23年Q423年Q423年Q2内存规格大小192GB96GB96GB处理器基本功率125W45W15W处理器最大功率253W115W57WGPU

33、名称英特尔超高清显卡 770Intel Arc graphicsIntel GraphicsGPU最大动态频率1.65 GHz2.35GHz1.95 GHzNPU名称Intel AI BoostIntel AI BoostNPU最大频率1.4 GHz1.4 GHzNPU 支持的人工智能软件框架OpenVINO,WindowsML,DirectML,ONNX RTOpenVINO,WindowsML,DirectML,ONNX RT2.2.2 短期来看，端侧AI对硬件规格革新要求较小苹果A16 Bionic到A17Pro的升级主要在于NPU算力和存储的升级：根据nanoreview的数据，苹果

34、A16 Bionic的到A17Pro的NPU算力分别为17TOPS和35TOPS，存储容量分别为6GB和8GB，我们判断这是苹果14 Pro未能参与到此次AI核心的根本原因。然而短期来看，苹果A18 处理器并未对存储最大容量升级，我们判断原因是端侧AI的模型参数量较小。21 苹果A16到A18SOC比对CPUCPUA18 ProA18 ProA17 ProA17 ProA16 BionicA16 Bionic神经中枢处理器(NPU)Neural EngineNeural EngineNeural EngineNPU理论性能35 TOPS17 TOPS架构2x 3.89 GHz 4x 2.2 G

35、Hz 2x 3.78 GHz Everest4x 2.11 GHz Sawtooth2x 3.46 GHz-Everest4x 2.02 GHz-Sawtooth核心数量666频率3890 MHz3780 MHz3200 MHz持续功率限制8w8wL1储存器256 KB257 KBL2储存器16 MB17 MB制作工艺/制程3nm(N3P)3nm(N3)4nm(N4P)架构Apple Bionic GPUApple Bionic GPUApple Bionic GPUGPU 频率1450 MHz1398 MHz1398 MHz执行单元665着色器单元128128128总着色器768768640

36、FLOPS2227.2 Gigaflops2147.2 Gigaflops1789.4 Gigaflops存储种类LPDDR5TLPDDR5LPDDR5存储频率4800 MHz3200 MHz3200 MHz内存总线4x 16 Bit4x 16 Bit4x 17 Bit最大带宽78.8 Gbit/s51.2 Gbit/s51.3 Gbit/s最大容量8GB8GB6GB2.3.1 长期来看，大模型的爆发呈现指数级别增长，相关零部件有望升级大模型参数呈现指数规模，引爆海量算力需求:根据财联社和OpenAI数据，ChatGPT浪潮下算力缺口巨大，根据OpenAI数据，模型计算量增长速度远超人工智能硬

37、件算力增长速度，存在万倍差距。运算规模的增长，带动了对AI训练芯片单点算力提升的需求。根据智东西数据，过去五年，大模型发展呈现指数级别，部分大模型已达万亿级别，因此对算力需求也随之攀升。我们判断，未来随着终端AI需求的增多，模型参数量有望继续上升台阶，从而带动端侧AI的算力，进而带动零部件结构占比的结构变化。根据36氪的消息，我们可将AIPC分级：AIPC L1：入门级，适用于基础的AI任务，如语音助手、简单图像识别等，总算力达到 15 TOPS。AIPC L2：标准级，能处理较为复杂的AI应用，如高级图像和语音处理，适合多媒体内容创作，总算力至少为 45 TOPS。AIPC L3：高级，适合

38、运行实时视频分析和复杂的机器学习模型，为专业图像处理和数据科学提供支持，总算力达到 90 TOPS。AIPC L4：专业级，专为大规模机器学习模型和高级深度学习应用设计，适用于 AI 研究和大数据分析，总算力超过 180 TOPS。我们判断，未来端侧AI算力升级的逻辑与英伟达架构升级的逻辑相似，高算力与高功耗相匹配。22 大模型参数数量和训练数据规模快速增长近年大模型的参数规模增长趋势2.3.2 算力在大模型时代迎来爆发，高算力与高功耗相匹配AI芯片架构升级速度明显加快，高算力与高功耗相匹配：复盘英伟达数据中心芯片产品，其中明显可以看到其芯片算力和芯片的功耗成明显的正相关。23 架构架构英伟达

39、英伟达VoltaVolta架构架构英伟达英伟达TuringTuring架构架构英伟达英伟达AmpereAmpere架构架构型号V100V100sT4A100A800规格PCIeSXM2PCIePCIeSXMPCIePCIeSXM芯片架构NVIDIA VoltaNVIDIA VoltaNVIDIA VoltaNVIDIA TuringNVIDIA AmpereNVIDIA AmpereNVIDIA AmpereNVIDIA AmpereNVIDIA Ampere显存32GB或 16GB HBM232GB或 16GB HBM232GB HBM216GB GDDR680GB HBM2e80GB HB

40、M2e40GB HBM280GB HBM2e80GB HBM2e显存带宽900GB/s900GB/s1134GB/s320 GB/S1935GB/s2039GB/s1555GB/s1935GB/s2039GB/sFP64算力7TFLOPS7.8TFLOPS8.2TFLOPS254.4GFLOPS9.7TFLOPS9.7TFLOPS9.7TFLOPS9.7TFLOPS9.7TFLOPSFP64 Tensor Core19.5TFLOPS19.5TFLOPS19.5TFLOPS19.5TFLOPS19.5TFLOPSFP32算力14TFLOPS15.7TFLOPS16.4TFLOPS8.1TFLO

41、PS19.5TFLOPS19.5TFLOPS19.5TFLOPS19.5TFLOPS19.5TFLOPSFP32算力(Tensor)Tensor Float 32（TF32）156 TFLOPS156 TFLOPS156 TFLOPS156 TFLOPS156 TFLOPSTF32(Tensor Core)312 TFLOPS 312 TFLOPS 312 TFLOPS 312 TFLOPS 312 TFLOPS FP16算力(Tensor Core)112TFLOPS125TFLOPS130TFLOPS65TFLOPS312 TFLOPS312 TFLOPS312 TFLOPS312 TFL

42、OPS312 TFLOPSBFLOAT16(Tensor Core)312 TFLOPS312 TFLOPS312 TFLOPS312 TFLOPS312 TFLOPSFP8(Tensor Core)-INT8算力(Tensor Core)130 TOPS624 TOPS624 TOPS624 TOPS624 TOPS624 TOPSCUDA 核心数量56912Tensor Cores 核心数量640320432432功耗250瓦300瓦250瓦70瓦300瓦400瓦250瓦300瓦400瓦晶管数量（亿）2制成（nm）12nm12nm7nm7nm互联

43、速度32GB/s300GB/s32GB/s32GB/SNVLink：600GB/s PCIe 4.0：64GB/sNVLink：600GB/s PCIe 4.0：64GB/sNVLink：400GB/s PCIe 4.0：64GB/sNVLink：400GB/s PCIe 4.0：64GB/sAI芯片架构升级速度明显加快，高算力与高功耗相匹配2.3.2 算力在大模型时代迎来爆发，高算力与高功耗相匹配AI芯片架构升级速度明显加快，高算力与高功耗相匹配：从下图可以看到，英伟达GB200单芯片组的功耗为2700W。24 AI芯片架构升级速度明显加快，高算力与高功耗相匹配架构架构英伟达英伟达Hoppe

44、rHopper架构架构BlackwellBlackwell架构架构型号H100H800H200GH200B100B200GB200规格SXMPCIeNVLSXMPCIeSXM芯片架构NVIDIA HopperNVIDIA HopperNVIDIA HopperNVIDIA HopperNVIDIA HopperNVIDIA HopperNVIDIA HopperARMNVDIA BlakwellNVDIA BlakwellNVDIA Blakwell显存80GB HBM380GB HBM2e188GB HBM380 GB HBM380 GB HBM3141GB HBM3e96GB|144GB

45、HBM3e192GB 192GB384GB显存带宽3.35TB/s2TB/s7.8TB/s3.35TB/s2TB/s4.8TB/s512GB/s(CPU)8TB/s8TB/s16TB/sFP64算力34 TFLOPS26 TFLOPS68 TFLOPS1 TFLOP0.8 TFLOP34 TFLOPS34TFLOPSFP64 Tensor Core67 TFLOPS51 TFLOPS134 TFLOPS1 TFLOP0.8 TFLOP67 TFLOPS67TFLOPS30TFLOPS40TFLOPS90TFLOPSFP32算力67 TFLOPS51 TFLOPS134 TFLOPS 67 TF

46、LOPS51 TFLOPS67TFLOPS67TFLOPSFP32算力(Tensor)Tensor Float 32（TF32）67 TFLOPSTF32(Tensor Core)494.5 TFLOPS378 TFLOPS989.5 TFLOPS 494.5 TFLOPS378 TFLOPS494.5 TFLOPS494 TFLOPS0.9 PFLOPS1.12PFLOPS2.5PFLOPSFP16算力(Tensor Core)989.5 TFLOPS 756.5TFLOPS1979 TFLOPS989.5 TFLOPS 756.5TFLOPS989.5 TFLOPS 990 TFLOPS1

47、.8 PFLOPS2.25 PFLOPS5 PFLOPSBFLOAT16(Tensor Core)989.5TFLOPS756.5TFLOPS1979 TFLOPS989.5TFLOPS756.5TFLOPS989.5TFLOPS990 TFLOPS1.8 PFLOPS2.25 PFLOPS5 PFLOPSFP8(Tensor Core)1979 TFLOPS1513 TFLOPS3958 TFLOPS1979 TFLOPS1513 TFLOPS1,979 TFLOPS1,979 TFLOPS3.5 PFLOPS4.5 PFLOPS10 PFLOPSINT8算力(Tensor Core)197

48、9 TOPS1513 TOPS3958 TOPS1979 TOPS1513 TOPS1,979 TOPS1,979 TOPS3.5 PFLOPS4.5 PFLOPS10 PFLOPSCUDA 核心数量6896Tensor Cores 核心数量528528528功耗700 瓦300-350 瓦2x 350-400W高达 700 瓦300-350 瓦700瓦1000瓦700W1000W2700W晶管数量（亿）800800800制成（nm）4nm4nm4nm4nm互联速度NVLink:900GB/s PCIeGen5:128GB/sNVLink:600GB/s PCIeGen5

49、:128GB/sNVLink:600GB/s PCIeGen5:128GB/sNVLink:400GB/s PCIe 5.0:128GB/sNVLink:400GB/s PCIe 5.0:128GB/sNVIDIA NVLink:900GB/SPCle Gen5:128GB/s900 GB/s bidirectionalNV Link：1.8 TB/sNV Link：1.8 TB/sNV Link：2x1.8 TB/S03AI重塑操作系统253.1.1 安卓15携手Gemini大模型，AI创新引领未来AI技术在移动端操作系统实质突破：谷歌I/0 2024开发者大会揭示了Android 15和G

50、emini 1.5 Pro大模型的革新，包括下一代移动操作系统Android 15、先进的Gemini大模型，以及多项AI驱区动的创新功能。谷歌宣布，Android 15将深度融合谷歌的Gemini大模型，名称为Gemini Nano，可为用户带来前所未有的智能体验。新系统将支持AI语音助理防诈骗、画圈图片搜索等前沿功能，并通过卫星通信连接扩展平台支持，确保在偏远地区也能保持连接。Gemini家族迎来是史诗级更新：Gemini 1.5 Pro上下文窗口扩展支持200万token，号称“迄今为止所有基础模型中最长的上下文窗口”，此次大会谷歌重磅宣布推出基于 Gemini 1.5 Pro 的 Ge

51、mini Advanced。同时，新成员包括Gemini 1.5 Flash，擅长摘要、聊天应用程序、图像和视频字幕、从长文档和表格中提取数据等，在应用场景上，它擅长总结、聊天、图像视频字幕、长文档数据提取等任务。Gemini 1.5 Flash通过从1.5 Pro模型中学习，继承了其核心能力。此外，谷歌同样展示新的多模态AI项目Project Astra，是谷歌人工智能助手的最新进展。26资料来源：格隆汇，InfoQ，华西证券研究所Gemini 1.5 Flash示意图谷歌将AI与安卓深度绑定示意图3.1.2 微软AI PC全面“亮剑”，Copilot融入Windows 11微软AI PC全

52、面“亮剑”，Copilot融入Windows 11：微软介绍Copilot+PC 是迄今为止速度最快、最具智能体验的 Windows PC。凭借强大的新型芯片，能够实现40+TOPSAI 算力、电池续航时间可达一整天。每台 Copilot+PC 都配备了强大的 AI Agent，只需在键盘上轻点新的 Copilot 按键即可快速交互。未来，用户将获得包括来自 OpenAI GPT-4o 在内的最新模型，进行更自然的语音对话。AI 能力也完全嵌入了 Windows 11 系统，例如控制面板里有 Copilot 修改设置的按钮，图片文件的菜单里出现了一键修图。微软AIPC功能强大：Copilot+

53、PC采用了强劲的处理器和多个最先进的AI 模型，其中包含了Microsoft 研发的顶尖小型语言模型，让用户可以在装置上直接本地运行AI，具备即时回想、图像创建和编辑功能、AI修图等功能。下一代Winodws操作系统有望更深度融入AI技术：根据中关村在线和36氪消息，下一代Windows操作系统有望将围绕AI功能进行重构，作为系统底层的一部分，此时的AI将不会再受到系统安全的限制，可以直接调用系统的各个功能和应用。27资料来源：机器之心，中关村在线，36氪，微软官网，华西证券研究所微软Copilot示意图微软AIPC搭载高通骁龙X产品示意图3.1.3 Apple Intelligence 深度

54、集成于苹果操作系统中Apple Intelligence 深度集成于 iOS 18、iPadOS 18 和 macOS Sequoia：如上文所述，Apple Intelligence总体来说分成三个部分来实现：自研端侧模型、自研云端模型，再加上OpenAI的GPT大模型这三套系统。Apple Intelligence 深度集成于 iOS 18、iPadOS 18 和 macOS Sequoia 中，充分运用 Apple 芯片对语言和图像的理解与创作能力，可做出多种跨 app 操作，同时结合个人场景，为用户简化和加快日常任务流程。Apple Intelligence功能强大：1、理解和创造语言

55、的全新能力，系统可调用的新工具 Writing Tools，让用户能在几乎任何场景下对文本进行改写、校对和摘要，包括邮件、备忘录、Pages 文稿和各类第三方 app；2、Image Playground 为交流和自我表达增添乐趣，可帮助用户用全新方式进行交流和表达自我。3、创建应景的 Genmoji，用户现可创建原创 Genmoji 来表达自我。4、添加照片等新功能，查找照片更加方便，添加会议功能等；5、Siri迈进新时代，Apple Intelligence与Siri结合更加紧密，Siri具备更深层次的语言理解能力。28资料来源：苹果官网，华西证券研究所Apple Pencil 工具盘中的

56、 Image Wand 工具示意图文字与 Siri 会话，在文本和语音之间任意切换Image Playground示意图04软硬件全面自主可控，华为领衔演绎国产生态崛起294.1 硬件侧：华为海思是国产芯片之光海思是全球领先的Fabless半导体与器件设计公司。公司前身为华为集成电路设计中心，1991年启动集成电路设计及研发业务，为汇聚行业人才、发挥产业集成优势，2004年华为将海思注册全资子公司，提供海思芯片对外销售及服务。海思产品覆盖智慧视觉、智慧IoT、智慧媒体、智慧出行、显示交互、手机终端、数据中心及光收发器等多个领域。产品服务辐射全球，持续研发专利丰厚。海思在中国、新加坡、韩国、日本

57、、欧洲等地设有12个办事处和研发中心，产品和服务遍布全球100多个国家和地区。海思有着20余年的技术积累，目前拥有200+自主知识产权的芯片，8,000+专利。30海思产品服务九大领域使能万物互联的智能终端资料来源：海思官网，华西证券研究所4.1.1 端侧手机：从K3V1到麒麟9000，华为手机重回巅峰31资料来源：华为麒麟官方公众号，C114网，华西证券研究所麒麟芯片发展历程华为2024年Q1销量重回中国大陆首位麒麟系列是华为在手机上搭载的CPU处理器芯片。2020年，麒麟系列更新到麒麟9000。麒麟9000是业界最高集成度5nm 5G SoC，采用全球顶级5nm工艺制程，集成153亿个晶体

58、管的手机芯片。麒麟9000更快、更高、更强：刷新5G速度，麒麟9000通过支持5G SA双载波聚合，使其在Sub-6G下行理论峰值速率达4.6Gbps，上行理论峰值速率达2.5Gbps，带来更快的5G体验。AI+AR，AI方面，麒麟9000解锁更多AI功能，例如让AI实时处理从照片走向视频；AR方面，基于SLAM和实时语义理解，以及专属的AR加速器硬化模块。华为手机重回巅峰：根据C114消息，2024年第一季度，中国大陆智能手机市场时隔两年首次回暖，出货量与去年同期持平，达6770万台。华为重夺中国大陆市场第一，凭借Mate及nova系列热烈的市场反响，出货量达1170万台，市场份额达17%，

59、此外，根据搜狐消息，华为Mate70或将成为首款搭载纯血鸿蒙系统的手机。4.1.2 端侧PC：纯血PC静待花开32资料来源：自主可控新鲜事，快科技，华西证券研究所第一二次信创国测名单第二期国测结果公开，华为6款CPU进入名单：其中在第一期结果华为共4款CPU进入，分别是鲲鹏920、麒麟9006C、麒麟990、盘古M900，第二期新进入CPU分别为麒麟9000C、鲲鹏920 V200。华为PC CPU性能接近苹果M3，GPU性能接近苹果M2：根据快科技消息，华为PC处理器将采用自主的泰山V130 CPU架构，基于指令集，最多八核心，包括四个高性能大核、四个高能效小核。目前的麒麟9000系列架构是

60、泰山V120。GPU方面升级为马良920，而且是10核心，而目前的麒麟9000系列是4核心的马良910。内存容量最高支持32GB，估计是128-bit的位宽，而类型可能是LPDDR5、LPDDR5X、DDR5。存储则最高支持2TB。看起来，CPU性能在多核心方面可以非常接近苹果M3，单核心不详，GPU性能则能接近苹果M2。发布时间，预测是9月份，可能会分为Pro、Max等不同级别的版本。4.1.2 端侧PC：华为AI PC已应用盘古大模型33资料来源：芯语，华西证券研究所华为AIPC功能示意图华为MateBook X Pro在华为鸿蒙生态春季沟通会上正式登场，首次支持华为盘古大模型。据介绍，华

61、为MateBook X Pro具有3大AI优势，包括大模型优势、端云协同优势、全场景优势。华为MateBook X Pro具有3大AI优势，包括大模型优势、端云协同优势、全场景优势。华为MateBook X Pro首次支持AI概要能力，它基于华为盘古L0基础大模型，在超千亿参数的中文预训练大模型基础上，融入大量场景数据，对模型进行精调，最终炼成的一个为用户提供概要能力的场景模型。盘古模型功能强大：全新AI概要功能能够快速、准确地从音频内容中提取关键信息，可为客户提供三大简短的核心内容，一句话概要、关键词、全文摘要（200字左右，视具体全文长度而有所变化），从而帮助客户更高效地掌握会议要点。AI

62、概要不仅可以边录音边实时转写，最后进行总结，还支持本地的音频、视频文件的总结，当用户没有网络或者忘记带电脑，可以先用手机或者相机进行录音或者录像，回去再上传到电脑上进行AI概要的信息提取。4.1.3 云端算力：华为海思昇腾AI芯片，构建算力的第二极全栈全场景AI芯片，构建智能计算架构核心昇腾 910 和昇腾 310 两款AI 芯片均使用华为的达芬奇架构，每个 AI 核心可以在 1 个周期内完成 4096 次 MAC 计算，集成了张量、矢量、标量等多种运算单元，支持多种混合精度计算，支持训练及推理两种场景的数据精度运算。基于昇腾系列AI处理器和基础软件构建Atlas人工智能计算解决方案，包括At

63、las系列模块、板卡、小站、服务器、集群等丰富的产品形态，打造面向“端、边、云”的全场景AI基础设施方案，覆盖深度学习领域推理和训练全流程，可以满足不同场景的大模型计算需求。华为的全栈全场景AI解决方案日臻完善。主要基于昇腾系列处理器和基础软件构建的全栈AI计算基础设施、行业应用及服务，包括昇腾系列芯片、Atlas系列硬件、芯片使能、CANN（异构计算架构）、AI计算框架、应用使能等。算力是衡量单卡性能的直观指标：参数方面，我们认为昇腾910芯片单卡算力已经可以与英伟达A100相媲美。34昇腾全栈 AI 软硬件平台，构筑智能世界的基石英伟达与华为参数比对架构架构算力算力最大功耗最大功耗昇腾31

64、0达芬奇架构3D Cube技术16 TOPSINT88 TOPSFP168W昇腾910达芬奇架构3D Cube技术640 TOPSINT8320 TFLOPSFP16310W英伟达A100NVIDIA 安培 GPU 架构624 TOPSINT8312 TFLOPSFP16300W英伟达H100NVIDIA Hoppe GPU 架构3958 TOPSINT81979 TFLOPSFP16700W 4.1.3 云端算力：华为昇腾芯片，统一达芬奇架构助力AI计算引擎昇腾AI芯片的计算核心主要由AI Core构成:AI Core采用了达芬奇架构，它包括了三种基础计算资源，矩阵计算单元、向量计算单元和标

65、量计算单元。这三种计算单元分别对应了张量、向量和标量三种常见的计算模式，在实际的计算过程中各司其职，形成了三条独立的执行流水线，在系统软件的统一调度下互相配合达到优化的计算效率,AI Core中的矩阵计算单元目前可以支持INT8、INT4和FP16的计算；向量计算单元目前可以支持FP16和FP32的计算。我们认为本质上讲昇腾芯片属于专为AI而生的特定域架构芯片。存储转换单元(MTE)是达芬奇架构的特色：比如通用GPU要通过矩阵计算来实现卷积，首先要通过Im2Col的方法把输入的网络和特征数据重新以一定的格式排列起来，通用GPU通过软件实现，效率较为低下，达芬奇架构采用了一个专用的存储转换单元来

66、完成此过程，可以在较短的时间之内完成整个转置过程，定制化电路模块的设计可以提升AI Core的执行效率，从而能够实现不间断的卷积计算。35华为昇腾AI芯片架构图基础计算资源，矩阵计算单元、向量计算单元示意图 4.1.3 云端算力：华为HCCS互联技术，实现卡间高速互联HCCS是华为自研的高速互联接口，实现高效卡间连接。HCCS是华为自研的高速互联接口，片内RoCE可用于节点间直接互联。HCCS是HCCL的硬件形态，HCCL提供了深度学习训练场景中服务器间高性能集合通信的功能。每台设备具备两个HCCS环共8颗处理器（A0A7）。每个HCCS存在4颗处理器，同一HCCS内处理器可做数据交换，不同H

67、CCS内处理器不能通信。单个AI处理器提供3条HCCS互连链路，提供最大90GB/s带宽能力。NPU载板由4个AI处理器组成，3条HCCS组成一个4P Full mesh互联，4个AI处理器间互联带宽达到30GB/s，双向60GB/s。我们认为AI大算力集群背景下，单张AI芯片无法完成训练任务，需要联合多张AI芯片，数据传输速率同样重要，华为HCCS互联技术可以实现卡间高速互联，相较于PCIE模式有显著优势，能有效帮助服务器集群协同训练，从而加速AI的训练。36 HCCS互联拓扑图（K0-K3为鲲鹏处理器）昇腾AI集群组网要求4.1.3 云端算力：华为910C 敬请期待，Atlas打开国产算力

68、集群想象空间华为910C敬请期待：根据集成电路IC消息，华为旗下昇腾910C芯片正处于紧张的测试阶段。华为昇腾910C芯片预计在今年第四季度推出样机，而到2025年第一季度将实现量产。华为昇腾910C芯片作为新一代算力核心，其价值量接近前款昇腾910B芯片的1.5倍。在搭载昇腾910C芯片的服务器中，单台服务器的整体价值将得到大幅提升。此外，我们判断，在国产化大背景下，昇腾910C相关供应链有望快速切入国产化，供应链国产化为大势所趋。华为发布全新架构AI集群，支持超万亿参数大模型训练：在华为全联接大会2023上，华为推出全新架构的昇腾AI计算集群Atlas 900 SuperCluster。新

69、集群采用了全新的华为星河AI智算交换机CloudEngine XH16800，借助其高密的800GE端口能力，两层交换网络即可实现2250节点（等效于1.8万张卡）超大规模无收敛集群组网。其优势显著，新集群同时使用了创新的超节点架构，大大提升了大模型训练能力实现算力的资源统一调度，采用液冷设计。37 华为Atlas 900 SuperCluster示意图华为Atlas 900 SuperCluster大模型连续训练时长4.2 鸿蒙OS国产操作系统先进龙头，拥抱万物互联鸿蒙系统(HarmonyOS、鸿蒙OS)是华为推出的一款面向万物互联的全场景分布式操作系统：1+8+N战略，即1（手机）8（车机

70、、音箱、耳机、手表/手环、平板、大屏、PC、AR/VR）N（泛IOT设备）战略，开创了全新局面，OpenHarmony是其对应的开源项目。华为公司在2019年8月正式发布HarmonyOS，实行开源HarmonyOS通过创造一个超级虚拟终端互联的世界，将人、设备、场景有机地联系在一起，将消费者在全场景生活中接触的多种智能终端，实现极速发现、极速连接、硬件互助、资源共享，用合适的设备提供场景体验。根据techweb和博云，2024Q1在中国智能手机市场，鸿蒙操作系统的份额达到17%，开发者超过220万人，鸿蒙生态已经与iOS、安卓形成了“三分天下”的格局，成为当下的风口。38 鸿蒙发展历程4.2

71、.1鸿蒙操作系统市占率不断提升，HarmonyOS NEXT值得期待鸿蒙市场份额快速攀升：CounterPoint的报告显示，2024年第一季度，华为鸿蒙系统在全球市场的份额从2%增长到4%，而在中国市场的份额则爆增至17%。同期，苹果iOS在中国智能手机操作系统市场的份额则下降了四个百分点，降至16%，这也就标志着鸿蒙系统在中国市场的市占率正式超越了iOS。纯血鸿蒙值得期待：根据TechWeb，备受瞩目的华为开发者大会2024（HDC 2024）将于本月21日至23日在东莞松山湖召开。此次大会不仅是全球开发者与科技创新者的年度盛会，更将带来HarmonyOS NEXT鸿蒙星河版的正式发布，并

72、进入Beta测试阶段，引领“纯血鸿蒙”向正式商用迈出关键一步。鸿蒙+AI打开全新国产化生态：HarmonyOS NEXT作为华为操作系统家族的最新力作，被寄予厚望。该版本不仅在系统性能、安全性和用户体验上进行了全面升级，还深度融合了华为云盘古大模型5.0，为开发者提供了更为强大的AI开发能力和丰富的应用场景。HarmonyOS NEXT的发布预示着华为将进一步巩固其在物联网生态建设中的领先地位，推动构建全场景智慧化生活的新篇章。39 中国手机操作系统市场份额HarmonyOS NEXT即将发布4.2.2 鸿蒙Next版本正式发布，AI深度赋能操作系统星河璀璨，加入鸿蒙正当时：在6月21日，在主

73、题演讲中，华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东分享了鸿蒙生态的最新进展。HarmonyOS操作系统从2019年8月9日正式发布，历时1778天，历经4代，鸿蒙生态设备数量已超过9亿，已有254万 HarmonyOS开发者投入到鸿蒙世界的开发中来，鸿蒙学堂学习人次435万，开发者服务调用次数827亿次/月。鸿蒙原生应用已进入全面冲刺阶段，5000多个常用应用已全部启动开发，其中超过1500家已完成上架。Harmony Intelligence正式发布：HarmonyOS NEXT首次将AI能力融入系统，赋能生态。小艺升级为小艺智能体，可执行更复杂的操作，并在端云大模型协

74、同和意图框架的加持下获得更好的场景感知、意图识别和用户理解能力，能够帮助用户更好地获取所需个性化服务。HarmonyOS NEXT也为鸿蒙生态带来了强大的AI能力，围绕图像智能、通话智能、文档智能、跨应用协同等，华为全面构筑了开放给应用的AI能力，和开发者共同打造生态级的鸿蒙原生智能。40 鸿蒙生态，星河璀璨示意图4.2.3 AI+OS时代已来临，全面打开想象空间原生智能OS已来临:下一代原生智能 OS 架构，统一的 AI 子系统底座使得 OS 各个组件内部和彼此之间都能够灵活高效地使用 AI 技术；此外，内置于 OS 内的系统级 AI Agent 出现，使得原生智能 OS 不仅仅是一个操作系

75、统，更是能够深度理解用户、自主闭环用户任务的、智慧的、常驻的超级智能体。多模态带来全新的人机交互体验：生成式 AI 为终端设备带来更自然、更全面、更多维的人机交互方式，打破了传统单一独立 I/O 通道输入方式的限制，极大地丰富了人机交互的维度。多模态理解大模型可以让用户使用文本、图像、声音、视频、传感等多种数据类型与终端进行交流，大大拓展了用户同终端的交互形式。AI+鸿蒙，拥抱万物互联的AI时代已经来临：AI深度融合进入操作系统，随着AI+物联的设备数量增加，可以实现AI的有限感知到全面感知，从单场景应用到多场景多设备服务流转，从而实现以场景为中心，AI感知用户场景、识别用户意图、多个设备联动

76、任务的万物互联。41 原生OS智能架构已来临华为原生智能OS示意图盘古5.0大模型正式发布，重塑千行万业：6 月 21 日，华为开发者大会 2024（HDC 2024）正式揭幕，华为常务董事、华为云 CEO 张平安重磅发布盘古大模型 5.0，在全系列、多模态、强思维三个方面全新升级。在过去的一年中，盘古大模型持续深耕行业，已在30 多个行业、400 多个场景中落地，在政务、金融、制造、等领域发挥着巨大价值。全系列：盘古大模型 5.0 包含不同参数规格的模型，以适配不同的业务场景。十亿级参数的 Pangu E 系列可支撑手机、PC 等端侧的智能应用；百亿级参数的 Pangu P 系列，适用于低时

77、延、低成本的推理场景；千亿级参数的 Pangu U 系列适用于处理复杂任务，可以成为企业通用大模型的底座；万亿级参数的 Pangu S 系列超级大模型是处理跨领域多任务的超级大模型够在全场景应用 AI 技术。多模态：盘古大模型 5.0 能够更好更精准地理解物理世界，包括文本、图片、视频、雷达、红外、遥感等更多模态。在生成方面，盘古5.0，可以生成符合物理世界规律的多模态内容，让创新随心所欲。强思维：复杂逻辑推理是大模型成为行业助手的关键。盘古大模型 5.0 将思维链技术与策略搜索技术深度结合，极大提升了数学能力、复杂任务规划能力。4.2.4 盘古5.0大模型正式发布，重塑千行万业42 盘古大

78、模型5.0示意图4.3 端侧AI革命进行时，盘古+鸿蒙星河+麒麟+昇腾+鲲鹏打造最强生态打响关键自主可控保卫战，自主可控势在必行：手机等终端，苹果拥有其自己的A系列手机芯片和M系列的PC芯片、操作系统拥有IOS等系统、云端可配备英伟达、AMD等AI算卡、大模型侧拥有Apple Intelligence 其中集成了ChatGPT。AI PC端，海外拥有Intel、AMD、高通等端侧AI PC芯片，操作系统为Winodws，目前融入了Copilot等AI功能。自2018年来，美国通过多种制裁手段，严重限制我国高科技领域发展，因此对于关键高科技领域自主可控势在必行。盘古+鸿蒙星河+麒麟+昇腾+鲲鹏打

79、造国产最强生态：我们判断AI端侧爆发为产业趋势，AI应用离落地更进一步，因此国产领域中华为拥有最完整的生态，软件端，盘古可赋能千行百业，鸿蒙可实现万物互联，例如，智慧屏、穿戴设备、车机、音箱、手机等，硬件端，端侧，麒麟已重回巅峰，鲲鹏+昇腾有望构筑全球算力体系的第二极，因此我们判断在终端爆发元年，华为有望凭借盘古+鸿蒙星河+麒麟+昇腾+鲲鹏最强生态领衔演绎国产软硬件生态崛起。43 操作系统将广泛应用于万物互联领域华为1+8+N战略应用程序框架基础服务内核鸿蒙：微内核方舟编译器多终端开发IDE05投资建议:梳理AIGC相关受益厂商444.1 投资建议:梳理AIGC的受益厂商端侧AI爆发带动换机潮

80、，AI的Iphone时刻已到来，AI需求有望带动换机潮，相关终端和芯片厂商直接受益，短期来看，端侧AI对硬件规格革新要求较小，长期来看，端侧大模型的爆发有望呈现指数级别增长，相关零部件有望升级。打响关键自主可控保卫战，自主可控势在必行，盘古+鸿蒙星河+麒麟+昇腾+鲲鹏有望打造最强生态，受益标的为：零部件：飞荣达、芯海科技、泰嘉股份等；鸿蒙：软通动力、九联科技、润和软件、芯海科技、智微智能等；国产终端厂商：华勤技术、软通动力、神州数码等；应用：金山办公、万兴科技、润达医疗等；技术开发：中科创达等。苹果产业链及相关零部件厂商、全球终端厂商等。45 3.1 投资建议:梳理AIGC的受益厂商46 AI

81、GC的A股受益标的公司名称公司名称股票代码股票代码收盘价收盘价市值市值(亿元亿元)EPS(EPS(元元)PE(PE(倍倍)2024/6/262024/6/262024/6/262024/6/2620222022202320232024E2024E20222022202320232024E2024E泰嘉股份*002843.SZ15.39 38.92 0.620.600.9524.8 25.7 16.3 飞荣达*300602.SZ14.32 83.06 0.190.190.5875.4 75.4 24.8 软通动力*301236.SZ36.87 351.35 1.590.560.7423.2 65

82、.8 49.9 九联科技*688609.SH9.11 45.55 0.12-0.400.2775.0-33.8 润和软件300339.SZ21.43 170.67 0.130.210.38164.8 102.0 56.4 芯海科技*688595.SH30.69 43.71 0.02-1.01-0.311534.5-智微智能*001339.SZ28.50 71.18 0.580.130.4849.1 219.2 59.5 金山办公688111.SH249.90 1154.68 2.422.863.49103.3 87.4 71.6 万兴科技*300624.SZ56.82 109.85 0.310

83、.640.64183.3 88.8 88.7 润达医疗*603108.SH15.39 92.16 0.720.470.6321.4 32.7 24.6 中科创达*300496.SZ46.49 213.48 1.771.021.4326.2 45.7 32.4*来自WIND一致预期04风险提示47风险提示核心技术水平升级不及预期的风险:AIGC相关产业技术壁垒较高，公司核心技术难以突破，进程低于预期，影响整体进度。AI伦理风险:AI可能会生产违反道德、常规、法律等内容。政策推进不及预期的风险:受到宏观经济、财政、疫情影响，政策推进节奏不及预期。中美贸易摩擦升级的风险:供应链存在部分海外提供商，容

84、易受到美国制裁，导致产品研发不及预期。48免责声明49分析师分析师与研究助理简介与研究助理简介刘泽晶（首席分析师）2014-2015年新财富计算机行业团队第三、第五名，水晶球第三名，10年证券从业经验。孟令儒奇(分析师)悉尼大学量化金融学&大数据分析硕士，覆盖AI算力、信创、网络安全、军工信息化等赛道，2022年加入华西证券。分析分析师承诺师承诺作者具有中国证券业协会授予的证券投资咨询执业资格或相当的专业胜任能力，保证报告所采用的数据均来自合规渠道，分析逻辑基于作者的职业理解，通过合理判断并得出结论，力求客观、公正，结论不受任何第三方的授意、影响，特此声明。评级说明评级说明公司评级标准公司评级

85、标准投资评级投资评级说明说明以报告发布日后的6个月内公司股价相对上证指数的涨跌幅为基准。买入分析师预测在此期间股价相对强于上证指数达到或超过15%增持分析师预测在此期间股价相对强于上证指数在5%15%之间中性分析师预测在此期间股价相对上证指数在-5%5%之间减持分析师预测在此期间股价相对弱于上证指数5%15%之间卖出分析师预测在此期间股价相对弱于上证指数达到或超过15%行业评级标准行业评级标准以报告发布日后的6个月内行业指数的涨跌幅为基准。推荐分析师预测在此期间行业指数相对强于上证指数达到或超过10%中性分析师预测在此期间行业指数相对上证指数在-10%10%之间回避分析师预测在此期间行业指数相

86、对弱于上证指数达到或超过10%华西证券研究所：华西证券研究所：地址：北京市西城区太平桥大街丰汇园11号丰汇时代大厦南座5层免责声明50华西证券股份有限公司（以下简称“本公司”）具备证券投资咨询业务资格。本公司不会因接收人收到或者经由其他渠道转发收到本报告而直接视其为本公司客户。本报告基于本公司研究所及其研究人员认为的已经公开的资料或者研究人员的实地调研资料，但本公司对该等信息的准确性、完整性或可靠性不作任何保证。本报告所载资料、意见以及推测仅于本报告发布当日的判断，且这种判断受到研究方法、研究依据等多方面的制约。在不同时期，本公司可发出与本报告所载资料、意见及预测不一致的报告。本公司不保证本报

87、告所含信息始终保持在最新状态。同时，本公司对本报告所含信息可在不发出通知的情形下做出修改，投资者需自行关注相应更新或修改。在任何情况下，本报告仅提供给签约客户参考使用，任何信息或所表述的意见绝不构成对任何人的投资建议。市场有风险，投资需谨慎。投资者不应将本报告视为做出投资决策的惟一参考因素，亦不应认为本报告可以取代自己的判断。在任何情况下，本报告均未考虑到个别客户的特殊投资目标、财务状况或需求，不能作为客户进行客户买卖、认购证券或者其他金融工具的保证或邀请。在任何情况下，本公司、本公司员工或者其他关联方均不承诺投资者一定获利，不与投资者分享投资收益，也不对任何人因使用本报告而导致的任何可能损失

88、负有任何责任。投资者因使用本公司研究报告做出的任何投资决策均是独立行为，与本公司、本公司员工及其他关联方无关。本公司建立起信息隔离墙制度、跨墙制度来规范管理跨部门、跨关联机构之间的信息流动。务请投资者注意，在法律许可的前提下，本公司及其所属关联机构可能会持有报告中提到的公司所发行的证券或期权并进行证券或期权交易，也可能为这些公司提供或者争取提供投资银行、财务顾问或者金融产品等相关服务。在法律许可的前提下，本公司的董事、高级职员或员工可能担任本报告所提到的公司的董事。所有报告版权均归本公司所有。未经本公司事先书面授权，任何机构或个人不得以任何形式复制、转发或公开传播本报告的全部或部分内容，如需引用、刊发或转载本报告，需注明出处为华西证券研究所，且不得对本报告进行任何有悖原意的引用、删节和修改。

友情提示

1、下载报告失败解决办法
2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。
3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

本文（AIGC行业深度报告（15）：端侧AI爆发元年软硬架构全面升级-240626（50页）.pdf）为本站（Seven seconds）主动上传，三个皮匠报告文库仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知三个皮匠报告文库（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。

上海品茶

AIGC行业深度报告（15）：端侧AI爆发元年软硬架构全面升级-240626（50页）.pdf

AIGC行业深度报告（15）：端侧AI爆发元年软硬架构全面升级-240626（50页）.pdf

AIGC行业深度报告（15）：端侧AI爆发元年软硬架构全面升级-240626（50页）.pdf