上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

计算机行业人工智能系列报告(一):终端智能人工智能AI的新革命-240305(21页).pdf

编号:156149 PDF  RTF  21页 2.09MB 下载积分:VIP专享
下载报告请您先登录!

计算机行业人工智能系列报告(一):终端智能人工智能AI的新革命-240305(21页).pdf

1、 1|请务必仔细阅读报告尾部的投资评级说明和声明 行业专题报告行业专题报告|计算机计算机 终端智能,人工智能 AI 的新革命 人工智能系列报告(一)核心结论核心结论 行业评级行业评级 超配超配 前次评级 超配 评级变动 维持 近一年近一年行业行业走势走势 相对表现相对表现 1 个月个月 3 个月个月 12 个月个月 计算机 35.45-8.84-17.94 沪深 300 11.41 5.05-13.68 分析师分析师 郑宏达郑宏达 S0800524020001 相关研究相关研究 计算机:AI 新硬件的崛起计算机行业 2024年 3 月研究观点 2024-03-03 计算

2、机:从 OpenAI 论文看 AI 算力的重要性AIGC 行业跟踪 2024-02-27 计算机:继续围绕人工智能投资主线计算机行业周观点第 2 期 2024-02-25 基于成本、能耗、可靠性和时延、隐私、个性化服务等考虑,端云基于成本、能耗、可靠性和时延、隐私、个性化服务等考虑,端云混混合的合的 AI才是才是 AI 的未来,高通认为终端的未来,高通认为终端 AI 能力是赋能混合能力是赋能混合 AI 并让生成式并让生成式 AI 实现全实现全球规模化扩展的关键。球规模化扩展的关键。百亿参数开源百亿参数开源 MoE 大模型大模型 Mixtral 8x7B 再掀热潮,性能超再掀热潮,性能超 LLa

3、MA2-70B,对,对标标 GPT-3.5。MoE(混合专家模型)通过将任务分配给对应的一组专家模型来提高模型的性能和效率。Mixtral 8x7B 的专家数量为 8 个,总参数量为 470 亿,但在推理过程中仅调用两个专家即只调用 130 亿参数。我们认为我们认为 MoE 或为现阶段大模型平衡成本、延迟以及性能的最优选择,叠加或为现阶段大模型平衡成本、延迟以及性能的最优选择,叠加开源模型本身高灵活性、安全性和高性价比特点,开源模型本身高灵活性、安全性和高性价比特点,Mistral AI 的开源的开源 MoE 轻量轻量化模型可能是未来最适合部署于终端的模型。化模型可能是未来最适合部署于终端的模

4、型。目前,高通、联发科、英特尔、目前,高通、联发科、英特尔、AMD 等龙头芯片厂商都推出了终端等龙头芯片厂商都推出了终端 AI 芯片芯片,能跑十亿甚至百亿量级大模型。后能跑十亿甚至百亿量级大模型。后续类续类 Mixtral 8x7B 的的 SMoE 模型在高性能基础上继续压缩的话,很大几率可以模型在高性能基础上继续压缩的话,很大几率可以装进终端设备实现本地运行。装进终端设备实现本地运行。SMoE 轻量模型大幅降低了训练的门槛和成本,且由于在推理时只激活少部分参数,保持较高性能的同时能适应不同的计算环境,包括计算能力有限的终端,降低推理成本且将催生更多大模型相关应用。2024 年有望成为终端智能

5、元年,年有望成为终端智能元年,看好拥有终端资源、深耕场景、掌握行业看好拥有终端资源、深耕场景、掌握行业knowhow、积累了海量数据的、积累了海量数据的 B 端端和和 C 端端公司。公司。1)未来每台终端都将是 AI终端,包括 AI PC、AI 手机、AI MR 等,这将带来全新的用户体验。2)AI PC有望成为“AI+”终端中最先爆发的。英特尔预计全球今年将交付 4000 万台 AI PC,明年将交付 6000 万台,预估 2025 年底 AI PC 在全球 PC 市场中占比将超过 20%;微软 AI PC 预计于今年亮相。3)随着大模型逐步发展,尤其是多模态能力增强,更广泛的 AIoT 设

6、备也迎来了更新换代的重要机遇。3)B 端私有化部署也是 AI 应用的重要方向,关注边缘侧 AI。4)鸿蒙:提供顶级流畅连接体验,大模型有望赋能奔赴万物智联下一站。人形机器人是大模型应用的重要硬件载体,也是终端智能发展的核心方向。人形机器人是大模型应用的重要硬件载体,也是终端智能发展的核心方向。1)人形机器人是目前具身智能最好的形态,因为它们有着与人相似的外观设计,能更好地适应周围的环境和基础设施。2)端云混合的“大脑”让机器人既能处理复杂和高强度的计算任务,又能实时进行信息处理和分析。建议关注建议关注:1)算力基础)算力基础:中科曙光、神州数码、浪潮信息、高新发展;2)AI PC:华勤技术、龙

7、旗科技、联想集团、星环科技-U、海光信息;3)终端鸿蒙:)终端鸿蒙:润和软件、九联科技、东方中科、软通动力、中国软件国际、拓维信息、初灵信息;4)拥有丰富)拥有丰富的的终端资源:终端资源:海康威视、大华股份、科大讯飞、萤石网络、漫步者;5)B 端应用:端应用:北路智控、智洋创新、云涌科技、商汤-W、云从科技-UW。风险提示:AIGC 技术突破不及预期、终端智能需求不及预期、宏观经济增长不及预期、国际环境变化。-39%-31%-23%-15%-7%1%9%17%-072023-11计算机沪深300证券研究报告证券研究报告 2024 年 03 月 05 日 行业专题报告|计算

8、机 西部证券西部证券 2024 年年 03 月月 05 日日 2|请务必仔细阅读报告尾部的投资评级说明和声明 索引 内容目录 一、端云混合的 AI 是 AI 的未来.4 二、高性能小模型比肩 GPT-3.5,终端智能前景可期.4 2.1 关注 MoELLM 头部玩家们正在实践的重要技术路线.4 2.2 Mixtral 8x7B:低成本 SMoE 小模型+开源,更务实的 GenAI 商业化路线.6 2.3 端侧 AI 芯片已能支持百亿参数模型本地运行,看好轻量 SMoE 模型终端部署前景.8 2.3.1 高通:端侧 AI 芯片领导者,提供软硬件全栈优化.8 2.3.2 全球芯片巨头:密集发布新品

9、,抢抓终端侧 AI 机遇.11 三、看好拥有终端资源的 B 端和 C 端公司.13 3.1 各类“AI+”终端产品陆续发布,新周期大幕拉开.13 3.2 AI PC 有望成为“AI+”终端中最先爆发的.14 3.3 大模型有望驱动 AIoT 硬件升级,关注深耕场景、具有终端资源的公司.15 3.4 私有化部署的 B 端场景也是 AI 应用的重要方向,关注边缘侧 AI.16 3.5 鸿蒙:提供顶级的流畅连接体验,大模型有望赋能奔赴万物智联下一站.16 四、人形机器人:大模型应用的重要硬件载体,终端智能发展的核心方向.17 4.1 具备思维链及零样本学习特性,大模型开启机器人智能化新篇章.18 4

10、.2 端云融合 AI 为机器人打造智能高效“大脑”.19 4.3 产业催化不断,人形机器人有望迎来奇点时刻.19 五、建议关注.20 六、风险提示.20 图表目录 图 1:AI 处理的重心正在向边缘转移.4 图 2:MoE 架构示意图.5 图 3:MoE 两个关键部分.5 图 4:Gemini 1.5 领先的上下文窗口长度.6 图 5:Mistral 8x7B 与 LLama 性能对比.6 图 6:Mistral 8x7B 性能可对标 GPT-3.5.7 图 7:LMSys 排行榜上 Mixtral 8x7BInstruct 得分较高.7 图 8:Mistral 8x7B 与 Llama“规模

11、-效率”对比图.8 图 9:Hexagon 处理器的迭代更新过程.9 图 10:高通 AI 软件栈.9 图 11:高通 AI 研究采用整体 AI 模型效率研究方法.9 图 12:高通全球终端芯片布局.10 图 13:高通骁龙 X Elite 概览.10 2VgYkZqYhUaXtQ9PcM8OoMmMsQnRjMrRoNfQoOsN9PpOqQxNsRmMNZsRtQ 行业专题报告|计算机 西部证券西部证券 2024 年年 03 月月 05 日日 3|请务必仔细阅读报告尾部的投资评级说明和声明 图 14:高通骁龙 8 Gen3 概览.10 图 15:高通骁龙 XR2 Gen2 概览.11 图

12、16:高通骁龙 AR1 Gen1 概览.11 图 17:高通骁龙 XR2+Gen2 概览.11 图 18:第一代高通 S7 和 S7 Pro 音频平台概览.11 图 19:天玑 9300 端侧 AI 性能概览.12 图 20:锐龙 8040G 的 CPU+NPU+GPU 架构.12 图 21:锐龙 8040G 在生成式 AI 方面性能提升.12 图 22:Meteor Lake 在 AI 方面性能优异.12 图 23:Meteor Lake 支持 Llama-7B 端侧无网运行.12 图 24:英特尔宣布启动“AI PC 加速计划”.13 图 25:PC 优势与大模型本地部署时的需求天然匹配.

13、14 图 26:AI 技术在安防领域的变革从感知智能到决策智能.15 图 27:认知智能的两个研究方向及对应的安防应用.15 图 28:“1+8+N”全场景战略.16 图 29:鸿蒙万物智联愿景.17 图 30:Figure 01 制作咖啡.18 图 31:特斯拉 Optimus Gen 2 叠衣服.18 图 32:结合思维链推理,RT-2 驱动机械臂执行“在现场找能钉钉子的物体”的任务.18 图 33:VoxPoser 系统驱动下机械臂可以完成没见过的任务,可操作的物体也是开放的.19 图 34:智元“具身智脑”EI-Brain 框架.19 行业专题报告|计算机 西部证券西部证券 2024

14、年年 03 月月 05 日日 4|请务必仔细阅读报告尾部的投资评级说明和声明 一、一、端云混合的端云混合的AI是是AI的未来的未来 基于成本、能耗、可靠性和时延、隐私和安全、个性化服务等考虑,端云融合的基于成本、能耗、可靠性和时延、隐私和安全、个性化服务等考虑,端云融合的 AI 才是才是AI 的未来,高通认为终端侧的未来,高通认为终端侧 AI 能力是赋能混合能力是赋能混合 AI 并让生成式并让生成式 AI 实现全球规模化扩展实现全球规模化扩展的关键的关键。高通曾发布白皮书称混合 AI 是 AI 的未来。只有云和终端都能承担 AI 处理的任务,才能实现 AI 的规模化扩展并发挥其最大潜能正如传统

15、计算从大型主机和瘦客户端演变为当前云端和终端相结合的模式。混合 AI 指终端和云协同,根据不同场景和需求分配 AI 计算的工作负载,以提供更好的体验并高效利用资源。在一些场景下,AI 处理将以终端为中心,必要时向云端分求助;而在以云为中心的场景下,终端将根据自身能力,在可能的情况下从云端分担部分 AI 工作负载。图 1:AI 处理的重心正在向边缘转移 资料来源:高通混合 AI 是 AI 的未来白皮书、西部证券研发中心 二、二、高性能小模型高性能小模型比肩比肩GPT-3.5,终端智能前景可期,终端智能前景可期 百亿参数开源百亿参数开源 MoE 大模型大模型 Mixtral 8x7B 再掀热潮,再

16、掀热潮,性能超性能超 LLaMA2-70B,对标,对标 GPT-3.5。Mixtral 8x7B 每个每个 token 可以访问可以访问 470 亿亿参数,但推理过程中仅使用参数,但推理过程中仅使用 130 亿亿参数,参数,低成本低成本优势显著优势显著。我们认为。我们认为 MoE 或为现阶段大模型平衡成本、延迟以及性能的最优选择,叠加或为现阶段大模型平衡成本、延迟以及性能的最优选择,叠加开源模型本身高灵活性、安全性和高性价比特点,开源模型本身高灵活性、安全性和高性价比特点,Mistral AI 的开源的开源 MoE 轻量化轻量化模型可模型可能是未来最适合部署于终端的模型能是未来最适合部署于终端

17、的模型。2.1 关注关注MoELLM头部玩家们正在头部玩家们正在实践实践的重要技术路线的重要技术路线 MoE(Mixture of Experts,混合专家模型)是一种创新的深度学习架构,旨在通过,混合专家模型)是一种创新的深度学习架构,旨在通过将将任任务分配给务分配给对应对应一组专家模型来提高模型的性能和效率。一组专家模型来提高模型的性能和效率。MoE 架构最早由 1991 年的论文 Adaptive Mixture of Local Experts提出,其核心思想在于利用多个小型的专家网络,每个网络专注于处理输入数据的不同部分或特征;然后通过一个“门控”机制来被选择性地激活,该机制基于输入

18、数据的特性来决定哪些专家网络应该参与到当前任务的预测中。行业专题报告|计算机 西部证券西部证券 2024 年年 03 月月 05 日日 5|请务必仔细阅读报告尾部的投资评级说明和声明 图 2:MoE 架构示意图 资料来源:Mixtral of Experts、西部证券研发中心 MoE 基于基于 Transformer 架构,主要由稀疏架构,主要由稀疏 MoE 层和层和门控网络这门控网络这两个关键部分组成两个关键部分组成。1)稀疏 MoE 层:取代传统 transformer 模型中的前馈网络层(FFN),MoE 层中每个专家本身也是一个独立的神经网络;2)门控网络或路由:决定输入的 token

19、 激活哪些专家。例如在下图中,“More”被发送到第二个专家,而“Parameters”被发送到第一个专家,在某些情况下单个 token 甚至可能被发送至多位专家。最后,所有专家的输出会被聚合(aggregated)起来,形成最终的模型输出。图 3:MoE 两个关键部分 资料来源:Switch Transformers:Scaling to Trillion Parameter Models with Simple and Efficient Sparsity、西部证券研发中心 GPT-4 或已采用或已采用 MoE 架构架构。根据 semianalysis 文章,GPT-4 参数规模是 GPT

20、-3 的 10 倍以上。GPT-3 的参数量约 1750 亿,semianalysis 推测 GPT-4 约 1.8 万亿个参数,这些参数分布在 120 个 transformer 层上。GPT-4 中有 16 个 MLP.2(Multi-Layer Perceptron,多层感知机)类型的专家,每个专家网络的参数大约为 1110 亿个,每次前向传递中会调用其中的两个专家模型;此外,还有 550 亿个 attention 共享参数。这样推理时,每生成一个 token 仅需约 2800 亿个参数和 560 TFLOP,而相比之下,如果使用稠密模型,每次生成一个 token 需要约 18000 亿

21、个参数和 3700 TFLOP。谷歌谷歌 Gemini 1.5 采用采用 MoE 架构架构,可一次性、高效处理大量信息可一次性、高效处理大量信息。2024 年 2 月 15 日,谷歌发布 Gemini 1.5,宣布将上下文窗口长度扩展到 100 万个 tokens,也就是说 Gemini 1.5可以一次性处理 1 小时的视频、11 小时的音频、超过 3 万行代码或超过 70 万字的代码库。谷歌甚至在研究中成功测试了多达 1000 万个 tokens。行业专题报告|计算机 西部证券西部证券 2024 年年 03 月月 05 日日 6|请务必仔细阅读报告尾部的投资评级说明和声明 图 4:Gemin

22、i 1.5 领先的上下文窗口长度 资料来源:机器之心公众号、西部证券研发中心 2.2 Mixtral 8x7B:低成本:低成本SMoE小小模型模型+开源开源,更务实的更务实的GenAI商业化路线商业化路线 Mistral AI横空出世打造超强横空出世打造超强轻量化轻量化模型模型Mistral 7B。Mistral AI是一家法国AI初创公司,也是目前欧洲最强的 LLM 公司之一,团队成员中 7 人来自 Facebook(4 位参与 Llama 研发),3 人来自 Hugging Face,2 人来 Deepmind。2023 年 9 月 27 日,Mistral AI 发布轻量化大模型 Mis

23、tral 7B。根据技术论文Mistral 7B,Mistral-7B 在每个基准测试中,都优于Llama2-13B,并且在代码、数学和推理方面优于 LLaMA1-34B。根据 Percy Liang 团队HELM 模型测评报告,Mistral 7B 的表现甚至超越了 Cohere-52B 的模型。开源开源 SMoE 大模型大模型 Mixtral 8x7B 再掀热潮,性能超越再掀热潮,性能超越 LLaMA2-70B。2023 年 12 月 8 日,Mistral AI 在 X 上发布了一条磁力链接,直接开源了自己最新的,基于 Mistral 7B 打造的SMoE(Sparse Mixture

24、of Experts,稀疏混合专家模型,相对 MoE 引入了稀疏性的概念,以提高模型的稀疏性和计算效率)轻量大模型 Mixtral 8x7B;2024 年 1 月 8 日,Mistral AI在 Arxiv 公开 Mixtral 8x7B 的论文Mixture of Experts。Mixtral 8x7B 的研发人员使用自己的流程全方位评估了模型性能,结论是:Mixtral 8x7B 在大多数指标测试中的表现均优于 LLaMA2-70B,尤其在代码和数学基准测试中优势明显。图 5:Mistral 8x7B 与 LLama 性能对比 资料来源:Mixtral of Experts、西部证券研发

25、中心 行业专题报告|计算机 西部证券西部证券 2024 年年 03 月月 05 日日 7|请务必仔细阅读报告尾部的投资评级说明和声明 Mistral 8x7B 比肩比肩 GPT-3.5,Mistral AI 成为开源成为开源 LLM 新领军新领军。与 semianalysis 文章中的GPT-4 对比,Mistral 8x7B 架构类似,有和 GPT-4 相同的 3.2 万上下文窗口长度,但在规模小很多:1)专家数量为 8 个;2)每个专家拥有 70 亿左右参数;3)每个每个 token 可以访可以访问问 470 亿参数,但在推理过程中仅亿参数,但在推理过程中仅调用两个专家,即只调用两个专家,

26、即只使用使用 130 亿参数亿参数。在Mixture of Experts 论文中,研究者也展示了 Mixtral 8x7B 和 GPT-3.5、LLama2-70B 的性能评测结果,综合来看,Mixtral 8x7B 可以对标甚至超越其它两个模型。研究者使用优化后的MixtralInstruct 进行跑分测试,在 MT-Bench 评估中得分 8.30,在 Arena Elo rating 中得分1121,超过了 Claude-2.1、GPT-3.5-Turbo 所有版本、Gemini Pro 和 Llama-2-70b-chat。图 6:Mistral 8x7B 性能可对标 GPT-3.5

27、 图 7:LMSys 排行榜上 Mixtral 8x7BInstruct 得分较高 资料来源:Mixtral of Experts、西部证券研发中心 资料来源:Mixtral of Experts、西部证券研发中心 Mistral 7B 已已做了针对性优化以降低推理成本和延迟。做了针对性优化以降低推理成本和延迟。根据论文Mistral 7B,Mistral 7B使用了 GOA(grouped-query attention,分组查询注意力)以加速推理,同时采用 SWA(Sliding Window Attention,滑动窗口注意力机制)以降低成本。Hugging Face CSO 在 X 上

28、以 Summarize.tech 为例,提及在实际应用中,使用 Mistral 7B 替代 GPT-3.5 可节省了一大半推理成本。Mistral 8x7B 增大总参数以提高性能,但推理时只增大总参数以提高性能,但推理时只激活激活小部分参数,有效提高小部分参数,有效提高了了效率、降效率、降低低了了成本成本。下图横轴为推理时激活的参数量,这与推理时的计算成本强相关,竖轴表示推理效率。可以看出,对比 LLama,Mistral 8x7B 由于推理时调用的参数较少,故成本低;且由于 MoE 模型中的专家是并行工作的,并且在任何给定时间只激活一部分专家,因此它能实现更快的推理速度,即能能以以更低的计算

29、更低的计算成本成本下下实现实现更高推理效率更高推理效率。行业专题报告|计算机 西部证券西部证券 2024 年年 03 月月 05 日日 8|请务必仔细阅读报告尾部的投资评级说明和声明 图 8:Mistral 8x7B 与 Llama“规模-效率”对比图 资料来源:Mixtral of Experts、西部证券研发中心 2.3 端侧端侧AI芯片已能支持百亿芯片已能支持百亿参数参数模型本地运行,模型本地运行,看好轻量看好轻量SMoE模型终端部署模型终端部署前景前景 我们认为,我们认为,低成本、高灵活性及安全性的开源低成本、高灵活性及安全性的开源轻量轻量化化 SMoE 模型模型较为适合在终端部署。较

30、为适合在终端部署。1)训练端,训练端,Mixtral 8x7B 这类高性能开源这类高性能开源小小模型大幅降低了模型训练的门槛模型大幅降低了模型训练的门槛,也降低了,也降低了软硬件成本软硬件成本。硬件方面,这类模型总体规模相对小很多,因此对 AI 芯片数量需求以及单卡性能要求都有所降低,这意味着即使在没有大量高端硬件资源的情况下,企业也能够进行有效的模型训练和优化。在软件方面,开源特性让企业可以基于自身场景及需求灵活调试模型,且成本相对于闭源模型更低。2)推理端推理端,轻量轻量 MoE 模型模型推理时只激活少部分参数,推理时只激活少部分参数,也就意味着也就意味着大模型大模型可以在保持可以在保持较

31、较高高性能的同时适应不同的计算环境,包括计算能力有限的终端设备。性能的同时适应不同的计算环境,包括计算能力有限的终端设备。同时由于模型本地部署同时由于模型本地部署于终端,推理计算时更多依赖终端设备的芯片,即计算成本转移到了端侧,总推理成本会于终端,推理计算时更多依赖终端设备的芯片,即计算成本转移到了端侧,总推理成本会大幅降低,这将催生大幅降低,这将催生许多许多大模型相关的应用。大模型相关的应用。目前,高通、联发科目前,高通、联发科、英特尔、英特尔、AMD 等龙头芯片厂等龙头芯片厂都推出了终端都推出了终端 AI 芯片芯片,能跑十亿能跑十亿级级甚甚至百亿量级大模型。至百亿量级大模型。后续后续类类

32、Mixtral 8x7B 的的 SMoE 模型模型在高性能基础上继续压缩的话,在高性能基础上继续压缩的话,很大几率可以装进终端设备实现本地运行很大几率可以装进终端设备实现本地运行。高通从手机、PC、耳机、XR、眼镜、汽车等多方面布局端侧 AI,接连推出大算力端侧芯片;联发科推出可本地运行百亿参数大模型的手机芯片;英特尔推出内置 NPU 的酷睿 Ultra 处理器且宣布启动“AI PC 加速计划”。2.3.1 高通:高通:端侧端侧AI芯片领导者,提供软硬件全栈优化芯片领导者,提供软硬件全栈优化 高通高通通过通过持续优化硬件性能和持续优化硬件性能和 AI 软件栈来加速终端侧软件栈来加速终端侧 AI

33、。硬件上,高通 AI 引擎采用异构计算架构,包括 Hexagon 处理器、Adreno GPU 和高通 Kryo CPU,全部面向在终端侧快速高效地运行 AI 应用而打造。其中,Hexagon 处理器不断演进,已经成为了高通 AI 引 行业专题报告|计算机 西部证券西部证券 2024 年年 03 月月 05 日日 9|请务必仔细阅读报告尾部的投资评级说明和声明 擎最关键的部分,能够应对不断变化的 AI 需求。Hexagon 处理器的迭代更新为高通端侧芯片处理器的迭代更新为高通端侧芯片 AI 性能跃升的关键。性能跃升的关键。2015 年,高通将 AI 技术集成到 Hexagon 处理器中;201

34、7 年,骁龙 845 芯片中引入 Hexagon 685 DSP,通过迭代、优化、更新,现在骁龙 X Elite 和 8 Gen 3 芯片中的 Hexagon NPU 可以提供 45TOPS的 AI 算力。Hexagon NPU 与之前的 DSP 相比,在架构、计算单元上都进行了重新设计,升级了全新的微架构,集成了硬件加速单元和微型区块推理单元,以及全新的张量单元、标量单元、矢量单元,并且所有单元共享 2 倍带宽的大容量共享内存,内部运行频率更高,内部缓存空间更大,实现了显著的运行速度的提升。Hexagon 处理器在 6 年时间里 AI 性能提高了 100 倍,计算能力呈陡峭上升趋势。图 9:

35、Hexagon 处理器的迭代更新过程 资料来源:极客公园公众号、西部证券研发中心 软件上,在算法和模型开发方面,高通进行了神经网络架构开发和调整工作,以在不牺牲准确度的前提下提高效率;在软件和模型效率方面,高通打造 AI 软件栈来帮助开发者实现一次开发,即可跨高通所有硬件运行 AI 负载,并且采用全面而有针对性的策略,包括量化、压缩、条件计算、神经网络架构搜索(NAS)和编译等技术,在不牺牲太多精度的前提下缩减 AI 模型,使其高效运行。图 10:高通 AI 软件栈 图 11:高通 AI 研究采用整体 AI 模型效率研究方法 资料来源:高通混合 AI 是 AI 的未来白皮书、西部证券研发中心

36、资料来源:高通混合 AI 是 AI 的未来白皮书、西部证券研发中心 行业专题报告|计算机 西部证券西部证券 2024 年年 03 月月 05 日日 10|请务必仔细阅读报告尾部的投资评级说明和声明 高通终端芯片布局包括手机、汽车、高通终端芯片布局包括手机、汽车、XR、PC 和物联网等,种类和数量都为行业领先,和物联网等,种类和数量都为行业领先,搭载骁龙平台的终端能够推动混合搭载骁龙平台的终端能够推动混合 AI 扩展至跨不同细分领域和层级的数十亿产品扩展至跨不同细分领域和层级的数十亿产品。手机领域,高通目前已出货的且具备 AI 能力的处理器达到十亿量级。汽车领域,高通提供领先的座舱和车载信息娱乐

37、解决方案,合作伙伴包括诸多头部车厂。物联网领域,高通是物联网终端芯片的主要提供商之一,高通物联网芯片的 AI 处理能力支持终端设备以高效可行的方式进行端侧数据分析,推动了跨多个细分领域的创新和转型,包括机器人、智能摄像头、零售和城市基础设施。XR 领域,Meta 等公司的 VR 头显和 AR 眼镜等 XR 终端集成了高通终端侧 AI 和 Snapdragon Spaces 技术。图 12:高通全球终端芯片布局 资料来源:高通混合 AI 是 AI 的未来白皮书、西部证券研发中心 2023年年10月,高通发布了两款支持端侧运行百亿大模型的芯片月,高通发布了两款支持端侧运行百亿大模型的芯片面向面向P

38、C的骁龙的骁龙X Elite以及面向手机的骁龙以及面向手机的骁龙 8 Gen3。1)高通骁龙 X Elite:支持在终端本地运行 130 亿参数大模型,能以 30 Tokens/s 的速度在终端运行 70 亿参数的 Llama-2 模型,实现快速、准确的响应。AI 方面整合 CPU、GPU、NPU 等模块,总算力最高 75TOPS,其中 Hexagon NPU 峰值算力为 45TOPS。2)高通骁龙 8 Gen3:用 Hexagon NPU 代替了原有的 Hexagon DSP,总算力 73TOPS,支持在终端运行 100 亿大模型。运行 70 亿参数大模型时,每秒可生成20 个 token;

39、运行 Stable Diffusion 时,创作图像只需 0.6 秒。图 13:高通骁龙 X Elite 概览 图 14:高通骁龙 8 Gen3 概览 资料来源:高通中国公众号、西部证券研发中心 资料来源:高通中国公众号、西部证券研发中心 2023年年9月,高通宣布推出两款全新空间计算平台月,高通宣布推出两款全新空间计算平台第二代骁龙第二代骁龙XR2和第一代骁龙和第一代骁龙AR1,分别用于分别用于 MR 和和 VR、智能眼镜设备。、智能眼镜设备。这两款产品是与 Meta 密切合作而开发的:Meta Quest 3 搭载了骁龙 XR2 Gen2 平台,Ray-Ban Meta 智能眼镜系列搭载骁

40、龙 AR1 Gen1 平台。1)行业专题报告|计算机 西部证券西部证券 2024 年年 03 月月 05 日日 11|请务必仔细阅读报告尾部的投资评级说明和声明 与 XR2 Gen1 对比,骁龙 XR2 Gen2 的 GPU 性能提升 2.5 倍,AI 性能提升 8 倍;2)骁龙AR1 Gen1 的终端侧 AI 能提供音质增强、视觉搜索和实时翻译等个人助手体验。图 15:高通骁龙 XR2 Gen2 概览 图 16:高通骁龙 AR1 Gen1 概览 资料来源:高通中国公众号、西部证券研发中心 资料来源:高通中国公众号、西部证券研发中心 2024年年1月,高通推出第二代骁龙月,高通推出第二代骁龙X

41、R2加强版本第二代骁龙加强版本第二代骁龙XR2+平台平台。相对于XR2 Gen2,XR2+Gen2 的 GPU 频率提升 15%,CPU 频率提升 20%,支持更逼真、具备更丰富细节的全新水平 MR 和 VR 体验。搭载第二代骁龙 XR2+的设备能够支持 12 路及以上并行摄像头和强大的终端 AI,轻松追踪用户的运动轨迹和周围环境,从而实现融合物理和数字空间的便捷导航和出色 XR 体验。三星和谷歌的 XR 设备采用 XR2+Gen2 平台。2023 年年 10 月,月,高通推出面向耳塞、耳机和音箱设计的第一代高通高通推出面向耳塞、耳机和音箱设计的第一代高通 S7 和和 S7 Pro 音频平台音

42、频平台。对比此前的 S5 系列,带来了 3 倍的 DSP 性能、6 倍的计算性能、100 倍的端侧 AI 性能进步,以及 3 倍的集成内存带宽。AI 性能大幅提升有利于提高耳机降噪性能;同时,芯片算力提高将为未来无线耳机实现更多功能奠定基础,比如支撑耳塞内置传感器以收集整理数据等。图 17:高通骁龙 XR2+Gen2 概览 图 18:第一代高通 S7 和 S7 Pro 音频平台概览 资料来源:高通中国公众号、西部证券研发中心 资料来源:高通中国公众号、西部证券研发中心 2.3.2 全球芯片巨头:全球芯片巨头:密集发布新品密集发布新品,抢抓终端侧,抢抓终端侧AI机遇机遇 联发科天玑联发科天玑 9

43、300 可本地运行可本地运行 70 亿参数大模型,亿参数大模型,还还和和 vivo 一起将规模提高到一起将规模提高到 130 亿参数亿参数,甚至在基于甚至在基于 24GB 内存的智能手机上,已成功运行最高内存的智能手机上,已成功运行最高 330 亿参数的亿参数的 AI 大模型。大模型。2023 年11 月,联发科发布天玑 9300 旗舰 5G 生成式 AI 移动芯片。在整体架构上,天玑 9300采用全大核 CPU 架构,大幅减少任务的总消耗时间,提升应用执行效率、减少卡顿,同时也能降低功耗,为 AI 算力提升打下底层计算基础。在 AI 能力上,天玑 9300 集成性能 行业专题报告|计算机 西

44、部证券西部证券 2024 年年 03 月月 05 日日 12|请务必仔细阅读报告尾部的投资评级说明和声明 显著提升的 Media Tek 第七代 AI 处理器 APU 790,内置硬件级的生成式 AI 引擎,整数运算和浮点运算性能均是上一代的 2 倍,同时功耗降低 45%,是业界首款搭载硬件生成式 AI 引擎的智能手机芯片,可实现更加高速且安全的终端 AI 计算。同时,天玑 9300 深度适配 Transformer 模型,在核心的 Softmax+LayerNorm 算子上,处理速度较上代提升 8 倍。图 19:天玑 9300 端侧 AI 性能概览 资料来源:联发科技公众号、西部证券研发中心

45、 AMD 推出内置推出内置 Ryzen AI 引擎的新一代移动处理器。引擎的新一代移动处理器。2023 年初,AMD 推出了首款内置Ryzen AI 引擎的锐龙 7040 系列处理器;2023 年 12 月,AMD 发布 8040 系列,升级了 XDNA NPU,使其AI算力从10TOPS升至16TOPS,提升幅度达到了60%,同时整体算力从33TOPS增加到 39TOPS。根据 AMD 给出的数据,相比于前代 7040 系列,锐龙 8040 系列在 Llama 2 和视觉模型方面,性能提升多达 40%。图 20:锐龙 8040G 的 CPU+NPU+GPU 架构 图 21:锐龙 8040G

46、在生成式 AI 方面性能提升 资料来源:天极网公众号、西部证券研发中心 资料来源:天极网公众号、西部证券研发中心 英特尔第一代酷睿英特尔第一代酷睿 Ultra 支持端侧无网运行支持端侧无网运行 Llama2-7B。酷睿 Ultra 处理器(代号为 Meteor Lake)是英特尔首款搭载 NPU 的处理器,其搭载的 GPU、NPU、CPU 都可以承载 AI 算力。阿里通义千问大模型已成功适配英特尔酷睿 Ultra 平台,未来可在 PC 等端侧部署。图 22:Meteor Lake 在 AI 方面性能优异 图 23:Meteor Lake 支持 Llama-7B 端侧无网运行 资料来源:APPS

47、O 公众号、西部证券研发中心 资料来源:APPSO 公众号、西部证券研发中心 行业专题报告|计算机 西部证券西部证券 2024 年年 03 月月 05 日日 13|请务必仔细阅读报告尾部的投资评级说明和声明 三、三、看好拥有终端资源看好拥有终端资源的的B端和端和C端端公司公司 随着轻量模型性能愈加强大随着轻量模型性能愈加强大、端侧芯片算力提升,大模型本地部署于终端为大势所趋。我端侧芯片算力提升,大模型本地部署于终端为大势所趋。我们认为,们认为,2024 年年将将成为成为 AI 终端终端发展元年发展元年。AI 赋能赋能有望有望带来带来 PC、手机、手表等智能可穿、手机、手表等智能可穿戴设备、平板

48、、戴设备、平板、XR 等各类数码产品的换机热潮等各类数码产品的换机热潮,而更广,而更广泛泛 AIoT 智能智能也有望在大模型加也有望在大模型加持下迎来全面升级。持下迎来全面升级。3.1 各类各类“AI+”终端产品终端产品陆续发布,陆续发布,新周期大幕拉开新周期大幕拉开 未来每一个终端将是未来每一个终端将是 AI 终端,每一个终端,每一个 PC、手机、手机、MR、手表都将是、手表都将是 AI PC、AI 手机、手机、AI MR、AI 手表手表。1)英特尔预估 2024 年全球将交付 4000 万台 AI PC,明年将交付 6000 万台,并计划到 2025 年底,英特尔为超过 1 亿台 AI P

49、C 供应处理器,而彼时 AI PC 在全球 PC 市场中的占比将超过 20%。2)据 Digitimes,微软 AI PC 将于今年首次亮相。微软将在2024年中旬首先推出以AI PC为主的Windows 11更新版,还将与高通合作将Windows on ARM 和英特尔的 x86 系统进行整合,这一全新版本预计将在 2024 年台北国际电脑展上正式亮相。英特尔英特尔启动启动“AI PC 加速计划加速计划”,拉动,拉动 PC 进入新一轮换机周期。进入新一轮换机周期。英特尔认为 AI 将成为 PC市场转折点,并在 2023 年 10 月“英特尔 on 技术创新大会”期间宣布启动 AI PC 加速

50、计划将在 2025 年前为超过 1 亿台 PC 带来 AI 特性。英特尔将充分利用英特尔在 AI 工具链、协作共创、硬件、技术经验等资源以最大化利用 AI,通过与超 100 家独立软件供应商合作伙伴的深度合作,集合 300 余项 AI 加速功能,在音频效果、内容创建、游戏、安全、直播、视频协作等方面继续强化 PC 体验 图 24:英特尔宣布启动“AI PC 加速计划”资料来源:英特尔中国公众号、西部证券研发中心 智能手机市场低迷,智能手机市场低迷,AI 或为破局关键,国内外厂商抢滩大模型手机或为破局关键,国内外厂商抢滩大模型手机。消费者换机周期延 行业专题报告|计算机 西部证券西部证券 202

51、4 年年 03 月月 05 日日 14|请务必仔细阅读报告尾部的投资评级说明和声明 长,智能手机市场急需颠覆性突破,AI 带来想象空间。Siri 引领了手机“智能语音助手”浪潮,虽然普及率高,但因为语音识别准确率较低以及实现场景较少,该类助手使用率较低。现在,大模型赋能的“智能助手”性能更为强大且支持多模态输出,由于天然接入了用户的私人数据库,它可以学习用户习惯以提供个性化输出或辅助,还能不断优化自身,同时还可以调用其他 App,进而在更好识别用户意图的基础上实现功能多元化。2023 年 10 月,谷歌发布可搭载谷歌 AI 模型的手机 Pixel 8 Pro,采用自研 Tensor G3 芯片

52、。2023 年 11 月,vivo 发布 X100 系列,支持本地运行 70 亿参数端侧大模型,曾跑通端侧 130亿参数大模型。2024 年 1 月,OPPO 发布 Find X7 系列,宣布 70 亿参数的 AI 大模型在手机端落地;荣耀发布 Magic6 系列,首发搭载荣耀自研 70 亿参数端侧平台级 AI 大模型“魔法大模型”。3.2 AI PC有望成为有望成为“AI+”终端中最先爆发的终端中最先爆发的 PC 相对于其它终端,有最多样化交互方式、能承载最多的场景,同时存储容量较大且较相对于其它终端,有最多样化交互方式、能承载最多的场景,同时存储容量较大且较为安全为安全,和大模型本地部署需

53、求更为适配,和大模型本地部署需求更为适配。根据 IDC 与联想联合发布的白皮书AI PC 产业(中国)白皮书,PC 具有以下四点优势从而使其与大模型更为匹配:1)PC 作为终端设备,拥有全模态的交互方式,包括触控、语音、手势控制和专业的键鼠、数字笔交互等,在人机交互方面有天然优势;2)既能承载生活娱乐场景,也能够承载工作、学习等场景,为创新的 AI 应用提供了更多可能性;3)PC 通常拥有大容量的本地安全存储,非常适合大模型本地部署以及隐私保护。最重要的是最重要的是 PC 通用计算能力较强,且能搭载较大体积的芯片,能实现强算力与便携性的通用计算能力较强,且能搭载较大体积的芯片,能实现强算力与便

54、携性的平衡,是大模型实时推理和高性能计算的更为理想的平台。平衡,是大模型实时推理和高性能计算的更为理想的平台。手机、平板电脑和智能穿戴设备便携性强,但由于体积不够大,很多时候无法搭载体积偏大的算力芯片。而 AI PC 的异构算力(CPU+GPU+NPU)协同运用,为 PC 提供了相对来说更为强劲的并行计算能力,且随着终端 AI 芯片计算能力和能效的提升,算法和存储方案的优化,PC 有望实现更大量级模型的本地部署。图 25:PC 优势与大模型本地部署时的需求天然匹配 资料来源:AI PC 产业(中国)白皮书、西部证券研发中心 近年来近年来 PC 全球出货量每年都有全球出货量每年都有 2 亿台以上

55、,所以当大模型与亿台以上,所以当大模型与 PC 结合后,能触及的用户结合后,能触及的用户群体将非常庞大。同时,群体将非常庞大。同时,PC 拥有大量的用户基础,这意味着一旦拥有大量的用户基础,这意味着一旦 AI 技术在技术在 PC 上得到了上得到了有效的集成和应用,其影响力和覆盖范围将会很广,有效的集成和应用,其影响力和覆盖范围将会很广,AI PC 将会迅速普及将会迅速普及。我们认为我们认为 AI PC有望有望成为“成为“AI+”终端中最先爆发的,尔后随着”终端中最先爆发的,尔后随着技术进步技术进步和和产业发展产业发展,手机、,手机、音箱、音箱、MR、行业专题报告|计算机 西部证券西部证券 20

56、24 年年 03 月月 05 日日 15|请务必仔细阅读报告尾部的投资评级说明和声明 人形机器人等等所有人形机器人等等所有终端终端设备设备都都将将 AI 化化。3.3 大模型有望大模型有望驱动驱动AIoT硬件升级硬件升级,关注深耕场景,关注深耕场景、具有终端资源、具有终端资源的的公司公司 过往讨论过往讨论“AI+终端终端”,更多集中在消费电子类,更多集中在消费电子类数码数码产品产品,但随着,但随着大模型逐步发展,尤其是大模型逐步发展,尤其是多模态能力增强,多模态能力增强,更广泛的更广泛的 AIoT 设备也迎来了更新换代的重要机遇设备也迎来了更新换代的重要机遇。大模型只有与各类AIoT 设备深度

57、结合才能真正从数字世界走向物理世界,同样 AIoT 设备只有与大模型深度结合才能从单纯的数据收集传输工具变为可以决策分析的智能化产品。例如安防领域,传统的监控设备主要依赖于人力进行监控和分析,效率低下且容易出错。然而,当大模型被应用于安防领域的摄像头等传感器设备时,大模型可以实时分析摄像头的视频流,自动检测异常行为和事件,如入侵者、火灾等,并及时发出警报,不仅可以大大提高监控的效率和准确性,而且能减轻安保人员的工作负担。此外,大模型还可以帮助AIoT 设备更好地理解和适应环境的变化。而由于用户数据的私密性要求、个性化体验要而由于用户数据的私密性要求、个性化体验要求以及出于成本考虑,大模型本地部

58、署才是更好的选择。求以及出于成本考虑,大模型本地部署才是更好的选择。AI 在安防领域的应用有三个阶段,大模型技术主导下的在安防领域的应用有三个阶段,大模型技术主导下的 AI 2.0 时代将成为分界线。时代将成为分界线。AI 1.0时代,主要聚焦于感知智能,通过深度学习技术赋予机器类似人类的视觉、听觉和触觉,对特定目标进行分析;AI 2.0 时代,则标志着认知智能的崛起,大模型成为主导,推动了机器的学习、思考和推理能力的提升;未来 AI 3.0 时代,机器将拥有真正的“人工大脑”,能够代替人类进行决策判断。图 26:AI 技术在安防领域的变革从感知智能到决策智能 图 27:认知智能的两个研究方向

59、及对应的安防应用 资料来源:安博会 SecurityChina、西部证券研发中心 资料来源:安博会 SecurityChina、西部证券研发中心 Transformer 大模型是预训练模型,可以理解语义信息且具有很强的通用性,即使没有事大模型是预训练模型,可以理解语义信息且具有很强的通用性,即使没有事先掌握所有的复杂视觉场景也能够理解和执行更广泛的下游任务。先掌握所有的复杂视觉场景也能够理解和执行更广泛的下游任务。根据海康威视 2023 年三季报业绩会,在容易发生野泳溺水但不能常年派人值守的地方,用一台具备识别算法的海康威视设备进行监控,并搭配报警系统,结合现场的语音提示,能阻止大量危险行为的

60、发生。此外,在工厂的螺丝安装过程中,视觉大模型可以在大量不同产品的场景中识别到不同的螺丝孔位并提示工人,有效避免螺丝漏打的问题,提高了生产质量。爱芯智元认为,爱芯智元认为,端侧部署大模型,有助于解决长尾场景下端侧部署大模型,有助于解决长尾场景下 AI 智能应用投入太高的问题。智能应用投入太高的问题。爱芯智元是一家 AI 视觉感知芯片研发及基础算力平台公司,其在需求沟通过程中发现,目前凡是需要用摄像头去捕捉画面的应用场景,都开始对大模型产生比较迫切的需求。比如做河道垃圾监测,以前的方式是采集数据、数据标注模型训练,新垃圾出现时模型可能识别不出来了,而重新训练又耗费时间和成本,而大模型能识别从未见

61、过的新垃圾。但如果将数据传输回云端,会产生较高成本且增加云基础设施的压力。所以,不仅要关注所以,不仅要关注 AIPC 等消费电子类产业变革,也要关注物联网智能终端在大模型加持等消费电子类产业变革,也要关注物联网智能终端在大模型加持下的升级迭代机遇,我们看好下的升级迭代机遇,我们看好拥有终端资拥有终端资源、深耕场景、掌握行业源、深耕场景、掌握行业 knowhow、积累了海、积累了海 行业专题报告|计算机 西部证券西部证券 2024 年年 03 月月 05 日日 16|请务必仔细阅读报告尾部的投资评级说明和声明 量数据的量数据的 B 端公司。端公司。3.4 私有化部署的私有化部署的B端场景端场景也

62、也是是AI应用的重要方向应用的重要方向,关注边缘,关注边缘侧侧AI 出于安全可控考虑,出于安全可控考虑,国央企通常都有私有化部署国央企通常都有私有化部署 AI 的的需求需求。国央企是国家重要的经济支柱和产业龙头,掌控着国家关键资源及相关产业链,且较大的业务范围和业务体量有助于其实现规模效应,降低运营成本以及提高盈利能力,实现较好的经济效益,所以国央企通常具有较为丰富的资金储备以及较强的支付能力。而国央企在考虑 AI 部署时,会特别关注数据安全和合规性问题,私有化部署不仅能满足安全要求,还可以提供更大的灵活性和可控性,使得企业可以根据自身独特的业务需求来自定义 AI 系统的功能和配置。政策驱动下

63、,央企将发力政策驱动下,央企将发力 AI 赋能赋能原有业务原有业务。在央企人工智能专题推进会上,国资委要求央企把加快发展新一代 AI 摆在更加突出的位置,着力打造 AI 产业集群,带头抢抓发力AI 赋能传统产业,开展 AI+专项行动,构建优质数据集,打造从基础设施、算法工具、智能平台到解决方案的大模型赋能产业生态。我们认为,私有化部署的我们认为,私有化部署的 B 端场景是端场景是 AI 应用的重要方向。应用的重要方向。从从行业行业分布来看,分布来看,国国央企数量央企数量较多的主要有金融、电力、煤炭矿冶、运输物流、钢铁机械等为行业较多的主要有金融、电力、煤炭矿冶、运输物流、钢铁机械等为行业,关注

64、面向这些重点关注面向这些重点行业,且能对大量终端或边缘侧设备进行连接管理的计算机公司。行业,且能对大量终端或边缘侧设备进行连接管理的计算机公司。3.5 鸿蒙:鸿蒙:提供提供顶级顶级的的流畅连接体验流畅连接体验,大模型大模型有望有望赋能赋能奔赴万物智联下一站奔赴万物智联下一站 鸿蒙鸿蒙 OS 是一款面向万物互联时代的、全新的分布式操作系统,是一款面向万物互联时代的、全新的分布式操作系统,具备分布架构、天生流畅、具备分布架构、天生流畅、内核安全、生态共享四大特征内核安全、生态共享四大特征,打破设备,打破设备“孤岛孤岛”。2019 年 8 月,华为在 HDC 大会上正式发布鸿蒙操作系统。鸿蒙 OS

65、的设计初衷是为满足全场景智慧体验的高标准的连接要求,为此华为提出了 4 大特性的系统解决方案:1)将分布式架构首次用于终端 OS,实现跨终端无缝协同体验;2)确定时延引擎和高性能 IPC 技术,以实现系统天生流畅;3)基于微内核架构重塑终端设备可信安全;4)通过统一 IDE 支撑一次开发、多端部署,实现跨终端生态共享“1+8+N”全场景战略布局明确,为消费者串联起过往割裂的终端体验全场景战略布局明确,为消费者串联起过往割裂的终端体验,实现了跨终端的无,实现了跨终端的无缝切换,让缝切换,让各类各类终端终端相互相互协同组成协同组成“超级终端超级终端”。2019 年,华为首次“1+8+N”全场景智慧

66、战略,“1”是智能手机,“8”是指围绕手机的、华为自研的车机、音箱、耳机、手表/手环、平板、大屏、PC、AR/VR 产品,N 则指众多泛 IoT 设备,是华为与生态伙伴,例如摄像头、智能秤等外围智能硬件。图 28:“1+8+N”全场景战略 资料来源:华为公众号、西部证券研发中心 鸿蒙计划打造面向万物互联的人机交互统一入口,鸿蒙计划打造面向万物互联的人机交互统一入口,我们认为我们认为大模型大模型未来将深度未来将深度赋能赋能智能助智能助 行业专题报告|计算机 西部证券西部证券 2024 年年 03 月月 05 日日 17|请务必仔细阅读报告尾部的投资评级说明和声明 手手“小艺小艺”,叠加鸿蒙软总线

67、能力,有望成为,叠加鸿蒙软总线能力,有望成为“超级终端超级终端”的的“大脑大脑”,加速加速万物智联时代来临万物智联时代来临。在华为的愿景中,未来的万物智联是通过智能助手“小艺”实现统一交互,解决不同 IoT 设备入口的差异,然后从海量应用中找到用户需要的服务,最终的目标是让终端真正懂用户、让设备去将服务推荐给用户,而不是用户自己去查找和调用服务。我们认为,大模型赋能后,可以让此目标更近一步,比如智能家居系统中,大模型可以助力设备实现更准确的协同响应;此外大模型还可以根据用户的行为习惯和生活模式,自动调整家庭环境的温度、湿度和照明等条件,为用户创造舒适的生活环境。目前,大模型已经和华为手机中的小

68、艺深度融合;未来,大模型如果能深度融入鸿蒙 OS、部署于各个设备,将有望成为“超级终端”的“大脑”,让万物智联真正进入现实生活。图 29:鸿蒙万物智联愿景 资料来源:华为 HDC 2021、西部证券研发中心 鸿蒙渗透率攀升,生态逐步繁荣。鸿蒙渗透率攀升,生态逐步繁荣。自上线以来,鸿蒙 OS 仅用两年时间就实现用户数就突破 1 亿,四年时间从 1.0 升级至 4.0。2023 年 8 月,华为在 HDC 大会上官宣鸿蒙生态设备数量为 7 亿台;2024 年 1 月,鸿蒙生态设备增长至 8 亿。根据 IDC 数据,2023 年前三季度,在中国智能手机操作系统市场中,安卓份额为71.8%,iOS占比

69、16.4%,鸿蒙份额11.8%。鸿蒙鸿蒙 PC 或将于今年发布,鸿蒙生态拼图渐趋完整或将于今年发布,鸿蒙生态拼图渐趋完整。2023 年,软通动力子公司鸿湖万联率先完成了 OpenHarmony 操作系统基于 X86 架构的英特尔芯片在 PC 端的适配。2023 年 12月,华为高管余承东在花粉年会上表示,华为即将在 2024 年推出非常有引领性、创新性、颠覆性的产品。正如鸿蒙设备开发官网所说,鸿蒙正如鸿蒙设备开发官网所说,鸿蒙 OS 为不同设备的智能化、互联与协同提供了统一的语为不同设备的智能化、互联与协同提供了统一的语言,根据言,根据用户用户不同需求不同需求和和不同不同使用使用场景场景将生态

70、伙伴各类相互分离的设备将生态伙伴各类相互分离的设备协同联动起来。协同联动起来。我我们们看好终端智能化趋势下,看好终端智能化趋势下,鸿蒙软硬件生态鸿蒙软硬件生态的迭代发展的迭代发展,建议建议关注大模型赋能下鸿蒙关注大模型赋能下鸿蒙万物万物智联更上一层楼,智联更上一层楼,以及未来基于鸿蒙以及未来基于鸿蒙 OS 的的 AI 手机、手机、AI PC 等等各类各类 AI 终端终端。四、四、人形机器人:大模型人形机器人:大模型应用应用的的重要重要硬件载体硬件载体,终端智能,终端智能发展的核心方向发展的核心方向 人形机器人是是一种设计来模仿人类外观和行为特征的机器人,其主干结构与人类相似,包括头部、躯干、手

71、臂和腿,所以能在一定程度上模拟人类的行走、抓取物体等物理动作。我们认为,人形机器人是目前具身智能最好的形态,因为它们有着与人相似的外观设计,我们认为,人形机器人是目前具身智能最好的形态,因为它们有着与人相似的外观设计,能更好地适应按照人的身体尺寸和操作习惯而设计的环境和基础设施,例如门框的尺寸、能更好地适应按照人的身体尺寸和操作习惯而设计的环境和基础设施,例如门框的尺寸、开关的位置、工具的握把等。这意味着,无需对外部环境或工具进行过多额外的修改或适开关的位置、工具的握把等。这意味着,无需对外部环境或工具进行过多额外的修改或适应,人形机器人便能无缝融入并承担应,人形机器人便能无缝融入并承担多种多

72、种工作工作。行业专题报告|计算机 西部证券西部证券 2024 年年 03 月月 05 日日 18|请务必仔细阅读报告尾部的投资评级说明和声明 图 30:Figure 01 制作咖啡 图 31:特斯拉 Optimus Gen 2 叠衣服 资料来源:智东西公众号、西部证券研发中心 资料来源:智东西公众号、西部证券研发中心 智能化趋势明确,大模型将成为机器人智能化趋势明确,大模型将成为机器人“大脑大脑”。腾讯首席科学家张正友认为机器人要从自动化变成自主化(智能化)。目前很多工业机器人可以精准做好预编程的动作,而智能机器人要实现自主,能在环境不确定时自动调整,以应对没有预测到的情况。而大模型的庞大知识

73、库、强大的通识理解能力和泛化能力让机器人智能化向前迈进一大步。4.1 具备思维链具备思维链及及零样本学习特性零样本学习特性,大模型大模型开启机器人智能化新篇章开启机器人智能化新篇章 具身智能的核心为具身智能的核心为“主动感知主动感知”和和“物理交互物理交互”。具身智能(Embodied Intelligence)是人工智能的一个子领域,关注的是智能体如何在具有实体形式的情况下,通过与环境的物理交互来学习、适应并获得认知能力。具身智能的一个重要特点是强调了“感知-行动回路”的重要性。这意味着智能体需要通过感受世界、对世界进行建模,进而采取行动,并通过行动的反馈来调整和优化其模型。这一过程与人类的

74、学习和认知过程相似,即通过实践和经验来学习和适应。具身智能具身智能机器人机器人从上到下可划分为:大脑、小脑、主控系统、主干结构以及零部件从上到下可划分为:大脑、小脑、主控系统、主干结构以及零部件。大脑负责规划决策、分解任务;小脑负责全身的运动分层控制;主控系统,包括实施系统调度、通信协议站、CPU、GPU、FPG 硬件加速进程和算力的优化;主干结构及零部件有双臂、足式、轮式等,类似于人的一系列关节和肌肉。具备思维链及零样本学习特性,大模型有望成为机器人的具备思维链及零样本学习特性,大模型有望成为机器人的“大脑大脑”。思维链是大模型涌现时出来的一种特殊能力,是被偶然发现的有人在提问时以“Lets

75、 think step by step”开头,后面发现 AI 自动把问题分解为多个步骤,然后逐步解决。谷歌在研发机器人模型 RT-2 时受到 LLM 思维链提示方法启发,将机器人控制与思维链推理相结合,使其可以执行多阶段语义推理。图 32:结合思维链推理,RT-2 驱动机械臂执行“在现场找能钉钉子的物体”的任务 资料来源:智东西公众号、西部证券研发中心 斯坦福李飞飞团队 VoxPoser 系统让机械臂实现了零样本的日常操作任务轨迹合成:1)机 行业专题报告|计算机 西部证券西部证券 2024 年年 03 月月 05 日日 19|请务必仔细阅读报告尾部的投资评级说明和声明 器人用相机采集 RGB

76、-D 图像,并输入自然语言指令;2)LLM 根据这些内容编写代码,所生成代码与 VLM(视觉语言模型)进行交互,指导系统生成相应的操作指示地图,即3D Value Map;3)动作规划器将生成的 3D 地图作为其目标函数,合成最终操作轨迹。图 33:VoxPoser 系统驱动下机械臂可以完成没见过的任务,可操作的物体也是开放的 资料来源:量子位公众号、西部证券研发中心 4.2 端云端云融合融合AI为机器人打造智能高效为机器人打造智能高效“大脑大脑”端云混合的端云混合的“大脑大脑”让机器人既能处理复杂和高强度的计算任务,又能实时进行信息处理和让机器人既能处理复杂和高强度的计算任务,又能实时进行信

77、息处理和分析。分析。基于混合 AI 思想,智元机器人团队打造出具身智脑 EI-Brain 框架,包括部署在云端的超脑,部署在端侧的大脑、小脑以及脑干,分别对应机器人任务不同级别的技能,包括技能级、指令级、伺服级等。具体来说,“大脑”进行抽象思考、多级推理,“小脑”负责运动控制方面的指令生成,“脑干”负责电机控制、伺服等硬件底层任务。图 34:智元“具身智脑”EI-Brain 框架 资料来源:智元机器人公众号、西部证券研发中心 4.3 产业产业催化不断,催化不断,人形机器人有望迎来奇点时刻人形机器人有望迎来奇点时刻 英伟达公司成立具身智能实验室英伟达公司成立具身智能实验室 GEAR,专注四大关键

78、领域研究:多模态基础模型、通用,专注四大关键领域研究:多模态基础模型、通用型机器人研究、虚拟世界中的基础智能体、模拟与合成数据技术。型机器人研究、虚拟世界中的基础智能体、模拟与合成数据技术。2 月 24 日,英伟达高级科学家 JimFan 在 X 上宣布,英伟达将在内部组建一个新研究小组专攻通用具身智能体研究,并强调“2024 年将是属于机器人、游戏 AI 和模拟的一年”。英伟达将在英伟达将在 3 月下旬的月下旬的 GTC 上发布机器人领域成果上发布机器人领域成果。Agility Robotics、波士顿动力、迪士尼和 Google DeepMind 等全球领先的机器人公司将在活动中共展示 2

79、5 款新一代机器人产品,包括人形机器人、工业机械手等。初创公司初创公司 Figure AI 获北美获北美 AI 大厂看好,大厂看好,OpenAI、亚马逊、英伟达等参与融资。、亚马逊、英伟达等参与融资。2024 年3 月 1 日,OpenAI 官宣将与 Figure 合作,专为人形机器人打造下一代 AI 多模态模型,而Figure 创始人 Brett Adcock 认为“Figure 的人形机器人是 AGI 的最终部署载体”。Figure 行业专题报告|计算机 西部证券西部证券 2024 年年 03 月月 05 日日 20|请务必仔细阅读报告尾部的投资评级说明和声明 还宣布了 6.75 亿美元的

80、巨额 B 轮融资,亚马逊创始人贝索斯、英伟达等参与,此前 Figure AI 已获得来自 OpenAI 和微软的支持,本轮融资前的估值已达到约 20 亿美元。五、五、建议关注建议关注 1)算力基础:算力基础:中科曙光中科曙光、神州数码、浪潮信息、高新发展;、神州数码、浪潮信息、高新发展;2)AI PC:华勤技术、龙旗科技、联想集团、星环科技:华勤技术、龙旗科技、联想集团、星环科技-U、海光信息;、海光信息;3)终端鸿蒙:润和软件、九联科技、东方中科、软通动力、中国软件国际、拓维信息、终端鸿蒙:润和软件、九联科技、东方中科、软通动力、中国软件国际、拓维信息、初灵信息初灵信息;4)拥有丰富终端资源

81、的公司:海康威视、大华股份、科大讯飞、萤石网络、漫步者;拥有丰富终端资源的公司:海康威视、大华股份、科大讯飞、萤石网络、漫步者;5)B 端应用:北路智控、智洋创新、云涌科技、商汤端应用:北路智控、智洋创新、云涌科技、商汤-W、云从科技、云从科技-UW。六、六、风险提示风险提示 AIGC 技术突破不及预期。技术突破不及预期。AIGC 发展受到许多因素的影响,包括数据的质量和可用性、算法的效率和准确性以及计算资源的限制等。终端智能需求不及预期。终端智能需求不及预期。终端智能需求的增长受到多种因素的影响,包括技术创新的速度、市场竞争的激烈程度以及消费者对新技术的接受度等。宏观经济增长不及预期。宏观经

82、济增长不及预期。宏观经济的表现与政策的变化、市场的波动以及全球经济的趋势等息息相关。国际环境变化。国际环境变化。各类政治事件、经济政策的变动以及地缘政治的风险等。行业专题报告|计算机 西部证券西部证券 2024 年年 03 月月 05 日日 21|请务必仔细阅读报告尾部的投资评级说明和声明 西部证券西部证券投资评级说明投资评级说明 超配:超配:行业预期未来 6-12 个月内的涨幅超过市场基准指数 10%以上 行业评级行业评级 中配:中配:行业预期未来 6-12 个月内的波动幅度介于市场基准指数-10%到 10%之间 低配:低配:行业预期未来 6-12 个月内的跌幅超过市场基准指数 10%以上

83、买入:买入:公司未来 6-12 个月的投资收益率领先市场基准指数 20%以上 公司评级公司评级 增持:增持:公司未来 6-12 个月的投资收益率领先市场基准指数 5%到 20%之间 中性:中性:公司未来 6-12 个月的投资收益率与市场基准指数变动幅度相差-5%到 5%卖出:卖出:公司未来 6-12 个月的投资收益率落后市场基准指数大于 5%报告中所涉及的投资评级采用相对评级体系,基于报告发布日后 6-12 个月内公司股价(或行业指数)相对同期当地市场基准指数的市场表现预期。其中,A 股市场以沪深 300 指数为基准;香港市场以恒生指数为基准;美国市场以标普 500 指数为基准。分析师声明分析

84、师声明 本人具有中国证券业协会授予的证券投资咨询执业资格并注册为证券分析师,以勤勉的职业态度、专业审慎的研究方法,使用合法合规的信息,独立、客观地出具本报告。本报告清晰准确地反映了本人的研究观点。本人不曾因,不因,也将不会因本报告中的具体推荐意见或观点而直接或间接收到任何形式的补偿。联系地址联系地址 联系地址:联系地址:上海市浦东新区耀体路 276 号 12 层 北京市西城区丰盛胡同 28 号太平洋保险大厦 513 室 深圳市福田区深南大道 6008 号深圳特区报业大厦 10C 联系电话:联系电话: 免责声明免责声明 本报告由西部证券股份有限公司(已具备中国证监会批复的

85、证券投资咨询业务资格)制作。本报告仅供西部证券股份有限公司(以下简称“本公司”)机构客户使用。本报告在未经本公司公开披露或者同意披露前,系本公司机密材料,如非收件人(或收到的电子邮件含错误信息),请立即通知发件人,及时删除该邮件及所附报告并予以保密。发送本报告的电子邮件可能含有保密信息、版权专有信息或私人信息,未经授权者请勿针对邮件内容进行任何更改或以任何方式传播、复制、转发或以其他任何形式使用,发件人保留与该邮件相关的一切权利。同时本公司无法保证互联网传送本报告的及时、安全、无遗漏、无错误或无病毒,敬请谅解。本报告基于已公开的信息编制,但本公司对该等信息的真实性、准确性及完整性不作任何保证。

86、本报告所载的意见、评估及预测仅为本报告出具日的观点和判断,该等意见、评估及预测在出具日外无需通知即可随时更改。在不同时期,本公司可能会发出与本报告所载意见、评估及预测不一致的研究报告。同时,本报告所指的证券或投资标的的价格、价值及投资收入可能会波动。本公司不保证本报告所含信息保持在最新状态。对于本公司其他专业人士(包括但不限于销售人员、交易人员)根据不同假设、研究方法、即时动态信息及市场表现,发表的与本报告不一致的分析评论或交易观点,本公司没有义务向本报告所有接收者进行更新。本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。本公司力求报告内容客观、公正,

87、但本报告所载的观点、结论和建议仅供投资者参考之用,并非作为购买或出售证券或其他投资标的的邀请或保证。客户不应以本报告取代其独立判断或根据本报告做出决策。该等观点、建议并未考虑到获取本报告人员的具体投资目的、财务状况以及特定需求,在任何时候均不构成对客户私人投资建议。投资者应当充分考虑自身特定状况,并完整理解和使用本报告内容,不应视本报告为做出投资决策的唯一因素,必要时应就法律、商业、财务、税收等方面咨询专业财务顾问的意见。本公司以往相关研究报告预测与分析的准确,不预示与担保本报告及本公司今后相关研究报告的表现。对依据或者使用本报告及本公司其他相关研究报告所造成的一切后果,本公司及作者不承担任何

88、法律责任。在法律许可的情况下,本公司可能与本报告中提及公司正在建立或争取建立业务关系或服务关系。因此,投资者应当考虑到本公司及/或其相关人员可能存在影响本报告观点客观性的潜在利益冲突。对于本报告可能附带的其它网站地址或超级链接,本公司不对其内容负责,链接内容不构成本报告的任何部分,仅为方便客户查阅所用,浏览这些网站可能产生的费用和风险由使用者自行承担。本公司关于本报告的提示(包括但不限于本公司工作人员通过电话、短信、邮件、微信、微博、博客、QQ、视频网站、百度官方贴吧、论坛、BBS)仅为研究观点的简要沟通,投资者对本报告的参考使用须以本报告的完整版本为准。本报告版权仅为本公司所有。未经本公司书面许可,任何机构或个人不得以翻版、复制、发表、引用或再次分发他人等任何形式侵犯本公司版权。如征得本公司同意进行引用、刊发的,需在允许的范围内使用,并注明出处为“西部证券研究发展中心”,且不得对本报告进行任何有悖原意的引用、删节和修改。如未经西部证券授权,私自转载或者转发本报告,所引起的一切后果及法律责任由私自转载或转发者承担。本公司保留追究相关责任的权力。所有本报告中使用的商标、服务标记及标记均为本公司的商标、服务标记及标记。本公司具有中国证监会核准的“证券投资咨询”业务资格,经营许可证编号为:982242D。

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(计算机行业人工智能系列报告(一):终端智能人工智能AI的新革命-240305(21页).pdf)为本站 (B-ing) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部