您的当前位置：上海品茶 > 报告分类 > PDF报告下载

报告预览

海外机器人行业系列跟踪报告（一）：美股科技巨头纷纷入局AI大模型将推动机器人商业化落地-240314（37页）.pdf

编号：156745

PDF 37页 2.11MB 下载积分：VIP专享

下载报告请您先登录！

海外机器人行业系列跟踪报告（一）：美股科技巨头纷纷入局AI大模型将推动机器人商业化落地-240314（37页）.pdf

1、证券研究报告证券研究报告 2024年3月14日美股科技巨头纷纷入局，美股科技巨头纷纷入局，AIAI大模型将推动机器人商业化落地大模型将推动机器人商业化落地海外机器人系列跟踪报告（一）海外机器人系列跟踪报告（一）分析师付天姿执业证书编号 S0930517040002 联系人黄铮请务必参阅正文之后的重要声明核心观点核心观点事件：机器人赛道火爆事件：机器人赛道火爆，产品迭代迅速产品迭代迅速，美股头部科技公司纷纷入局美股头部科技公司纷纷入局。2024年2月24日，英伟达宣布成立新的研究部门“GEAR”，加码机器人赛道；2月29日，人形机器人初创公司Figure宣布，已从亚马逊创始人贝索

2、斯、英伟达、OpenAI和微软等公司筹集了约6.75亿美元资金，使其公司估值达到26亿美元；3月13日，Figure最新发布了一段视频，展示了机器人Figure 01在OpenAI大模型的支持下，已能够与人类对话，理解并执行人类的指令和任务。当前美股机器人赛道火爆，人形机器人初创公司在一级市场上获得高估值，高科技公司纷纷加入，AI行业与人形机器人行业融合发展加速。行业进展：人形机器人硬件上突破运动控制能力，结合行业进展：人形机器人硬件上突破运动控制能力，结合AIAI大模型实现更多的功能。大模型实现更多的功能。1 1）人形机器人厂商逐渐突破硬件瓶颈人形机器人厂商逐渐突破硬件瓶颈，机器人的操作能力

3、和移动能力得到较大提升：机器人的操作能力和移动能力得到较大提升：Figure机器人具备行走能力；特斯拉Optimus-Gen2相比第一代运动性能提升。2 2）人形机器人厂商通过自研或者与）人形机器人厂商通过自研或者与AIAI厂商合作的方式，结合厂商合作的方式，结合AIAI训练人形机器人：训练人形机器人：Figure与OpenAI合作开发下一代人形机器人的AI模型；特斯拉采用自研FSD控制系统；1X与OpenAI合作开发具身学习模型。AIAI +机器人机器人:人形机器人是人形机器人是AIAI的重要应用场景之一的重要应用场景之一，AIAI大模型成为人形机器人商业化落地的关键大模型成为人形机器人商业

4、化落地的关键。1 1）机器人训练方式由机器人训练方式由“传统机器学习传统机器学习”向向“端到端端到端”神经网络转变神经网络转变：机器人的“感知规划执行”流程缩短为“感知执行”,减少人为写代码的过程，但对数据提出更高要求；“具身学习”方法引入，从真实世界中获取数据，完成对机器人的训练。2 2）面向机器人的生成式人工智能软件开发：面向机器人的生成式人工智能软件开发：主要由谷歌、Meta、微软和英伟达等头部AI 厂商主导，目前重点为优化机器人任务的基础模型+机器人人工智能开发平台。1 风险提示：风险提示：技术发展不及预期；商业化落地不及预期；相关技术被不当使用或存在缺陷等未来展望：硬件未来展望：硬

5、件+软件软件+商业化商业化，人形机器人发展潜力巨大人形机器人发展潜力巨大。1 1）硬件层面：硬件层面：提升零部件精度&降低重量，突破运动与灵活度的性能瓶颈；2 2）量产能力和商业化：量产能力和商业化：核心为降本&控制良率，产品上市进程或将加快；3 3）软件算法：软件算法：“具身智能”有望为人形机器人通用性赋能。QV1W0WEUTUBVVX8O8Q6MnPoOoMmQfQnNsRiNpOmRbRqRqQxNsOqMxNrRtN请务必参阅正文之后的重要声明目目录录 1 1、海外头部机器人：运动控制能力有所突破，将结合、海外头部机器人：运动控制能力有所突破，将结合AIAI大模型拓展功能大模型拓展

6、功能 2 2、美股科技巨头：纷纷入局，投资、美股科技巨头：纷纷入局，投资+优化开发优化开发机器人赛道的生成式机器人赛道的生成式AIAI平台平台 2 2 3 3、未来展望：硬件、未来展望：硬件+软件软件+商业化，人形机器人发展潜力巨大商业化，人形机器人发展潜力巨大 4 4、风险提示、风险提示请务必参阅正文之后的重要声明 1 1、海外人形机器人头部公司、海外人形机器人头部公司 3 1.1、Figure：人形机器人初创企业，具备端到端学习能力 1.2、特斯拉：Optimus研发进展迅速，FSD控制系统和Dojo算力提供技术底座 1.3、波士顿动力：深耕多年，机器人硬件技术积累深厚 1.4、1X T

7、echnologies：类人机器人硬件技术与“具身学习”AI技术相结合 1.5、Agility Robotics：致力于实现商业化人形机器人量产请务必参阅正文之后的重要声明 1 1、海外机器人头部公司、海外机器人头部公司 4 FigureFigure 特斯拉特斯拉波士顿动力波士顿动力 1X1X TechnologiesTechnologies Agility RoboticsAgility Robotics 人形机器人产品 Figure 01 Optimus;Optimus-Gen 2 Atlas NEO Digit 运动能力和灵活性中，具备行走能力，移动速度1.2m/s（4.32km/

8、h）中，移动速度第一代约为8.05km/h，第二代约为10.46km/h 高，可以后空翻、跑酷中，行走速度4km/h，跑步速度为12km/h 较高，能适应不平坦地面、上台阶、受到撞击使自己保持稳定手部灵活性五指五指三指五指合作方软件算法：OpenAI；微软无软件算法：英伟达；资金：美国军方（早期）软件算法：OpenAI 资金：亚马逊；制造：福特 AI融合程度多模态大模型识别理解端到端训练自有FSD和Dojo 具身学习+共享自治较弱适用场景通用通用处在实验室研发阶段通用物流仓储量产时间未进入到量产阶段预计2025年 Atlas暂未实现量产未进入到量

9、产阶段（2024年产品发布）2024年定价未公布 2万美元未公布未公布 25万美元表1：海外机器人头部公司人形机器人产品参数对比资料来源：各公司官网，海量观世界，澎湃新闻，第一财经，CyberDaily，新智元，界面新闻，中国机器人网，搜狐网，前瞻网，新华社客户端，硅星人，财联社，维科网，机器人大讲堂公众号，cnBeta，华尔街见闻，极客公园，元宇宙资讯，证券时报，爱范儿公众号，光大证券研究所整理请务必参阅正文之后的重要声明 1.11.1、FigureFigure：人形机器人初创企业，具备领先理解与学习能力：人形机器人初创企业，具备领先理解与学习能力 5 Figure Figur

10、e：人形机器人初创企业，产品已经具备多模态理解、端到端学习能力和较为流畅运动能力。人形机器人初创企业，产品已经具备多模态理解、端到端学习能力和较为流畅运动能力。Figure是一家人形机器人初创企业，于2022年成立于美国硅谷，公司官网显示公司的目标是在全球范围内部署自主的人形工人机器人，以解决劳动力空缺的问题。公司推出的首款人形机器人产品命名为Figure 01，已经具备多项先进能力。1 1）高级视觉和语言智能高级视觉和语言智能：2024年3月13日，公司最新发布了一段视频，展示了Figure 01 在 OpenAI 强大模型的支持下，通过与人类对话交互来执行命令。根据视频，Figure 01

11、 Figure 01 具有以下能力：具有以下能力：a)视觉识别和理解：当人类问Figure 01看到了什么，Figure 01回答:“我看到了桌子中央的盘子上有一个红苹果、一个装满杯子和盘子的晾碗架，以及你站在附近，手放在桌子上。”b)语言识别和理解：在人类说出需要食物的命令时递上苹果;c)语言解释动作原因：解释递苹果是因为“这是我可以从桌子上为您提供的唯一可食用物品”；d)流畅的任务执行：能够意识到垃圾应该放到筐子里，杯子和盘子应该归置放在沥水架上，并做出相应的动作;e)自我评价与反馈。核心特点：核心特点：a)在OpenAI的加持下，机器人已经能够理解任务内容，并非机械执行；同时能够与与人类

12、交互对话。b)全程自主控制，无需任何远程操作；c)机器人执行的速度和流畅度有了显著的提升，开始接近人类的速度。资料来源：公司官网，证券时报，财联社，光大证券研究所整理图1：Figure 01给人类递上苹果图3：Figure 01把盘子放到沥水架上图2：Figure 01把垃圾放到筐子里请务必参阅正文之后的重要声明 6 Figure Figure：人形机器人初创企业，产品已经具备端到端学习能力和行走能力。人形机器人初创企业，产品已经具备端到端学习能力和行走能力。2 2）端到端的学习能力）端到端的学习能力：2024年1月，公司发布了Figure 01无需人为远程操控，实现自主冲咖啡的视频。

13、据公司介绍，Figure 01只需看一段人类演示的视频，再加上10小时的端到端的训练，就能够学会视频里的操作技巧，自主完成任务；3 3）行走能力）行走能力：2023年11月，公司展示了Figure 01的行走能力，能够从许多塑料箱子中拿起一个，搬运一定距离，并放置到传送带上。这说明此时Figure 01已拥有自主导航、识别箱子和任务优先级排序的能力。多个高市值科技公司投资，公司在一级市场广受青睐。多个高市值科技公司投资，公司在一级市场广受青睐。2024年2月29日，公司宣布，已从亚马逊创始人贝索斯、英伟达、OpenAI和微软等公司那里筹集了约6.75亿美元的资金，使其公司估值达到了26亿美元。

14、资料来源：公司官网，财联社，华尔街见闻，量子位，腾讯新闻，光大证券研究所整理图6：Figure的投资方图5：Figure 01搬箱子图4：Figure 01冲咖啡 1.11.1、FigureFigure：人形机器人初创企业，具备领先理解与学习能力：人形机器人初创企业，具备领先理解与学习能力请务必参阅正文之后的重要声明 7 核心竞争力核心竞争力1 1：创始人和团队具备丰富的创业经验、技术能力和运营能力。：创始人和团队具备丰富的创业经验、技术能力和运营能力。1 1）公司创始人）公司创始人Brett AdcockBrett Adcock：2020年三次创业年三次创业，曾经创办的企业包括基于A

15、I的在线人才市场Vettery和eVTOL（电动垂直起降机）公司Archer，前者于2018年被全球最大的招聘公司The Adecco Group以 1.1 亿美元收购，后者则以27亿美元估值在纽交所上市，并与联合航空签署了15亿美元的商业协议。2022年，Brett开始专注于创办Figure；2 2）公司）公司CTOCTO Jerry PrattJerry Pratt：在加入Figure前是人类和机器认知研究所的首席研究员，专注于对步行和平衡的理解和建模，长期投身于机器人技术的研究；3 3）战略发展副总裁战略发展副总裁Dana BerlinDana Berlin：此前任职于巴克莱资本投行业务

16、能源和可持续发展领域；4 4）其他细分模块）其他细分模块：聚集了曾在波士顿动力、特斯拉、Lucid Motors等公司任职的专业人员。创始人和团队具备丰富的创业经验、创始人和团队具备丰富的创业经验、技术能力和运营能力，将推动技术能力和运营能力，将推动FigureFigure持续稳健成长。持续稳健成长。资料来源：公司官网，光大证券研究所整理图7：Figure公司领导层 1.11.1、FigureFigure：人形机器人初创企业，具备领先理解与学习能力：人形机器人初创企业，具备领先理解与学习能力请务必参阅正文之后的重要声明核心竞争力核心竞争力2 2：多模态大模型赋能，机器人加速迭代。多模态大

17、模型赋能，机器人加速迭代。多模态多模态模型同时理解输入的图像和文本信息：模型同时理解输入的图像和文本信息：Figure AI 将机器人摄像头拍摄的图像和通过板载麦克风记录的语音转录文本输入到一个由 OpenAI 训练的多模态模型中，这个模型能够同时理解图像和文本信息。模型负责生成语言响应模型负责生成语言响应：该模型会处理整个对话的历史记录，包括以往的图像，以生成语言响应，并通过文本到语音的方式向人类回话。模型对于给定命令进行动作决策执行：模型对于给定命令进行动作决策执行：同一个模型还负责决定执行哪种已学习的闭环行为来响应给定的命令，它将特定的神经网络权重加载到 GPU 上，并执行相应的策略。资

18、料来源：图8：Figure 1.11.1、FigureFigure：人形机器人初创企业，具备领先理解与学习能力：人形机器人初创企业，具备领先理解与学习能力 8 请务必参阅正文之后的重要声明 9 核心竞争力核心竞争力3 3：自主完成任务自主完成任务具备端到端的学习能力具备端到端的学习能力表象：机器人训练省时省力。表象：机器人训练省时省力。Figure 01只需看一段人类操作的视频，再用上10小时训练，就能实现无需人为远程操控，自主冲咖啡；在咖啡胶囊位置没摆正时还可以自动调整。底层逻辑：端到端神经网络底层逻辑：端到端神经网络(End to End Neural Networks(End to E

19、nd Neural Networks）传统机器学习：传统机器学习：过程包括，（1）输入原始数据；（2）引入特定领域的知识，手动提取特征；（3）采用传统机器学习算法生成预测。尽管能够达成目标，但程序非常耗时，需要大量特定领域的知识。端到端深度学习：端到端深度学习：将数据直接通过一个大型神经网络，该神经网络处理输入的数据并自动提取相关特征自动提取相关特征，然后用于生成预测。“端到端”的特点“端到端”的特点：（1）神经网络技术使得无需手动提取特征，省去传统机器学习第二个过程，直接从数据中进行输入-输出映射的学习，有效减少训练所需的时间和精力；（2）技术的前提是训练期间需要使用大量数据。资料来源：公司

20、官网，华尔街见闻，Baeldung，光大证券研究所整理图9：传统机器学习流程图图10：端到端深度学习流程图 1.11.1、FigureFigure：人形机器人初创企业，具备领先理解与学习能力：人形机器人初创企业，具备领先理解与学习能力请务必参阅正文之后的重要声明 10 未来发展：未来发展：AIAI赋能人形机器人赋能人形机器人与OpenAI合作，开发下一代人形机器人的人工智能(AI)模型：利用筹得的资金为机器人开发大语言模型，将基于OpenAI最新的GPT模型，并专门训练Figure收集的机器人动作数据，以便其人形机器人可以与人交谈，看到东西并执行复杂任务；使用微软的Azure云服务搭建

21、人工智能基础设施和存储数据等。资料来源：各公司官网，财联社，光大证券研究所整理图11：OpenAI 图12：微软Azure云服务 1.11.1、FigureFigure：人形机器人初创企业，具备领先理解与学习能力：人形机器人初创企业，具备领先理解与学习能力请务必参阅正文之后的重要声明 1.21.2、特斯拉：、特斯拉：OptimusOptimus人形机器人技术进步迅速人形机器人技术进步迅速 11 特斯拉特斯拉OptimusOptimus：OptimusOptimus人形机器人技术进步迅速。人形机器人技术进步迅速。2021年8月19日，特斯拉首次向世界展示了将要推出的一款人形机器人“Optim

22、us Bot”，此时特斯拉人形机器人方案还处在准备阶段。2022年10月1日，在特斯拉AI Day上，马斯克正式介绍了特斯拉首款人形机器人Optimus（擎天柱），该机器人搭载特斯拉同款的自动驾驶软件系统和传感器。2023年12月，特斯拉放出了Optimus-Gen 2（第二代擎天柱）的视频，性能相比第一代已经有了大幅度的跃升。参数指标参数指标静坐功率快走功率行走速度英里小时全身自由度个自由度手部个执行器，个自由度内核（大脑）单块（）电池电压、容量、内置电子电气元件的一体单元电池包总电量整体重量表2：特斯拉Optimus主要参数资料来源：公司官网，财联社，界面新闻，澎湃新闻，DX Plus

23、，中国机器人网，光大证券研究所整理核心升级点核心升级点执行器与传感器特斯拉自主设计制造行走速度英里小时，比上一代提升；并具有扭矩感应、铰接式角质部分和人体足部几何形状（脚踝增加六维力矩传感器）脖子新增个自由度机械手个自由度，所有手指增加触觉传感器，可以处理精致物体，如鸡蛋平衡平衡感和身体协调性得到改进，能够深蹲整体重量（比一代减轻）表3：特斯拉Optimus-Gen2主要参数/结构特征请务必参阅正文之后的重要声明 1.21.2、特斯拉：、特斯拉：FSD+DojoFSD+Dojo，为训练提供技术底座，为训练提供技术底座 12 核心竞争力核心竞争力1 1：特斯拉特斯拉FSDFSD已经具备“

24、端到端”的能力。已经具备“端到端”的能力。马斯克曾介绍，Optimus与特斯拉FSD（全自动驾驶）构建的强大视觉系统能够共通，两者的底层模块已经打通；特斯拉FSD v12背后神经网络的训练全部使用视频数据，不需要手写一行代码；总部有一个“AI大脑”，可以分析汽车收集的大量视频数据，然后告诉汽车如何在道路上遇到的每个场景中行走；“端到端”的能力使特斯拉摆脱了代码的限制，接下来只需要在数据和算力两个层面进行突破。核心竞争力核心竞争力2 2：DojoDojo超算中心提供算力支撑。超算中心提供算力支撑。特斯拉Dojo超算中心已经于2023年上线，由一万个英伟达H100GPU组成，能提供340 FP64

25、 PFLOPS的峰值算力，为AI提供39.58 INT8 ExaFLOPS的峰值算力，主要用于训练包括特斯拉FSD自动驾驶系统在内的各种AI应用。除了FSD v12以外，人形机器人Optimus也将从特斯拉巨大的算力储备当中获益。展望：展望：有望受益于FSD和Dojo，继续训练机器人的通用性；未来人形机器人量产有望受益于可迁移的汽车制造经验。资料来源：公司官网，新智元公众号，界面新闻，光大证券研究所整理图13：特斯拉FSD控制系统图14：特斯拉Dojo超算中心请务必参阅正文之后的重要声明 1.31.3、波士顿动力：深耕多年，机器人硬件技术积累深厚、波士顿动力：深耕多年，机器人硬件技术积累

26、深厚 13 波士顿动力：波士顿动力：波士顿动力公司成立于1992年，源自麻省理工学院的一个研究项目。公司的机器人产品十分先进，人形机器人Atlas曾因为动态跑酷能力引起全世界的关注。公司机器人产品覆盖军用和民用两大类，硬件技术优越。公司机器人产品覆盖军用和民用两大类，硬件技术优越。军用类：军用类：1 1）四足机器狗）四足机器狗BigDogBigDog：2005年，公司就研发出了第一代机器狗BigDog，生产初衷是让其在地形奇怪复杂地区代替运输车运载物资，但因噪声太大等缺陷提前退役；2 2）四足机器人）四足机器人CheetahCheetah（猎豹）和猎豹）和WildCatWildCat（野猫）：

27、野猫）：奔跑速度极快，前者时速高达28.3英里/h（约45.5km/h），后者时速高达32km/h。民用类：民用类：1 1）四足机器狗）四足机器狗SpotSpot；2 2）人形机器人）人形机器人AtlasAtlas；3 3）货物搬运机器人）货物搬运机器人HandleHandle。资料来源：公司官网，澎湃新闻，机器之心公众号，光大证券研究所整理图15：波士顿动力产品迭代历程请务必参阅正文之后的重要声明 1.31.3、波士顿动力：深耕多年，机器人硬件技术积累深厚、波士顿动力：深耕多年，机器人硬件技术积累深厚 14 核心竞争力：核心竞争力：机器人硬件技术领先，动作灵活性优于同业水平。机器人硬件技

28、术领先，动作灵活性优于同业水平。（1）Atlas已经掌握了双腿跳远、后空翻、跳过路中障碍物、不打破步伐的前提下跳跃台阶等技能；（2）Atlas的控制软件使用了包括腿部、手臂和躯干在内的整个身体来掌握力量；与此同时，其他人形机器人公司刚刚在机器人双足行走能力上取得突破，灵活性远不及Atlas。可见，公司通过多年的产品迭代，已经将机器人的运动能力和灵活性推向行业领先水平。发展阻力：发展阻力：产品商业化落地不及预期，资金不足。产品商业化落地不及预期，资金不足。（1）商业化不及预期，早期军方撤资导致资金不足：早先，美国军方是波士顿动力技术研发的主力支持，后来由于研究成果存在单价费用过高（Atlas单台

29、成本190万美元）、维修困难、运行噪音过大、体积过大等问题，在多项成果都无法满足实际应用需求后，军方逐渐减少投入。美国军方的“撤资”致使波士顿动力资金不足，不得不选择被收购来保全自身；（2）七年三次易主，估值仅剩三分之一：公司成立至今多次被收购，前后包括Alphabet、日本软银和韩国现代。在2020年被韩国现代收购时，公司估值仅剩11亿美元。资料来源：公司官网，机器人大讲堂公众号，澎湃新闻，市值观察，光大证券研究所整理图16：Atlas双腿跳远图17：Atlas腿部结构请务必参阅正文之后的重要声明 1.31.3、波士顿动力：深耕多年，机器人硬件技术积累深厚、波士顿动力：深耕多年，机器人

30、硬件技术积累深厚 15 未来展望：未来展望：公司未来发展关键在于产品商业化落地，期待公司未来发展关键在于产品商业化落地，期待AIAI大模型的出现为公司带来新的增长机会。大模型的出现为公司带来新的增长机会。1 1）开展机器人在企业的首次规模化部署。）开展机器人在企业的首次规模化部署。根据奥托集团（Otto Group，全球最大的电子商务零售商之一）官网，该公司已经在2023年9月与波士顿动力公司签署协议，以帮助加强其物流业务。根据协议，未来两年Otto Group将在10多个设施中部署Spot机器人，在20多个设施中部署Stretch机器人。2 2）将）将ChatGPTChatGPT与机器人相结

31、合，探索与机器人相结合，探索AIAI在机器人上应用的可能性。在机器人上应用的可能性。2023年10月，波士顿动力公司在其官网上宣布了一项消息：他们成功地将ChatGPT与Spot相结合，开发出了一种会说话的导游机器狗。据了解，为了让Spot开口说话，波士顿动力公司使用了OpenAI的ChatGPT API以及一些开源的大语言模型来训练Spot的反应。公司在此前接近30年的发展历史中积累了丰厚的技术经验，但产品的商业化推广仍然存在瓶颈。期待公司通过AI大模型加速训练机器人，使机器人在未来适应更加丰富的应用场景，加速技术和产品商业化落地的进程。资料来源：波士顿动力官网，奥托集团官网，澎湃新闻，光大

32、证券研究所整理图18：ChatGPT和Spot结合（会说话的导游机器狗）请务必参阅正文之后的重要声明 1.41.4、1X Technologies1X Technologies：第一代人形机器人：第一代人形机器人EVEEVE已经成功实现商业化已经成功实现商业化 16 1X Technologies1X Technologies：公司于公司于20142014年在挪威成立。年在挪威成立。公司第一款机器人医护助理轮式机器人EVE于2022年初推出，“保安EVE”于2023年5月推出并入驻一家制造工厂，第二款机器人NEO预计将于2024年发布。公司是公司是OpenAIOpenAI对外投资的第一家人形

33、机器人企业。对外投资的第一家人形机器人企业。2023年3月，1X曾宣布完成了融资金额高达2350万美元的A2轮融资，获得OpenAI旗下创业基金、Tiger Global以及一群挪威投资者的支持；2024年1月，公司完成融资金额高达一亿美元的B轮融资，由瑞典知名风投基金EQT Ventures领投，同时吸引了新投资者Samsung NEXT的加入，而现有投资者Sandwater、Skagerak Capital和Nistad集团也继续跟投。资料来源：公司官网，机器人大讲堂公众号，光大证券研究所整理图19：第一款机器人EVE 图20：第二款机器人NEO 请务必参阅正文之后的重要声明 1.41.

34、4、1X Technologies1X Technologies：第一代人形机器人：第一代人形机器人EVEEVE已经成功实现商业化已经成功实现商业化 17 已开发出第一代成熟产品已开发出第一代成熟产品EVEEVE：公司第一代产品名为EVE，是一款拥有两臂、两眼和四轮底盘的机器人，软件部分由OpenAI的ChatGPT提供支持，可以通过头部的LED面板直接对话，融合了VR、AI、智能导航等多种技术，使其具备了强大的拟人化执行能力，例如，转弯、开门、开窗、抬起物品等，能在各种环境中执行多种任务，如后勤和安保等。EVEEVE已经实现商业化：已经实现商业化：（1 1）医院后勤领域：）医院后勤领域：20

35、22年初，1X推出了医护助理轮式机器人EVE，已经在挪威Sunnaas医院进行测试，负责医院后勤工作，让护理人员解放出更多时间，关心患者。据悉，1X已经销售了140台人形机器人；（2 2）安保领域：）安保领域：2023年5月，1X推出“保安EVE”入驻一家制造工厂，负责监控和安全管理工作。1X创始人兼首席执行官Bernt yvind Brnich表示，安保人员已经习惯了使用技术，利用相机系统、警报传感器和动作传感器。现在，这些保安也将能够操作一批 EVE 机器人。EVEEVE暂未实现人形机器人的自主控制。暂未实现人形机器人的自主控制。由于人形机器人活动复杂，EVE暂未实现人形机器人的自主控制，

36、而主要采用AI与人工结合的方式控制，但一位操作员可同时操控一组多台EVE机器人。资料来源：公司官网，东四十条资本公众号，光大证券研究所整理图21：第一代人形机器人EVE和公司创始人&CEO 请务必参阅正文之后的重要声明 1.41.4、1X Technologies1X Technologies：结合类人机器人技术与“具身学习”：结合类人机器人技术与“具身学习”AIAI技术技术 18 核心竞争力核心竞争力1 1：硬件创新：硬件创新自主开发自主开发Revo1Revo1伺服电机和下一代双足人形机器人伺服电机和下一代双足人形机器人NEONEO 1 1）拥有“世界上最高的扭矩重量比”，奠定公司在机器人

37、领域的领先地位。）拥有“世界上最高的扭矩重量比”，奠定公司在机器人领域的领先地位。根据公开专利信息，Revo1采用了哈尔巴赫阵列的特殊磁铁排列技术哈尔巴赫阵列的特殊磁铁排列技术：1）不仅让电机更为紧凑和轻巧，还赋予了电机产生高扭矩的能力，使得Revo1的扭矩-重量比是市面上发动机的四倍；2）能够更加有效地将磁场指向转动轴，从而提高电机的效率；3）通过精准调整磁铁的厚度，能有效防止在高温和高扭矩环境下磁铁的退磁现象，从而确保电机的持久性能和稳定性。2 2）开发下一代家用双足人形机器人）开发下一代家用双足人形机器人NEONEO：提高机器人的类人性：提高机器人的类人性 NEO 重 30 公斤（66.

38、1 磅），高 167 厘米（65 英寸），约为人类的平均身高。它的运动范围与人类基本相同，双手十分灵巧，并且可以在硬拉或深蹲中举起 75 公斤（165.3 磅）的重量。由于NEO面向家庭场景，主要是用来处理日常家务，因此其高精度运动模仿了人类肌肉模式，并在铝芯之上覆盖了一层软层，在保障用户安全性的同时保证其能如人一般行走。截至目前，NEO不仅可以自然准确地穿门、爬楼梯，在 OpenAI 的软件加持下有望完成更多高难度任务以及完整的无人操作体验。资料来源：公司官网，机器人大讲堂公众号，极客公园公众号，光大证券研究所整理图22：人形机器人NEO 图23：人形机器人NEO 请务必参阅正文之后的重要

39、声明 1.41.4、1X Technologies1X Technologies：结合类人机器人技术与“具身学习”：结合类人机器人技术与“具身学习”AIAI技术技术 19 核心竞争力核心竞争力2 2：训练方式：训练方式开发“具身学习”和“共享自治”增强人形机器人的学习能力开发“具身学习”和“共享自治”增强人形机器人的学习能力 1 1）具身学习（）具身学习（Embodied LearningEmbodied Learning）AIAI技术用于数据搜集技术用于数据搜集：（1）原理：“通过人类专家的示范教学，将人类行为和人类思维克隆到机器中，与训练大语言模型的方法非常相似。”（2）具体方式：1X操作

40、员在工作室中，通过VR Teleop引导机器人完成各种真实场景，操作员不仅会展示他如何用身体完成任务的行为，还会展示他的思维过程，这样训练数据就会与他的思维过程贴上标签。这种互动提供了一个独特数据集，使机器人能够理解并适应各种模式和行为。在大规模地搜集了多样数据后，机器人就学会了一项新技能。2 2）共享自治（）共享自治（Shared AutonomyShared Autonomy）增强机器人的学习适应能力）增强机器人的学习适应能力：创建了一个数据反馈回路，涉及到人机协作，即机器人可以请求人类干预复杂任务。未来展望：未来展望：机器人硬件已经成熟，未来有望在机器人硬件已经成熟，未来有望在AIAI加

41、持下开拓更广泛的市场：加持下开拓更广泛的市场：早在2022年，1X与OpenAI合作开发具身学习模型。截止至2024年1月上旬，1X工作室中已有20个机器人正在收集数据，同时还有部署在客户端站点的EVE。据悉，1X接下来将重点对具身智能模型进行开发和训练。资料来源：公司官网，机器人大讲堂公众号，极客公园公众号，光大证券研究所整理图24：1X操作员通过VR Teleop训练机器人请务必参阅正文之后的重要声明 1.51.5、Agility RoboticsAgility Robotics：致力于实现商业化人形机器人量产：致力于实现商业化人形机器人量产 20 Agility RoboticsAg

42、ility Robotics：背靠亚马逊，机器人产品背靠亚马逊，机器人产品DigitDigit主要面向工业场景。主要面向工业场景。2022年，亚马逊成立了工业创新基金，投资10亿美元，以刺激供应链和物流创新，并进一步改善客户和员工体验。Agility Robotics成为该基金投资的首批公司之一。公司研发的机器人产品名为“Digit”，旨在作为“机器人同事”在仓库和工厂内运输和搬运货物。它具有手臂和双腿，可以爬楼梯、蹲下或进入狭小空间。公司的联合创始人兼CEO表示：“我们研发Digit的初衷是为了解决当今劳动力中存在的问题，比如工作损伤、倦怠、高流动性和无法填补的人力缺口，最终目标是让人类能够

43、更加人性化地工作。”资料来源：公司官网，机器人大讲堂公众号，CyberDaily公众号，光大证券研究所整理图25：Digit机器人请务必参阅正文之后的重要声明 1.51.5、Agility RoboticsAgility Robotics：致力于实现商业化人形机器人量产：致力于实现商业化人形机器人量产 21 核心竞争力核心竞争力1 1：人形机器人已经进入量产阶段。人形机器人已经进入量产阶段。当地时间2023年9月18日，初创企业Agility Robotics宣布，公司将在美国俄勒冈州开设一家机器人制造工厂“RoboFab”，计划在该厂大规模生产其人形物流仓储机器人“Digit”。该机器人

44、工厂占地面积7万平方英尺，建设开始于2022年，预计将于2024年开始交付机器人，第一年将有数百台Digit的产能，而到2027年，产能将扩大到10000台/年。核心竞争力核心竞争力2 2：已进入亚马逊物流中心“实习”，展现出卓越的工作能力。已进入亚马逊物流中心“实习”，展现出卓越的工作能力。Digit在亚马逊的“实习”始于2023年10月，此后亚马逊官方对于Digit实习期间表现进行了汇报：能够连续工作长达7.5小时，并且在执行任务时实现了100%的自主性；工作效率达到了人类速度的75%，并且拥有高达97%的任务完成成功率。资料来源：公司官网，机器人大讲堂公众号，Axios，光大证券研究所整

45、理图26：RoboFab机器人制造工厂请务必参阅正文之后的重要声明 2 2、美股科技巨头入局机器人赛道、美股科技巨头入局机器人赛道 22 2.1、人形机器人是AI的重要应用场景之一，美股科技巨头纷纷入局 2.2、英伟达：数据、大模型等全方位布局 2.3、谷歌：RT-1和RT-2端到端模型迭代迅速 2.4、Meta：V-JEPA视觉模型，实现自我监督进行学习请务必参阅正文之后的重要声明 2.12.1、美股科技巨头纷纷入局、美股科技巨头纷纷入局 23 AIAI大模型成为人形机器人商业化落地的关键，人形机器人是大模型成为人形机器人商业化落地的关键，人形机器人是AIAI的重要应用场景之一。的重要

46、应用场景之一。AIAI大模型成为人形机器人商业化落地的关键：大模型成为人形机器人商业化落地的关键：人形机器人与其他特定场景下的机器人存在一个极大的不同之处，即应用场景的多元化，相比特定场景下的机器人，人形机器人需要同时具备在家庭、服务、工业等众多场景运行的能力，这对用于训练人形机器人的数据和算力提出了极大的需求。AI大模型的强大算法能够大大提升训练机器人的效率，节约投入的时间和精力，并且能够让机器人更加适应通用化的场景，是人形机器人商业化落地的关键。人形机器人是人形机器人是AIAI的重要应用场景之一：的重要应用场景之一：人形机器人作为一种新兴的智能终端，也是AI技术重要的下游应用之一，未来可能

47、走进千家万户，背后将是巨大的市场空间。美股头部科技公司凭借算力、大模型和资金，纷纷押注人形机器人赛道。美股科技巨头美股科技巨头机器人机器人相关的布局相关的布局优势优势特斯拉（）硬件终端：人形机器人（）算法：算法系统（）算力：超算中心（）算法系统有着丰富的数据基础，来自于自动驾驶汽车此前收集到的数据；（）算力自有，不易受限；（）汽车的研发制造经验与人形机器人的研发制造互通，此前已有长期深厚积累。英伟达（）数据：模拟器将真实世界数据集扩大倍（）大模型：新成立实验室聚焦具身智能大模型研究（）开发平台：提供端到端、机器人开发平台（）对外投资：通过投资人形机器人初创公司和机器人工厂拓展在机器人领域的

48、布局（）对外合作：在机器人领域与追觅科技、禾赛科技、九号公司、奥比中光、宇树科技等有着相关合作（）具身智能已有部分研究成果，团队具备研发经验；（）新成立实验室由和领导，研发团队具备领域的顶尖水平；（）算力支持：上游芯片部署。微软（）对外投资：投资和（）大模型对外合作：软件支持；未来与合作开发人形机器人的模型（）大模型迭代迅速，技术实力雄厚；（）资金充沛：截止至年月，微软已经向注资多亿美元。谷歌大模型：和机器人模型端到端迭代迅速，端到端学习将加速机器人训练效率。大模型：模型已实现自我监督学习，迭代迅速。亚马逊对外投资：投资人形机器人公司和（）发展迅速，具备相关技术和人才积累；（）资金充沛：设

49、立工业创新基金对外投资表4：美股科技巨头布局机器人&AI进展资料来源：各公司官网，科创板日报，光大证券研究所整理请务必参阅正文之后的重要声明 2.22.2、英伟达：成立、英伟达：成立GEARGEAR实验室聚焦具身智能大模型研究实验室聚焦具身智能大模型研究 24 新进展：成立新进展：成立GEARGEAR聚焦具身智能大模型研究。聚焦具身智能大模型研究。2024年2月24日，英伟达宣布成立GEAR（Generalist Embodied Agent Research，通用具身智能体研究），由英伟达高级研究科学家Jim Fan与Yuke Zhu教授携手组建，旨在构建适用于虚拟与物理世界的具身智能体

50、的基础模型，致力于实现跨多模态、多场景的智能应用。具身智能已有成果：具身智能已有成果：EurekaEureka、VoyagerVoyager、MineDojoMineDojo、VIMAVIMA EurekaEureka：用GPT-4生成奖励函数，教会机器人完成了三十多个复杂任务：比如，快速转个笔，打开抽屉和柜子、抛球和接球，使用GPU加速的物理模拟进行训练，速度比实时快1000倍；VoyagerVoyager：把GPT-4放进我的世界在游戏中点亮科技树的速度是此前方法的15.3倍，同时获得的独特物品是此前的3.3倍，探索范围是2.3倍。Voyager完全借助游戏画面推理，一切操作与反馈通过文本

51、和游戏的Javascript API进行。第一个LLM驱动、能熟练玩我的世界的智能体。MineDojoMineDojo：提出一个由3个智能体组成的“具身GPT-3”，可以感知无限世界并在其中行动。MineDojo是一个将我的世界变成 AGI 研究游乐场的开放框架。VIMAVIMA：第一个带有机械臂的多模态LLM，为机器人学习引入了“多模态提示”。图27：Eureka 图28：Voyager 图29：MineDojo 图30：VIMA 资料来源：英伟达官网，财联社，量子位公众号，机器人大讲堂公众号，光大证券研究所整理请务必参阅正文之后的重要声明 2.22.2、英伟达：数据、开发平台均部署，积极

52、对外投资、英伟达：数据、开发平台均部署，积极对外投资&合作合作 25 利用模拟器扩大真实世界利用模拟器扩大真实世界数据数据集：集：在人形机器人目前非常稀缺的真实性物理数据方面，英伟达于2023年10月推出MimicGenMimicGen模拟器，模拟器，可将真实世界数据集扩大100倍，大大减少昂贵的人工演示工作、加快机器人AI化进程。部署人形机器人部署人形机器人开发平台开发平台：英伟达提供端到端端到端IsaacIsaac、JetsonJetson机器人开发平台机器人开发平台，结合生成式AI来支持大规模训练、开发和部署AI机器人，降低机器人开发门槛与开发成本。波士顿动力公司和宇树科技等公司都已经在

53、CES 2024上展示了基于英伟达机器人开发平台研制的机器人成果。对外投资对外投资&合作：合作：在投资方面，英伟达通过投资人形机器人初创公司FigureAI和机器人工厂Machina Labs拓展在机器人领域的布局。同时英伟达还与众多海内外人形机器人公司有着相关合作，可见其未来借助机器人实现增长的决心。机器人公司机器人公司合作内容合作内容波士顿动力开发芯片以实现强大的人工智能和计算机视觉技术进行机器人感知和控制瑞士机器人公司ANYbotics 共同开发增强四足机器人ANYmal的感知和导航能力 AIBrain 共同开发了芯片，适用于各种机器人应用的人工智能技术和解决方案 InOrbit

54、共同开发自主机器人和无人机提供云平台解决方案表5：英伟达和机器人公司合作资料来源：英伟达官网，机器人大讲堂公众号，机器人技术与应用公众号，科创板日报，光大证券研究所整理请务必参阅正文之后的重要声明 2.32.3、谷歌：发布、谷歌：发布RTRT-1 1、RTRT-2 2机器人模型机器人模型 26 20222022年年1212月开发出月开发出RTRT-1 1端到端模型端到端模型：这是一个基于机器人数据的端到端模型。输入端：可以把相机图片、指令与电动机命令作为输入；输出端：动作指令，包括7个维度的手臂动作指令、3个维度的基础移动指令和1个维度的状态切换指令。研究人员让机器人执行了超过 700

55、项任务，结果显示：在之前见过的场景、之前未见过的场景、被干扰场景、背景更换场景，搭载 RT-1 模型的机器人都展现出了更高的成功率。这是机器人首次通过庞大的、多样化的、任务无关的数据，展现出泛化性，执行了一些未曾见过的任务。20232023年年7 7月发布月发布RTRT-2 2：视觉视觉-语言语言-动作模型动作模型，理解能力理解能力、推理能推理能力力、泛化能力显著提升泛化能力显著提升。在这个模型里，谷歌将参数量从35M提高到55B。研究人员对RT-2模型进行了和RT-1一样的测试。结果显示，RT-2的理解能力、推理能力、针对未知场景的泛化能力都显著优于RT-1模型。图：的架构和训练对一个事先

56、训练好的模型进行了协同微调，使用了机器人和网络数据。最终的模型接收机器人摄像头的图像并直接预测机器人执行的动作资料来源：谷歌官网，读懂财经公众号，产品欧sir公众号，光大证券研究所整理请务必参阅正文之后的重要声明 2.42.4、MetaMeta：V V-JEPAJEPA教会机器理解和建模物理世界教会机器理解和建模物理世界 27 V V-JEPAJEPA模型：模型：通过观看视频教会机器理解和建模物理世界通过观看视频教会机器理解和建模物理世界。V-JEPA是由Meta公司首席AI科学家Yann LeCun基于JEPA架构开发的一种新型视频预测模型，它是一种通过观看视频来学习理解物理世界的新型视觉

57、模型，旨在让人工智能有能力通过形成其周围环境的内部模型来规划、推理和执行复杂的任务。特征：特征：1 1）自我监督学习：自我监督学习：V-JEPA的架构并不依赖于常见的图像编码器、文本和负样本或其它监督学习输入，而是采用自我监督学习，这意味着它能够在没有标记数据的情况下进行训练，这提高了其适应性和多样性。2 2）以特征预测为目标：以特征预测为目标：不同于重建图像或依赖像素级预测，V-JEPA 专注于预测视频特征，这使得训练更加高效，且在后续任务中表现更佳。3 3）效率提高：效率提高：Meta 通过 V-JEPA 实现了显著的效率提升，在缩短训练时间的同时，仍然保持了高性能。4 4）多功能的视觉表

58、征：多功能的视觉表征：V-JEPA 能够产生适用于多种任务的视觉表征，无论是基于运动还是外观的任务，它都能有效捕捉视频数据中的复杂互动。优势：优势：教会机器真正理解世界教会机器真正理解世界，下一步开发出高级机器智能下一步开发出高级机器智能（AMIAMI）的的 JEPAJEPA。V-JEPA 的开发主要集中在感知方面理解各种视频流的内容，以实现对周围世界的即时情境感知。它的预测器在联合嵌入预测架构中扮演了一个早期的物理世界模型角色，能够在不需深入分析每个细节的情况下理解视频帧中的事件。Meta 的未来目标是利用这一预测模型进行规划和序列决策任务，使其应用范围扩展到感知之外。图：模型方法论资料来

59、源：官网，大模型实验室公众号，光大证券研究所整理请务必参阅正文之后的重要声明 3 3、未来展望、未来展望 28 3.1、硬件层面：突破瓶颈，运动性能和灵活性提升 3.2、量产能力和商业化：降本&控制良率，产品上市进程加快 3.3、软件算法：“具身智能”为人形机器人通用性赋能请务必参阅正文之后的重要声明核心观点核心观点 29 上游：零部件软件算法中游：人形机器人下游：应用场景硬件零部件软件算法减速器行星减速器谐波减速器无框力钜电机减速器电机丝杠传感器空心杯电机行星滚柱丝杠视觉传感器力矩传感器惯导摄像头激光雷达毫米波雷达超声波雷达微软微软（）；英伟达（）；英伟达（）；谷歌（）；谷歌（；）；）；

60、（）；特斯拉）；特斯拉（）工业物流；特斯拉（特斯拉（）；波士顿动力；优必选优必选（）日本纳博特斯克（纳博特斯克（）日本哈默纳科（哈默纳科（）美国科尔摩根（科尔摩根（）；德国集团；日本电产日本电产（）瑞士；德国；瑞士德国舍弗勒（舍弗勒（）；瑞士图像传感器镜头（）；禾赛科技（）；禾赛科技（）；速腾聚创）；速腾聚创（）法雷奥（法雷奥（；）；海拉（）；海拉（）；博世）；博世（）；大陆集团（）；大陆集团（；）；德尔福美国美国（）（）；日本）；日本（）医疗教育家用专用机器人医疗物流教育人形机器人工业海外机器人产业链梳理海外机器人产业链梳理资料来源：各公司官网，化工仪器网，前瞻经济学人，半导体产业纵横，

61、电子发烧友，公众号，中国机器人网公众号，光大证券研究所整理图33：海外机器人产业链梳理请务必参阅正文之后的重要声明 3.13.1、硬件层面：突破瓶颈，运动性能和灵活性提升、硬件层面：突破瓶颈，运动性能和灵活性提升 30 人形机器人智能化的前提是突破硬件性能的瓶颈。人形机器人智能化的前提是突破硬件性能的瓶颈。Figure的CEO Brett此前在访谈中表示，“我们以为能很容易买到现成的，但市场上根本没有好的驱动器、电池、控制软件和中间件操作系统解决方案。传感器虽然有一些现成的，但我们几乎都是自己制造下一代机器人的电子元件，并不是因为我们想，而是不得不。”可见，即便已经有企业布局人形机器人的上

62、游零部件，但这些零部件存在不能满足人形机器人使用需求的情况。我们认为存在以下原因：1 1）零部件的尺寸、重量不能满足需求：）零部件的尺寸、重量不能满足需求：Figure曾自主研发了执行器，相比市面上具有相同扭矩的执行器，Figure自主研发的版本在尺寸上减半，更加能够满足人形机器人轻量化的要求。市面上的零部件可能并非人形机器人专用，存在和人形机器人不适配的问题；2 2）零部件的性能不能满足要求：）零部件的性能不能满足要求：随着各家企业对人形机器人类人化的要求提升，零部件的精度不足，无法使人形机器人展现出更加灵活的运动能力，或者更加强大的承重能力。资料来源：海外独角兽公众号，光大证券研究所整理

63、零部件性能提升的两种路径：零部件性能提升的两种路径：（1 1）纵向合作，上游厂商满足下游需求：）纵向合作，上游厂商满足下游需求：上游零部件厂商根据下游机器人客户需求，合作研发出能够满足需求的零部件和解决方案；（2 2）自主研发，机器人企业自主研发硬件核心技术：）自主研发，机器人企业自主研发硬件核心技术：人形机器人企业自研零部件，根据实际需要进行研发，并掌握关键部件的技术。图34：自研的执行器（左）具有相同扭矩的现成执行器（右）请务必参阅正文之后的重要声明 3.23.2、量产能力和商业化：降本、量产能力和商业化：降本&控制良率，产品上市进程加快控制良率，产品上市进程加快商业化进程领先的人形机器

64、人企业正在走向量产出货阶段。商业化进程领先的人形机器人企业正在走向量产出货阶段。2023年末，Agility Robotics公司在美国俄勒冈州的一家机器人制造工厂“RoboFab”开业；2024年1月25日，马斯克在特斯拉财报电话会上表示，部分擎天柱很有可能在2025年某个时候交付。1)1)量产降本能力看好特斯拉。量产降本能力看好特斯拉。制造端，人形机器人将会走降本路线，这需要制造工厂具备丰富的生产经验，能够在原材料和零部件采选、生产工艺等环节降低成本，同时保证产品的良率。特斯拉此前生产并销售自动驾驶汽车，具备丰富的生产经验，而自动驾驶汽车与人形机器人在硬件组装和软件集成方面存在互通之处，可

65、迁移的生产经验是其他人形机器人企业不曾有的。我们看好特斯拉量产降本方面的能力。此外，特斯拉曾公开表明，Optimus售价预计不到2万美元。公司已经将低成本作为机器人的生产目标。2)2)预计特斯拉机器人商业化进程将会领先其他机器人企业。预计特斯拉机器人商业化进程将会领先其他机器人企业。特斯拉的优势在于数据+算力（Dojo超算中心）+算法（FSD控制系统）+制造（汽车工厂）全部有所积淀，具备人形机器人的核心技术和关键能力。在未来需求交付的过程中，有能力快速定位和解决问题，提升开发效率和产品质量。预计许多人形机器人企业将会在近几年快速将产品投放进市场。预计许多人形机器人企业将会在近几年快速将产品投

66、放进市场。实验室的数据满足不了训练机器人通用性的需求，人形机器人需要快速进入市场，收集更多真实场景的数据，以训练更加智能化的机器人，实现产品迭代更新。人形机器人将首先在物流仓储等领域布局，逐步成熟后再转向家用，家用人形机器人前路漫漫。人形机器人将首先在物流仓储等领域布局，逐步成熟后再转向家用，家用人形机器人前路漫漫。Figure和1X等公司将产品定位于“解决劳动力短缺”，而非“替代人类劳动力”，这是由于公司发现在工作场景中，存在大量工作环境恶劣，人类不愿意从事的工作，比如看管仓库（冬冷夏热）或者是重复性高的流水线工作。预计人形机器人将首先在工业场景中布局。而在工业场景中布局成熟后，机器人需要先

67、完全具备在家庭中各个场景下工作的技能，机器人需要先完全具备在家庭中各个场景下工作的技能，取得市场上广泛消费者的信任，才能够顺利向家用延展取得市场上广泛消费者的信任，才能够顺利向家用延展。因此，我们预计人形机器人进入家用场景仍有很长的路要走。资料来源：光大证券研究所整理量产降本良率提升物流仓储等场景家用场景图35：人形机器人未来发展趋势 31 请务必参阅正文之后的重要声明 3.33.3、软件算法：“具身智能”、软件算法：“具身智能”为人形机器人通用性赋能为人形机器人通用性赋能 32 20222022年，著名人工智能教授李飞飞在美国文理科学院的会刊年，著名人工智能教授李飞飞在美国文理科学院的会刊

68、 DdalusDdalus 上发表了一篇文章，指明了计算机视觉未来的三个发展方向：具上发表了一篇文章，指明了计算机视觉未来的三个发展方向：具身智能、视觉推理和场景理解。身智能、视觉推理和场景理解。方向方向1 1：具身智能：具身智能（EmbodiedEmbodied AIAI）通过在物理世界和数字世界的学习和进化，达到理解世界、互动交互并完成任务的目标。具身智能是由“本体”和“智能体”耦合而成且能够在复杂环境中执行任务的智能系统。具身智能研究成果已经涌现具身智能研究成果已经涌现。在基于Transformer的大语言模型浪潮带领下，微软、谷歌、英伟达等大厂，以及斯坦福、卡耐基梅隆等高等学府均开展了

69、具身智能的相关研究。（1）微软基于ChatGPT的强大自然语言理解和推理能力，生成控制机器人的相关代码；（2）英伟达VIMA基于T5模型，将文本和多模态输入交错融合，结合历史信息预测机器人的下一步行动动作；（3）斯坦福大学利用LLM的理解、推理和代码能力，与VLM交互并生成3D value map，来规划机械臂的运行轨迹；（4）谷歌具身智能路线较多，包括从PaLM衍生来的PaLM-E，从Gato迭代来的RoboCat，以及最新基于RT-1和PaLM-E升级得到的RT-2。方向方向2 2:视觉推理视觉推理理解二维场景中的三维关系，例如将“把金属马克杯搬回麦片碗左边”的指令。方向方向3 3:场景理

70、解场景理解机器能够理解场景中的人，包括社会关系和人类意图；计算机视觉和人类视觉一样，将不仅仅是感知，而是深度认知。资料来源：Li Fei-Fei&Ranjay Krishna Searching for Computer Vision North Stars，新智元公众号，光大证券研究所整理计算机视觉具身智能视觉推理场景理解图36：计算机视觉未来发展方向请务必参阅正文之后的重要声明 3.33.3、软件算法：“具身智能”、软件算法：“具身智能”为人形机器人通用性赋能为人形机器人通用性赋能 33“具身智能具身智能”为人形机器人通用性赋能为人形机器人通用性赋能，但仍面临诸多挑战但仍面临诸

71、多挑战。具身智能作为迈向通用人工智能（AGI）的重要一步，是学术界和产业界的热点，随着大模型的泛化能力进一步提升，各种具身方法和智能体不断涌现，但是要实现好的具身智能，会面临算法、工程技术、数据、场景和复杂软硬件等的诸多挑战。资料来源：甲子光年公众号，光大证券研究所整理本体本体人形机器人智能体智能体多模态模型数据数据真实数据虚拟数据学习和进化架构学习和进化架构解决硬件的关键零部件技术突破，形成具有优秀运动能力和操作能力的平台级通用机器人产品设计强大的智能体系统，完成高速的数据采集、传输和处理，以及实时的决策反应，用高算力做支撑需要大量高质量的行业数据：大量的人类操作数据+

72、实际业务的数据通过虚拟和真实的交互，形成持续学习和进化的能力，使具身智能得以演进图37：具身智能的四个核心要素及未来需要突破的难点核心要素核心要素难点突破难点突破请务必参阅正文之后的重要声明风险提示风险提示技术发展不及预期：技术发展不及预期：人形机器人的未来快速发展取决于硬件性能的突破和AI在数据、算法、算力上的加持，若相关技术的发展不及预期，将会导致人形机器人的进一步发展受到阻碍。商业化落地不及预期：商业化落地不及预期：人形机器人最终目标是面向更加通用化的市场，若未来人形机器人产品满足不了市场需求，或是和市场预期不匹配，将会因商业化落地不及预期导致行业发展陷入瓶颈。相关技术被不当使

73、用或存在缺陷：相关技术被不当使用或存在缺陷：随着AI的引入，人形机器人正在变得更类人、更智能，若人形机器人相关技术被不当使用或存在缺陷，将会使人形机器人行业陷入伦理道德甚至法律的纠纷当中。34 海外TMT研究团队分析师：付天姿执业证书编号：S0930517040002 电话：邮件：联系人：黄铮电话：邮件：鹏华基金分析师声明分析师声明本报告署名分析师具有中国证券业协会授予的证券投资咨询执业资格并注册为证券分析师，以勤勉的职业态度、专业审慎的研究方法，使用合法合规的信息，独立、客观地出具本报告，并对本报告的内容和观点负责。负责准备以及

74、撰写本报告的所有研究人员在此保证，本研究报告中任何关于发行商或证券所发表的观点均如实反映研究人员的个人观点。研究人员获取报酬的评判因素包括研究的质量和准确性、客户反馈、竞争性因素以及光大证券股份有限公司的整体收益。所有研究人员保证他们报酬的任何一部分不曾与，不与，也将不会与本报告中具体的推荐意见或观点有直接或间接的联系。行业及公司评级体系行业及公司评级体系买入未来6-12个月的投资收益率领先市场基准指数15%以上；增持未来6-12个月的投资收益率领先市场基准指数5%至15%；中性未来6-12个月的投资收益率与市场基准指数的变动幅度相差-5%至5%；减持未来6-12个月的投资收益率落后市场基准

75、指数5%至15%；卖出未来6-12个月的投资收益率落后市场基准指数15%以上；无评级因无法获取必要的资料，或者公司面临无法预见结果的重大不确定性事件，或者其他原因，致使无法给出明确的投资评级。基准指数说明：A股市场基准为沪深300指数；香港市场基准为恒生指数；美国市场基准为纳斯达克综合指数或标普500指数。特别声明特别声明光大证券股份有限公司（以下简称“本公司”）成立于1996年，是中国证监会批准的首批三家创新试点证券公司之一，也是世界500强企业中国光大集团股份公司的核心金融服务平台之一。根据中国证监会核发的经营证券期货业务许可，本公司的经营范围包括证券投资咨询业务。本公司经营范围：证券经

76、纪；证券投资咨询；与证券交易、证券投资活动有关的财务顾问；证券承销与保荐；证券自营；为期货公司提供中间介绍业务；证券投资基金代销；融资融券业务；中国证监会批准的其他业务。此外，本公司还通过全资或控股子公司开展资产管理、直接投资、期货、基金管理以及香港证券业务。本报告由光大证券股份有限公司研究所（以下简称“光大证券研究所”）编写，以合法获得的我们相信为可靠、准确、完整的信息为基础，但不保证我们所获得的原始信息以及报告所载信息之准确性和完整性。光大证券研究所可能将不时补充、修订或更新有关信息，但不保证及时发布该等更新。本报告中的资料、意见、预测均反映报告初次发布时光大证券研究所的判断，可能需随时进

77、行调整且不予通知。在任何情况下，本报告中的信息或所表述的意见并不构成对任何人的投资建议。客户应自主作出投资决策并自行承担投资风险。本报告中的信息或所表述的意见并未考虑到个别投资者的具体投资目的、财务状况以及特定需求。投资者应当充分考虑自身特定状况，并完整理解和使用本报告内容，不应视本报告为做出投资决策的唯一因素。对依据或者使用本报告所造成的一切后果，本公司及作者均不承担任何法律责任。不同时期，本公司可能会撰写并发布与本报告所载信息、建议及预测不一致的报告。本公司的销售人员、交易人员和其他专业人员可能会向客户提供与本报告中观点不同的口头或书面评论或交易策略。本公司的资产管理子公司、自营部门以及其

78、他投资业务板块可能会独立做出与本报告的意见或建议不相一致的投资决策。本公司提醒投资者注意并理解投资证券及投资产品存在的风险，在做出投资决策前，建议投资者务必向专业人士咨询并谨慎抉择。在法律允许的情况下，本公司及其附属机构可能持有报告中提及的公司所发行证券的头寸并进行交易，也可能为这些公司提供或正在争取提供投资银行、财务顾问或金融产品等相关服务。投资者应当充分考虑本公司及本公司附属机构就报告内容可能存在的利益冲突，勿将本报告作为投资决策的唯一信赖依据。本报告根据中华人民共和国法律在中华人民共和国境内分发，仅向特定客户传送。本报告的版权仅归本公司所有，未经书面许可，任何机构和个人不得以任何形式、任何目的进行翻版、复制、转载、刊登、发表、篡改或引用。如因侵权行为给本公司造成任何直接或间接的损失，本公司保留追究一切法律责任的权利。所有本报告中使用的商标、服务标记及标记均为本公司的商标、服务标记及标记。光大证券股份有限公司版权所有光大证券股份有限公司版权所有。保留一切权利。保留一切权利。

友情提示

1、下载报告失败解决办法
2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。
3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

本文（海外机器人行业系列跟踪报告（一）：美股科技巨头纷纷入局AI大模型将推动机器人商业化落地-240314（37页）.pdf）为本站（Dimples）主动上传，三个皮匠报告文库仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知三个皮匠报告文库（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。