《电力设备行业人形机器人专题(上篇):历史、变化与未来-230724(36页).pdf》由会员分享,可在线阅读,更多相关《电力设备行业人形机器人专题(上篇):历史、变化与未来-230724(36页).pdf(36页珍藏版)》请在三个皮匠报告上搜索。
1、 请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 Table_Info1 电力设备电力设备 Table_Date 发布时间:发布时间:2023-07-24 Table_Invest 优于大势优于大势 上次评级:同步大势 Table_PicQuote 历史收益率曲线 Table_Trend 涨跌幅(%)1M 3M 12M 绝对收益-2%-4%-28%相对收益-1%1%-18%Table_Market 行业数据 成分股数量(只)283 总市值(亿)55,174.13 流通市值(亿)30,114.04 市盈率(倍)21.20 市净率(倍)3.07 成分股总营收(亿)26,648.87 成分
2、股总净利润(亿)2,064.53 成分股资产负债率(%)57.33 Table_Report 相关报告 鼎智科技(873593):微特电机领先企业,看好未来成长性-20230502 Table_Author 证券分析师:韩金呈证券分析师:韩金呈 执业证书编号:S0550521120001 Table_Title 证券研究报告/行业深度报告 人形机器人专题(上篇):历史、变化与未来人形机器人专题(上篇):历史、变化与未来 报告摘要:报告摘要:Table_Summary 历史:行业百花齐放,工业类崭露锋芒。历史:行业百花齐放,工业类崭露锋芒。自 1968 年通用电气试制第一
3、台双足机器人以来,人形机器人产业已经历了三个主要发展阶段,包括萌芽阶段(1960-1990)、发展阶段(1990-2010)以及“百花齐放”阶段(2010至今),行业技术日趋成熟。而以工业场景为主要用途的人形机器人产品持续迭代,涌现出以波士顿动力的 Atlas、特斯拉的 Optimus、Agility Robotics 的 Digit 为代表的优秀产品,家庭&商用场景中也出现以Engineered Arts 的 Ameca 为代表的产品。变化:政策持续加码,软件端迎来奇点,硬件端有待优化。变化:政策持续加码,软件端迎来奇点,硬件端有待优化。产业维度,产业维度,国内针对人形机器人的政策走向更为积
4、极的方向,包括对产业的顶层设计和产业链的各环节扶持都陆续出台了相关政策,人形机器人的国内产业环境正逐步得到优化。产品维度,产品维度,在 AI 技术的新一轮革命浪潮下,机器人在软件端也得到了极大优化,尤其是算法训练、感知能力和人机交互等方面取得了重大突破,比如在算法训练上,以英伟达、谷歌为代表的大厂先后推出 Isaac 和 Robocat 等机器人训练平台,为机器人在数据生成、预训练 AI 模型以及仿真等维度提供了成熟工具,在感知能力方面,AI 大模型的持续迭代,为多传感器融合技术的优化提供可能,帮助机器人更精准融合传感器信息,提高对外界环境的感知能力,而在人机交互方面,LLM 的使用帮助机器人
5、更好地理解和学习人类语言,进行语音交流和反馈,并且能将自然语言转化为行动指令;但硬件端在关键零部件技术及方案选择上仍存在一定问题,主要是下肢和灵巧手的关节模组设计和集成上,比如下肢的驱动器在反射惯性、传感器在负载能力、灵巧手的传感器在集成上都有进一步优化的空间。未来:工业场景率先放量,逐步渗透家庭未来:工业场景率先放量,逐步渗透家庭&商用。商用。考虑到成本、需求以及容错率等因素,我们认为,人形机器人将率先在工业场景落地,随后经过技术优化和成本下降,场景将逐步渗透到家庭和商用。工业场景方工业场景方面,面,人形机器人依靠性能和成本优势,未来在工业制造中有望部分替代传统工业机器人和人类劳动力;家庭家
6、庭&商用场景商用场景方面方面,人形机器人作为AI 的重要载体之一,能搭载包括 ChatGPT 等多种先进模型和技术,更好地识别环境和理解人类生活,为人类提供情绪价值,有望成为人类日常生活重要构成。对应到市场空间,根据我们的测算,到 2030 年工业场景的需求量将达到 328.4 万台,家庭&商用场景的需求量达到 43.5 万台,整体市场规模接近 400 亿美元。风险提示:风险提示:硬件优化不及预期硬件优化不及预期,成本下降不及预期成本下降不及预期,产业政策不及预期产业政策不及预期 -40%-30%-20%-10%0%10%2022/7 2022/10 2023/12023/4电力设备沪深300
7、 请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 2/36 电力设备电力设备/行业深度行业深度 目目 录录 1.历史:工业类人形机器人崭露锋芒历史:工业类人形机器人崭露锋芒.5 1.1.人形机器人发展的三阶段.5 1.2.以工业类为代表的产品持续迭代.7 1.2.1.工业类的代表之作.8 1.2.2.娱乐&服务类的代表之作.11 2.问题问题&变化:政策扶持加码,软件端迎来奇点变化:政策扶持加码,软件端迎来奇点.13 2.1.产业维度:国内政策不断加码.14 2.2.产品维度:软件端迎来奇点,硬件端有待优化.15 2.2.1.软件端:AI 赋能机器人.15 2.2.1.1.算法训练.
8、15 2.2.1.2.感知能力.18 2.2.1.3.人机交互.20 2.2.2.硬件端:零部件有待优化.23 2.2.2.1.下肢:行走稳定性.23 2.2.2.2.手部:零部件集成.26 3.未来:应用场景未来:应用场景&市场空间市场空间.28 3.1.工业场景:替代传统工业机器人和人类劳动力.28 3.1.1.性能+成本优势凸显.28 3.1.2.工业场景的市场空间.30 3.2.家庭&商用场景:成为人类生活的一部分.31 3.2.1.人机交互的价值体现.31 3.2.2.家庭&商用场景的市场空间.33 4.风险提示风险提示.34 ZZpY3XRZkUyX6M9R9PpNqQsQnOfQ
9、pPtMkPmOoQ8OrRzQxNsRrRwMqMpN 请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 3/36 电力设备电力设备/行业深度行业深度 图表目录图表目录 图图 1:加藤实验室研制出:加藤实验室研制出 WL-5 双足步行机器人双足步行机器人.5 图图 2:我国第一台仿人型机器人:我国第一台仿人型机器人“先行者先行者”.5 图图 3:本田:本田“ASIMO”仿人机器人仿人机器人.6 图图 4:索尼:索尼“SDR-3X”仿人机器人仿人机器人.6 图图 5:波士顿动力展示机器人最新成果:波士顿动力展示机器人最新成果.6 图图 6:特斯拉机器人最新展示:特斯拉机器人最新展示.6
10、 图图 7:人形机器人发展的三阶段人形机器人发展的三阶段.7 图图 8:人形机器人主流产品:人形机器人主流产品.8 图图 9:Atlas 跑酷视觉跑酷视觉“看到看到”和规划的信息和规划的信息.9 图图 10:3D 打印参与打印参与 Atlas 液压动力单元制造液压动力单元制造.9 图图 11:波士顿动力机器狗:波士顿动力机器狗/人发展历史人发展历史.10 图图 12:Digit(右)及其第一代产品(右)及其第一代产品 Cassie.11 图图 13:Agility robotics 团队关于如何实现双足机器人的深度学习的理论团队关于如何实现双足机器人的深度学习的理论.11 图图 14:Agil
11、ity Robotics 机器狗机器狗/人的发展历史人的发展历史.11 图图 15:西部世界中的人形机器人更偏向娱乐:西部世界中的人形机器人更偏向娱乐&服务型服务型.12 图图 16:Ameca.13 图图 17:Mesmer 平台的基本架构平台的基本架构.13 图图 18:Engineered Arts 机器人发展历史机器人发展历史.13 图图 19:针对人形机器人的政策逐渐增多:针对人形机器人的政策逐渐增多.14 图图 20:Isaac 的基本框架的基本框架.17 图图 21:Isaac 可实时渲染来自传感器上的物理数据可实时渲染来自传感器上的物理数据.17 图图 22:Isaac 通过构
12、建虚拟场景进行测试通过构建虚拟场景进行测试.17 图图 23:RoboCat 的训练周期的训练周期.18 图图 24:训练的成功率随着训练次数的增多而提高:训练的成功率随着训练次数的增多而提高.18 图图 25:后融合算法:后融合算法.19 图图 26:数据级融合:数据级融合.19 图图 27:TransFormers 的整体架构的整体架构.20 图图 28:BEV+TransFormers.20 图图 29:波:波士顿动力机器狗接入士顿动力机器狗接入 Chat gpt 后,实现与工作人员的直接对话后,实现与工作人员的直接对话.20 图图 30:Ameca 能做出一系列丰富的面部表情能做出一系
13、列丰富的面部表情.20 图图 31:谷歌打造的以语言为中心的智能体框架:谷歌打造的以语言为中心的智能体框架.21 图图 32:研究人员使用:研究人员使用 LLM 将给定的高级指令拆分为具体的行动规划将给定的高级指令拆分为具体的行动规划.22 图图 33:研发人员展示:研发人员展示 PaLM-E 如何分步骤控制机器如何分步骤控制机器人执行任务人执行任务.22 图图 34:VoxPoser 的具体流程和操作展示的具体流程和操作展示.23 图图 35:目前主流的四种驱动器:目前主流的四种驱动器.24 图图 36:四种驱动器的性能对比:四种驱动器的性能对比.24 图图 37:谐波减速器(上)、:谐波减
14、速器(上)、RV 减速器(中)、行星减速器(下)减速器(中)、行星减速器(下).24 图图 38:电机以差动配置布置,在不显著增加反射惯性情况下增加肢体的受力能力:电机以差动配置布置,在不显著增加反射惯性情况下增加肢体的受力能力.24 图图 39:行走速度越快,机器人受到的地面反作用力(:行走速度越快,机器人受到的地面反作用力(GRF)也越高)也越高.25 图图 40:不同机器人配置的传感器负载范围(:不同机器人配置的传感器负载范围(GRF range factor)为)为 1-2,即机器人行走或奔跑时,传感器能,即机器人行走或奔跑时,传感器能感知的最大的力为自身重量的感知的最大的力为自身重量
15、的 1-2 倍倍.25 图图 41:安装了冲击吸收部件的脚部结构,用以吸收机器人行走时传递的冲击力:安装了冲击吸收部件的脚部结构,用以吸收机器人行走时传递的冲击力.26 图图 42:带有定制的足部传感器的脚部结构:带有定制的足部传感器的脚部结构.26 图图 43:腾讯灵巧手:腾讯灵巧手 TRX-Hand.27 图图 44:腾讯机械臂:腾讯机械臂 TRX-Arm.27 图图 45:人类手指和机器人手指之间接触表面的差异:人类手指和机器人手指之间接触表面的差异.27 图图 46:具有内在触觉的:具有内在触觉的 3D 打印手掌、内部结构以及打印手掌、内部结构以及 3D 打印制造步骤打印制造步骤.27
16、 图图 47:Figure 公司的企业愿景:替代劳动力、家庭服务、外太空探索公司的企业愿景:替代劳动力、家庭服务、外太空探索.28 图图 48:我国工业机器人以搬运和焊接为主:我国工业机器人以搬运和焊接为主.29 图图 49:按作业方式分类的工业机器人:按作业方式分类的工业机器人.29 请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 4/36 电力设备电力设备/行业深度行业深度 图图 50:特斯拉:特斯拉 Optimus 在工厂展示分拣工作在工厂展示分拣工作.29 图图 51:波士顿动力:波士顿动力 Atlas 根据指令在工厂中灵活执行任务根据指令在工厂中灵活执行任务.29 图图 5
17、2:美国员工平均工资约为:美国员工平均工资约为 28.83 美元美元/小时小时.30 图图 53:2022 年欧盟的平均每小时劳动力成本估计为年欧盟的平均每小时劳动力成本估计为 30.5 欧元,欧元区为欧元,欧元区为 34.3 欧元欧元.30 图图 54:全球工业机器人保有:全球工业机器人保有量量.31 图图 55:全球劳动力数量:全球劳动力数量.31 图图 56:我国老龄化趋势越发明显(:我国老龄化趋势越发明显(%).32 图图 57:分年龄段分受教育程度的人口单身率(:分年龄段分受教育程度的人口单身率(%).32 图图 58:“萌妹萌妹”机器人具备多种功能机器人具备多种功能.33 图图 5
18、9:用户可通过手机:用户可通过手机 App 选择剧情让机器人表演选择剧情让机器人表演.33 图图 60:全球服务机器人销量(万台):全球服务机器人销量(万台).33 图图 61:全球服务机器人销售额(亿美元):全球服务机器人销售额(亿美元).33 表表 1:北京市机器人产业创新发展行动方案(:北京市机器人产业创新发展行动方案(20232025 年)部分内容年)部分内容.15 表表 2:机器人成本的敏感性分析(单位:美元:机器人成本的敏感性分析(单位:美元/小时)小时).30 表表 3:工业领域的人形机器人需求预测:工业领域的人形机器人需求预测.31 表表 4:家庭:家庭&商用领域的人形机器人需
19、求预测商用领域的人形机器人需求预测.34 请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 5/36 电力设备电力设备/行业深度行业深度 1.历史历史:工业类人形机器人崭露锋芒:工业类人形机器人崭露锋芒 1.1.人形机器人发展的三阶段 人形机器人的“萌芽阶段”人形机器人的“萌芽阶段”(1960-1990)。这一阶段的人形机器人特征为初具“人形这一阶段的人形机器人特征为初具“人形态”态”,研发重点着重在机器人的“下肢运动”。,研发重点着重在机器人的“下肢运动”。1968 年,美国的通用电气公司(RSmosher)试制了一台名为“Rig”的操纵型双足步行机器人机械,同年,日本早稻田大学加藤
20、一郎教授在日本首先展开了双足机器人的研制工作,并先后推出了WAP-1、WAP-3、WL-5 等持续迭代的双足机器人版本,自此人形机器人产业步入萌芽阶段。此外,除了日本在人形机器人研制上做出较大贡献外,包括英国、苏联等国家也纷纷加入机器人的研制上,例如,英国于 1970 年研制成功的“Witt”型双足机器人,苏联则研制出两轮双足行走机器人。而我国在人形机器人的研发起步相对较慢,自 1985 年始,国内几所科研院校才陆续开始人形机器人的研发工作,而直到 2000 年,中国国防科技大学经过多年的努力成果才研制出我国第一台仿人型机器人“先行者”,哈尔滨工业大学也自 1985 年研发双足步行机器人以来,
21、先后推出 HJT-I、HJT-II、HJT-III 等型号的机器人。图图 1:加藤实验室加藤实验室研制出研制出 WL-5 双足步行机器人双足步行机器人 图图 2:我国第一台仿人型机器人“先行者”我国第一台仿人型机器人“先行者”数据来源:仿人机器人的研究历史、现状及展望,东北证券 数据来源:仿人机器人的研究历史、现状及展望,东北证券 人形机器人的“发展阶段”人形机器人的“发展阶段”(1990-2010)。这一阶段的人形机器人特征为附加更多功。这一阶段的人形机器人特征为附加更多功能,研发重点从之前的“如何实现更好行走”到“赋予机器人更多其他的能,研发重点从之前的“如何实现更好行走”到“赋予机器人更
22、多其他的仿人特仿人特征征”。自 1986 年开始,日本丰田公司推出了 P 系列 1-3 型机器人,在 1997 年推出了“P3”和 2000 年推出了“ASIMO”,“ASIMO”除了优化步行方式外,还增加了对手部的操作和控制。同年,日本索尼于 2000 年推出人形娱乐机器人 SDR-3X,该机器人较以往产品最大的区别在于配备了声音识别和图像识别功能,可以根据音乐实现节奏运动。丰田和索尼公司推出的新一代人形机器人,将仿人机器人的研制和生产正式推向实用化、工程化和市场化。请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 6/36 电力设备电力设备/行业深度行业深度 图图 3:本田“:本田
23、“ASIMO”仿人机器人”仿人机器人 图图 4:索尼“:索尼“SDR-3X”仿人机器人”仿人机器人 数据来源:仿人机器人的研究历史、现状及展望,东北证券 数据来源:仿人机器人的研究历史、现状及展望,东北证券 人形机器人的“百花齐放阶段”(人形机器人的“百花齐放阶段”(2010 至今)。这一阶段的人形机器人特征为至今)。这一阶段的人形机器人特征为“智“智能化”,研发重点从之前的“能化”,研发重点从之前的“赋予机器人更多其他的仿人特征赋予机器人更多其他的仿人特征”到“”到“机器人机器人如何如何衍生自主决策能力”衍生自主决策能力”。海外方面,波士顿动力、特斯拉、Engineered Arts、软银等
24、海外科技企业纷纷发布自主研发的人形机器人,比如 2015 年软银率先实现人形机器人的商业化进程、2021 年波士顿动力展示运动能力出色的 Atlas、2022 年特斯拉发布 Optimus 原型机等。国内方面,小米、优必选、傅利叶智能等厂商也积极入局。该阶段的人形机器人除了运动模块和感知模块更为成熟外,最突出的特点就是大模型的应用,机器人的训练速度和效率大大提高、强化机器人的自主决策能力。图图 5:波士顿动力展示机器人最新成果波士顿动力展示机器人最新成果 图图 6:特斯拉机器人最新展示特斯拉机器人最新展示 数据来源:科技最前线,东北证券 数据来源:特斯拉官网,东北证券 请务必阅读正文后的声明及
25、说明请务必阅读正文后的声明及说明 7/36 电力设备电力设备/行业深度行业深度 图图 7:人形机器人发展的三阶段人形机器人发展的三阶段 数据来源:仿人机器人的研究历史、现状及展望,特斯拉官网,小米官网,波士顿动力官网,索尼官网,Agility Robotics 官网,东北证券 1.2.以工业类为代表的产品持续迭代 人形机器人发展至今,涌现出适用于各种应用场景的产品,按照目前主流的场景应用分类,可大致分为工业类、娱乐&服务类等两大类,对应用在工业场景、家庭&商业场景。工业类人形机器人主要用于处理物流、制造、安保和复杂任务等领域的工业场景,替代的是低级和高危人工劳动、以及部分传统工业机器人无法胜任
26、的工种,比如流水线的后道工序。娱乐类主要实现情感交互和表演展览等场景,而服务类则主要是从事家庭服务、教育、引导、送餐等场景。请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 8/36 电力设备电力设备/行业深度行业深度 图图 8:人形机器人主流产品人形机器人主流产品 数据来源:特斯拉官网,波士顿动力官网,Agility Robotics 官网,1X Technologies 官网,Sanctuary AI 官网,Figure 官网,Engineered Arts 官网,小米官网,Robotsguide,东北证券(注:*为预测值)1.2.1.工业类的代表之作 由于工业场景相较于家庭、商用
27、场景而言,环境的可预测、可控性更强以及机器人自身造成危害的影响性更低,对处于发展初期的人形机器人而言,工业场景的容错率相对更高,因此比较适合厂商作为人形机器人投放的第一站。纵观近几年的机器人新品,工业类产品进展也相对较快,比如波士顿动力的 Atlas、特斯拉的 Optimus、Agility Robotics 的 Digit 等。波士顿动力:波士顿动力:成立于 1992 年,公司先后借助美国军方、谷歌、软银、现代集团等股东的支持,陆续发布了 Big Dog、Little Dog、Cheetah、Spot 等四足机器狗和 Atlas 等双足机器人。于 2022 年和母公司现代汽车共同成立了 BD
28、AII(波士顿动力人工智能研究所),目标是“引领人工智能和机器人技术的进步”,目前在围绕 Spot 和 Stretch这类机器人的商业道路和独立的完全专注于 Atlas 的技术研究道路两条路线上齐头并进。Atlas:高约 1.5 米,重 80 公斤,拥有 28 个自由度,主动力来源为电池,驱动方式为液压,配备 RGB 与深度相机,机器人本体共搭载 3 台 NUC/工控机负责整体控制系统的运算。Atlas 最突出的亮点是能实现像最突出的亮点是能实现像人一样奔跑、跳跃和跨人一样奔跑、跳跃和跨越障碍,越障碍,而而实现这种跑酷动作的核心源于其独特的感知、规划、驱动以及驱动实现这种跑酷动作的核心源于其独
29、特的感知、规划、驱动以及驱动背后的制造技术背后的制造技术。感知能力:感知能力:基于配备的 RGB 摄像头和 TOF 深度传感器,Atlas 能快速生成环境的点云,再使用一种名为多平面分割的算法从点云中提取平面,机器人中的映射系统将算法获取的信息构建模型,从而辅助后续的行为规划。规划能力:规划能力:一方面,一方面,设计人员通过离线优化,为 Atlas 不断创建新的运动轨迹,而在这些给定的轨迹设计下,Atlas 会在实际行动中尽量选择与之匹配的行为动作,从而 请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 9/36 电力设备电力设备/行业深度行业深度 减少相关的计算量,提升运动准确性。另
30、一方面,另一方面,在实际的运动过程中,Atlas 会使用 MPC(模型预测控制器,该控制器使用机器人动力学模型来预测机器人未来的动作并计算出当前要做的最优动作)来调整实时的力、姿势和行为时间等细节,以完成“没有见过的动作”。进一步而言,进一步而言,MPC 的预测特性还允许 Atlas 跨越行为边界来查看后续动作,使得机器人能实现从一个动作到另一个动作的平滑过渡。运动能力:运动能力:在完成感知和动作规划后,机器人要“跑起来”,而液压系统为 Atlas 产生了强大的推力,在同样的空间内,用液压元件所做的功是电机的数倍甚至是数十倍,因此液压系统能帮助机器人实现奔跑、跳跃、后空翻等高难度的动作。制造制
31、造技术:技术:感知、规划、运动是感知、规划、运动是 Atlas 跑酷的跑酷的核心程序核心程序,而这些动作实现的背后离,而这些动作实现的背后离不开“如何将重达不开“如何将重达 80kg 的物体推上天”的制造技术。的物体推上天”的制造技术。波士顿动力将 3D 打印应用于制造 Atlas 机器人的液压动力单元(HPU),用于生产稳态控制器、传感器、过滤器、排污阀等部件,好处是可以制造紧凑、轻量型阀块,极大减轻重量并提高空间利用率,从而赋予 Atlas 跳跃和翻腾所需的强度/重量比。图图 9:Atlas 跑酷视觉跑酷视觉“看到”“看到”和规划的信息和规划的信息 图图 10:3D 打印参与打印参与 At
32、las 液压动力单元制造液压动力单元制造 数据来源:机器之心,东北证券 数据来源:3D 打印技术参考,东北证券 请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 10/36 电力设备电力设备/行业深度行业深度 图图 11:波士顿动力机器狗:波士顿动力机器狗/人发展历史人发展历史 数据来源:波士顿动力官网,东北证券 Agility Robotics:成立于 2015 年,公司以生产腿部行走机器人为主,专门为物流和制造企业提供仓库机器人,以应对季节性需求波动造成的劳动力短缺,主要是可以协助人工完成卸货搬箱、管理货架、最后一公里配送等任务。Digit:高约 1 米,重 31 公斤,拥有 18
33、 个自由度。Digit 在高难度动作、复杂环境适应等高阶维度可能不如波士顿动力的 Atlas 以及特斯拉的 Optimus,但是作为仓储的搬运机器人,其突出的特点就是“实用”,即能在不充电情况下“暴走”5km,意味着意味着Digit能较好地自适应工厂中的各种复杂场地和实现高续航能力能较好地自适应工厂中的各种复杂场地和实现高续航能力,完美适配特定场所的使用需求完美适配特定场所的使用需求,而而能能实现稳定敏捷的运动实现稳定敏捷的运动,核心核心源于其深度学源于其深度学习能力和习能力和独特独特的运动的运动设计设计。学习能力:学习能力:让 Digit 学会走路,需要用到强化学习和模仿学习。其中,强化学习
34、解决马尔可夫决策过程(Markov Decision Process,MDP)的最优策略,需要用到策略梯度算法;而模仿学习则需要解决参数策略问题。用关键算法 DASS 来搞定数据集,再将 DASS 于强化学习、模仿学习结合在一起,为机器人设定策略。通过强化学习和模拟学习,训练双足机器人模拟及适应不同高度的地面变化,而且只需要稍加改变现有的平地强化学习框架,就可以在楼梯、不平的地面等场景中稳健地行走。运动运动设计设计:在下肢架构上,Digit 及其第一代产品及其第一代产品 Cassie 最大的特点就是最大的特点就是他的“鸵他的“鸵鸟腿”鸟腿”,在动力学部分参考了鸟类步态,尤其是鸵鸟,膝盖设计成弯
35、曲形状,能以比较自然的方式去减缓震动。同时在自由度配置上,Digit 在下肢也配备了较多的自由度,每条腿 5 个自由度,其中臀部 3 个,允许腿向前、后、侧三个方向摆动,胫骨和脚踝各 1 个自由度,但区别于臀部由电机驱动,后两者是附着在弹簧上,有助于机器人在遇到障碍物时也能保持平衡。另外,Digit V2 版本还对足部进行了优化,增加了横滚自由度,使得 Digit 可以在不进行侧向踩踏的条件下抵抗侧向力冲击,甚至可以实现单脚的静态平衡。请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 11/36 电力设备电力设备/行业深度行业深度 图图 12:Digit(右)(右)及其第一代产品及其第
36、一代产品 Cassie 图图 13:Agility robotics 团队关于如何实现双足机器团队关于如何实现双足机器人的深度学习的理论人的深度学习的理论 数据来源:Agility Robotics 官网,东北证券 数据来源:Blind Bipedal Stair Traversal via Sim-to-Real Reinforcement Learning,东北证券 图图 14:Agility Robotics 机器狗机器狗/人的发展历史人的发展历史 数据来源:Agility Robotics 官网,东北证券 1.2.2.娱乐&服务类的代表之作 工业类人形机器人侧重点在“工作”,而娱乐&服
37、务类则着重在“交互”,前者更多是在传统工业机器人基础上增加“人形态”,使得机器人更适合替代人类工作,而后者在某种意义层面更符合“仿人机器人”的概念本质-能成为“人”。请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 12/36 电力设备电力设备/行业深度行业深度 图图 15:西部世界中的人形机器人更偏向娱乐:西部世界中的人形机器人更偏向娱乐&服务服务型型 数据来源:百度,东北证券 Engineered Arts:成立于 2005 年,公司至今推出了 6 款机器人,最新型号 Ameca是 Engineered Arts 机器人技术的集大成者。公司的产品已用于娱乐与教育行业。Ameca:高
38、 1.87 米,重 49 公斤,拥有 51 个主要关节并配置 52 个电动马达。Ameca 最突出的特点就是能实现复杂的脸部表情管理,而这样逼真的仿人表情核心在于结合了 AI 与 AB(Artificial Body)技术。此外,Ameca 在近期接入了 GPT-4 训练其语言能力、嵌入了 Stable Diffusion 赋予了自身绘画能力。因此,可以看到 Ameca 除了运动能力外,在各方面都不断逼近人类的真实行为。而而 Ameca 能实现这样的动作表现,离不开其底层系统,包括机器人操作系统能实现这样的动作表现,离不开其底层系统,包括机器人操作系统Tritium 和工程艺术系统和工程艺术系
39、统 Mesmer。Tritium:该系统类似于“大脑”,主要负责智能化和各个机械结构之间的联动。Tritium 可以直接在浏览器运行,适用几乎任何编码语言和多种软件,登录后即可快速处理各种数据,远程控制机器人面部、头颈、四肢等的各方面组件,使得机器人适应环境的突然变化并即时做出响应,保证人机交互的安全和乐趣。Mesmer:该系统负责展现身而为人的“灵魂”,像是给出人类的情绪表情和肢体语言。为了让 Ameca 看起来像人,Mesmer 平台首先解决的是关节问题,通过对颈部的设计,让头部可顺滑转移到任何方位,其次是通过搭配 LIDAR 设计侦测移动物体,让机器人能一直注视和它说话的人类,然后通过对
40、手臂、手腕、肩部等部位的设计,让机器人能做出微妙的肢体语言,比如“耸肩”,最后搭配上人工皮肤,使得Ameca 从语言表达到行为动作,都表现得和人一样流畅自然。请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 13/36 电力设备电力设备/行业深度行业深度 图图 16:Ameca 图图 17:Mesmer 平台的基本架构平台的基本架构 数据来源:Engineered Arts 官网,东北证券 数据来源:Engineered Arts 官网,东北证券 图图 18:Engineered Arts 机器人发展历史机器人发展历史 数据来源:Engineered Arts 官网,东北证券 2.问题
41、问题&变化变化:政策扶持加码,软件端迎来奇点:政策扶持加码,软件端迎来奇点 人形机器人从提出概念到最近一年各厂商最新型号的推出,已经迈过了 60 个年头,发展阶段也从“萌芽”到现今的“百花齐放”,工业类出现了以波士顿动力、特斯拉为代表的优秀产品,娱乐&服务类进展也持续推进,特别是最近几年,人形机器人的产业发展持续超乎市场预期。而站在当前时点,我们可以看到整个人形机器人产而站在当前时点,我们可以看到整个人形机器人产业自上而下都出现了推动产业和产品向下一阶段业自上而下都出现了推动产业和产品向下一阶段演变演变的新变化,的新变化,另一方面另一方面从产品本从产品本身角度来看,人形机器人也存在不少的问题有
42、待解决。身角度来看,人形机器人也存在不少的问题有待解决。具体而言:具体而言:产业维度:产业维度:今年以来,国内针对人形机器人的政策走向更为积极的方向,包括对产业的顶层设计和产业链的各环节扶持都陆续出台了相关政策,人形机器人的国内产业环境正逐步得到优化,我们认为,此举或类似此前新能源车和光伏产业爆发前夕,政策的持续加码下的产业正逐步走出平台期、迈向下一阶段。产品维度:产品维度:人形机器人按照系统进行划分,可大致分为感知、控制、执行系统,其中感知和控制系统主要依赖算法、模型等软件,执行系统则主要是通过执行器及其中的零部件来实现。软件端,软件端,随着近年来大模型的爆发性发展,机器人的算法训练、感知能
43、力和人机交互等方面都得到极大地改善,可以说软件端在 请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 14/36 电力设备电力设备/行业深度行业深度 这一轮 AI 革命中迎来了奇点时刻,机器人作为 AI 技术的载体也跟随 AI 的变革出现了巨大变化。硬件端,硬件端,相较于软件端的问题不断得到优化,机器人在下肢行走和手部集成等方面上仍存在一定的硬件问题。简而言之,我们认为,虽然硬件端的问题有待完善,但受益于产业维度的政策催化和产品维度的软件优化,人形机器人产业应该会比之前的三个发展阶段“走得更快”,更多的优秀产品也有望加速落地,推动人形机器人最终走向人类社会。2.1.产业维度:国内政策不
44、断加码 今年以来,针对机器人以及人形机器人的政策呈现显著变化。今年以来,针对机器人以及人形机器人的政策呈现显著变化。一是从数量维度来看,2023 年提出的相关文件明显要比往年更多,根据不完全统计,今年出台的政策文件共计 6 份,而 2019-2022 年间共计出台的相关政策文件才 8 份,可以看到国家在对机器人产业的扶持力度上不断加码;二是发布政策的部门由中央层面逐步扩散到地方层面,比如在 2019-2022 年,发行部门均为包括发改委、工信部、科技部等部委级以上的单位,但是今年以来,包括上海、深圳、北京等一线城市均出台了相关的机器人行动方案,我们认为此举意味着各地政府开始深入落实国家对于机器
45、人产业的支持指导,有望加速机器人产业的落地,推动相关企业在主流城市的发展;三是从政策的内容来看,今年以来出台的政策更多提及“人形机器人”这一概念,而非笼统的“机器人”,比如北京的行动方案中,提及“对标国际领先人形机器人产品,支持企业和高校院所开展人形机器人整机产品、关键零部件攻关和工程化,加快建设北京市人形机器人产业创新中心,争创国家制造业创新中心。”,可以看出,政策的重点从最初聚焦在传统工业机器人逐步扩散到人形机器人上面。图图 19:针对人形机器人的政策逐渐增多:针对人形机器人的政策逐渐增多 数据来源:政府网站,东北证券 请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 15/36
46、电力设备电力设备/行业深度行业深度 进一步而言进一步而言,即使是今年发布的机器人政策也呈现出显著变化即使是今年发布的机器人政策也呈现出显著变化。我们将北京市在 6月 28 日发布的北京市机器人产业创新发展行动方案(20232025 年),与之前上海、深圳、山东等省市发布的相关政策作对比,可以发现,最明显的区别在于:之前的政策更多是立足在顶层设计维度对机器人及人形机器人产业作出指导,对产业在发展趋势上提供了建议,而北京的行动方案除了顶层设计外,特别地将人形机器人产业链中重要的零部件单独提出来,包括减速器、伺服驱动系统、控制器、传感器、末端执行器等,对其也同样提出了对应的指导意见。我们认为,北京的
47、行动方案有着更为重要的意义,一是代表着产业政策从顶层设计落脚到具体的产业链环节,为各地方政府对相关企业的扶持提供了更为明确的指导和要求,加速具体细则的落地;二是重点提及人形机器人产业链中的关键环节,对技术难度大且价值量高的零部件环节和企业提供支持,有望进一步完善我国人形机器人产业链,为后续产业链降本奠定基础,加速下游人形机器人产品的迭代和商业化落地。表表 1:北京市机器人产业创新发展行动方案(北京市机器人产业创新发展行动方案(20232025 年)年)部分内容部分内容 零部件零部件 文件内容文件内容 减速器减速器 研发旋转矢量(RV)、谐波等减速器先进设计技术和精密加工工艺,突破高强度耐磨材料
48、、精密机加工、高精度装配、高速润滑、高效热管理、先进检测等技术瓶硕提高产品可靠性和稳定性 伺服驱动系统伺服驱动系统 突破高磁性材料、高精度编码器等技术,提升伺服电机结构设计、制造工艺、自整定水平和热控制能力,研制高精度、高功率密度和耐剧烈速度波动的伺服电机、驱动器及制动器 控制器控制器 研发振动抑制、惯量动态补偿、复杂运动控制等智能算法,研制多处理器并行、高实时性控制器。提升控制软件架构设计、任务调度等能力。研发机器人实时操作系统、系统仿真软件、机器视觉算法平台软件等。开发机器人控制高性能模拟仿真环境和自动离线编程技术增强人机交互和二次开发能力 传感器传感器 攻克力、热、光、电等先进传感器设计
49、、制造、封测技术优化精密加工工艺。提升微机电系统(MEMS)的工艺稳定性和良品率,研制 3D 视觉、热成像、六维力、激光雷达等传感器,加快突破肌电、脑电等前沿传感器技术 末端执行器末端执行器 提升末端执行器研发设计能力,提高柔性操作性能和荷载水平,研制灵巧五指手、柔性夹爪、范德华力吸附式末端夹爪、气炭式末端夹爪等促进模块化、通用化发展。数据来源:政府网站,东北证券 2.2.产品维度:软件端迎来奇点,硬件端有待优化 2.2.1.软件端:AI 赋能机器人 在人形机器人的产品层面,软件端的变化显得尤为突出,特别是 AI 技术的发展,逐步渗透到机器人研发和生产中,并在算法训练、感知能力、人机交互等多个
50、维度对人形机器人产生重大影响。2.2.1.1.算法训练 在现实世界中构建机器人需要从头开始创建数据集,这样做既耗时又耗费成本,并且训练速度较慢。开发人员为了降低成本并加快训练,逐步开始采用合成数据生成(SDG)、预训练 AI 模型(pretrained AI models)、机器人仿真(robotics simulation)、迁移学习(transfer learning)等一系列工具。而以英伟达、谷歌为代表的大厂近几年而以英伟达、谷歌为代表的大厂近几年在这些工具开发上均取得较好进展在这些工具开发上均取得较好进展,为机器人客户在研发和训练上提供更为成熟的,为机器人客户在研发和训练上提供更为成熟
51、的工具。工具。1)英伟达 请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 16/36 电力设备电力设备/行业深度行业深度 Isaac 是英伟达是英伟达推出的一款专门用于机器人环境模拟的引擎,提供从数据合成和训推出的一款专门用于机器人环境模拟的引擎,提供从数据合成和训练、到仿真和测试的全流程配套支持,他融合了机器人相关的深度学习、强化学习、练、到仿真和测试的全流程配套支持,他融合了机器人相关的深度学习、强化学习、SLAM、图像处理等的算法。、图像处理等的算法。基于英伟达强大的硬件支持,相较于此前常用的仿真器(VREP、ROS 等),Isaac 在性能、算法、渲染效果、生态支持等维度都明
52、显更为出色。数据合成:数据合成:Isaac Sim 是英伟达的一个机器人模拟应用程序及合成数据生成的工具,而 Isaac Sim Replicator 作为其中用于合成数据生成的引擎,可以生成物理级精确的 3D 合成数据,用以加速 AI 感知模型的训练和性能。模型训练:模型训练:NVIDIA NGC 汇集了通过 GPU 优化的 AI 软件、模型和 Jupyter Notebook 示例,包括各种预训练模型以及为 NVIDIA AI 平台优化的 AI 基准和训练方式。研发人员通过 NVIDIA NGC 选择合适的预训练 AI 模型后,通过NVIDIA TAO 进行进一步的训练和微调(NVIDIA
53、 TAO 作为一个可使用自定义数据训练、调整和优化的框架,使用 NVIDIA TAO 工具包能帮助研发人员微调 NVIDIA NGC 目录中的预训练 AI 模型)。仿真和测试:仿真和测试:研发人员通过使用仿真器,检测物体之间的潜在碰撞和识别碰撞物体之间的接触点,并计算机器人的传感器信号,借此来构建虚拟场景,在这个虚拟世界中,开发人员创建了机器人、环境以及机器人可能遇到的其他资产的数字版本。这些环境可以遵守物理定律,并模仿现实世界的重力、摩擦、材料和照明条件。在所构建的虚拟场景中,研发人员通过此前搭建的预训练模型进行运动规划和任务规划,并让机器人执行任务。在对虚拟场景中执行任务的机器人进行多次试
54、错和调整,以此不断优化控制信号,从而验证和优化机器人的设计、系统及其算法,为机器人在现实世界执行任务实现最高效率打下基础。至此,英伟达的至此,英伟达的 Isaac 平台从数据合成、模型训练到仿真测试等提供了全流程的配平台从数据合成、模型训练到仿真测试等提供了全流程的配套支持,帮助机器人客户实现套支持,帮助机器人客户实现 0-1 构建一个机器人,并大大降低了训练的成本和提构建一个机器人,并大大降低了训练的成本和提高了机器人训练的速度。高了机器人训练的速度。请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 17/36 电力设备电力设备/行业深度行业深度 图图 20:Isaac 的基本框架的
55、基本框架 数据来源:Nvidia 官网,东北证券 图图 21:Isaac 可实时渲染来自传感器上的物理数据可实时渲染来自传感器上的物理数据 图图 22:Isaac 通过构建虚拟场景进行测试通过构建虚拟场景进行测试 数据来源:Nvidia 官网,东北证券 数据来源:Nvidia 官网,东北证券 2)谷歌 2023 年 6 月 20 日,发布名为 Robocat 的 AI 模型,作为世界上第一个能解决和适应多种任务的模型,能安装在不同的现实机器人上使用。Robocat 是一个用于机器人是一个用于机器人操作的能实现自我迭代的智能体,可以在虚拟和现实世界中实现多项任务,包括对操作的能实现自我迭代的智能
56、体,可以在虚拟和现实世界中实现多项任务,包括对文字、图像、语音等的处理。文字、图像、语音等的处理。Robocat 最大的特点是在于“自我迭代”,所谓的自我迭代是指基于一定数量的源于现实世界的数据集,对该数据集进行微调后衍生出新的数据集,将现实世界和衍生出来的数据集进行融合,并在此基础上进行新的训练,请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 18/36 电力设备电力设备/行业深度行业深度 以此循环反复继而不断扩充智能体的学习数据。具体来说,每个新任务的学习遵循5 个步骤:1.使用由人类控制的机械臂收集 100-1000 个新任务或机器人的演示;2.在这个新的任务/手臂上微调 Ro
57、boCat,创建一个专门的衍生代理;3.衍生代理在这个新任务/手臂上平均练习 10000 次,生成更多的训练数据;4.将演示数据和自生成数据整合到 RoboCat 现有的训练数据集中;5.在新训练数据集上训练新版本的 RoboCat。而且这样的“自我迭代”具备良性循环的训练:学习的新任务越多,它学习其他新任务的能力就越好。RoboCat 的初始版本在以前看不见的任务上只有 36%的时间成功,每个任务从 500 个演示中学习。但是最新的 RoboCat,它已经训练了更多样化的任务,在相同的任务上,成功率增加了一倍多。简而言之,简而言之,RoboCat 作为目前为止机器人控制作为目前为止机器人控制
58、 AI 模型的“最优形态”模型的“最优形态”,核心优势在,核心优势在于于在在合成数据生成维度的合成数据生成维度的跳跃式发展跳跃式发展,能快速根据模拟和现实世界中收集到的图像,能快速根据模拟和现实世界中收集到的图像和动作数据进行训练,大大降低了机器人对新任务的学习时间和障碍,极大地提高和动作数据进行训练,大大降低了机器人对新任务的学习时间和障碍,极大地提高了训练效率。了训练效率。图图 23:RoboCat 的训练周期的训练周期 图图 24:训练的成功率随着训练次数的增多而提高:训练的成功率随着训练次数的增多而提高 数据来源:Deepmind 官网,东北证券 数据来源:Deepmind 官网,东北
59、证券 2.2.1.2.感知能力 人形机器人的感知是指通过各种传感器的信息收集,将被测量的环境信息转化为电信号或其他所需的形式,然后经过数据处理阶段,输送到不同的感知算法,为机器人后续的规划、控制阶段提供支持。机器人的传感器按照类别可以分为多种,包括视觉传感器、力矩传感器、触觉传感器、听觉传感器等,虽然每个传感器的功能都不一,但是当机器人执行某一动作时有可能需要同时用到多种传感器的信息,比如用于识别环境时,需要使用摄像头、激光雷达、毫米波雷达等传感器,机器人才能比较精准地确定物体的信息并进行后续的操作。因此,如何融合多个传感器的信息,因此,如何融合多个传感器的信息,并通过并通过感知感知算法同时处
60、理多维度信息,是人形机器人在运动规划和感知能力上需要算法同时处理多维度信息,是人形机器人在运动规划和感知能力上需要解决的问题。解决的问题。多传感器融合(多传感器融合(Multi-sensor Fusion,MSF),是指利用计算机技术,将来自多传感),是指利用计算机技术,将来自多传感器或多源的信息和数据以一定的准则进行自动分析和综合,以完成所需的决策和估器或多源的信息和数据以一定的准则进行自动分析和综合,以完成所需的决策和估计而进行的信息处理过程。计而进行的信息处理过程。和人的感知相似,不同的传感器拥有其他传感器不可替代的作用,当各种传感器进行多层次,多空间的信息互补和优化组合处理,最终产生对
61、观测环境的一致性解释。传感器融合能帮助机器人提高识别精度、增强鲁棒性、扩展覆盖范围。请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 19/36 电力设备电力设备/行业深度行业深度 AI 大模型大模型将优化多传感器将优化多传感器融合技术融合技术。按照信息融合架构进行划分,可以将传感器融合技术分为分布式、集中式和混合式,或者可以分为后融合算法和前融合算法,或者可以分为数据级、特征级和决策级融合。其中,目前常用的是分布式/后融合算法,其核心思想是每个传感器都有自己独立处理的目标数据,融合模块将对各传感器的滤波结果进行有效结合,而集中式/前融合算法则相反,使用一个感知算法对多维综合感知数据进
62、行处理。在以往算力受限和模型发展不成熟的情况下,使用分布式/后融合算法能在牺牲一定精度的同时降低算法复杂度,但由于不同传感器的数据类型不一,系统稳定性也会因此受到影响,而且受限于单一类型传感器的能力上限,后融合算法会导致特定条件下的偶发性漏检或误检。而随着算力的提升和多模态大模型的发展,而随着算力的提升和多模态大模型的发展,数据级数据级/集中集中式式/前融合算法的缺点有望得到弥补,比如集中式融合存在因中央处理单元性能不足前融合算法的缺点有望得到弥补,比如集中式融合存在因中央处理单元性能不足导致通信延迟和计算瓶颈的问题,而导致通信延迟和计算瓶颈的问题,而 AI 大模型的算力提升将解决这一点,从而
63、将大模型的算力提升将解决这一点,从而将目前主流的融合算法方案从后融合目前主流的融合算法方案从后融合/分布式分布式/决策级推向前融合决策级推向前融合/集中式集中式/数据级,数据数据级,数据级的传感融合也能减少感知过程中原始数据的信息损失级的传感融合也能减少感知过程中原始数据的信息损失而提高感知精度,提高数据而提高感知精度,提高数据处理的准确性处理的准确性。图图 25:后融合算法:后融合算法 图图 26:数据级融合:数据级融合 数据来源:CSDN,东北证券 数据来源:CSDN,东北证券 基于基于 TransFormers 模型的多传感器融合技术率先在自动驾驶领域得到应用。模型的多传感器融合技术率先
64、在自动驾驶领域得到应用。TransFormers 作为可能取代 CNN 和 RNN 的深度学习模型,能快速地完成对大量数据的特征提取,使得大模型在多模态信息处理上的能力得到不断强化。而TransFormers 需要海量训练数据,而大模型和更大参数量级的发展将推动TransFormers 模型的完善,驱动数据级的感知算法进一步优化。特斯拉在 2021 年的AI Day 上率先发布 BEV+TransFormers 算法,基于“输入-提取-转换-融合-时序-输出”的思路,实现“2D-3D-4D”的转换。请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 20/36 电力设备电力设备/行业深度
65、行业深度 图图 27:TransFormers 的整体架构的整体架构 图图 28:BEV+TransFormers 数据来源:CSDN,东北证券 数据来源:CSDN,东北证券 2.2.1.3.人机交互 AI 大模型对机器人在人机交互层面的影响除了能实现更好的对话交流,让机器人执行语言任务外,更为重要的影响是在于能将人类传递的自然语言转化为执行任务的指令,让机器人能根据指令反馈物理操作。1)语言任务 近年来,大型语言模型(LLM)在语言生成和理解方面取得了重大进展,LLM 的使用帮助机器人更好地理解和学习人类语言,并根据人类的意图和语气,进行语音交流和反馈。比如,波士顿动力将 ChatGPT 安
66、装到机器狗 Spot 中,Spot 能根据工作人员的问题作出相应的回答,并且能根据机器狗自身的实际情况,将信息反馈给工作人员,例如当被问及下一次任务的检查次数时,Spot 能准确回答次数。除了能反馈语音信息外,机器人还可以根据所表达的语言,传递面部表情,例如,Engineered Arts 将 GPT-4 接入到 Ameca 中,Ameca 不仅能流畅地和人类进行交流,还会根据聊天的内容作出相应的面部表情,包括皱眉、吃惊、生气、眨眼等。图图 29:波士顿动力机器狗接入:波士顿动力机器狗接入 Chat gpt 后,实现与后,实现与工作人员的直接对话工作人员的直接对话 图图 30:Ameca 能做
67、出一系列丰富的面部表情能做出一系列丰富的面部表情 数据来源:波士顿动力官网,东北证券 数据来源:Engineered Arts 官网,东北证券 请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 21/36 电力设备电力设备/行业深度行业深度 2)物理任务 更进一步而言,我们其实不仅希望 LLM 在机器人中的角色仅仅作为一个“语音助手”,对外界输入的信息作出包括语言、图片甚至表情等的输出反馈,更是希望输入的语音信息如何转化为能使机器人主体在现实世界中作出物理行为。简单来说,简单来说,我我们希望们希望 LLM 帮助机器人帮助机器人实现与人的对话互动,以及更为重要的动作互动实现与人的对话互动
68、,以及更为重要的动作互动。如何实现机器人与环境的物理交互,如何实现机器人与环境的物理交互,谷歌在谷歌在今年推出的视觉语言模型今年推出的视觉语言模型 PaLM-E 给出给出了答案。了答案。PaLM-E 作为一个具备 5620 亿个参数,集成了视觉和语言,用于机器人控制的视觉语言模型(VLM),与 LLM 不同之处在于其对物理世界的感知。PaLM-E能驱动机器人执行任务,比如当人类给机器人一个高级指令,PaLM-E 可以为机器人将这一指令生成行动规划,然后让机器人亲自执行。为什么 PaLM-E 能实现这样的功能?具体来说,PaLM-E 是基于谷歌现有的大型语言模型 PaLM,通过添加感官信息和机器
69、人控制而迭代生成的。因此:一方面,它具备一方面,它具备大型大型语言模型的功能。语言模型的功能。通过语言模型将指令分解为一系列文本步骤,同时训练人员会为机器人预先提供一个基础技能库,这个技能库包含了一系列的“原子”技能,每个“原子”技能对应执行一个短任务。因此当机器人接受到高级指令时,会通过 LLM 将其拆分为多个简单动作,而且这些简单动作已经存在于训练集中,机器人只需要把对应的动作从训练集中摘取出来,组成一套行为步骤即可。另一方面另一方面,它具备分析图像和传感器数据的能力。,它具备分析图像和传感器数据的能力。通过分析机器人相机收集的数据,PaLM-E 可以将这些图像、语音之类的数据,编码成一系
70、列与语言标记大小相同的向量,类似语言模型处理语言数据一样处理感官数据。最后,通过神经网络对机器人实现控制。简而言之,要实现机器人的动作互动,一是要通过 LLM 使机器人理解人类的自然语言,二是通过 VLM 使机器人实时理解周围的环境以便后续的任务操作。因此,因此,在未来,“在未来,“LLM+VLM”将成为机器人作为一个智能体能够推理环境、任务,并完”将成为机器人作为一个智能体能够推理环境、任务,并完全根据语言采取行动的核心框架。全根据语言采取行动的核心框架。图图 31:谷歌打造的以语言为中心的智能体框架谷歌打造的以语言为中心的智能体框架 数据来源:Towards A Unified Agent
71、 with Foundation Models,东北证券 请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 22/36 电力设备电力设备/行业深度行业深度 图图 32:研究人员使用:研究人员使用 LLM 将给定的高级指令拆分将给定的高级指令拆分为具体的行动规划为具体的行动规划 图图 33:研发人员展示研发人员展示 PaLM-E 如何分步骤控制机器如何分步骤控制机器人执行任务人执行任务 数据来源:Language models as zero-shot planners:Extracting actionable knowledge for embodied agents,东北证券 数
72、据 来 源:PaLM-E:An Embodied Multimodal Language Model,东北证券 但是但是,上述的做法存在一个较大的问题,万一拆分出来的短任务并没有出现在数据上述的做法存在一个较大的问题,万一拆分出来的短任务并没有出现在数据集中,那如何处理?集中,那如何处理?即当面对没有预训练样本的行为动作,机器人该如何执行相应即当面对没有预训练样本的行为动作,机器人该如何执行相应任务。任务。针对这一问题,学术界最近也提出了新的解决方案,2023 年 7 月 12 日,李飞飞团队发布最新成果展示:通过大模型的接入,能直接将复杂指令转化为具体行动规划,而无需额外的数据和训练。换句话
73、来说,当人类通过自然语言向机器人发出指令后,机器人通过视觉系统识别物体并进行行动规划,然后在没有预训练的基础上执行了任务。相较于传统方法需要进行预训练,这相较于传统方法需要进行预训练,这一一成果最大的特点是,机器人能在零样本的基成果最大的特点是,机器人能在零样本的基础上执行任务操作,极大地解决了机器人训练数据稀缺性的问题础上执行任务操作,极大地解决了机器人训练数据稀缺性的问题。那么如何通过大模型实现这样的效果呢?具体而言,通过名为 VoxPoser 的系统将任务指令分为三个主要步骤:首先,收集信息,包括通过相机收集环境信息和通过语音系统收集人类语音指令;其次,通过 LLM 将自然语言编写成代码
74、,并将生成的代码与 VLMs 进行交互,指导系统生成相应的操作指示地图(3D Value Map);最后,通过动作规划器,将生成的 3D 地图作为其目标函数,并最终合成要执行的操作轨迹。这一整套流程的核心这一整套流程的核心思想思想,其实是,其实是运用运用 VoxPoser 将将 LLM 生成的代码,与生成的代码,与 VLM 进进行交互,将图像和文本映射到同一个语义空间,生成一系列的行交互,将图像和文本映射到同一个语义空间,生成一系列的 3D 值地图值地图。比如,给出一个指令“拿起水杯”,LLM 会将这个指令生成一串代码,并依据代码调研 VLM的 API,找到环境中最可能是水杯的物体,给予他一个
75、最高值,同时给予水杯周围其他物体一个低值或负值,从而生成 3D 地图。请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 23/36 电力设备电力设备/行业深度行业深度 图图 34:VoxPoser 的具体流程和操作展示的具体流程和操作展示 数据来源:VoxPoser:Composable 3D Value Maps for Robotic Manipulation with Language Models,东北证券 2.2.2.硬件端:零部件有待优化 人形机器人的执行系统由多个执行器组成,而执行器主要安装在机器人的双臂和双腿,帮助机器人实现手部操作和腿部移动的两个主要功能,因此机器人的
76、硬件端问题主要集中在上肢的手部和下肢的腿部两个部位。2.2.2.1.下肢:行走稳定性 虽然已经有以 Atlas 为代表的机器人能实现十分炫酷的奔跑、跳跃等动作,但其实目前对于大部分双足人形机器人而言,行走稳定性仍然难以保证,特别是针对非直线平面的环境,机器人因为感知、规划等问题仍会出现失去平衡等现象,而且使用双足行走的机器人目前行走缓慢,最高行走速度也只有 1-2m/s,比如 Optimus 最高时速为 5 英里/小时、Atlas 时速为 2.5m/s、CyberOne 时速为 3.6km/h 等。因此,对于人形机器人而言,首要问题仍是使机器人“像人一样行走”-在各种环境中平稳行走甚至奔跑,同
77、时还拥有较快的速度。而目前看来,从脚部的而目前看来,从脚部的传感器传感器、驱动器驱动器的的方案方案到控制器的算法规划到控制器的算法规划,都有待进一步完善的地方。,都有待进一步完善的地方。下面我们主要讨论硬件端的下面我们主要讨论硬件端的问题及解决方案,即驱动器和传感器的情况。问题及解决方案,即驱动器和传感器的情况。1)驱动器驱动器 存在的问题:存在的问题:反射惯性大。反射惯性大。为了实现动态任务,机器人的驱动系统需要发挥出与机器人总重量相匹配的力,换句话来说,就是机器人的下肢需要较高的力密度。一般而言,增加执行器的转矩密度比较常用的方案是增加减速器的传动比,但这样做的缺点是增加传动比的同时会增加
78、关节中的摩擦力和转子的反射惯性,从而降低肢体的反向驱动能力及其调节和减轻冲击的能力。而且更为重要的是,传动比不能无限地增加,因为反向驱动性能的下降速度是要明显快于扭矩密度的增加速度。简单来简单来说,说,目前常用的目前常用的高齿轮减速比的方案(比如谐波减速器高齿轮减速比的方案(比如谐波减速器+力矩传感器)可以使得机力矩传感器)可以使得机器人的扭矩密度在有限范围内增大,器人的扭矩密度在有限范围内增大,但同时由于其摩擦力增大和脆弱性提高,机器但同时由于其摩擦力增大和脆弱性提高,机器人只能比较缓慢地行走。人只能比较缓慢地行走。解决解决方案方案:针对这个问题,目前学术界也提出多种方案,比如在Design
79、 of a Highly Dynamic Humanoid Robot中也提到,使用气隙电机+行星减速器的方案能减少因冲击负载而对齿轮造成的损害,一是随着气隙半径的增大,能在产生相同峰值扭矩和反射惯性的情况大大降低齿轮减速比,二是行星减速器依靠更小的齿隙和摩擦,能提高反向驱动力,减少冲击力对齿轮的损害;在Tello Leg:The Study of Design Principles and Metrics for Dynamic Humanoid Robots一文中提到,使用协同驱动的 请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 24/36 电力设备电力设备/行业深度行业深度
80、设计原理,能在产生较大的力的同时最大限度减少反射惯性,具体来说,在不显著增加反射惯性的情况下降低对电机的扭矩要求,方法的核心思想是通过组合多个电机来同时驱动机器人肢体的多个关节;另外,包括串联弹性致动器(SEA,即在齿轮箱和载荷之间放置弹性元件从而减少齿轮箱上受到的冲击载荷)、本体驱动器(Proprioceptive actuators,即使用电机的电流来估计致动器的转矩输出从而降低反射惯性提供抗冲击性能)以及液压驱动(即波士顿动力使用的方案)等方案也被逐步应用到机器人上。另外,除了驱动器的方案选择外,包括下半身的散热系统、各关节的结构设计(髋关节、膝关节和踝关节)也对驱动器的性能以及机器人的
81、双腿行走产生较大影响,在机器人设计时也需考虑到这些零部件的情况。图图 35:目前主流的四种驱动器:目前主流的四种驱动器 图图 36:四种驱动器的性能对比四种驱动器的性能对比 数据来源:Design of a Highly Dynamic Humanoid Robot,东北证券 数据来源:Design of a Highly Dynamic Humanoid Robot,东北证券 图图 37:谐波减速器(上)、谐波减速器(上)、RV 减速器(中)、行星减减速器(中)、行星减速器(下)速器(下)图图 38:电机以差动配置布置,在不显著增加反射惯电机以差动配置布置,在不显著增加反射惯性情况下增加肢体
82、的受力能力性情况下增加肢体的受力能力 数据来源:百度,东北证券 数据来源:Tello Leg:The Study of Design Principles and Metrics for Dynamic Humanoid Robots,东北证券 请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 25/36 电力设备电力设备/行业深度行业深度 2)力矩传感器力矩传感器 存在的问题:存在的问题:负载能力不足。负载能力不足。安装在机器人脚部的力矩传感器是最基本的传感器,他的作用是测量施加在其脚上的地面反作用力和力矩,进而用于计算零点矩点,作为控制机器人行走稳定性的重要参数。但是基于传感器中的
83、弹性体设计等因素,六维力矩传感器在刚度、测量精确性、灵敏度等存在不足。特别是刚度问题,根据数特别是刚度问题,根据数据统计,目前六维力矩传感器的最大据统计,目前六维力矩传感器的最大力力负载一般仅为机器人重量的负载一般仅为机器人重量的 1-2 倍倍(当面临(当面临外部干扰或者变化复杂的地面环境外部干扰或者变化复杂的地面环境时时,载荷也随之下降),载荷也随之下降),一旦承受超出这一范围,一旦承受超出这一范围的冲击力的冲击力(机器人(机器人奔跑奔跑时的负载范围时的负载范围较步行较步行时更小时更小),传感器或出现故障并影响机,传感器或出现故障并影响机器人的行走。器人的行走。另外,传感器中的扭矩范围也受到
84、机器人重量和脚部尺寸的限制,一般而言,脚踝扭矩要求不大于机器人重量和脚部尺寸的乘积。图图 39:行走速度越快,机器人受到的地面反作用力:行走速度越快,机器人受到的地面反作用力(GRF)也越高也越高 图图 40:不同机器人配置的传感器负载范围不同机器人配置的传感器负载范围(GRF range factor)为为 1-2,即机器人行走或奔跑时,传感,即机器人行走或奔跑时,传感器能感知的最大的力为器能感知的最大的力为自身自身重量的重量的 1-2 倍倍 数据 来源:Multi-Axis Force-Torque Sensors for Measuring Zero-Moment Point in Hu
85、manoid Robots:A Review,东北证券 数据来 源:Multi-Axis Force-Torque Sensors for Measuring Zero-Moment Point in Humanoid Robots:A Review,东北证券 解决方案:解决方案:为了避免传感器在意外情况下受到损坏,目前业界一般采用过载保护机制+安装冲击吸收部件的组合方案,一是过载保护机制,通过制动器来实现断开保护,二是在传感器中安装冲击吸收部件以减轻机器人接触地面时的反作用力,比如安装阻尼器、记忆材料、液压减震器、弹簧等。在Design of a Highly Dynamic Humanoi
86、d Robot中也提到,使用定制的足部传感器仅测量脚趾和脚跟的垂直反作用力,附加一个六维的 IMU 用于测量地面的接触状态,这样能减少传感器的受力负载,同时使用线切割来作为过载保护。总体而言,目前针对传感器载荷能力的问题,要么采用减少维度的方式降低受力(比如使用三维力矩传感器),要么采用增加结构件的方式缓冲受力,这两种方法虽然一定程度上弥补了传感器刚度不足的问题,但同时导致测量精度下降和腿部关节模组集成难度增大等问题,因此如何根据人形机器人的足部特点定制适合的传感器,最大程度保证行走稳定性仍然需要学术界和业界的进一步探讨。请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 26/36 电
87、力设备电力设备/行业深度行业深度 图图 41:安装了冲击吸收部件安装了冲击吸收部件的脚部结构的脚部结构,用以,用以吸收吸收机器人行走时传递的冲击力机器人行走时传递的冲击力 图图 42:带有定制的足部传感器的脚部结构带有定制的足部传感器的脚部结构 数据 来源:Multi-Axis Force-Torque Sensors for Measuring Zero-Moment Point in Humanoid Robots:A Review,东北证券 数据来源:Design of a Highly Dynamic Humanoid Robot,东北证券 2.2.2.2.手部:零部件集成 如果说实现
88、双腿的平稳行走是人形机器人的第一功能和要求,那么将机器人推向商业化的核心就是如何通过机器人的双臂执行任务来实现机器人的商用价值。人形机器人的双臂是实现大部分工业操作的工具,因此对双臂的要求主要集中感知物体和承载物体两个维度,前者帮助机器人在执行任务前识别所需要操作的目标,后者帮助机器人在工业流程中应对各种任务。具体到硬件端,基于工业机械臂的成熟工艺,机器人在手部构成上可借鉴机械臂的技术,而区别在于人形机器人对于精细化操作要求更高,因此需要在传感器上进一步优化。目前机器人的主要问题体现在传感器目前机器人的主要问题体现在传感器上上,虽然和腿部的硬件类似,但是手部对于传感器,虽然和腿部的硬件类似,但
89、是手部对于传感器的的要求与上述谈到的腿部部分有要求与上述谈到的腿部部分有所不同。所不同。1)传感器传感器 人形机器人的灵巧手安装有多个不同的传感器,以腾讯的 TRX-Hand 为例,手指就结合了视觉、接近觉、触觉和力觉传感器,而其中触觉和力矩传感器是大多数灵巧手都会配置的,用以在接触物体时,获取物体的位置、形状和受力等信息,使机器人能感知物体的状态并在物体交互时更为轻柔和自然。请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 27/36 电力设备电力设备/行业深度行业深度 图图 43:腾讯灵巧手:腾讯灵巧手 TRX-Hand 图图 44:腾讯机械臂:腾讯机械臂 TRX-Arm 数据来源
90、:腾讯 RoboticsX 实验室,东北证券 数据来源:腾讯 RoboticsX 实验室,东北证券 存在的问题:存在的问题:集成难度大。集成难度大。相对于腿部而言,手部对传感器的集成有更高的要求。比如手部一般具有 10-12 个自由度,这就意味着需要将 10-12 组关节模组(包括驱动器、传感器和结构件等零部件)都集成到手掌,这大大提高了对零部件的体积和重量的要求。进一步而言,光是将触觉传感器集成到手指和指尖就存在不少问题,比如机器人的手和人类指骨有所不同,前者的手指近端和中端的距离要比人类的短,接触面积的缩小导致连接困难,而且由于灵活性的原因,触觉传感器不能完全覆盖手指链接之间的空白区域。又
91、比如,触觉传感器的触觉元件增多会导致读取和传输数据的导线增多,导线数量越多集成难度越大,而将并行连接改为串行连接可以减少导线数量,但会导致传输速率变慢,等等。解决方案解决方案:针对集成问题,目前逐渐被市场所接受的是通过 3D 打印技术将传感器嵌入机器人的手指,传感器之间的紧凑性、坚固性以稳定性也因此得到提高,常用的材料包括 TPU、炭黑、CNT 等。另外,研究人员也提出使用欠驱动运动(underactuated movements,当致动器数量小于自由度时,机器人系统就被称为欠驱动系统),通过减少致动器数量并简化结构来实现自适应抓取,将驱动力传递给欠驱动关节,从而简化了机械手的组装,以降低集成
92、难度和成本,等等。图图 45:人类手指和机器人手指之间接触表面的差异人类手指和机器人手指之间接触表面的差异 图图 46:具有内在触觉的具有内在触觉的 3D 打印手掌、内部结构以打印手掌、内部结构以及及 3D 打印制造步骤打印制造步骤 数据来源:百度,东北证券 数 据 来 源:Robotic Hands with Intrinsic Tactile Sensing via 3D Printed Soft Pressure Sensors,东北证券 请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 28/36 电力设备电力设备/行业深度行业深度 3.未来未来:应用场景:应用场景&市场空间市
93、场空间 人形机器人的应用场景会是哪里?人形机器人的应用场景会是哪里?为什么在过去十年各家科技企业纷纷染指机器人赛道,并且花费大量的时间、成本和人力进行数次的试验和测试。虽然现在基于高昂的成本和不成熟的技术,人形机器人的应用场景有限,短期也难以激起大量的市场需求,但是我们认为,正如马斯克所说,当人形机器人成熟后,机器人的需求将远超汽车等产品,届时机器人的作用将作为人类的“替代工具”,替代人类在工业、家庭、商业中的部分功能,特别是成本、安全、健康等因素导致人类无法胜任的工种,机器人的应用场景也遍布人类生活和工作的多个地方。比如,人工智能机器人公司 Figure 制造通用类人形机器人的目的就是为了解
94、决劳动力短缺、人口老龄化、外太空探索等问题。因此,考虑到成本、需求以及容错率等因素,因此,考虑到成本、需求以及容错率等因素,我们认为,人形我们认为,人形机器人将率先在工业场景,特别是工厂中落地,随后经过技术优化和成本下降,场机器人将率先在工业场景,特别是工厂中落地,随后经过技术优化和成本下降,场景将逐步渗透到家庭和商用。景将逐步渗透到家庭和商用。图图 47:Figure 公司的企业愿景:替代劳动力、家庭服务、公司的企业愿景:替代劳动力、家庭服务、外太空探索外太空探索 数据来源:Figure 官网,东北证券 3.1.工业场景:替代传统工业机器人和人类劳动力 3.1.1.性能+成本优势凸显 在人形
95、机器人中,未来率先应用的大概率会在工业场景,去取代重复、无聊、危险的工作,替代传统工业机器人和人类劳动力。性能优势下,机器人将性能优势下,机器人将部分替代传统工业机器人。部分替代传统工业机器人。现阶段传统工业机器人基本上能覆盖工业制造中大部分的使用场景,那人形机器人取代的是哪部分工种呢?传统工传统工业机器人存在灵活性较差的问题。业机器人存在灵活性较差的问题。对于工业机器人而言,按照应用场景来分类,按照应用场景来分类,可以分为搬运、码垛、分拣、焊接、装配、喷涂、切割、检测等用途,目前主要以搬运和焊接为主,其他场景由于工业机器人的可移动性较差、安装条件要求较高等原因无法较好地使用机器人。按照作业方
96、式按照作业方式进行划分,进行划分,可以分为直角坐标、圆柱坐标、SCARA、多关节、协助机器人,除了协助机器人外,前 4 种属于传统工业机器人,这些传统工业机器人存在的问题是,虽然可以按照需求开发新的功能,但是需要专业人员进行编程、测试、开发等一系列流程,灵活性较差,而协助机器人虽然操作简单、编程方便,但是只适合用在任务简单的工种,且属于轻量级机器人,负载能力相对较弱。因此,归纳起来可以发现,传统工业机器人的灵活性、易用性较差,因此,归纳起来可以发现,传统工业机器人的灵活性、易用性较差,难以满足一些长尾和灵活性要求较高的工业需求。难以满足一些长尾和灵活性要求较高的工业需求。请务必阅读正文后的声明
97、及说明请务必阅读正文后的声明及说明 29/36 电力设备电力设备/行业深度行业深度 图图 48:我国工业机器人以搬运和焊接为主:我国工业机器人以搬运和焊接为主 图图 49:按作业方式分类的工业机器人:按作业方式分类的工业机器人 数据来源:艾迪咨询,东北证券 数据来源:艾迪咨询,东北证券 人形机器人将作为传统工业机器人的重要补充。人形机器人将作为传统工业机器人的重要补充。人形机器人的优势在于,在运动方面能像人一样灵活移动,快速移动到工厂中各种场景,在任务执行中基于大模型训练迭代后形成的自主决策能力,能针对各种工作和场景做出实时的反馈。简单而言,人形机器人在工业场景中,依靠更高阶的自主决策能力和更
98、灵活的移动方式,能较好地填补传统工业机器人的不足、替代原本由人工操作的工作。图图 50:特斯拉:特斯拉 Optimus 在工厂展示分拣工作在工厂展示分拣工作 图图 51:波士顿动力:波士顿动力 Atlas 根据指令在工厂中灵活执根据指令在工厂中灵活执行任务行任务 数据来源:特斯拉官网,东北证券 数据来源:波士顿动力官网,东北证券 成本优势下,机器人将成本优势下,机器人将部分部分取代人类劳动取代人类劳动。海外高昂的劳动力成本使得机器人替代人工的优点越发凸显。以美国为例,用工成本除了基本薪酬外,还包含税收、福利、保险、培训费用以及各种法律法规风险造成的潜在成本。首先只粗略对比基本薪酬,根据美国劳工
99、统计局数据,2023 年 5 月美国所有员工的实际平均工资为 28.83 美元/小时,联邦规定的最低工资标准也达到 7.25 美元/小时,我们假设人形机器人的初期售价为 3 万美元,按照 10 年折旧,每年工作 360*24h 进行计算,对应的用工成本仅为 0.35 美元/小时,远远低于最低工资标准,而按照敏感性分析,当机器人售价达到 20 万美元且使用寿命仅为 3 年时,对应的用工成本才接近美国最低工资标准。当然,这样计算存在不妥之处,比如人工劳动方面,包含税费、福利和保险费用等各种成本并没有考虑进去,而机器人方面也需进一步考虑机器人的电费、维修和保养等各种费用。但总体而言,通过简单的成本对
100、比,我们仍能看到人形机器人在工业场景替代传统劳动力的经济性,未来即使由于各种原因并不能完全取代人类,但也能部分替代性价比更低的工种。搬运焊接装配洁净分拣加工其他 请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 30/36 电力设备电力设备/行业深度行业深度 表表 2:机器人成本的敏感性分析机器人成本的敏感性分析(单位:美元(单位:美元/小时)小时)年限年限(年)(年)售价售价(万美元)(万美元)3 5 7 10 3 1.16 0.69 0.50 0.35 5 1.93 1.16 0.83 0.58 7 2.70 1.62 1.16 0.81 10 3.86 2.31 1.65 1.1
101、6 15 5.79 3.47 2.48 1.74 20 7.72 4.63 3.31 2.31 数据来源:东北证券 图图 52:美国员工平均工资约为美国员工平均工资约为 28.83 美元美元/小时小时 图图 53:2022 年欧盟的平均每小时劳动力成本估计为年欧盟的平均每小时劳动力成本估计为 30.5 欧元,欧元区为欧元,欧元区为 34.3 欧元欧元 数据来源:Bureau of Labor Statistics,东北证券 数据来源:Eurostat,东北证券 3.1.2.工业场景的市场空间 依靠上述的优势,人形机器人在工业领域将逐步取代传统工业机器人和人类劳动力。因此我们以工业机器人的保有量
102、和劳动力数量为锚,假设人形机器人在工业机器人的渗透率将从 2024 年的 1%逐步提升到 2030 年的 30%,同时假设单个人形机器人能取代2-5个人类劳动力且在劳动力的渗透率从2024年的0.0003%逐步提升到2030年的 0.1%。那么,对应那么,对应 2024 年工业领域的人形机器人出货预计为年工业领域的人形机器人出货预计为 1.6 万台万台,到,到 2030年这一数字将增加到年这一数字将增加到 328.4 万台,万台,CAGR 达达 143%。请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 31/36 电力设备电力设备/行业深度行业深度 图图 54:全球工业机器人全球工业
103、机器人保有量保有量 图图 55:全球:全球劳动力数量劳动力数量 数据来源:Wind,东北证券 数据来源:Wind,东北证券 表表 3:工业领域的人形机器人:工业领域的人形机器人需求需求预测预测 2022E 2023E 2024E 2025E 2026E 2027E 2028E 2029E 2030E 替代传统工业机器人替代传统工业机器人 工业机器人保有量(万台)382.5 420.7 462.8 509.1 560.0 616.0 677.6 745.4 819.9 yoy 10%10%10%10%10%10%10%10%10%渗透率 0.3%1.0%5.0%10.0%20.0%25.0%30
104、.0%人形机器人需求人形机器人需求量(万台)量(万台)1.2 5.1 28.0 61.6 135.5 186.3 246.0 yoy 340%450%120%120%38%32%替代人类劳动力替代人类劳动力 劳动力数量(亿人)34.6 35.0 35.3 35.7 36.0 36.4 36.8 40.8 41.2 yoy 1%1%1%1%1%1%1%11%1%替代比例 2.0 2.0 3.0 3.0 5.0 5.0 5.0 渗透率 0.0003%0.0010%0.0050%0.0100%0.0500%0.0750%0.1000%人形机器人需求人形机器人需求量(万台)量(万台)0.4 1.8 6
105、.0 12.1 36.8 61.2 82.4 yoy 304%237%102%203%67%35%工业领域人形机工业领域人形机器人总需求量器人总需求量(万台)(万台)1.6 6.9 34.0 73.7 172.3 247.5 328.4 yoy 330%395%117%134%44%33%售价(万美元)2.0 2.0 2.0 1.8 1.8 1.5 1.5 市场规模市场规模(亿美元)(亿美元)3.2 13.7 68.0 132.7 310.1 371.3 492.6 数据来源:东北证券 3.2.家庭&商用场景:成为人类生活的一部分 3.2.1.人机交互的价值体现 人形机器人有望成为人类日常生活
106、重要构成。人形机器人有望成为人类日常生活重要构成。在 2023 年的特斯拉股东大会上,马斯克表示,当Optimus成熟后,届时机器人和人类的配置比例应该达到1:1甚至2:1,-4%-2%0%2%4%6%8%10%12%14%16%18%0500300350400全球工业机器人保有量(万台)yoy-2.0%-1.5%-1.0%-0.5%0.0%0.5%1.0%1.5%2.0%25272931333537全球劳动力数量(亿人)yoy 请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 32/36 电力设备电力设备/行业深度行业深度 对应人形机器人的出货将至少达到 100
107、 亿台以上,因此机器人的需求将远远超过车,特斯拉的长期价值中的大部分也将来源于 Optimus。在老龄化日趋严重以及单身率持续攀升的社会上,越来越多的群体需要替代工具来实现部分人类的功能,比如陪伴、聊天、安抚等,而相较于普通的商品而言,人形机器人具有显著优势。人形机器人作为 AI 的重要载体之一,能搭载包括 ChatGPT等多种先进模型和技术,更好地识别环境和理解人类生活,实现和人类的日常对话、服务娱乐、陪伴看护等多种技能,将逐渐成为人类家庭和商业场景中重要组成部分,其作用和功能远远大于一般的商品。因此,长期来看,人形机器人有望成为解决人因此,长期来看,人形机器人有望成为解决人类部分心理需求的
108、重要工具。类部分心理需求的重要工具。图图 56:我国老龄化趋势越发明显我国老龄化趋势越发明显(%)图图 57:分年龄段分受教育程度的人口单身率(分年龄段分受教育程度的人口单身率(%)数据来源:Wind,东北证券 数据来源:中国青年图鉴:个体化明显增强,单身、失婚“一人户”大增,东北证券 能能提供情绪价值提供情绪价值的机器人已逐步推出的机器人已逐步推出。能流利地和人类对话并提供情绪价值是机器人踏进人类生活的重要一步,而现今越来越多企业为人类生活陪伴推出了专门的聊天陪伴机器人,实现机器人与人类深层次的互动交流。比如,清宝引擎机器人团队近期发布了“萌妹”机器人,后者具备完整的视觉和表情,皮肤采用特殊
109、材质,能实现人机交互、人脸识别、情绪识别等功能。作为聊天陪伴机器人,“萌妹”能通过视觉识别和表情分析,了解人的情绪状态,并结合语言模型,与人类进行实时的沟通交流,为人类提供情绪价值,解决精神层面的需求。又比如,乐森机器人公司发布的人形机器人巴斯光年,搭载了电影元素的配件,可实现与人类进行语言互动,同时由于经过了多次大模型的训练,能表现出 100 多种不同的情绪并且会根据实际的环境自动调用,而且基于手机上的 APP,机器人看到用户就会主动发起聊天,并且还能通过声纹识别不同的家庭成员,将聊天记录储存至不同模块。0246810121416中国:人口结构:占总人口比例:65岁及以上中国:出生率 请务必
110、阅读正文后的声明及说明请务必阅读正文后的声明及说明 33/36 电力设备电力设备/行业深度行业深度 图图 58:“萌妹”机器人“萌妹”机器人具备多种功能具备多种功能 图图 59:用户可通过手机用户可通过手机 App 选择剧情让机器人表演选择剧情让机器人表演 数据来源:清宝引擎机器人公司官网,东北证券 数据来源:乐森机器人官网,东北证券 3.2.2.家庭&商用场景的市场空间 考虑到人形机器人的性能和成本问题,我们认为,成熟的能提供娱乐服务的人形机器人或将在工业类机器人模式跑通后,逐步渗透到家庭和商用场景。因此,我们以全球人口为锚(劳动力人口虽然和工业类有所重复,但机器人的用途不同),假设机器人的
111、售价在 2 万美元的水平时属于小众商品,而当售价逐步降低到和家用电器价格相当(比如 5000 美元以下)后,机器人将从小众商品进化成通用产品,渗透率也逐步提升到 2030 年的 0.01%左右,对应出货量将达到 43.5 万台。图图 60:全球服务机器人销量(万台):全球服务机器人销量(万台)图图 61:全球服务机器人销售额(亿美元):全球服务机器人销售额(亿美元)数据来源:Wind,东北证券 数据来源:Wind,东北证券 050002500200420052006200720082009200001901
112、02030405060 请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 34/36 电力设备电力设备/行业深度行业深度 表表 4:家庭:家庭&商用领域的人形机器人商用领域的人形机器人需求需求预测预测 2022A 2023E 2024E 2025E 2026E 2027E 2028E 2029E 2030E 全球人口数量(亿)80 79 80 81 82 83 84 85 86 yoy 1%-1%1%1%1%1%1%1%1%渗透率 0.000000%0.000000%0.000010%0.000200%0.000500%0.001000%0.002500%0.005000%0.0100
113、00%人形机器人累计量(万台)0 0 0.08 1.62 4.1 8.3 21 42.5 86 人形机器人出货人形机器人出货量(万台)量(万台)0 0 0.08 1.54 2.48 4.2 12.7 21.5 43.5 yoy 1825%61%69%202%69%102%售价(万美元)2.0 2.0 2.0 1.8 1.8 1.5 1.5 市场规模市场规模(亿美元)(亿美元)0.2 3.1 5.0 7.6 22.9 32.3 65.3 数据来源:东北证券 4.风险提示风险提示 硬件优化不及预期。硬件优化不及预期。对于人形机器人而言,目前最大的瓶颈或许在硬件端,特别是执行器的设计上,比如特斯拉也
114、提到,目前执行器只能由公司自己设计,外部供应商无法独立提供完整的可用于机器人上的执行器,这反映出零部件供应商对于人形机器人的执行器技术工艺的理解和认知有待进一步提高,这也与其他人形机器人的产业进展有重要关联。成本下降成本下降不及预期。不及预期。除了产品本身性能外,限制机器人商业化的核心原因仍然是成本问题,包括特斯拉、波士顿动力以及小米等厂商的较为成熟的产品成本基本维持在较高区间,高昂的成本使得人形机器人初期只能应用在特定场景,难以规模化生产。产业政策不及预期。产业政策不及预期。对于处于商业化初期的人形机器人产业,政策的扶持起到了重要的作用,特别是在产业链的建设上,在经济性凸显之前,政策的推动能
115、带动更多的零部件厂商入局,从而推动产业以及零部件的进一步优化。请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 35/36 电力设备电力设备/行业深度行业深度 研究团队简介:研究团队简介:Table_Introduction 韩金呈:复旦大学应用统计硕士,四川大学金融学学士。现任东北证券电新组证券分析师,主要研究方向为风电、光伏和储能等。曾任东方证券股票质押/融资融券岗位。分析师声明分析师声明 作者具有中国证券业协会授予的证券投资咨询执业资格,并在中国证券业协会注册登记为证券分析师。本报告遵循合规、客观、专业、审慎的制作原则,所采用数据、资料的来源合法合规,文字阐述反映了作者的真实观点
116、,报告结论未受任何第三方的授意或影响,特此声明。投资投资评级说明评级说明 股票 投资 评级 说明 买入 未来 6 个月内,股价涨幅超越市场基准 15%以上。投资评级中所涉及的市场基准:A 股市场以沪深 300 指数为市场基准,新三板市场以三板成指(针对协议转让标的)或三板做市指数(针对做市转让标的)为市场基准;香港市场以摩根士丹利中国指数为市场基准;美国市场以纳斯达克综合指数或标普 500指数为市场基准。增持 未来 6 个月内,股价涨幅超越市场基准 5%至 15%之间。中性 未来 6 个月内,股价涨幅介于市场基准-5%至 5%之间。减持 未来 6 个月内,股价涨幅落后市场基准 5%至 15%之
117、间。卖出 未来 6 个月内,股价涨幅落后市场基准 15%以上。行业 投资 评级 说明 优于大势 未来 6 个月内,行业指数的收益超越市场基准。同步大势 未来 6 个月内,行业指数的收益与市场基准持平。落后大势 未来 6 个月内,行业指数的收益落后于市场基准。请务必阅读正文后的声明及说明请务必阅读正文后的声明及说明 36/36 电力设备电力设备/行业深度行业深度 重要声明重要声明 本报告由东北证券股份有限公司(以下称“本公司”)制作并仅向本公司客户发布,本公司不会因任何机构或个人接收到本报告而视其为本公司的当然客户。本公司具有中国证监会核准的证券投资咨询业务资格。本报告中的信息均来源于公开资料,
118、本公司对这些信息的准确性和完整性不作任何保证。报告中的内容和意见仅反映本公司于发布本报告当日的判断,不保证所包含的内容和意见不发生变化。本报告仅供参考,并不构成对所述证券买卖的出价或征价。在任何情况下,本报告中的信息或所表述的意见均不构成对任何人的证券买卖建议。本公司及其雇员不承诺投资者一定获利,不与投资者分享投资收益,在任何情况下,我公司及其雇员对任何人使用本报告及其内容所引发的任何直接或间接损失概不负责。本公司或其关联机构可能会持有本报告中涉及到的公司所发行的证券头寸并进行交易,并在法律许可的情况下不进行披露;可能为这些公司提供或争取提供投资银行业务、财务顾问等相关服务。本报告版权归本公司
119、所有。未经本公司书面许可,任何机构和个人不得以任何形式翻版、复制、发表或引用。如征得本公司同意进行引用、刊发的,须在本公司允许的范围内使用,并注明本报告的发布人和发布日期,提示使用本报告的风险。若本公司客户(以下称“该客户”)向第三方发送本报告,则由该客户独自为此发送行为负责。提醒通过此途径获得本报告的投资者注意,本公司不对通过此种途径获得本报告所引起的任何损失承担任何责任。地址地址 邮编邮编 中国吉林省长春市生态大街 6666 号 130119 中国北京市西城区锦什坊街 28 号恒奥中心 D 座 100033 中国上海市浦东新区杨高南路 799 号 200127 中国深圳市福田区福中三路 1006 号诺德中心 34D 518038 中国广东省广州市天河区冼村街道黄埔大道西 122 号之二星辉中心 15 楼 510630