《元宇宙2023:硬件的“大”年报告(270页).pdf》由会员分享,可在线阅读,更多相关《元宇宙2023:硬件的“大”年报告(270页).pdf(270页珍藏版)》请在三个皮匠报告上搜索。
1、元宇宙元宇宙20232023硬件的“大”年硬件的“大”年传媒首席分析师 焦娟SAC执业证书编号:S01安信证券元宇宙研究院2022年12月30日投资评级:领先大市-A目录目录20232023版元宇宙研究框架版元宇宙研究框架、元宇宙的上半场与下半场元宇宙的上半场与下半场20232023:硬件的:硬件的“大大”年年硬件之硬件之“沉浸感沉浸感”、“交互范式交互范式”、“操作系统操作系统”元宇宙之百舸争流元宇宙之百舸争流 虚拟人:交互世界的新物种;NFT:数字世界的魔法棒 Web 3:内核是“治理”,“去中心化”实则为“反抗有理”AI与后端基建:2023年迎来景气上行 场景:20
2、24-2025年的“八面来风”研究研究思路思路01020304核心观点核心观点继2021年FB改名Meta是为“穿云箭穿云箭”,我们对2022年全年的判断为“蓄积的力量蓄积的力量”。2022年我们看到了PICO/META/HTC/SONY/TCL/联想/创维等的新一代硬件硬件产品、看到了NVIDIA/UNITY的底层架构底层架构系列化发布、看到了AIAI作画作画/AIGC/AIGC(内容与场景内容与场景)的巨大争议,看到了国内外科技巨头伴随股价下跌而来的争议甚至是批评2022年确是预期中的“分歧期分歧期”;着眼于国内二级市场,我们预计7月底8月初会有新一轮元宇宙行情的开启,在去年NFTNFT、
3、元宇宙元宇宙、虚拟数字人虚拟数字人的基础上,我们认为细分方向有望新增WebWeb 3 3、人形机器人人形机器人、XRXR硬件相关硬件相关等,各方向相关标的在去年基础上会有明显的发散,但核心仍然在于弹性。2022年国内A股的元宇宙行情与2021年有一定的呼应2021年7、8月份NFT,9月元宇宙、11月虚拟数字人;2022年7月人形机器人、8月XR硬件、9月/10月调整、11月Web 3/AIGC2021年行情的触发要素是Meta改名,2022年则是5部门联合发布的虚拟现实五年发展计划;过去的2022年,我们兢兢业业且持续迭代研究框架,无论是元宇宙的年度预判,还是国内二级市场的节奏推演,唯一值得
4、庆幸感恩的,是我们敢真正去下前瞻判断我们敢真正去下前瞻判断,且得到了基本兑现的正向反馈且得到了基本兑现的正向反馈。在我们给出20232023年的年度前瞻判断年的年度前瞻判断之际,我们将同时:1)迭代2021年建立的研究框架研究框架(六大投资版图);2)新增元宇宙下半场下半场的系统推演(新硬件主义,2022年5月出版);3)植入112页拆机报告拆机报告的独家研究结论(硬件入口的沉浸、交互、操作系统);4)深化对虚拟人与虚拟人与NFTNFT的理解与定位;5)提示对WebWeb 3 3的警惕;6)展望将要在2024-2025年“八面来风”的场景场景的投资框架;7)AIGCAIGC;我们非常期待202
5、3年!2023年有可能是“预期差预期差”最大的一年最大的一年,我们认为它将是将是“硬件的大年硬件的大年”,“硬件硬件”是指MR,即通用硬件设备,“大大”年年,则是综合考虑了“周期周期、全局全局、结构结构”。之所以会导致“预期差”最大,是市场尚未认知到“交互范式的定义”对硬件入口的重要性,此外,市场也尚未意识到,与硬件配套的软件部分,借力于AI的应用/场景/模式甚至是内容的创新(AIGC)速度极快,这是认知结构结构层面的“预期差”;META&MICROSOFT与APPLE,通用硬件设备的开源&封闭系统之争,犄角之势将领航2023年的全局全局;2023年又是多周期共振出清的节点,市值的底部有望迎来
6、的并购潮、巨头市值下跌将加速其对“第二曲线”的“打出明牌”,是大周期周期轮动给2023年的大助力。硬件层面的进展低于预期应用领域的“劣币驱逐良币”诸多进展带来的伦理争议AI失控风险提示风险提示目录目录20232023版元宇宙研究框架版元宇宙研究框架、元宇宙的上半场与下半场元宇宙的上半场与下半场20232023:硬件的:硬件的“大大”年年硬件之硬件之“沉浸感沉浸感”、“交互范式交互范式”、“操作系统操作系统”元宇宙之百舸争流元宇宙之百舸争流 虚拟人:交互世界的新物种;NFT:数字世界的魔法棒 Web 3:内核是“治理”,“去中心化”实则为“反抗有理”AI与后端基建:2023年迎来景气上行 场景:
7、2024-2025年的“八面来风”研究研究思路思路02023版元宇宙研究框架版元宇宙研究框架资料来源:安信证券研究中心整理研究框架所配套的认知体系研究框架所配套的认知体系生态重构时空/混合平台技术虚拟现实/人机共生共识(NFT/币)治理(区块链)所有繁杂概念都可归入的认知体系资料来源:安信证券研究中心整理元宇宙的上半场与下半场元宇宙的上半场与下半场资料来源:安信证券研究中心整理20262026年是上下半场的中间节点年是上下半场的中间节点我们更新了元宇宙的版图,以“智能”的真正实现为总纲,下括元宇宙元宇宙与混合平台混合平台这两条肩负着真正实现虚拟现实的技术路径,其中:重构时
8、空的元宇宙,其构建需要六大板块(硬件与内容/场景;后端基建/人工智能;底层架构/协同方);混合平台包括人形机器人(以机器为载体)、脑机接口(以人为载体)。元宇宙是实现了智能的“内在部分”;如果将人的身体看作“硬件”,智能的实现过程,也是新智能交互硬件层出不穷新智能交互硬件层出不穷、旧旧硬件迭代甚至是重塑硬件迭代甚至是重塑的过程。2023年焦点为硬件(MR)、2024/2025年核心在应用/场景/模式等配套硬件的诸多新内容;2026年是马斯克指向的人形机器人进入家庭端的节点年份、本质均为AI的人形机器人或将开启2027-2029年的垂类硬件的快速发展期;2026年之前是元宇宙的上半场建设过程,2
9、026年之后是元宇宙下半场囊括现实物理世界的过程,2030-2032年元宇宙或将已如移动互联网般深入人心。1 1.特斯拉的人形机器人之所以火爆的原因特斯拉的人形机器人之所以火爆的原因?2 2.人形机器人与智能电车人形机器人与智能电车、NeuralinkNeuralink有什么关系有什么关系?3 3.以全局的眼光来理解马斯克的以全局的眼光来理解马斯克的“庞大商业版图庞大商业版图”背后的科技意图;背后的科技意图;4 4.新硬件之所以新硬件之所以“新新”,跟智能手机及之前的硬件逻辑已完全不同;跟智能手机及之前的硬件逻辑已完全不同;5 5.新硬件的历史观新硬件的历史观、本质本质、全球全球2424家相关
10、科技巨头;家相关科技巨头;6 6.新硬件与元宇宙有什么关系新硬件与元宇宙有什么关系?AIAI的重要性被低估;的重要性被低估;7 7.引入古印度的引入古印度的“唯识学唯识学”,提供一个特别视角提供一个特别视角,去理解真正的去理解真正的“智能智能”。由特斯拉人形机器人透视元宇宙下半场由特斯拉人形机器人透视元宇宙下半场特斯拉以及其背后的马斯克,备受科技圈瞩目,马斯克在科技界的领袖特斯拉以及其背后的马斯克,备受科技圈瞩目,马斯克在科技界的领袖风范堪比智能手机时代的乔布斯。也正因为特斯拉以“鲶鱼”的姿态进风范堪比智能手机时代的乔布斯。也正因为特斯拉以“鲶鱼”的姿态进入中国,触发了入中国,触发了20192
11、019年以来新能源电车浩浩荡荡的大行情,堪比年以来新能源电车浩浩荡荡的大行情,堪比20132013年年左右开始的移动互联网资本浪潮;左右开始的移动互联网资本浪潮;20212021年开始,马斯克对特斯拉的期许,越来越转移至机器人“擎天柱”年开始,马斯克对特斯拉的期许,越来越转移至机器人“擎天柱”身上,身上,20222022年年4 4月更是直言“擎天柱”是特斯拉的“第二曲线”、“这月更是直言“擎天柱”是特斯拉的“第二曲线”、“这比车重要(“这”指特斯拉推出人形机器人的原型机)”;比车重要(“这”指特斯拉推出人形机器人的原型机)”;当下仍处于新能源电车流畅且热烈的行情中,出于对科技前沿的敏锐、当下仍
12、处于新能源电车流畅且热烈的行情中,出于对科技前沿的敏锐、更出于对复制“新能源电车”火热行情的期待,国内资本市场对“擎天更出于对复制“新能源电车”火热行情的期待,国内资本市场对“擎天柱”关注,期待“机器人”板块性行情;柱”关注,期待“机器人”板块性行情;很多人开始感受到了这种“火热”,但绝大多数人仍一头雾水,“机器很多人开始感受到了这种“火热”,但绝大多数人仍一头雾水,“机器人”由来已久,“擎天柱”的特别之处在哪里?人”由来已久,“擎天柱”的特别之处在哪里?特斯拉人形机器人特斯拉人形机器人“火火”的背景的背景由特斯拉人形机器人透视元宇宙下半场由特斯拉人形机器人透视元宇宙下半场资料来源:特斯拉AI
13、 Day活动本质上与特斯拉的智能电车相同,均是建立在“输入本质上与特斯拉的智能电车相同,均是建立在“输入计算平台计算平台输出”模输出”模型上的智能交互硬件。也就是说,完全不同于工业界逐渐在普及的“机器臂”,型上的智能交互硬件。也就是说,完全不同于工业界逐渐在普及的“机器臂”,“机器臂”是一种生产力,而“擎天柱”是新一代智能交互硬件,你甚至可以把“机器臂”是一种生产力,而“擎天柱”是新一代智能交互硬件,你甚至可以把它看做一个独立“个体”,能独立应付复杂的环境、消解较为含混的“指令”,它看做一个独立“个体”,能独立应付复杂的环境、消解较为含混的“指令”,比如指令为“照顾好我奶奶”,背后是人工智能走
14、向了认知与决策阶段;比如指令为“照顾好我奶奶”,背后是人工智能走向了认知与决策阶段;这一次之所以资本市场反应非常快,是因为马斯克已经给出了“擎天柱”落地、这一次之所以资本市场反应非常快,是因为马斯克已经给出了“擎天柱”落地、投产、广泛应用的时间表:投产、广泛应用的时间表:20222022年出原型机、年出原型机、20232023年出有用的呈现(场景)、最年出有用的呈现(场景)、最快两年能做到小规模应用,此后,机器人应用逐年增长、成本降低、产量规模扩快两年能做到小规模应用,此后,机器人应用逐年增长、成本降低、产量规模扩大;且已经给出了“擎天柱”规模化推广及应用的节奏:大;且已经给出了“擎天柱”规模
15、化推广及应用的节奏:1 1)第一批机器人服务)第一批机器人服务于危险、无聊、重复的工作或人们不想做的工作,主要是于危险、无聊、重复的工作或人们不想做的工作,主要是to Bto B的应用;的应用;2 2)第二)第二批为大规模使用的机器人,让机器人在现实世界中导航,没有明确的指令下做有批为大规模使用的机器人,让机器人在现实世界中导航,没有明确的指令下做有用的事情;用的事情;3 3)第三批是机器人进入家庭端。)第三批是机器人进入家庭端。“擎天柱擎天柱”这个单点,确实不简单这个单点,确实不简单由特斯拉人形机器人透视元宇宙下半场由特斯拉人形机器人透视元宇宙下半场资料来源:特斯拉AI Day活动自动驾驶与
16、人形机器人自动驾驶与人形机器人人人大脑&眼睛神经网络&视觉问题人工智能人工智能现实世界的AI&摄像头硅神经网络&复杂的视觉系统马斯克认为“擎天柱”比自动驾驶容易(对速度的要求、速度高低的风险敞口完全不同),即使刚开始价格高(产量低),马斯克认为“擎天柱”比自动驾驶容易(对速度的要求、速度高低的风险敞口完全不同),即使刚开始价格高(产量低),但规模化生产后,成本比一辆车便宜(汽车的复杂性和成本都高于类人机器人);但规模化生产后,成本比一辆车便宜(汽车的复杂性和成本都高于类人机器人);我们先接受一个前提假设:移动互联网已是“旧周期”,新一代的计算平台是“元宇宙”,未来的所有智能交互硬件,都会我们先
17、接受一个前提假设:移动互联网已是“旧周期”,新一代的计算平台是“元宇宙”,未来的所有智能交互硬件,都会架构在新一代计算平台上,比如你的可穿戴设备架构在新一代计算平台上,比如你的可穿戴设备智能手表,只会跟你的智能手机连接,而不可能再架构在你的智能手表,只会跟你的智能手机连接,而不可能再架构在你的PCPC电脑上电脑上,更不用说架构于家中客厅里的那台电视机;,更不用说架构于家中客厅里的那台电视机;从智能的角度,未来新的智能交互硬件绝对不止人形机器人这一种,我们认为新硬件有两类:通用型硬件入口、分布式垂类从智能的角度,未来新的智能交互硬件绝对不止人形机器人这一种,我们认为新硬件有两类:通用型硬件入口、
18、分布式垂类硬件,其中分布式垂类硬件又包括三小类:基于情感需求投射的垂类硬件(对应元宇宙的内容硬件,其中分布式垂类硬件又包括三小类:基于情感需求投射的垂类硬件(对应元宇宙的内容/应用应用/场景)、机器人(对应场景)、机器人(对应元宇宙中的数字人)、未来将被重塑的现实世界中的“物”。元宇宙中的数字人)、未来将被重塑的现实世界中的“物”。人形机器人将共享特斯拉的自动驾驶能力、规模化生产的能力;人形机器人将共享特斯拉的自动驾驶能力、规模化生产的能力;传感器与执行器当下已有解决方案运行得不错,目前缺少的是足够的智能(传感器与执行器当下已有解决方案运行得不错,目前缺少的是足够的智能(AIAI通用平台)。通
19、用平台)。特斯拉的特斯拉的自动驾驶能力自动驾驶能力1.1.已建立了高质量统一的向量空间;已建立了高质量统一的向量空间;2.2.8 8个摄像头绑一起拍摄环绕图,加入时个摄像头绑一起拍摄环绕图,加入时间维度,生成环绕立体视频;间维度,生成环绕立体视频;3.3.环绕的视频必须被自动标记,特斯拉编环绕的视频必须被自动标记,特斯拉编写了自己的标签工具,创造了自动标签写了自己的标签工具,创造了自动标签系统;人类标签只是辅助,对已经生成系统;人类标签只是辅助,对已经生成的视频标签做一些细微的修改,然后将的视频标签做一些细微的修改,然后将这些修改反馈给未来的订单标签机;最这些修改反馈给未来的订单标签机;最终你
20、得到了一个“飞轮”,在这里汽车终你得到了一个“飞轮”,在这里汽车标签能够接收大量的视频,高精度地自标签能够接收大量的视频,高精度地自动标签视频汽车、车道线、驾驶空间;动标签视频汽车、车道线、驾驶空间;4.4.需要对时间和空间进行存储,存储不能需要对时间和空间进行存储,存储不能是无限的,会消耗大量内存。是无限的,会消耗大量内存。资料来源:特斯拉AI Day活动特斯拉的特斯拉的自动驾驶能力自动驾驶能力1.1.计算机(计算机(AIAI、摄像头)替代人(大脑、眼、摄像头)替代人(大脑、眼睛),实际上解决的是现实世界的睛),实际上解决的是现实世界的AIAI和视和视觉问题;觉问题;2.2.根据特斯拉在无人
21、驾驶上具备的能力(自根据特斯拉在无人驾驶上具备的能力(自动驾驶、规模化生产),类人机器人上,动驾驶、规模化生产),类人机器人上,特斯拉只需要设计专门的驱动器以及类人特斯拉只需要设计专门的驱动器以及类人机器人所需要的传感器;机器人所需要的传感器;3.3.安全设施方面,需要在新硬件上安装一个安全设施方面,需要在新硬件上安装一个本地化的本地化的ROMROM芯片,且无法在线更新;芯片,且无法在线更新;4.4.设立人工智能监管机构,这对公共安全很设立人工智能监管机构,这对公共安全很重要;重要;5.5.机器人的风险在于人工智能或数字超级智机器人的风险在于人工智能或数字超级智能与人类的集体意志脱钩。能与人类
22、的集体意志脱钩。资料来源:特斯拉AI Day活动NeuralinkNeuralink:与人形机器人并行的工程方案:与人形机器人并行的工程方案1.1.我们已是终端的一部分我们已是终端的一部分计算机是我们自身的延伸。计算机是我们自身的延伸。2.2.是什么抑制了人机共生?是数据速率;是什么抑制了人机共生?是数据速率;3.3.读取神经元的基本原理,用微小的电极在神经元上进行读写并非新读取神经元的基本原理,用微小的电极在神经元上进行读写并非新概念;概念;4.4.但当下没有一种产品能很好地运转且带宽高、安全,均为实验室测但当下没有一种产品能很好地运转且带宽高、安全,均为实验室测试款;试款;5.5.Neur
23、alinkNeuralink装置的方式,像装置的方式,像FitbitFitbit或苹果手表,数字智能与生物智或苹果手表,数字智能与生物智能紧密联系在一起;能紧密联系在一起;6.6.需要很多年做到近似于高带宽神经接口的东西,让人工智能与人类需要很多年做到近似于高带宽神经接口的东西,让人工智能与人类共生;共生;7.7.长期是来应对人工智能带来的文明风险。长期是来应对人工智能带来的文明风险。混合平台是智能的一条技术路径,在这条技混合平台是智能的一条技术路径,在这条技术路径上,脑机接口与人形机器人是不同的术路径上,脑机接口与人形机器人是不同的工程方案,即智能的实现分别以人、机器人工程方案,即智能的实现
24、分别以人、机器人为载体:为载体:1.1.NeuralinkNeuralink背后的想法:为了更紧密地背后的想法:为了更紧密地结合人类集体世界;结合人类集体世界;2.2.数字超智,将人类的集体世界转化为数字超智,将人类的集体世界转化为数字智能;数字智能;3.3.同时解决很多脑损伤和脊髓损伤。同时解决很多脑损伤和脊髓损伤。资料来源:格物者马斯克的布局版图马斯克的布局版图海外对海外对AIAI的重视程度很高,真正的的重视程度很高,真正的“智能智能”有嵌套的四个层次,若要实现真正的智有嵌套的四个层次,若要实现真正的智能:能:1 1)混合平台,如人机接口;)混合平台,如人机接口;2 2)重新建构一个环境,
25、元宇宙即新的时空架构。)重新建构一个环境,元宇宙即新的时空架构。自哥伦布大航海时代以来,关于地理空间的探索已阶段性到头,自哥伦布大航海时代以来,关于地理空间的探索已阶段性到头,“上天上天”“”“入地入地”“”“元宇宙元宇宙”均是空间探索。均是空间探索。NeuralinkNeuralink混合平台混合平台新时空架构新时空架构TwitterTwitterTeslaTeslaSpace XSpace XThe Boring CompanyThe Boring CompanyOpenAIOpenAI 视觉系统 规模化生产能力 空间 智能本身 空间资料来源:安信证券研究中心整理软硬一体软硬一体/高度集成
26、高度集成/门槛提高门槛提高/竞争加剧竞争加剧1.1.全局角度,未来新的智能交互硬件绝对不止人形机全局角度,未来新的智能交互硬件绝对不止人形机器人这一种,我们认为新硬件有两类:通用型硬件器人这一种,我们认为新硬件有两类:通用型硬件入口、分布式垂类硬件,其中分布式垂类硬件又包入口、分布式垂类硬件,其中分布式垂类硬件又包括三小类:基于情感需求投射的垂类硬件(对应元括三小类:基于情感需求投射的垂类硬件(对应元宇宙的内容宇宙的内容/应用应用/场景)、机器人(对应元宇宙中场景)、机器人(对应元宇宙中的数字人)、未来将被重塑的现实世界中的“物”。的数字人)、未来将被重塑的现实世界中的“物”。2.2.擎天柱藏
27、着两个秘密:擎天柱藏着两个秘密:1 1)未来的智能交互硬件,本)未来的智能交互硬件,本质都是一样的,能做人形机器人,自然能做出来更质都是一样的,能做人形机器人,自然能做出来更多新的智能交互硬件;多新的智能交互硬件;2 2)“擎天柱”身上藏着一个)“擎天柱”身上藏着一个马斯克尚未实现的秘密马斯克尚未实现的秘密特斯拉尚未实现真正的特斯拉尚未实现真正的“智能驾驶”,这也是特斯拉将“智能驾驶”,这也是特斯拉将20222022年的“人工智年的“人工智能日”推迟到能日”推迟到9 9月月3030日的原因日的原因一旦攻克了“基于一旦攻克了“基于现实世界的“智能”问题”,自动驾驶与人形机器现实世界的“智能”问题
28、”,自动驾驶与人形机器人将同时成功,且马斯克未来能毫无难度的推出更人将同时成功,且马斯克未来能毫无难度的推出更多的新硬件,那将产生特斯拉的“第三曲线”、多的新硬件,那将产生特斯拉的“第三曲线”、“第四曲线”“第四曲线”以“擎天柱”为代表的新一代智能以“擎天柱”为代表的新一代智能交互硬件,将与智能手机及之前的交互硬件,将与智能手机及之前的交互硬件有本质性的区别:交互硬件有本质性的区别:1 1)软硬一体将大势所趋;)软硬一体将大势所趋;2 2)AIAI的重要性更加凸显;的重要性更加凸显;3 3)入局的玩家将前所未有的广泛。)入局的玩家将前所未有的广泛。软硬一体软硬一体/高度集成高度集成/门槛提高门
29、槛提高/竞争加剧竞争加剧以“擎天柱”为代表的新硬件(硬件入口、垂类硬件)已走出软硬一体的趋势,软件、硬件、算法等诸多核心部位在一软件、硬件、算法等诸多核心部位在一家公司内高度集成家公司内高度集成(苹果模式苹果模式,但有别于过往硬件的主流模式开放平台结合标准化的硬件与软件,再整合),竞争门槛急剧提高,但在这个方向能成功的未来“王者”,将是真正的“集大成者”,会让竞争对手真正的“望其项背”;AIAI在元宇宙全貌中是递进式的发展脉络:在元宇宙全貌中是递进式的发展脉络:1)元宇宙上半场中,AI是元宇宙的六大组成部分之一,是元宇宙中的关键生产要素;2)元宇宙中场,AI以供给的方式辅助于人的决策,挖掘人的
30、更多需求/影响人的认知;3)元宇宙下半场中,AI将以新硬件/垂类硬件的方式,叠加入现实物理世界,以更好的满足人的需求/影响人的认知,由未来回溯当下,AI的重要性严重被低估,AI是新硬件的内核。我们在新硬件主义一书中,花了不少篇幅,着重讲“供需”、“AI”,就是基于未来人的认知,大概率将要被“AI”的供给所深度影响,大家要注意,“AI”在元宇宙中是内容、应用或场景,但“AI”也将显现为“各式垂类硬件”出现在现实物理世界中,以完成元宇宙对现实物理世界的囊括与重塑,这一幕很震撼,终将到来时也会让人“身不由己”围绕一个人的24个小时,哪哪都是AI;“王者”、难以“望其项背”的诱惑太大了,新硬件将前所未
31、有地吸引最广泛的玩家:新硬件将前所未有地吸引最广泛的玩家:1)竞争的胜负手由芯片、硬件入口至少扩展至芯片、通用型入口、AI、分布式垂类,入局方将包括但不限于XR厂商、智能手机厂商、智能电车厂商、AI与芯片巨头、垂类厂商(游戏主机、智能电视)、互联网巨头、诸多细分子行业的龙头、初创型公司等;2)新硬件的竞争会更残酷元宇宙的前半场是二维移动互联网升维至元宇宙,难度系数高;但元宇宙的后半场是三维元宇宙反向叠加现实物理世界,难度系数确定性会降低,全球科技巨头这一总决战,酣战至中场,利益格局的划分有可能就已接近于终局。新硬件主义新硬件主义的成书思路的成书思路 聚焦元宇宙下半场,描述元宇宙怎样囊括现实物理
32、世界聚焦元宇宙下半场,描述元宇宙怎样囊括现实物理世界1.1.元宇宙大投资元宇宙大投资专注于元宇宙上半场建设过程中的研究与投资框架;专注于元宇宙上半场建设过程中的研究与投资框架;2.2.新硬件主义新硬件主义聚焦于元宇宙下半场,刻画元宇宙怎样囊括现实物理世界的认知体系;聚焦于元宇宙下半场,刻画元宇宙怎样囊括现实物理世界的认知体系;3.3.两本书的成书时间相隔半年,全球化时代背景扭转为全国统一大市场,两本书的成书时间相隔半年,全球化时代背景扭转为全国统一大市场,元宇宙大投资元宇宙大投资作为一种分析框作为一种分析框架,立场较为中性,架,立场较为中性,新硬件主义新硬件主义作为时代背景扭转之后的一种认知体
33、系,立场有主观色彩作为时代背景扭转之后的一种认知体系,立场有主观色彩时代背时代背景变了,思路与打法需要彻底扭转,蹚一条自己的路,在此之前,则需要判断出正确的方向景变了,思路与打法需要彻底扭转,蹚一条自己的路,在此之前,则需要判断出正确的方向新硬件;新硬件;4.4.中国科技在元宇宙硬件入口方向上的资源投入,转一部分投向分布式垂类硬件,这一方向胜率与赔率更高,中国科技在元宇宙硬件入口方向上的资源投入,转一部分投向分布式垂类硬件,这一方向胜率与赔率更高,更重要的是,这是一条自己蹚出来的路,而非跟随策略。简单来说,硬件入口不允许有任何短板,分布式更重要的是,这是一条自己蹚出来的路,而非跟随策略。简单来
34、说,硬件入口不允许有任何短板,分布式垂类硬件可以充分利用长板效应。垂类硬件可以充分利用长板效应。新硬件历史观:交互硬件新硬件历史观:交互硬件5050年历史梳理年历史梳理 新硬件新硬件1.1.通用型硬件入口;通用型硬件入口;2.2.分布式垂类硬件:基于情感需求投射的新硬件、机分布式垂类硬件:基于情感需求投射的新硬件、机器人、当下现实物理世界中部分被重塑的“物”。器人、当下现实物理世界中部分被重塑的“物”。资料来源:新硬件主义,中译出版社新硬件本质:合之为一、衍之为万新硬件本质:合之为一、衍之为万 软硬一体:内核为软硬一体:内核为AIAI,外显为垂类硬件,外显为垂类硬件芯片是通用型硬件入口的命门,
35、芯片是通用型硬件入口的命门,AIAI则是分步垂类硬件创新的命门,故则是分步垂类硬件创新的命门,故全球科技巨头在元宇宙这盘大棋中的胜负手,上半场主要是硬件入口、全球科技巨头在元宇宙这盘大棋中的胜负手,上半场主要是硬件入口、芯片,下半场则增加了垂类硬件、芯片,下半场则增加了垂类硬件、AIAI;硬件入口与垂类硬件的发展并;硬件入口与垂类硬件的发展并非绝对的先后顺序,垂类硬件中的机器人、当下现实物理世界中部分非绝对的先后顺序,垂类硬件中的机器人、当下现实物理世界中部分“物”的重塑(如冬奥会中各类黑科技硬件)已启动;“物”的重塑(如冬奥会中各类黑科技硬件)已启动;垂类硬件中最重要的当属“基于情感需求投射
36、的新硬件”,为什么?垂类硬件中最重要的当属“基于情感需求投射的新硬件”,为什么?当下已启动的机器人、物理世界中部分“物”的重塑,仍处于“感知”当下已启动的机器人、物理世界中部分“物”的重塑,仍处于“感知”阶段(或正走向“认知”阶段),只有当元宇宙走完上半场,阶段(或正走向“认知”阶段),只有当元宇宙走完上半场,AIAI作为作为新的生产要素,以它的供给,充分挖掘出人在元宇宙中的更多、新情新的生产要素,以它的供给,充分挖掘出人在元宇宙中的更多、新情感需求,同时在科技的需求下,感需求,同时在科技的需求下,AIAI反向映射入现实物理世界,显现为反向映射入现实物理世界,显现为“基于情感需求投射的新硬件”
37、时,各式垂类新硬件已由“认知”阶“基于情感需求投射的新硬件”时,各式垂类新硬件已由“认知”阶段走向“决策”阶段,真正完成了元宇宙对现实物理世界的重塑及囊段走向“决策”阶段,真正完成了元宇宙对现实物理世界的重塑及囊括。此外,还有基于“利益”需求的新硬件。括。此外,还有基于“利益”需求的新硬件。资料来源:新硬件主义,中译出版社新硬件本质:合之为一、衍之为万新硬件本质:合之为一、衍之为万 软硬一体:驱动力是“人与科技的需求”软硬一体:驱动力是“人与科技的需求”我们将新硬件划分为两大类,通用型入口与分布式垂类,其中我们将新硬件划分为两大类,通用型入口与分布式垂类,其中入口只负责“承接”,交接用户的是元
38、宇宙内的万千存在;入口只负责“承接”,交接用户的是元宇宙内的万千存在;此外,此外,AIAI映射入现实物理世界显现为分布式垂类硬件,这背后映射入现实物理世界显现为分布式垂类硬件,这背后均有底层架构、后端基建、内容与场景、协同方的合围力量;均有底层架构、后端基建、内容与场景、协同方的合围力量;AIAI能真正的独立产品化,是未来的可能性,也是当下的发展方能真正的独立产品化,是未来的可能性,也是当下的发展方向;向;新硬件本质上就是新硬件本质上就是AIAI,这也回答了此前部分读者的一个疑问:,这也回答了此前部分读者的一个疑问:元宇宙是软硬一体化发展吗?我们认为元宇宙一定是软硬一体元宇宙是软硬一体化发展吗
39、?我们认为元宇宙一定是软硬一体化,甚至更进一步化,甚至更进一步新硬件即是新硬件即是AIAI,AIAI以显现为新硬件的方以显现为新硬件的方式更契合未来式更契合未来AIAI的进化需求。的进化需求。资料来源:新硬件主义,中译出版社 两本书给出了元宇宙的研究框架、认知体系,持续迭代以服务于未来十年的元宇宙两本书给出了元宇宙的研究框架、认知体系,持续迭代以服务于未来十年的元宇宙真实发展真实发展1.1.元宇宙:囊括现实物理世界、数字化元宇宙:囊括现实物理世界、数字化everythingeverything的虚拟集合。数字化人的更多感官体验,由移动互联网的二维升至三的虚拟集合。数字化人的更多感官体验,由移动
40、互联网的二维升至三维;维;2.2.新硬件主义:中国科技的打法必须要变;因为思路与打法的转变,需要推敲正确的方向。元宇宙叠加入现实物理世界,新硬件主义:中国科技的打法必须要变;因为思路与打法的转变,需要推敲正确的方向。元宇宙叠加入现实物理世界,速度会很快。速度会很快。推演元宇宙上半场,元宇宙的建设阶段定义、元宇宙的本质/历史观/终局、六大组成部分、全球科技巨头布局元宇宙的资源禀赋元宇宙长什么样子元宇宙长什么样子?中美优势比较中国企业:受益于全球化时代背景的惯性思维与打法元宇宙大投资元宇宙大投资20212021年年1111月出版月出版刻画元宇宙下半场,成型的元宇宙去囊括现实物理世界怎样囊括怎样囊括
41、?为什么要囊括为什么要囊括?交互硬件50年的历史梳理;新硬件包括元宇宙上半场的通用型硬件入口(包括但不限于VR/AR、触觉手套)、分布式垂类硬件(基于情感需求投射的垂类硬件、机器人、现实物理世界中未来会被重塑的“物”)垂类硬件与AI:合之为一、衍之为万全国统一大市场这一时代背景下全国统一大市场这一时代背景下,需要切换思路与打法需要切换思路与打法新硬件主义新硬件主义20222022年年5 5月出版月出版元宇宙全貌元宇宙全貌元宇宙大投资元宇宙大投资新硬件主义新硬件主义元宇宙全貌元宇宙全貌元宇宙大投资元宇宙大投资新硬件主义新硬件主义元宇宙:囊括现实物理世界、数字化元宇宙:囊括现实物理世界、数字化ev
42、erythingeverything的虚拟集合的虚拟集合数字化人的更多感官体验,由移动互联网的二维升至三维数字化人的更多感官体验,由移动互联网的二维升至三维新硬件主义:中国科技的打法必须要变新硬件主义:中国科技的打法必须要变因为思路与打法的转变,需要推敲正确的方向因为思路与打法的转变,需要推敲正确的方向元宇宙叠加入现实物理世界,速度会很快元宇宙叠加入现实物理世界,速度会很快背后的驱动力量:人的需求、科技的需求背后的驱动力量:人的需求、科技的需求资料来源:元宇宙大投资新硬件主义,中译出版社新硬件主义:全球新硬件主义:全球2424家科技巨头家科技巨头1.1.元宇宙的入局方可以是六大框架中的每一个企
43、业,目前均处于起跑元宇宙的入局方可以是六大框架中的每一个企业,目前均处于起跑线附近;线附近;2.2.美国与中国各有优势,通用型硬件入口非常关键,元宇宙的后半美国与中国各有优势,通用型硬件入口非常关键,元宇宙的后半场场以以AIAI为内核、以新硬件为显现的分布式垂类硬件,国内的全为内核、以新硬件为显现的分布式垂类硬件,国内的全面赶超,在路径上,可以有更多确定性的选项,面赶超,在路径上,可以有更多确定性的选项,硬件入口不能有短硬件入口不能有短板,但分布式垂类硬件天生比拼的是长板应用;板,但分布式垂类硬件天生比拼的是长板应用;3.3.我们信奉“德不孤必有邻”,但海外科技巨头的强势思维叠加资本我们信奉“
44、德不孤必有邻”,但海外科技巨头的强势思维叠加资本市场的杠杆效应,其高举高打更为流利顺畅,从微观角度,市场的杠杆效应,其高举高打更为流利顺畅,从微观角度,A A收购一收购一家优质标的,作为竞争对手的家优质标的,作为竞争对手的B B就少了一个落子之处且多了一个竞争就少了一个落子之处且多了一个竞争对手;对手;4.4.元宇宙的前半场是二维移动互联网升维至元宇宙,难度系数高;但元宇宙的前半场是二维移动互联网升维至元宇宙,难度系数高;但元宇宙的后半场是三维元宇宙反向叠加现实物理世界,难度系数确元宇宙的后半场是三维元宇宙反向叠加现实物理世界,难度系数确定性会降低,全球科技巨头这一总决战,酣战至中场,利益格局
45、的定性会降低,全球科技巨头这一总决战,酣战至中场,利益格局的划分有可能就已接近于终局。划分有可能就已接近于终局。资料来源:安信证券研究中心整理分布式垂类硬件,中国胜率与赔率更大分布式垂类硬件,中国胜率与赔率更大美国在硬件与操作系统美国在硬件与操作系统、底层架构底层架构、后端基建后端基建、人工智能方面优势突出人工智能方面优势突出中国在中国在“内容与场景内容与场景”、“协同方协同方”两部位的优势突出两部位的优势突出中国未来在后端基建中国未来在后端基建、人工智能两部位人工智能两部位,20242024年起预计将有大市值公司跑出来年起预计将有大市值公司跑出来现实物理世界并非一定需要人工智能,但元宇宙一定
46、需要后端基建与人工智能,必须等底层架构的升级元宇宙上半场,中国优势在“内容与场景”、“协同方”元宇宙上半场,中国优势在“内容与场景”、“协同方”硬件入口包括但不限于硬件入口包括但不限于VR/ARVR/AR、触觉手套等:触觉手套等:中国在智能交互硬件方面,智能手机时代是跟随策略,受益于全球化大背景硬件入口的命门在交互(沉浸式的迭代架构已相对清晰),当下元宇宙的硬件入口方向上,中国胜率及赔率一般垂类硬件的命门在AI(人工智能),中国头部科技公司可以在此方向走自己的路,大无畏、有担当;在全国统一大市场时代背景下,更能团结合作未来的垂类硬件,合之为一(AI)、衍之为万(诸多分布式垂类硬件)垂类硬件的衍
47、生,基于元宇宙中的诸多内容、应用、场景,这是中国擅长的硬件入口硬件入口递送机器人咖啡机器人炒菜机器人资料来源:北京冬奥会,新华社防疫机器人送餐机器人调酒机器人AIAI在元宇宙全貌中的递进式发展脉络在元宇宙全貌中的递进式发展脉络人工智能在元宇宙上半场人工智能在元宇宙上半场元宇宙的六大组成部分之一,是元宇宙中的关键生产要素元宇宙的六大组成部分之一,是元宇宙中的关键生产要素存在于硬件、内容等诸多环节,由感知逐渐走向认知存在于硬件、内容等诸多环节,由感知逐渐走向认知20232023年下半年乃至年下半年乃至20242024年才有年才有AIAI在元宇宙领域的明显进展(在元宇宙领域的明显进展(2021202
48、1年底的预判)年底的预判)人工智能在元宇宙建设成型时(中场)人工智能在元宇宙建设成型时(中场)AIAI在元宇宙中,以供给的方式辅助于人的决策,挖掘人的更多需求在元宇宙中,以供给的方式辅助于人的决策,挖掘人的更多需求/影响人的认知影响人的认知移动互联网时代的“供给决定需求”在此阶段,将发挥得淋漓尽致移动互联网时代的“供给决定需求”在此阶段,将发挥得淋漓尽致关键节点:由认知走向决策、关键节点:由认知走向决策、AIAI通用技术平台成型、通用技术平台成型、AIAI真正独立成产品真正独立成产品人工智能在元宇宙下半场人工智能在元宇宙下半场叠加入现实物理世界,以更好的满足人的需求叠加入现实物理世界,以更好的
49、满足人的需求/影响人的认知影响人的认知背后是人的需求、科技的需求,共同驱动的背后是人的需求、科技的需求,共同驱动的AIAI在物理世界显现为各式垂类硬件,包括新智能交互硬件、机器人、旧“物”改造在物理世界显现为各式垂类硬件,包括新智能交互硬件、机器人、旧“物”改造机器人包括虚拟数字人在现实世界“显现”(虚拟数字人原本即是机器人包括虚拟数字人在现实世界“显现”(虚拟数字人原本即是AIAI驱动)驱动)AIAI的的递进递进010203古印度的“唯识学”能提供一个特别视角古印度的“唯识学”能提供一个特别视角能实现自学习能实现自学习、自编程自编程,才能叫做人工智能才能叫做人工智能真正的智能严格来讲要有自我
50、意识真正的智能严格来讲要有自我意识目前人工智能大部分的工作只是在建构它捕捉外部世界的能力不管是一台机器,一个人形机器人还是一个机器盒子,业内做的大量工作都是帮助它们构建捕捉外部世界的能力,严格来讲这只能算是对一个复杂问题有求解的能力科技的发展在进入第三个1000年时发生了本质性的变化:第一次调头、针对人自己,我们用科技不再对外而是对自己的,这是人类历史上、科技史上、技术史上从没有过的表现出的最大特点就是意识问题唯识学认为,一个智能有四个层面,且四个层面是相互嵌套的(一个是另一个的基础,层层嵌套),经典人工智能,是从这四个层面的“最表层”开始去探索,并未整体去考虑智能本身(更意识不到智能有四层、
51、这四层是互相嵌套生成的),而是过于工具化的去想怎么技术上去解决,即经典人工智能认为“智能”就是人的大脑、是对数据/符号的抽象化处理从哲学角度,人工智能最棘手的问题,是它看上去充满未来感和高科技,但实际上是建立在早已过时了至少两百年的哲学体系上感知 人工智能最大的标志是自我意识,而自我意识这件事情是东方最擅长的,不管是禅定这种最古老的方式还是“唯识学”细密的、反身对自己意识的理解、剖析 感知不是第一代人工智能讲的纯粹的、被动的接收器,真正的感知是很复杂的,有意识混合的 西方对智能的理解,在哲学以及实践上其实已经开始知道要有智能、意识、有能力处理符号系统、人工神经网络,还是要有“身体”。我们的智能
52、不在大脑里,而是遍布全身的,如果没有身体、对外的感知、运动,是没有办法做智能的身体 马斯克的人形机器人目前看错解了身体,智能结构里的身体不是有四肢就可以解决的,它的身体背后一定有意识跟它混合,不是单纯的人形的、有接收的感应器的硬件,不是一个物理装置智能最底层 阿赖耶识,智能本身就是一股创造世界的力量而已;对阿赖耶识来说,以机器为平台来运行算法还是以人为平台来运行算法都无所谓目录目录20232023版元宇宙研究框架版元宇宙研究框架、元宇宙的上半场与下半场元宇宙的上半场与下半场20232023:硬件的:硬件的“大大”年年硬件之硬件之“沉浸感沉浸感”、“交互范式交互范式”、“操作系统操作系统”元宇宙
53、之百舸争流元宇宙之百舸争流 虚拟人:交互世界的新物种;NFT:数字世界的魔法棒 Web 3:内核是“治理”,“去中心化”实则为“反抗有理”AI与后端基建:2023年迎来景气上行 场景:2024-2025年的“八面来风”研究研究思路思路01020304为何为何20232023年是“大年”年是“大年”认知结构上的“预期差”“交互范式的定义”对硬件入口的重要性 通用硬件设备的交互范式定义出来后,AIAI加持下的场景/应用/模式甚至是内容的配套会极快领航全局的“犄角之势”Meta&Microsoft VS AppleMeta&Microsoft VS Apple,开源与封闭体系 其他厂商则跟随策略大周
54、期的助力 多周期共振出清,底部并购潮,以补足资源禀赋上的短板 巨头补跌,“第二曲线”的明牌化结构全局周期判断20232023年为硬件的“大”年,综合了周期、全局、结构的考量AppleAppleMRMR通用硬通用硬件设备件设备MetaMetaMicrosoftMicrosoftQuest 2Quest 2开始:消费者版本,已锁开始:消费者版本,已锁定长期架构(五年内的基本形态、定长期架构(五年内的基本形态、需要做什么已非常清楚);“需要做什么已非常清楚);“游游戏机”普及的一个大致标准戏机”普及的一个大致标准Quest ProQuest Pro是一个办公版本,是是一个办公版本,是MetaMeta
55、办公设备系列的办公设备系列的V1V1版本,后版本,后面会推面会推Quest Pro 2Quest Pro 2Quest 3Quest 3约约400400美金(传感器增加成本)美金(传感器增加成本)“笔记本电脑”“笔记本电脑”15001500美金,工美金,工作站(增强版)作站(增强版)20002000美金美金移动互联网、移动互联网、PCPC互联网互联网的“既得利益者”的“既得利益者”Qualcomm、Essilor Luxotica两代计算平台的“既两代计算平台的“既得利益者”得利益者”数十年的硬件与平台数十年的硬件与平台建设记录建设记录为何为何20232023年是“大年”年是“大年”资料来源:
56、Quest 官网为何为何20232023年是“大年”年是“大年”正式对打正式对打通用设备通用设备交互交互/跨屏跨屏形成标准形成标准商业模式商业模式Pro是通用计算设备的V1版;与微软一起构建开放的元宇宙和下一代平台的开放版本,且确保开放生态系统在下一轮计算中获胜下一轮计算中获胜;通用计算设备,需要一个接一个地开辟用例,游戏、社交、健身、办公;2023年,通用计算平台中的一个重大问题是:输输入是什么?入是什么?神经接口这样的输入方式(神经界面、肌电图腕带等)用户将在一个有着一大堆这些平台(电脑手机VR)的世界里生活,交互时如何顺利交互时如何顺利跨屏将是跨屏将是2323年的亮点之一?年的亮点之一?
57、Teams本质上就像一个浏览器本质上就像一个浏览器;Teams、Microsoft 365、Intune Device Management、Azure Active Directory、Windows Streaming、Xbox;HoloLens构建的应用将会带到包括Quest这样的所有平台之中(强大的ISV(独立软件供应商)Horizon更像是元宇宙的元宇宙的WebWeb端端(而不是应用商店),更像一个独立、本地应用程序谁在投资?谁拥有任何计算形态中最大的装机量最大的装机量?每一个主要的计算平台都有一个注重合作的开放生态系统,以及一个更加封闭和集成的生态系统:PC的Windows与Mac
58、;手机的Android与iOS入局且真正形成标准真正形成标准需要提前3-5年出发;最好的硬件,基本上以收支平衡点销售硬件甚至可以略有亏损,发展生态系统,商业模式通过软件和服务获得收入为何为何20232023年是“大年”年是“大年”硬件入口硬件入口 后端基建后端基建 底层架构底层架构 人工智能人工智能内容与场内容与场景景协同方协同方MetaMeta字节跳动字节跳动UnityUnityRobloxRobloxEpic GamesEpic GamesNvidiaNvidia高通高通SonySony网易网易腾讯腾讯AmazonAmazon阿里巴巴阿里巴巴MicrosoftMicrosoftGoogle
59、Google百度百度AppleApple华为华为小米小米HTCHTCValveValve以太坊以太坊PC时代Microsoft智能手机时代MetaBothApple元宇宙是一种技术路径,各家则在实施各自的工程方案工程方案,背后:1)既有的资源禀赋、收购以拼图;2)23年极为需要“元宇宙”这第二曲线。围绕沉浸式的各工程方案,未来五年的迭代框架已相对清晰,23年将围绕“交互范式的定义”,定义交互是海外巨头的强项(有成功经验、所需资源禀赋具足,即便不足也能大手笔收购以补足),也将开启硬件与内容的正反馈;美股23年或将是多周期共振出清的节点,与2001-2002年相比是全新的水域全新的风险,大巨头若补
60、跌,当下的业务结构撑不起持续快速增长的预期,需要“第二曲线”对抗周期动荡的持续性与连锁反应;且底部利于并购重组:1)美股是强势思维,杠杆更流畅(估值);2)元宇宙的前半场是二维移动互联网升维至元宇宙,难度系数高;但后半场是三维元宇宙反向叠加现实物理世界,难度系数降低,中场的利益格局的划分有可能就已接近于终局。资料来源:安信证券研究中心整理国内:虚拟现实国内:虚拟现实2222-2626年五年规划年五年规划 最大的意义是政策层面对元宇宙的技术本质(虚拟现实)“盖章”认可3500亿产业规模,2500万硬件销量:1)硬件700亿左右2)工业生产500亿(to B与to G)3)内容场景(包括NFT、游
61、戏)700亿4)融合媒体(VR直播、线上直播等)300-400亿5)K12应用700亿6)体育赛事&健康100亿左右7)商贸创意(其他细分应用)在200亿8)其他100亿(智慧城市)未来5年的指导思想和方针,对技术要求、场景应用进行全面规划关键点:产业发展战略窗口期已然形成 培育100家具有较强创新能力和行业影响力的骨干企业 10个具有区域影响力、引领虚拟现实生态发展的集聚区 推进关键技术融合创新:围绕近眼显示、渲染处理、感知交互、网络传输、内容生产、压缩编码、安全可信等关键细分领域 工业和信息化部、教育部、文化和旅游部、国家广播电视总局、国家体育总局:所覆盖的所有场景价值链拆分:价值链拆分:
62、35003500亿亿/2500/2500万台,万台,1.41.4万万/台的价值链台的价值链36048420052006200720082009200001920200.100.210.570.811.251.511.743.054.957.2510.1913.0114.3714.7314.6613.9513.7112.9204842005200620072008200920000192020全球智能手机出货量(亿第一代第
63、一代iPhoneiPhone问世问世YOY+75%YOY+75%PicoPico:市占率70%华为:华为:VR与AR,平台及软件工具OPPO&VIVOOPPO&VIVO:AR眼镜小米、小米、TCLTCL、创维、联想、创维、联想等3000元的单价,25002500元是元是硬件成本硬件成本(镜片、芯片、摄像头等供应商)1.11.1万万是内容,内容、服务(应用场景)、模式(会员、道具),内容领域空间巨大资料来源:IDC目录目录20232023版元宇宙研究框架版元宇宙研究框架、元宇宙的上半场与下半场元宇宙的上半场与下半场20232023:硬件的:硬件的“大大”年年硬件之硬件之“沉浸感沉浸感”、“交互范
64、式交互范式”、“操作系统操作系统”元宇宙之百舸争流元宇宙之百舸争流 虚拟人:交互世界的新物种;NFT:数字世界的魔法棒 Web 3:内核是“治理”,“去中心化”实则为“反抗有理”AI与后端基建:2023年迎来景气上行 场景:2024-2025年的“八面来风”研究研究思路思路01020304PART 01PART 01硬件之“沉浸感”硬件之“沉浸感”围绕沉浸感的技术架构,国内外均已成型围绕沉浸感的技术架构,国内外均已成型围绕沉浸感的各技术指标围绕沉浸感的各技术指标相对相对VRVR的沉浸感,的沉浸感,ARAR核心在于融合感核心在于融合感产业链关键环节产业链关键环节光学、显示、交互、芯片光学、显示、
65、交互、芯片沉浸感是区分互联网与元宇宙的最直观体验沉浸感是区分互联网与元宇宙的最直观体验VR通过模拟物理环境光、声音、气味、味道、运动,并以模拟出的物理环境来影响人的眼、耳、鼻、舌、体感、触觉,由此产生化学激素和电信号来影响到人。这也就是VR让人们产生“沉浸感”的心理基础。手机和PC之所以无法产生“沉浸感”就是因为手机和PC仅模拟了光源和声音,无法像VR一样模拟整个物理环境。光光声声气味气味味道味道运动运动PC/手机-模拟2D光源和声音VR/MR-模拟物理环境眼眼耳耳鼻鼻舌舌体体触触脑机接口-模拟电信号PC互联网移动互联网元宇宙/全真互联网以PC为载体,键鼠交互固定性、匿名性、非实时性、大屏幕沉
66、浸感低以智能手机为载体,触控、语音交互便携性、低实时性、小屏幕沉浸感提升以VR/AR/MR为载体,手势、语音交互实时性、所见即所得、全息投影沉浸感高资料来源:安信证券研究中心沉浸感的三个维度:视觉、物理、认知沉浸感的三个维度:视觉、物理、认知沉浸感是支撑元宇宙概念成立的核心要素之一,可以借助高性能VR硬件获得。国内VR厂商小派科技Pimax将这一系列技术提升的目标归纳为VR 3.0的技术标准,即在视觉沉浸感视觉沉浸感、物理沉浸感物理沉浸感、认知沉浸认知沉浸感感三方面技术达标。视觉沉浸感UVI(Unit of Visual Immersion)视觉沉浸感当量,是衡量视觉沉浸感的重要指标。PPD(
67、Pixels per Degree)即角分辨率、FOV(Field of View)即视场角、刷新率这三个指标决定。物理沉浸感需做到6DOF定位(six degrees-of-freedom tracking),即头、手的定位追踪。同时设备需在无线化、空间影响、体感外设、人体工程学设计、重量和体积控制和分布方面进行足够优化。认知沉浸感借用Mirror Test这个概念,意指在VR的镜子里是否能看到自己的表情、眼神、全身动作,以形成足够的自我存在感。需要face tracking(面部追踪)、eye tracking(眼部追踪)及body tracking(全身动作捕捉)甚至情绪跟踪等诸多功能的
68、支持。资料来源:小派科技,高性能VR是进入元宇宙的必经之路视觉沉浸感:视觉沉浸感:UVIUVI当量当量UVI(Unit of Visual Immersion)即视觉沉浸感当量,是衡量视觉沉浸感的重要指标。通常认为PPD(Pixels per Degree)即 角 分 辨 率、FOV(Field of View)即视场角、刷新率这三个指标都分别存在绝对的天花板水平:PPD=60代表了视网膜水平;FOV=220度代表了人眼自然视场角;刷新率大于180Hz人眼基本无法分辨。任何一款VR头显的这三个指标分别除以该指标的天花板水平(也就是100%水平)得到一个百分比,就代表该头显在该项指标上的表现。这
69、个三个百分比的加权调和平均数就是UVI。我们认为这个模型能够很好地量度视觉沉浸感水平。100%的UVI就意味着人眼已经完全无法分辨看到的是头显中的图像还是真实的世界。这个标准听上去很科幻,但是实际上离我们不再遥远。资料来源:小派科技,高性能VR是进入元宇宙的必经之路UVIUVI量化指标量化指标PPDPPDPPD(Pixels Per Degree)角分辨率,指视场角中的平均每 1夹角内填充的像素点的数量。计算公式PPD=单眼成像外接圆的直径像素点数量 单眼成像的对角线的视场角 FOV人眼正常视力下的分辨能力极限为50-60PPD。当PPD小于50时,人眼正常视力下的能够感受到头显产品的像素晶格
70、感,PPD越小,晶格感越强烈,即“纱窗效应”。头显产品的PPD越接近60,产品的成像清晰度就越接近人眼的分辨极限,人眼看图像就觉得越清晰。资料来源:泡咖元宇宙,VR/AR头显的PPD与和PPI有什么区别?屏幕分辨率与光学系统共同作用影响屏幕分辨率与光学系统共同作用影响 PPDPPD由PPD的计算公式可知,PPD由总像素数和视场角共同决定。其中,屏幕分辨率决定像素数,是清晰度的决定因素之一;光学系统决定视场角,对放大图像的清晰度影响很关键。头显产品有两种光学成像系统:屏幕覆盖光学、光学覆盖屏幕。屏幕覆盖光学屏幕覆盖光学的成像系统的视场角可以做得更大,但是会浪费了一些“屏幕边角料”,也就是产生“无
71、效像素点”,实际上被有效利用的像素点数量比屏幕分辨率少一些。光学覆盖光学覆盖屏幕屏幕类型的头显产品,相对来说视场角有所减小,但能够实现屏幕像素点的全部利用。屏幕覆盖光学屏幕覆盖光学VS VS 光学覆盖屏幕光学覆盖屏幕屏幕覆盖光学的头显:3840*2160 分辨率(4K 单屏)、视场角 FOV=110,计算单眼PPD为19.6光学覆盖屏幕的头显:1920*1080 分辨率*2(1080P 双屏)、视场角 FOV=63,计算PPD为35.0屏幕分辨率相似的情况下,光学系统对PPD有直接影响资料来源:泡咖元宇宙,VR/AR头显的PPD与和PPI有什么区别?UVIUVI量化指标量化指标FOVFOV视场
72、角(FOV,Field of View),即可见区域或可见角度,代表了人眼所能看到的空间区域范围。在计算机相关显示系统中,视场角就是显示器边缘与观察点(眼睛)连线的夹角。视场角在VR中的作用主要是与沉浸感密切相关,一般来说一般来说,视场角越大视场角越大、越不容易产生眩晕感越不容易产生眩晕感,沉浸感也就会越强;视场沉浸感也就会越强;视场角小意味着看到的影像小角小意味着看到的影像小,对分辨率的要求低对分辨率的要求低。对于VR设备而言,其水平视场角至少要达到90度左右,才能够保证用户获得较高的沉浸感。目前市场上主流VR设备的视场角范围在90度-110度之间。视场角并非越大越好,以屏幕大小为例,合适的
73、视场角要搭配合适尺寸的屏幕才能展现出最佳的显示效果。资料来源:多普微光学设计,安信证券研究中心UVIUVI量化指标量化指标刷新率和帧数刷新率和帧数刷新率,是指显卡将显示信号输出刷新的速度,60Hz就是每秒钟显卡向显示器输出60次信号。刷新率是由显示器决定的刷新率是由显示器决定的。帧数,是指画面改变的速度,60fps就是每秒钟显卡生成60张画面图片(理论上,每一帧都是不同的画面)。帧数帧数FPSFPS是由是由显卡所决定的显卡所决定的。刷新率与帧数的关系:刷新率与帧数的关系:在VR体验中,离开帧数只谈提高刷新率没有意义。假设帧数是刷新率的1/2,意味着显卡每两次向显示器输出的画面是用一幅画面。相反
74、,如果帧数是刷新率的2倍,画面每改变两次,其中只有1次是被显卡发送并在显示器上显示的。即高于刷新率的帧数都是无效帧数,对画面效果没有任何提升,反而可能导致画面异常。刷新率和帧数必须匹配,才可以获得流畅的VR体验。当前主流的VR设备基本可以做到90HZ的刷新率,但是帧数受限于芯片性能和网络带宽基本在60fps左右。资料来源:高清范VR,刷新率和帧数:如何影响VR体验?头6DOF+手6DOFInside-out定位方案,支持眼动/面部追踪重量722g支持全彩透视头6DOF+手6DOFInside-out定位方案,Pro版本支持眼动追踪重量586g(外壳重量295g),重量减轻26.2%,厚度减少3
75、8.8%支持全彩透视物理沉浸感:定位、追踪、重量、体积物理沉浸感:定位、追踪、重量、体积以VR硬件为例,足够好的物理沉浸感需做到头+手 6自由度定位,其中Inside-out定位方案是主流的发展方向,精确度足够高、价格便宜、使用便捷。同时设备需在无线化、空间影响、体感外设、人体工程学设计、重量和体积控制和分布方面足够优秀。物理沉浸感是影响VR设备的用户时长与佩戴舒适度的重要因素。此外,see-through功能已经形成全视野AR功能的雏形,为VR过渡到MR打下基础。以 旗 舰 VR 设 备 PICO4、Questpro 为 例,头 手6DOF+Inside-out定位方案已成为主流,重量、体积
76、相比上一代产品也显著优化。Quest Pro资料来源:Pico官网,Meta官网定位定位&追踪:追踪:InsideInside-OutOut降低部署成本降低部署成本Outside-in:使用外部定位模块+头部追踪器,来标定头盔位置。Outside-in方案的最大弊端在于,头盔的位移空间受制于外部定位器的放置位置,并且每组定位器都有其极限捕捉范围,并且易产生校准偏差,校准过程繁琐。典型产品是HTC Vive、Oculus Rift。Inside-out:使用头盔内的摄像头,来标定头盔位置。Inside-out 方案解决了空间限制,让用户可以更加专注在VR本身的体验上。典型产品是Oculus Qu
77、est 2。OutsideOutside-inin外向内追踪技术外向内追踪技术InsideInside-outout内向外追踪技术内向外追踪技术原理原理由外而内的定位:需要事先在环境中布置定位器,一般两个以上,实现从外到内的位置计算由内而外的定位:不需要额外布置空间定位设备,借助VR设备自身的传感器进行环境的感知与事实位置计算追踪精度追踪精度准确度较高目前的准确度略低(算法依赖)延迟延迟延迟相对低延迟相对高可移动范围可移动范围仅限于传感器监测范围无空间限制,活动自由成本成本较高较低对算力的需求对算力的需求较低较高事先环境部署事先环境部署需要不需要外部传感器外部传感器需要不需要主流设备应用主流设
78、备应用HTV VIVE pro、Oculus Rift、Varjo VR等Oculus Quest 2、HTC VIVE Cosmos、HTC VIVE Focus、Pico Neo等总结总结成熟但昂贵主流方案资料来源:安信证券研究中心整理定位定位&追踪:头手追踪:头手6DOF6DOF是多元交互的基石是多元交互的基石6DOF,就是指物体除了具备在X、Y、Z 三轴上旋转的能力之外,也具备在X、Y、Z三轴上移动的能力。6DOF的VR设备几乎可以模拟所有的头部动态。头部交互:6DOF中,头盔增强了许多主动性的行为,如微动作(歪头、缩脖子、半身前倾等)、主体移动(可以走、跳、蹲甚至躺等)。用户的头部以
79、及身体能够依靠与现实世界认知通用的反应来躲避对手的进攻。手部交互:手柄往往是标配,支持移动的定位方式,6DOF中,常规手柄键位设计极为相似,主要划分为三大区域拇指区域(摇杆+按键)的方式,食指区域(扳机),后三指区域(侧键)。头部头部+手部手部6DOF6DOF交互交互认知更匹配:认知更匹配:通过标定高度、位置、微动作等空间移动信息,为用户提供更加真实的观察角度,便于用户将虚拟环境和自我感知绑定,增强沉浸感。自由度更高:自由度更高:可移动的定位方式可以满足更多用户个性化需求,极大地丰富了探索VR世界的可能性。交互更多元:交互更多元:头手位移象限的解锁,使传统交互中的浏览、选择、点击再也无法满足用
80、户的探索欲望,握、拽、弹、砸,更多肢体语言被解放出来,人的潜意识行为更值得被关注。Oculus Quest 2头部交互:头盔、传感器、摄像头拇指区:摇杆+圆盘按键食指区:扳机后三指区:侧键资料来源:FerrymanX虚拟世界交互进阶6DOF,安信证券研究中心资料来源:Meta官网重量重量&体积:体积:PancakePancake光学方案助推光学方案助推VRVR轻薄化轻薄化VR光学方案发展大致经过非球面透镜菲涅尔透镜折叠光路(Pancake)三大阶段,目前菲涅尔透镜是市场主流方案,PancakePancake方案是光学系统的重大创新方案是光学系统的重大创新,在在VRVR头显轻薄化头显轻薄化、小型
81、化等方面起到重要推动作用小型化等方面起到重要推动作用,将成为将成为VRVR光学的主要升级方向光学的主要升级方向。非球面透镜非球面透镜菲涅尔透镜菲涅尔透镜折叠光路折叠光路PancakePancake600g400-500g200-300g40-50mm40-50mm15-20mm成像质量较高光路简单,光损较小制造工艺成熟,制造成本低相比非球面透镜更轻薄视场角扩大光路简单,光损较小制造工艺成熟,制造成本低焦距短,显著轻薄化多片式透镜,支持屈光度调节成像质量好,畸变小焦距长,模组厚不支持调节屈光度焦距长,模组厚不支持调节屈光度制造工艺不完全成熟,制造成本高多次折返,光损较大易出现画面重影3Glass
82、es D1(2014),Oculus Rift(2015),PSVR(2016),爱奇艺奇遇2Pro(2019),奇遇Dream(2021)HTC Vive(2015),DPVR P1(2018),Pimax 5K XR(2018),Oculus Quest 2(2020),Pico Neo 3(2022)华为VR Glass(2019),3Glasses X1S(2020),HTC Vive Flow(2021),arpara 5K(2021),创维PANCAKE 1(2022),PICO 4(2022),Quest Pro(2022),苹果MR(2023),PSVR2(2023)¥5-10
83、¥15-20¥150-200重量模组厚度优势单组价格代表产品劣势资料来源:Wellsenn XR,安信证券研究中心重量重量&体积:体积:PancakePancake光学方案助推光学方案助推VRVR轻薄化轻薄化Pancake方案在初期存在制造成本高、光学效率低等问题,仅在部分分体式VR 设备中采用。伴随供应链及众多终端品牌的协同技术调整,目前生产良率和使用效果已得到大幅改善,有望逐步替代菲涅尔方案。近两年Pancake 方案已被arpara、HTC、YVR、创维等品牌应用于一体式VR,HTC Flow系列、PICO VR Glasses、3Glasses X系列、创维S6及Pancake 1、a
84、rpara、Huawei、Shiftall等头显设备均已采用Pancake方案,还包括行业龙头的新一代产品,如近期发布的PICO 4、Meta Quest Pro,后续将发布的苹果MR、索尼PS VR2等。资料来源:Wellsenn XR,安信证券研究中心PICO 42022.09 Quest Pro认知沉浸感:眼球追踪、面部追踪、虚拟化身认知沉浸感:眼球追踪、面部追踪、虚拟化身借用Mirror Test概念,意指在VR的镜子里是否能看到自己的表情、眼神、全身动作,以形成足够的自我存在感认知。只有在充分的认知沉浸感的支持下,才有可能在VR中形成真正有效的社交场景。认知沉浸感需要除了物理沉浸感要
85、求的头手6DOF的跟踪定位之外,还需要face tracking(面部追踪)、eye tracking(眼部追踪)以及body tracking(全身动作捕捉)甚至情绪跟踪等诸多功能的支持。认知和观察外部环境(感觉、知觉、注意、记忆、思维、语言等)感觉(反射事物的属性)知觉(反射事物的整体)产生注意深入影响眼球追踪面部识别资料来源:FerrymanXVR交互设计:沉浸感要素拆解,安信证券研究中心眼球追踪眼球追踪:可应用范围广泛,逐渐成为标配可应用范围广泛,逐渐成为标配眼球追踪就是通过图像采集设备对眼球运动的信息进行捕捉,实现对眼球的跟踪和分析,从而服务于具体的场景当中。眼球追踪可应用于光学显示
86、、交互控制、目标识别、身份验证、健康监测、社交和多人协作等方面,几乎覆盖AR/VR的所有环节。从眼睛生理结构的特性出发,目前全球主流的智能眼镜公司的眼动追踪方法有五种:瞳孔角膜反射法瞳孔角膜反射法、视网膜影像视网膜影像、对眼睛对眼睛建模后计算视觉中心建模后计算视觉中心、视网膜反射光强度视网膜反射光强度、角膜的反射光强度角膜的反射光强度。其中第一种和第二种都是通过计算机对眼睛的图像进行处理、特征点提取,进而获得的眼睛视觉中心。第三种通过摄像头(红外相机、深度相机)对眼睛重建为三维模型再计算视觉中心。第四种和第五种仅仅可以通过一个或者几个光敏传感器元件捕获眼睛反射光的强度获取眼睛视觉中心,反射光可
87、能来自角膜中心或者视网膜。分类分类技术原理技术原理设备设备/器件器件代表企业代表企业瞳孔角膜反射法瞳孔角膜反射法通过角膜中心和瞳孔中心的连线进行眼动追踪。红外摄像头(2+)、红外光源,如LED红外传感器(2+)Magic Leap one、Digilens、Tobii、SMI、Apple、索尼。视网膜影像视网膜影像因为视网膜上不规则的毛血管、中央凹等生理结构形成的图案,通过计算视网膜图像变化来进行眼动追踪。光波导光学器件、全息波导Magic leap(第二代或者第三代)、lumuc、三星。对眼睛建模后计算视觉中心对眼睛建模后计算视觉中心1.利用结构光对眼睛建模;2.利用光场相机对眼睛建模结构化
88、的发光器、光场摄像头(2+)Facebook。视网膜反射光强度视网膜反射光强度激光透过角膜、瞳孔、晶状体最终打在视网膜上,视网膜会对入射的激光反射,外部光敏传感器通过检测视网膜反射光强度确定眼球运动的方向。光敏传感器、红外光发射器、透镜Facebook、Lumuc。角膜的反射光强度角膜的反射光强度当激光刚好射在角膜中心时(角膜中心是最高点),激光的反射强度最大,因此通过光敏传感器检测角膜反射光的强度确定眼球运动的方向。光敏传感器、红外光发射器、MEMS反射镜微软、华为、Adhawk。资料来源:AR/VR行业兵家必争之地-眼动追踪技术大全,天蝎科技,映维网,安信证券研究中心眼球追踪带来两大关键突
89、破,注视点渲染眼球追踪带来两大关键突破,注视点渲染&自动变焦自动变焦注视点渲染:注视点渲染:通过眼球追踪眼球追踪来识别用户在VR中的注视点,从而动态调节VR屏幕的清晰度,注视点区域最清晰,而余光部分则降低清晰度。注视点渲染方案有助于降低硬件压力,同时提升VR视觉清晰度。自动变焦:自动变焦:VR光学变焦主要有机械式变焦和电子液晶透镜变焦两种,机械式变焦通过在Pancake模组加入移动式机械变焦系统(音圈致动器和弯曲铰链阵列),配合眼球追踪眼球追踪来移动透镜的位置实现变焦实现无极可变焦调节。动态注视点渲染相比固定注视点渲染,等降低2倍左右的GPU着色负载,能更有效地维持高帧率,优化计算资源。机械式
90、可变焦显示器采用精密齿轮传动模组来调节VR/AR眼睛的两组透镜组件的间距,直至与使用者的瞳距相匹配。资料来源:Tobii,VR陀螺,映维网,安信证券研究中心面部追踪:现阶段与面部追踪:现阶段与AvatarAvatar化身配合使用化身配合使用面部追踪是动作捕捉技术的一部分,指使用机械装置、相机等设备记录人类面部表情和动作,将之转换为一系列参数数据的过程。与捕捉由关节点构成、较为稳定的人体动作相比,面部表情更为细微复杂,因此对数据精度要求更高。Meta Quest Pro搭载了全新的面部追踪系统,该系统能通过内部摄像头感知用户眼睛以及脸部某些部位的运动情况,结合免校准的机器学习模型,头显能将摄像头
91、所看到的内容实时驱动Avatar的面部动作。据新浪VR,Meta 已发布了 Aura 面部追踪示例供开发人员进行试验,以及与“运动 SDK”相关的开发人员示例,这些示例为开发人员创建具有眼睛、面部和身体追踪的富有表现力的化身奠定了基础。在短期内,面部追踪系统将与 Meta 现有的Avatar化身一起使用。资料来源:新浪VR,Meta 面向开发者发布 Aura 面部追踪示例全身动捕:高度依赖全身动捕:高度依赖AIAI算法,普及尚有距离算法,普及尚有距离常见的全身追踪技术主要包括光学动作捕捉技术、惯性动作捕捉技术以及视觉动作捕捉技术三种。光学动作捕捉技术光学动作捕捉技术:操作的时候会直接在人的身体
92、上进行简单的标记,标记点会直接反射到提前设定好的摄像机上,然后再通过反射的不同位置的成像信息来预算标记点的空间运动信息,最终将信息进行简单地定位以及输出。惯性动作捕捉技术惯性动作捕捉技术:会直接在人的身上佩戴陀螺仪,人在运动的时候,陀螺仪也会跟着进行旋转。此时,直接通过感知陀螺仪的旋转信息将人的运动推算出,然后实现动作捕捉。视觉动作捕捉技术视觉动作捕捉技术:在操作的时候是不需要标记和佩戴设备的,只要在人的活动范围内通过普通的摄像头进行动作的录制,将人体关键信息进行识别,然后采用特殊AI算法实现动作捕捉。全身追踪在VR中普及还有一段距离,由于技术的成本和使用门槛对新手并不算友好。据映维网,Met
93、a提出了一种仅通过Quest实现全身动捕的解决方案。对于上半身追踪,通过在AI训练过程中获得的经验,仅需来自现实世界的少量输入就足以将双手准确地转换到虚拟世界。资料来源:映维网,Meta提出一种通过Quest的全身动捕方案虚拟化身:元宇宙社交与互动的关键一步虚拟化身:元宇宙社交与互动的关键一步虚拟化身,是打造元宇宙沉浸感不可或缺的一部分。虚拟化身在元宇宙生活,成为模糊现实和虚拟世界界限的重要突破口。区分于社交头像,虚拟化身决定了人类个体在虚拟世界的独一无二,且能够实现脸部五官、情绪表情、手势姿态的变化,提升互动感和真实感。Meta一直致力于打造元宇宙社交体系,包括社交平台Horizon Wor
94、lds、社交形象Meta Avatar等。眼动追踪与面部追踪技术的普及有利于元宇宙社交的推进。据青亭网,Meta Avatar旨在提升VR头像的表现力、个性化功能(号称有超过1018种搭配),并且支持更多VR应用。将采用基于机器学习的动作预测算法,进一步提升虚拟头像运动的流畅性,可自然模拟挥手、微表情、注视点、语音驱动的面部表情等效果。Meta Avatar全身版的进展很慢,目前只能在第三人称视角中为Avatar配备虚拟腿。资料来源:青亭网当前处于部分沉浸向深度沉浸的过渡阶段当前处于部分沉浸向深度沉浸的过渡阶段沉浸体验的提升有赖于相关技术的突破和进步,是分阶段演进的过程,不同发展阶段对应不同体
95、验需求。部分沉浸:在当前可普遍获取的软硬件最高水准上再提升一步;深度沉浸:在屏幕/芯片性能、感知交互、内容质量等方面提升较大。当前虚拟(增强)现实的发展阶段已走过部分沉浸期,处于深度沉浸期。等级等级/指标指标视频分辨率门槛单眼分辨率门槛典型网络带宽需求典型网络RTT需求初级沉浸(初级沉浸(EIEI)EntryEntry-level Immersionlevel Immersion全视角4K 2D视频(全画面分辨率3840*1920)960*960FOV 100度约20PPD20-50Mbps40ms部分沉浸(部分沉浸(PIPI)Partial ImmersionPartial Immersio
96、n全视角8K 2D视频(全画面分辨率7680*3840)1920*1920FOV 110度约20PPD50-200Mbps30ms深度沉浸(深度沉浸(DIDI)Deep ImmersionDeep Immersion全视角12K 2D视频(全画面分辨率11520*5760)3840*3840FOV 120度约30PPD200Mbps-1Gbps20ms完全沉浸(完全沉浸(FIFI)Fully ImmersionFully Immersion全视角24K 3D视频(全画面分辨率23040*11520)7680*7680FOV 120度约60PPD2-5GbpsMRAR;与现实世界的交互程度:AR
97、MRVRVR VR AR AR MR MR 沉浸感沉浸感现实世界现实世界资料来源:泪雪网,站酷,安信证券研究中心贴合感的理想状态:实时贴合于时空与节奏贴合感的理想状态:实时贴合于时空与节奏AR,增强现实,其目标是通过AR技术,参与者可以与虚拟对象进行实时互动,从而获得不一样的视觉体验,且它能够突破空间、时间以及其它客观限制。AR将广泛应用于各种场景1.场景是争夺用户时长与可支配收入的产品与服务的组合,to C的场景如此,to B/G的场景亦然;2.从供给的角度,技术(虚拟现实还是人机协同/共生)决定操作系统,模式(to C还是to B/G)决定操作路径,要素与场景则以产品或服务形式共同作用于人
98、性(顺人性还是逆人性);3.基于技术与模式的任何产品与服务,底层逻辑均是作用于用户的“人性”,“顺人性”与“逆人性”是此消彼长的两大方向。顺人性更多的是情感需求,逆人性更多是利益需求;4.元宇宙是重构时空,场景是如何切割新时空;5.场景的本质之一,是各类新的时空,包括时间与空间两个维度;但从用户体验的角度,趋势上,时间是征服空间;6.基于抢用户时长、可支配收入的考量,场景一定是有自身独特节奏的,节奏是一种基于体验的抽象概念,具体分析起来,作用于人的时空观折叠空间(也包括反向折叠)、给时间加杠杆(也包括去杠杆)。AR 技术作用于场景,即通过扫描现实场景,让虚拟物体能够自然地和现实场景的平面贴合;
99、贴合感的理想状态,即实时的,贴合于时空与节奏。ARAR在在20222022年有一定发展,但变化幅度不大年有一定发展,但变化幅度不大VR与AR两者诸多技术互通。VR硬件目前基本达到消费级硬件标准,下一步聚焦于升级硬件性能及丰富内容生态。AR光学系统不同于VR,尚存技术难点待攻克,且轻量化要求与性能矛盾更大,目前仍处于硬件发展早期阶段。VR:VR产业链核心环节趋于成熟,硬件产品体验大幅提升。光学显示器件Fast-LCD+Pancake是目前主流方案,芯片/处理器由高通芯片占据统治地位,追踪定位环节Inside-Out+头手6Dof功能日趋完善,未来向手势、眼球识别方案发展。VR内容及应用逐步发力,
100、其中游戏内容生态已形成爆款游戏驱动用户增长用户反哺游戏内容丰富的良性循环。2022-2025年为VR硬件性能爬升期,VR头显将增加多样化功能并增强性能以提升用户体验,2025年有望达到硬件成熟期。预计2023年,随着Meta、苹果、索尼等众多重磅VR/MR头显的发布,推动全行业技术升级和出货量持续提升。AR:AR发展阶段晚于VR2-3年,光学与显示部分器件量产仍存难点,尚未推出相对成熟能大规模放量的C端产品。当前最佳技术路径已锁定Micro LED+光波导,Micro LED目前技术难点在于巨量转移技术,高性能光波导的量产尚未形成高性价比方案,未来海兹定律有望推动成本持续下探。我们预计2025
101、年前后,苹果和Meta预计将推出真正的AR眼镜,新一代硬件面世后有望带动产业链快速成长。但AR具备相比VR更大的市场潜力。AR具备虚实融合、赋能现实的特性,可适用于大多数 B 端和 C 端场景,AR眼镜相比VR一体机更加轻量化,可定位为未来的生产力工具和计算平台(与智能手机同一等级)。AR眼镜硬件发展初期预计将以手机配件形式发行,可类比 TWS 耳机和智能手表等可穿戴设备;未来一体机成熟后,预计将取代手机,拥有十亿级出货量的广阔市场空间。区分区分ARAR与与MRMR:“现实”的来源不同:“现实”的来源不同MR与AR看起来都是在真实环境中进行,但现实环境的来源是不同的。AR(增强现实)的“现实”
102、指的是真实的物理环境。MR(混合现实)的“现实”是通过摄像头捕捉来的画面信息。相应地,See-Through实现方式也主要有两种:光学透视(Optical See-Through,OST)和视频透视(Video See-Through,VST)。光学透视光学透视(OST)(OST):真实世界是通过放置在用户眼前的半透明光学合成器看到的。光学合成器也被用来将计算机生成的图像反射到用户的眼睛里,从而将真实世界和虚拟世界结合起来。视频透视视频透视(VST)(VST):真实世界是通过相机捕捉到实时视图,然后与计算机图像技术结合在一起,呈现在不透明的显示器上。使用视频透视,算法可以完全控制视觉集成,允许
103、虚拟和真实物体之间的完全遮挡,甚至可以对真实物体进行更高级别的修改。VS光学透视光学透视视频透视视频透视资料来源:S Dream LabXRXR均是基于视觉这一技术路径的不同工程方案均是基于视觉这一技术路径的不同工程方案AR1.0AR1.0AR2.0AR2.0VR1.0VR1.0VR2.0VR2.0MR1.0MR1.0FOV:40度显示技术:光波导定位与交互:inside-out,手柄,手势虚实结合算法:SLAMFOV:50度显示技术:光波导定位与交互:inside-out,手势虚实结合算法:增强型SLAMFOV:100度显示技术:AMOLED,LCD定位与交互:Outside-in,手柄FO
104、V:160度显示技术:AMOLED,CLPL,超高PPI800定位与交互:Outside-in,inside-out手柄FOV:FOV150度显示技术:90度光场定位与交互:inside-out,手势虚实结合算法:SLAM+未来5年到10年,VR与AR将会殊途同归走向MRMRMR眼镜眼镜2014AR/VR-MR 演进图20242018技术高技术低技术低HTC VIVEHTC VIVE ProOculus RiftPimax 4KPimax 8KHoloLensODGMagic LeapHoloLens2视觉只是技术路径之一,这一技术路径上有不同的工作方案,走向是充分开放的。资料来源:小派科技V
105、R/AR为基础的MR将成为下一代计算平台?20222022年年VRVR跟踪之跟踪之PICOPICO2015.12 2016.4 2017.12 2018.7 2019.5 2021.5 2022.9推出Pico 1 VR头盔推出VR一体机Pico Neo DK量产头手6DoF Pico Neo VR一体机Pico G2 VR一体机发布4K屏显VR一体机Pico G2 4K发布Pico Neo 3推出PICO 4&4 pro推出硬件产品硬件产品游戏串流助手 在VR一体机串流PC玩SteamVR游戏PICO VR助手 辅助PICO VR的手机AppPICO OS 5.0 基于Android定制开发
106、,专为VR一体机设计的操作系统远程播放助手 通过网络将PC视频传输至VR一体机软件产品软件产品VR游戏VR视频VR直播VR社交VR健身 内容生态内容生态PICO 4Pico Neo 3/3 ProPico G2 4K资料来源:PICO官网,安信证券研究中心PICO 4PICO 4产品亮点产品亮点自研自研PancakePancake光学透镜光学透镜前端重量减少26.2%,厚度减少38.8%4K+4K+超视感屏幕超视感屏幕搭载2块2.56英寸的Fast-LCD屏幕,整体分辨率4320X2160,1200PPI,20.6PPD,90HZ刷新率无级电动瞳距调节无级电动瞳距调节支持62-70毫米无级瞳距
107、调节,瞳距适配更精细亚毫米级定位精度、亚毫米级定位精度、毫秒级追踪速度毫秒级追踪速度搭载自研高精度四目环境追踪和红外光学定位系统,光学传感器进一步提升,以实现更好的追踪定位效果。FOV105FOV105105超广视野,上一代FOV为98资料来源:Pico官网,安信证券研究中心PICO PICO 影视:影视:VR+VR+电影破局,引入三体、灵笼重磅电影破局,引入三体、灵笼重磅IPIP目前,国内VR影视内容的制作产能体系尚未成熟,PICO的影视内容多采用外部合作方式。引入引入3 3D D电影大片:电影大片:PICO同迪士尼、索尼影视、环球、派拉蒙及狮门联手打造“PICO 3D大片重燃计划”,引入漫
108、威复仇者联盟系列、X战警系列、星球大战系列以及神偷奶爸、加勒比海盗、银翼杀手2049等100多部3D经典影片。试水试水VRVR短片:短片:PICO与国内拥有最多精品VR内容版权代理权之一的沙核科技达成深度合作,引入多部优质短片。PICO还开启了“超沉浸观影计划”,苍穹、纸鹤、水母等6DoF作品已在PICO视频上线。据PICO发布会,三体版权方三体宇宙已与PICO达成合作,将共同制作首个VR版本三体互动叙事作品,预计将在2023年上线;PICO也成为头部国创动画灵笼的VR动画番外篇的联合出品,预计将于2023年5月上线。资料来源:PICO官网,腾讯新闻,新浪VRPICO PICO 游戏:不乏游戏
109、:不乏TOPTOP级级VRVR大作,开发者生态尚未建成大作,开发者生态尚未建成引入引入TOPTOP级级VRVR大作:大作:据IDC统计,截至2021年Q2,Pico Store已有类似亚利桑那阳光(ArizonaSunshine)、MultiBrush等优质6DoF游戏及应用160余款,其中SUPERHOT VR幻音骑士(SynthRiders)雇 佣 战 士(CONTRACTORS)等TOP级VR大作,目前国内一体机平台均仅上线Pico。本地化运营:本地化运营:Pico还充分发挥本地优势,积极为海外引进的优质游戏进行本地化适配,针对雇佣战士(CONTRACTORS)超能军团(HyperDas
110、h 乒 乓:致 胜 11 分(ElevenTableTennis)等多人联机类游戏,Pico会为其在国内自建服务器以保证流畅运行,并进行本地化玩家社群运营。开发者生态:开发者生态:目前尚未看到Pico公开层面的内容筛选策略或规则,相比Quest和开发者共建生态,Pico在开发者生态仍然处于起步期。PICO 开发者计划资料来源:Pico官网PICO PICO 直播:明星、虚拟偶像、才艺主播三箭齐发直播:明星、虚拟偶像、才艺主播三箭齐发PICO的直播内容形式主要包括明星演唱会、虚拟直播和秀场直播。演唱会演唱会-借用明星效应出圈引流:借用明星效应出圈引流:2022年至今,PICO共举办了王晰、郑钧、
111、汪峰3场明星直播演唱会,1场A-SOUL虚拟偶像演唱会,VR线上演唱会这一形式已走进大众视野。虚拟主播虚拟主播-探索虚拟偶像技术边界:探索虚拟偶像技术边界:区别于其他VR直播形式,虚拟直播的主播形象均为虚拟建模,主播通过动作捕捉技术实现互动。才艺主播才艺主播-套用抖音成熟模式:套用抖音成熟模式:抖音早期直播依靠才艺直播起家,积累丰富主播资源及运营经验。赛事转播:PICO全程直播2022卡塔尔世界杯比赛。用户可通过超清巨幕观看世界杯赛事直播,还能邀请好友进入互动场实时语音畅聊,享受真正沉浸的观赛体验。资料来源:Pico公众号PICO PICO 社交:从社交:从0 0到到1 1阶段,主打虚拟形象阶
112、段,主打虚拟形象+PICO+PICO轻世界轻世界PICOPICO作为国内作为国内VRVR社交的开创者社交的开创者,已成立专门的已成立专门的VRVR社交中心社交中心。据36氪,波粒子科技创始人、前小米VR负责人马杰思任职Pico社交中心负责人。北京波粒子科技有限公司专注于二次元虚拟社交,2022年被字节跳动收购后原有团队50余人也整体并入Pico社交中心。PICOPICO虚拟数字人虚拟数字人+PICO+PICO轻世界轻世界,对标对标MetaMeta HorizonHorizon Worlds+AvatarWorlds+Avatar。PICO的VR社交布局当前处于从0到1的阶段,主打虚拟数字人+P
113、ICO轻世界,围绕用户在VR世界当中的形象与活动空间发力,路径类似Meta的Horizon Worlds+Avatar。三款团队协作游戏三款团队协作游戏射箭、投篮、网球娱乐性强,增加互动创造模式创造模式玩家可以使用创造编辑工具,创造自己的世界轻世界的“灵魂”定制虚拟形象定制虚拟形象官方形象模板个性化定制形象可以使用语音、手势、动作进行交互资料来源:Pico官网,36氪PICO PICO 健身:内容差异化拓展,兼顾趣味性与专业度健身:内容差异化拓展,兼顾趣味性与专业度对比Meta,PICO当前虽然硬件设备在中国市场已占据最高的市占率,但还未构建起可良性循环的完整生态。Meta的内容生态高度依赖重
114、度游戏,但PICO想要实现弯道超车,更有可能借力字节的视频内容、营销生态等资源优势走出差异化。VR+健身就是其中一个突破点。PICOPICO的的VR+VR+健身健身,兼顾趣味性兼顾趣味性、专业度专业度、社交社交。趣味性:趣味性:多合一运动OHSHAPE实况钓鱼等趣味性运动游戏,比较适合轻度健身爱好者;专业度:专业度:与超级猩猩合作的超燃一刻,配备专业教练与课程,内设奖励与闯关体系,运动强度较大的莱美搏击,比较适合中重度健身爱好者;社交:社交:PICO加入自研CalSense体能算法。用户可以在运动中心内查看卡路里燃烧量,运动数据可视化。同时,运动排行榜功能可与好友进行PK,增加社交属性。资料来
115、源:Pico官网20222022年年VRVR跟踪之跟踪之METAMETA从从RiftRift到到QuestQuest三款里程碑式产品三款里程碑式产品DKDK1 1VRVR产品范式的定义者产品范式的定义者:Oculus Rift DK1,简称Oculus一代。它的硬件部分是一个头戴式的显示设备,通过HDMI或DVI输入,可以将计算机渲染的画面显示在你面前的小屏幕里。这种全封闭的设计,虽然看起来有些笨重,但是却可以带给人以全方位的沉浸体验。QuestQuest2 2现象级消费级现象级消费级VRVR一体机一体机:Quest2是Facebook于2020年9月在Facebook Connect上正式发
116、布的VR一体机。它是既能独立工作又能连接到游戏PC的虚拟现实头盔;作为VR头部企业的年度旗舰VR一体机,Quest2一上市便获得了极大的关注。其配置与技术,乃至价格与外观设计等都或多或少的影响着日后VR一体机的走向。QuestQuest ProPro场景拓展场景拓展,娱乐娱乐-办公办公:Quest Pro是Meta高端产品线上的首款头显,为合作与创作而生,旨在扩展VR的可能性,其添加的一系列新技术能让创作者和用户在元宇宙中做到更多的事情。Meta希望Quest Pro能够为建筑师、工程师、设计师等工作者所用,帮助他们改进工作体验、提升创造力。Rift Rift DK1DK1Quest2Ques
117、t2Quest ProQuest Pro资料来源:Meta官网VRVR产品系列产品系列QuestQuest系列系列Meta产品路线机型机型Oculus Rift DK1Oculus Rift Oculus GoOculus Rift SQuestQuest2Quest Pro外观发布时间2012.82015.52017.102019.32018.92020.92022.10头显类型PCVRPCVR一体机PCVR一体机一体机一体机售价300美元599美元199美元399美元399美元299/399美元1499美元资料来源:Meta官网,安信证券研究中心Quest 2Quest 2产品亮点产品亮点
118、电池续航方面:电池续航方面:与一代基本一样,游戏时间为2至25小时(测试时间为2至3小时)。瞳距调节方面:瞳距调节方面:Quest 2摒弃了此前的底部滑轨设计(58Hz-72Hz),改用了屏幕侧滑三档调节(58mm、63mm和68mm)。硬件方面:硬件方面:Quest 2配备了卓越的Qualcomm Snapdragon XR2平台,有助于提供更好的AI功能,在性能翻倍的同时还带来5G接入能力。内存方面:内存方面:从原先的4G升级至6G。显示方面:显示方面:改进后的显示屏单眼具有1832 x 1920像素。为了获得更身临其境的体验,Quest 2还配备了90Hz显示屏。控制器:控制器:新版Oc
119、ulus Touch控制器具有先进的手势追踪功能,可以随心操控,享受更真实的VR体验。资料来源:Meta官网,青亭网,映维网,新浪VR,安信证券研究中心Quest proQuest pro产品亮点产品亮点作为Meta首款高端头显设备,Pro机型支持全彩MR混合现实体验的高分辨率传感器、高清LCD显示屏、以及眼动追踪和面部追踪功能。面部跟踪面部跟踪Quest Pro有五个面向面部的传感器,可以捕捉眼睛和面部,从而创建各种表情。全新光学组件全新光学组件采用Pancake透镜,全新搭载的两个LCD显示器还使用了高端桌面显示器才会使用的局部调光和量子点技术,在颜色方面的表现优秀。更强大的更强大的MRM
120、R体验体验全新的传感器架构,配备高分辨率的对外摄影机,进而打造高分辨率、全彩的MR体验。自动追踪手柄自动追踪手柄每个手柄内置了三个传感器,能在不借助头显的情况下追踪其自身在3D空间里的位置,为用户提供全方位的360度追踪。资料来源:Meta官网,青亭网,映维网,新浪VR,安信证券研究中心Quest Quest 内容生态内容生态2019年Meta建立Oculus Rift和Quest内容平台,并在2021年2月推出APP Lab平台,允许开发者以相对宽松的方式发布自己的游戏。2021年10月,Meta宣布1,000万美元的创作者基金,鼓励更多的内容创作者进行VR内容创作。目前,Quest商店有超
121、过400款内容,其中1/3的作品创造了超过100万美元的收入,有33款作品的总收入突破1000万美元。自2021年以来,收入超过500万美元的作品数量翻了一番,达到55款。在 META Connect2022大会期间,Meta宣布现在正在与十几个合作伙伴合作,为Quest生态系统带来新的工具。其中微软是重要的合作伙伴,将为Quest平台带来丰富的微软工具,包括办公套件、Xbox云游戏和 Windows等。资料来源:Meta Connect 2022,青亭网,映维网Quest Quest 游戏游戏据VR陀螺,截至2022年3月,Quest Store应用总数超400款,截至2022年8月,Que
122、st Store排名前十游戏有Beat Saber、Blade&Sorcery:Nomad、Warplanes:Battles over Pacific等,涉及射击、音乐、健身、战斗沙盒等题材;其中Beat Saber 是目前最畅销的VR游戏之一。d收购Beat Games收购Play Giga收购Sanzaru Games收购Ready At Town收购Downpour收购Unit2 Games收购Bigbox VR收购Withind 截至2021年年底,Quest商店交易规模已超过10亿美元;截至2022年4月,Oculus游戏平台VR内容达1738个。资料来源:VR陀螺,Oculus官
123、网Quest Quest 社交社交Horizon WorldsHorizon WorldsHorizon HomeHorizon HomeHorizon WorkroomsHorizon Workrooms可自定义形象与环境并邀请好友进入做客跨距离虚拟会议室,以虚拟形象参加会议,或通过视频电话从计算机拨号进入虚拟房间推出Messenger支持;Instagram、Facebook等服务成为Home的2D面板应用资料来源:Meta Connect2022PICO VS QuestPICO VS Quest:硬件旗鼓相当,差异在于内容:硬件旗鼓相当,差异在于内容Pico Neo 3 VS Ques
124、t 2产品Quest2Pico Neo3CPU高通XR2高通XR2运行内存RAM6GB6GB存储ROM128/256GB128/256GB基础版价格399美元2499RMB是否支持扩展存储不支持不支持材质LCDLCD分辨率3664*19203664*1920刷新率120HZ120HZ电池续航3640mAh5300mAh视场角FOV88度98度交互自由度6dof6dof是否支持Steam支持支持重量450g395g从硬件参数看,Pico Neo3可与Quest2一较高下,甚至在视场角、电池容量等方面优于Quest2。然而它们的核心差距还是在于其VR内容生态,Quest内容生态游戏、娱乐、社交等更
125、加丰富。资料来源:Pico官网,Oculus官网,安信证券研究中心PICO VS QuestPICO VS Quest:硬件旗鼓相当,差异在于内容:硬件旗鼓相当,差异在于内容PICO 4 Pro VS Quest Pro产品Pico4 ProQuest Pro处理器骁龙XR2XR2+Gen1内存8GB12GB存储512GB256GB视场角105度106度分辨率单眼2160*2160 LCD(两块)单眼1800*1920 LCD(两块)刷新率72hz/90hz72hz/90hz光学模组PancakePancake透视全彩全彩电池容量5300mAh5000mAh表情追踪(眼睛和面容)支持支持IPD
126、调整范围62-72mm55-75mm重量586g722g零售价3799RMB1500美元综合硬件指标来看,PICO4 Pro、Quest Pro两款设备均属同代产品中的旗舰产品,Quest Pro已着力于切入办公场景,PICO4仍着眼于娱乐与体验。资料来源:Pico官网,Oculus官网,安信证券研究中心PICO VS QuestPICO VS Quest:硬件旗鼓相当,差异在于内容:硬件旗鼓相当,差异在于内容PICO与Quest的比拼,实际上就是字节与Meta的比拼。Quest和Pico的硬件体验感差异不大,但Quest内容强于游戏,Pico内容强于视频,PICO有望借助字节的短视频内容生态
127、弯道超车。PICO当前在内容方向上的发力路径有两条,一是游戏,主要依靠串流Steam平台、海外VR大作的移植以及中小开发者的扶持;而是泛娱乐,包括视频、全景式沉浸视频、互动剧、直播等等。资料来源:Pico官网,Oculus官网20222022年年VRVR跟踪之跟踪之PimaxPimax系列系列推出第一代产品Pimax 4KPimax 8K X和Pimax 8K Plus发布Pimax Reality 12K发布Pimax Crystal 发布2016.6 2019 2020.12 2021.12 2022.6Pimax 5K Super发布小派科技(Pimax)创立于2015年,创始团队由国内
128、第一批对虚拟现实技术有狂热爱好的技术工程师组成,已经先后参与全球顶尖的VR头显项目研发与生产,团队成员大多来自虚拟现实、智能手机、可穿戴设备、互联网、游戏、医疗等专业领域。资料来源:Pimax官网PimaxPimax CrystalCrystalOLED+Mini LED屏幕160Hz硬核刷新率5760 x2880分辨率硬件方面:硬件方面:搭载了高通XR2和Pimax定制的PCVR引擎双处理双芯片。眼动追踪功能眼动追踪功能&Auto&Auto-IPDIPD:快速自动调节瞳距;完美眼追、虚拟社交、无限真实。突破突破VRVR镜片设计限制:镜片设计限制:通过可刚换透镜个性化调整用户所需的PPD和FO
129、V,可达消费级VR目前已知的最高PPD。体验方面:体验方面:WiGig:支持60GHz频率无线传输PC数据;6000mAh电池;四摄像头、双手柄、6DOF。屏幕方面屏幕方面资料来源:Pimax官网,安信证券研究中心小派内容生态小派内容生态在2022年6月的Pimax Crystal发布会上,小派就预告了自己的应用商城Pimax Store即将上线。在选取上架内容时,PimaxStore将兼顾用户体验和内容与硬件的匹配度,不仅会注重内容品质,也愿意与独特的、硬核的甚至小众的VR内容达成合作,扶持上架。小派应用商城首批上架阵容将涉及游戏,VR工具软件,VR视频播放器,VR社交软件等。首发的PCVR
130、游戏阵容将以能展现小派头显特性的游戏为主,其中就包含2021年大热僵尸FPS VR游戏Surv1v3,该游戏也曾荣登2021年度Steam大赏VR游戏黄金榜单。此外,小派已经与业内王牌拟真赛车游戏厂商iRacing,建立深度合作关系,进一步巩固小派产品在拟真游戏应用上的绝对首选地位。资料来源:Pimax官方公众号20222022年年VRVR跟踪之跟踪之HTCHTC系列系列VIVE Pro系列:专业级PC-VR设备。VIVE Pro为满足专业级的VR用户需求而设计,是简单易用的PC-VR系统,满足各种业务需求进行扩展HTC VIVEHTC VIVE系列产品系列产品VIVE Pro系列VIVE C
131、osmos系列VIVE Focus系列VIVE Focus系列:多模式6dof高端VR一体机。VIVE Focus3是HTC VIVE最新推出的VR一体机,搭载最新高通骁龙XR2处理器,以5K分辨率、120视场角和更平滑的90Hz刷新率,带来沉浸式视觉效果。VIVE Cosmos系列:定制化PC-VR设备。采用全新定位系统,六个摄像头传感器与最新的软件优化功能相结合,可实现精确的 inside-out追踪。资料来源:HTC官网HTCHTC Vive Focus3Vive Focus3高精度手部追踪功能:高精度手部追踪功能:用户可以随时放下操控手柄,以激活26点手部追踪,确保用户在虚拟环境中交互
132、的精准度达到新水准。显示方面:显示方面:5K分辨率;90Hz刷新率;120度视角。沉浸式沉浸式3 3D D空间音效:空间音效:开放式双驱动扬声器可提供3D空间音效。远程协作:远程协作:在不同地理位置远距离与团队合作,就像面对面一样,使用强大的交互式VR工具进行互动。VIVE VIVE Focus3Focus3资料来源:HTC官网20222022年年VRVR跟踪之跟踪之PS VRPS VR系列系列2016年,索尼的第一代VR设备PS VR正式推出,正是VR行业的第一次兴盛期。2022年,索尼宣布其第二代VR产品PS VR2即将在2023年2月发布,并且直接公布了产品的参数信息。PS VR,看起来
133、更像是PS游戏机的附庸品。从官宣信息来看,PS VR2仍然是从PS游戏机配件的角度做VR,需要搭配PS5使用。项目项目PS VRPS VRPS VR2PS VR2分辨率1920*10804000*2040显示屏OLEDOLED HDR刷新率90Hz 120Hz90Hz 120Hz视角100度110度跟踪通过PS MOVE进行LED跟踪眼动追踪触觉反馈仅手柄头显和手柄声音3.5mm耳机接口3.5mm耳机接口连接接口USB-A和HDMIType-C资料来源:PlayStation官网,安信证券研究中心PS VR2PS VR2眼动追踪眼动追踪头戴设备会侦测眼球的移动,让内向外追踪内向外追踪通过嵌于头
134、戴设备中的四个摄像头追踪用户与控制器,用户的动作与视线方向即会反映在游戏内。4KHDR4KHDR显示器显示器通过最高120fps的4K高动态范围视觉效果,体验清晰的虚拟现实环境。两个2000*2040的OLED显示器将提供原始PS VR头戴设备四倍以上的分辨率。PlayStation VR2 PlayStation VR2 SenseSense控制器控制器通过触觉反馈、自适应扳机、精准跟踪及手指触摸侦测,以全新方式与虚拟世界互动。这全都整合于一个以人体工学设计的独特外型中。用户在线与其他玩家相遇时能以逼真的全新方式进行互动,感受到的情绪反应和表达细腻度都会因而提升。头戴振动反馈头戴振动反馈资料
135、来源:PlayStation官网,安信证券研究中心PS VRPS VR内容生态内容生态索尼持续投入优质独占游戏,利用自身游戏平台的优势,借助经典热门IP吸引用户流量。包括生化危机7蝙蝠侠钢铁侠VRHitan等。索尼这几年悄然加快了在VR内容上的投入,公司计划未来通过积极投资建设全球工作室,加强游戏自研能力,打造优质独占游戏,维持自身在内容领域的优势。生化危机生化危机7 720162016蝙蝠侠:阿卡姆蝙蝠侠:阿卡姆2012017 7漫威钢铁侠漫威钢铁侠VRVR20202020Hitman3Hitman320202121资料来源:新浪VR20222022年年ARAR跟踪之跟踪之RokidRoki
136、d系列系列Rokid Glass二代发布(2020)Glass系列专用场景专用场景Rokid创立于2014年,目前致力于AR眼镜等软硬件产品的研发及以YodaOS操作系统为载体的生态构建。公司通过语音识别、自然语言处理、计算机视觉、光学显示、芯片平台、硬件设计等多领域研究,将前沿的Al和AR技术与行业应用相结合,为不同垂直领域的客户提供全栈式解决方案,其Al、AR产品已在全球七十余个国家和地区投入使用。内容属性内容属性日常佩戴日常佩戴工具属性工具属性Vision系列Rokid Vision2发布(2021)Air系列Rokid Air发布(2021)X系列X-Craft发布(2020)AR资料
137、来源:Rokid官网RokidRokid AirAir屈光度可调屈光度可调支持单眼500度以内屈光度调节记忆金属鼻托记忆金属鼻托各类鼻梁均使用轻巧便携轻巧便携仅重83g,机身可折叠易携带显示方面显示方面4K显示屏75Hz刷新率1800nit亮度视场角43度双高品质定向扬声器双高品质定向扬声器环绕立体声震撼音效拓展性强拓展性强可连接手机、PC、平板;兼容所有主流视频平台app。Rokid StationRokid StationRokid Station为Rokid Air智能眼镜的专配智能终端,也可化身为遥控器,当我们进行菜单选择或打游戏时,都可通过Station上的按键进行操作。资料来源:R
138、okid官网,安信证券研究中心RokidRokid内容生态内容生态在内容生态层面,目前阿里、b站、腾讯、字节等头部大厂都给予高度认可并与Rokid达成合作。引入了bilibili、抖音大屏版、葫芦视频、南瓜视频、CCTV新视听,在应用商店提供下载。全网影视、综艺、赛事、直播,应有尽有。还引入了QQ音乐、全民K歌等音乐视频内容,提供更丰富的泛娱乐应用。在游戏领域,Rokid Station引入上万款本地经典休闲游戏,同时还支持原神、最终幻想、仙剑奇侠传、真三国无双等数百款知名3A大作,并和中国移动、中国电信等运营商云游戏平台达成了合作,共同探索便携沉浸的巨幕云游戏体验。在办公领域,Rokid S
139、tation创新引入阿里无影云电脑。连接Rokid Air,配合蓝牙键鼠,成为一套小巧、便携的移动办公套件,随时随地满足工作、学习需求。资料来源:Rokid官网,官方公众号20222022年年MRMR跟踪之跟踪之HololensHololensHoloLens MR头显由Microsoft公司于北京时间2015年1月22日发布。M R 的 意 思 是 M i x e dReality混合现实,Hololens运用的MR技术具备环境学习能力,能够实现全息影像和真实环境的融合。辅助辅助3D3D建模建模模拟游戏模拟游戏观看视频观看视频模拟登陆火星场景模拟登陆火星场景功能介绍功能介绍资料来源:微软Ho
140、lolens官网,Taoxv论坛微软MR头显HoloLens测评产业链关键环节产业链关键环节光学、显示、交互、芯片光学、显示、交互、芯片相较于智能手机,我们认为XR硬件产业链的关键环节体现在光学、显示、交互、芯片。1 1)光学:对于光学:对于VRVR而言而言,PancakePancake助力助力VRVR头显进一步轻薄化头显进一步轻薄化,消费级消费级VRVR头显的商用进程正在加快头显的商用进程正在加快,视场角视场角、分辨率分辨率、PPDPPD等参数同等参数同样在进步提升样在进步提升。对于对于ARAR而言而言,光波导技术持续突破光波导技术持续突破,从光学效果从光学效果、外观形态来看具备较高的发展潜
141、力外观形态来看具备较高的发展潜力,有望探索更广阔的的消有望探索更广阔的的消费前景费前景。2 2)显示:显示:FastFast-LCDLCD由于成本优势当前仍然占据主流由于成本优势当前仍然占据主流,但但MicroMicro OLEDOLED正快速导入应用正快速导入应用,作为作为PancakePancake方案的配合加速提升显示性方案的配合加速提升显示性能能,MicroMicro LEDLED技术也在逐渐成熟技术也在逐渐成熟,有望接力有望接力MicroMicro OLEDOLED驱动近眼显示再升级驱动近眼显示再升级。3 3)交互:向接近人自然的交互不断进化交互:向接近人自然的交互不断进化。眼动追踪
142、眼动追踪、面部识别面部识别、自动自动IPDIPD调节调节、可变焦显示等技术越来越多地应用在新一代可变焦显示等技术越来越多地应用在新一代VRVR当中当中,手势识别手势识别、InsideInside-outout、6 6DoFDoF等技术也不断成熟等技术也不断成熟,与人交互的范围也越来越广与人交互的范围也越来越广。4 4)芯片:高通芯片持续迭代芯片:高通芯片持续迭代,从从VRVR2 2到到ARAR1 1,且定制化芯片成为最新趋势且定制化芯片成为最新趋势,手机芯片商手机芯片商/AIOT/AIOT专业芯片商专业芯片商/品牌厂商也纷纷参与开品牌厂商也纷纷参与开发发,希望抢占希望抢占XRXR产业链核心部位
143、产业链核心部位。VRVR光学:光学:PancakePancake方案带来里程碑式体验提升方案带来里程碑式体验提升VR光学方案沿着传统透镜-菲涅尔透镜-Pancake超短焦方案持续迭代。Pancake方案使光线在镜片、延迟片、反射式偏振片中多次折返,将光路压缩至2-3片偏振片的狭窄空间内,打破菲涅尔透镜对焦距的要求,帮助头显重量降至200g以内,厚度缩减至传统终端的三分之一,大幅提升佩戴舒适性。产品名称产品名称Oculus Quest 2Oculus Quest 2ArparaArpara AIO 5K VRAIO 5K VR一体机一体机ArparaArpara 5K VR5K VR头显头显华为
144、华为VR GlassVR Glass产品形态一体式分体式分体式,无计算模块和电池分体式产品示意图选择方案菲涅尔透镜+Fast LCDPancake+Micro OLEDPancake+Micro OLED超短焦+Fast LCD主机厚度142.5mm-30mm26.6mm整机重量503g380g200g166g资料来源:Oculus官网,Arpara官网,华为官网,安信证券研究中心PancakePancake商用趋势确定,存在透光率商用趋势确定,存在透光率/鬼影等痛点鬼影等痛点PancakePancake方案光效较低方案光效较低,理论最高理论最高2525%,通常仅约通常仅约1010%。受光学原
145、理限制,光线在Pancake模组中每次经过偏振/半反射环节,光效损失50%。以两片式Pancake 简易模组为例,光线从屏幕发出后至少经过一次圆偏振镜,两次半透半反镜,光效折损已到12.5%,考虑光线传播中不可避免的其他损失,通常Pancake模组光效仅约10%。因此,Pancake光学方案通常对屏幕亮度要求更高,光学与显示方案需配套迭代。PancakePancake方案的鬼影问题比传统透镜方案更严重方案的鬼影问题比传统透镜方案更严重。在光学成像系统中,透镜界面多次反射、透镜缺陷散射、物理结构散射等因素造成的杂散光,在画面中的某个位置形成的“像”被称为“鬼影”(ghost)。鬼影现象会直接导致
146、图像质量的降低。Pancake方案因为光线多次折返,鬼影问题相比常规非球面/菲涅尔方案更为严重,一般通过改善透镜材料、形状等方式优化。当前的当前的PancakePancake方案能实现的视场角较小方案能实现的视场角较小。尽管Pancake方案视场角理论上限较高,但目前可实现的视场角(90左右)明显低于菲涅尔透镜方案(100以上)。曲面贴膜工艺能够扩大FOV,改善Pancake视场角小的缺点,但是工艺难度较大。以上提及的Pancake方案的三大痛点中,光效低需通过配套高亮度显示方案解决,但鬼影现象、视场角小均可通过改进Pancake模组加工工艺解决/优化。PancakePancake工艺难点:工
147、艺难点:膜材料质量膜材料质量/贴膜工艺贴膜工艺/组装调整组装调整膜材料质量:膜材料质量:手握Pancake核心材料的公司美国3M,其反射偏振模是目前Pancake模组厂商难以绕开的关键材料。反射偏振片和1/4相位延迟片工作的准确性与稳定性对于Pancake光学成像质量构成关键影响,膜材质量的标准和对应要求较高,目前供应商以海外厂商3M、旭化成等,3M也联合华硕推出了基于Pancake方案的VR参考设计。贴膜工艺:贴膜工艺:光学贴膜的方式可以分为平面贴膜和曲面贴膜两种。平面贴膜技术难度较低,但会牺牲部分光学性能和成像质量。曲面贴膜可以带来更大的FOV和更优质的成像质量,但是工艺难度较大,容易边缘
148、褶皱和翘起。组装调整:组装调整:Pancake方案光路设计复杂,细微差异便会导致光学模组整体的光路变化,因此对组装调整环节的要求较高。高精度AA设备在Pancake组装过程中起到关键的效率和良率提升作用。图:Pancake模组的加工流程资料来源:Wellsenn XRARAR光学:光波导发展趋势清晰光学:光波导发展趋势清晰与VR的不同之处在于,AR眼镜需要透视(see-through),既要看到真实的外部世界,也要看到虚拟信息,所以成像系统不能挡在实现前方,这就需要多加一个或一组光学组合,通过层叠的方式,将虚拟信息和真实场景融为一体。目前比较成熟的AR光学方案主要包括棱镜、BirdBath自由
149、曲面、阵列光波导、光栅光波导。其中,棱镜方案畸变小、体积小但FOV小、镜片太厚难以普及;BirdBath自由曲面FOV较大、体积适中但是有较严重的重影问题。光波导方案可分为阵列光波导与衍射光波导,阵列光波导FOV较大显示效果好,但光效低、量产难度高,衍射光波导还存在较大技术难点,工艺上难以做到均匀性。技术路径技术路径优点优点缺点缺点代表公司代表公司棱镜棱镜畸变小、体积小、设计难度小FOV小、遮挡视线镜片较厚、外形难被大众接受RealWear、Google GlassBBBB自由曲面自由曲面FOV较大体积适中、设计难度小透光度低(10mm)Epson、耐德佳、Nreal、影创、Meta阵列光波导
150、阵列光波导FOV较大、显示效果佳透光度高(80%),镜片薄(1-2mm)光效率相对低加工难度高珑璟、Lumus、灵犀、理湃衍射光波导衍射光波导FOV、Eyebox可以设计得很大半导体工艺极限成本较低均匀性差,存在鬼影和倒影现象材料难找,设备贵,生产工艺难Microsoft、Vuzix、Magic Leap、Waveoptics、Digilens资料来源:VR陀螺,安信证券研究中心ARAR光学:自由曲面、光学:自由曲面、BirdBathBirdBath为过渡方案为过渡方案自由曲面和自由曲面和 BirdBathBirdBath 小幅改善镜片厚度小幅改善镜片厚度、其他性能良好其他性能良好、量产制造成
151、熟量产制造成熟,成为近几年的过渡方案成为近几年的过渡方案。自由曲面方案由表面形状不能被连续加工、具有传统加工成型的任意性曲面担当反射镜,对显示屏光线进行准直和成像,因此成像质量较高,色彩饱和度和光学效率表现优秀。但自由曲面结构局部精度低,带来低分辨率和画面扭曲,使得现实世界和虚拟世界光线传递时存在畸变现象。BirdBath 方案下,显示屏光线经 45 度角的分光镜反射至曲面镜弹射入眼,而现实光线透过曲面镜和分光镜入眼。光学结构简单,光效高、视场角大;但眼动范围受限,同时透射入眼面临图像畸变、光线透过率低的缺点。自由曲面和 BirdBath光学结构相对简单,一方面光效高,显示屏选择灵活,另一方面
152、制造难度低,可以较低成本规模量产,成为目前中低端或消费级 AR眼镜的主要光学方案。但其他性能一般,存在畸变等问题,致命的是,为实现可用视场角,镜片厚度压缩极限为8mm,无法做到日常眼镜般的轻薄机身。ARAR光学:光波导为最终发展方向光学:光波导为最终发展方向光波导由于轻薄性及显示效果优势光波导由于轻薄性及显示效果优势,一旦突破量产瓶颈后有望实现快速渗透一旦突破量产瓶颈后有望实现快速渗透。光波导可以分为两类技术方案光波导可以分为两类技术方案,几何光波导与衍射光波导几何光波导与衍射光波导。几何光波导成像效果好但量产难度高,衍射光波导具备基础量产条件有望成为主流技术方案。几何光波导由一系列半透半反镜
153、面组成,镜面是嵌入到玻璃基底里面并且与传输光线形成一个特定角度的表面,每一个镜面会将部分光线反射出波导进入人眼。几何光波导的概念最先由以色列公司Lumus提出并一直致力于优化迭代,市场上还未出现大规模的量产眼镜产品。衍射光波导可进一步细分为全息光波导与表面浮雕光栅波导,主要原理为通过衍射光栅替代传统几何光学器件,采用镜片表面的光栅结构实现光束的扩展和耦出。通过合理的设计光栅结构,光栅波导技术可以实现出瞳的二维扩展。全息体光栅方案厂商需要具有IDM能力,提供从材料到量产完整的解决方案,代表公司包括苹果公司收购的Akonia、Digilens、Sony等。表面浮雕光栅波导已具备成熟批量生产条件,代
154、表公司包括微软HoloLens 2,Magic Leap One等。显示:显示:LCD&OLEDLCD&OLED持续演进,硅基持续演进,硅基OLEDOLED路径明确路径明确AMOLED-Fast LCD(Mini LED背光)-Micro OLED.早期VR头戴式设备大部分采用普通LCD,而后逐渐被OLED取代。2016年前后,OLED技术尝试用于VR设备中,并一度成为VR设备生产商的首选。2018年以后,Fast-LCD技术的出现让LCD逐渐成为主流选择。自2022年起,显示方案进一步迭代,行业龙头开始使用带有Mini LED背光的Fast LCD显示面板,或使用硅基OLED(OLEDoS)
155、,来提升显示性能,比如Apple MR将使用硅基OLED显示方案,Quest Pro将使用Mini LED背光的Fast LCD显示面板等。资料来源:Omdia显示:趋势显示:趋势1 1MiniMini-LEDLED背光背光LCDLCDMini LED(Mini Light-Emitting Diode,次毫米发光二极管),指100300微米大小的LED芯片,芯片间距在0.11mm之间,采用SMD、COB或IMD封装形式的微型LED器件模块,往往应用于RGB显示或者LCD背光。Mini LED的应用主要分为作为使用MiniLED芯片+LCD的背光方案与直接使用Mini RGB显示屏的自发光方案
156、。当前Mini LED背光方案已经进入爆发期,苹果、三星等多家品牌厂商都已开始推出相关产品。Fast-LCD与Mini LED相结合,不仅可以很好的解决漏光难题,也能够进一步提升Fast-LCD在高对比度、高刷新率、高亮度等方面的性能,辅以HDR功能,将更好地发挥VR产品近眼超清显示的画质要求。截至目前,已发布的应用Mini LED的VR头显共有四款,为Varjo Aero、Pimax Reality 12KQLED、Pimax Crystal、创维Pancake 1pro。图:Mini LED背光结构图资料来源:Display技术,Varjo官网,安信证券研究中心图:全球首款Mini LED
157、 VR-Varjo Aero显示:趋势显示:趋势2 2MicroMicro-OLED(OLED(硅基硅基OLED)OLED)Micro OLED(又称硅基OLED,OLED on silicon),是半导体技术与OLED技术的结合,Micro-OLED光源模块是通过使用气相沉积将OLED沉积到衬底上而产生的。Micro OLED(硅基)包含了夹在两个电极之间的有机发光材料,当电流流过时二极管发光。随后通过滤光片生成所需的颜色。硅基OLED创新性地结合了半导体与OLED,显示器件采用单晶硅芯片基底。硅基OLED都是在6英寸、8英寸的晶圆上小面积蒸镀,大大减小了生产OLED时要克服的蒸镀均匀性难题
158、。Micro-OLED微显示器件具有OLED自发光、薄、轻、视角大、响应时间短、发光效率高等优异特性,而且更容易实现高 PPI(像素密度)、体积小、易于携带、功耗低等应用效果,特别适合应用于近眼显示设备。图:硅基OLED原理图资料来源:MicroDisplay,arpara官网,安信证券研究中心图:全球首款Micro OLED VR-arpara 5K VR显示:趋势显示:趋势3 3Micro LEDMicro LEDMicro LED(Micro Light-Emitting Diode,微型发光二极管),指在一个芯片上集成的高密度微小尺寸的LED阵列,如LED显示屏每一个像素可定址、单独驱
159、动点亮,可看成是户外LED显示屏的微缩版,将像素点距离从毫米级降低至微米级。通过巨量转移技术,将微米等级的RGB三色Micro LED搬到基板上,形成各种尺寸的Micro LED显示器。Micro LED的芯片到了肉眼难以分辨的等级,可以直接将R、G、B三原色的芯片拼成一个像素点,变成“一个像素”的概念,不再需要滤光片和液晶层。Micro LED用到的自主发光器件,即LED半导体灯珠,是一个正负极性明确、体积形状固定的固体小颗粒灯珠,再通过“巨量转移”技术平面化集成大量的微小LED灯珠器件。“巨量转移”技术是Micro LED产业独有技术,难以从其它相关产业获得巨大的技术帮助。目前,Micro
160、 LED巨量转移技术依然处在实验室攻关阶段。图:LCD、OLED、Micro LED结构图对比:Micro LED明显更薄资料来源:行家说Display,AMOLED,安信证券研究中心图:巨量转移技术原理图显示:硅基显示:硅基OLEDOLED有望成为行业主流有望成为行业主流从性能参数性能参数角度看,相比Fast-LCD和Micro LED,硅基OLED色彩表现要更强,沉浸体验更好。对比LCD屏幕来说,由于其拥有黑矩阵的工艺,因而限制了LCD的PPI提高,即便像素密度提高到1000ppi以上也难以完全消除纱窗效应;对比Micro LED来说,尚存在工艺和产业化问题,成熟度不够高,而且也可能会存在
161、像素点亮度不一致的问题。从工艺制造工艺制造角度看,其技术工艺主要分为单晶硅光刻的基底驱动层技术和OLED蒸镀技术。对于单晶硅光刻的基底驱动层技术而言,硅基OLED采用的是28nm、55nm、或者180nm成熟的CMOS工艺,其工艺难度要远低于目前的顶级光刻单晶硅技术。显示技术显示技术传统传统LCDLCDFastFast-LCDLCDMiniMini-LEDLEDOLEDOLEDMicroMicro-OLEDOLEDMicroMicro-LEDLED技术类型技术类型背光/LED背光/LED背光/LED自发光自发光自发光对比率对比率1,000:15,000:110,000:1无上限无上限无上限亮度
162、亮度5005001000+5001000+5000+发光效率发光效率低低中等中等高高反应时间反应时间毫秒(ms)毫秒(ms)纳秒(nm)微秒(m)微秒(m)纳秒(nm)对比度对比度低低中等高高高寿命寿命(小时小时)60k60k80-100k20-30k30k100k柔性显示柔性显示难难难容易容易难成本成本低低较高中等较高高功耗功耗高高约LCD的40%-50%约LCD的60%-80%约LCD的30%-40%约LCD的10%运作温度运作温度-40-100-40-100-100C-120-30C-85-50C-80-100-120产业化进展产业化进展已大规模量产已大规模量产已量产已规模量产初步规模量
163、产研究阶段产业成熟度产业成熟度高高较高高较低低主要机型主要机型早期VR盒子Quest 2、创维Pancake 1、PICO Neo3创维Pancake 1 pro、预计Quest ProQuest 1、HTC Vive、预计索尼PS VR2预计苹果MR-资料来源:OFweek,MicroDisplay,安信证券研究中心VRVR交互:需传感器、芯片、算法等多方共同参与交互:需传感器、芯片、算法等多方共同参与VR的感知交互交互需要传感器、芯片、算法等多方参与共同完成整体流程。传感器:利用含摄像头在内的传感器精准实时捕捉用户行为;芯片:多传感器融合和校准后的图像经芯片算力、算法打造多维感知效果;屏幕
164、:最后从设备呈现给用户。用户行为用户行为捕捉信息捕捉信息识别运算识别运算反馈输出反馈输出用户感知用户感知头部,手部眼球转动全身肢体肢体动作肢体动作触感压力触感压力声音声音摄像头摄像头灰度/RGB摄像头红外摄像头结构光摄像头TOF&深度相机惯性传感器惯性传感器陀螺仪加速度传感器磁力传感器其他传感器其他传感器芯片算力芯片算力算法算法计算机视觉机器学习深度学习SLAM屏幕、手柄扬声器震动设备视觉听觉触觉嗅觉味觉资料来源:CSDN论坛VR交互全流程ARAR交互:复用交互:复用VRVR交互,但需优化算法和传感器交互,但需优化算法和传感器AR交互的整体思路是复用相对成熟的VR感知交互技术,但受轻量化、功耗
165、和成本限制,现搭载功能有限,空间交互、手势识别将最先应用。AR 面临的难点是在使用较少数量传感器的情况下,保持高自由度和高精度,现阶段通过提升算法、传感器和软硬适配进行效果优化。目前AR多用的交互方式包括控制器、手势交互、语音交互等。部分B端眼镜可像VR般搭载大量传感器,交互精度较高,如微软 HoloLens 分别搭载 8 和 9 颗摄像头,附加 IMU 等传感器。但这同时带来设备体积、重量和价格上升,难推广至消费端。空间定位是空间定位是ARAR的必要交互功能的必要交互功能。AR区分于VR的目标是实现虚实融合,因此需要感知空间和分辨场景。手部交互具备进步空间手部交互具备进步空间。AR一般不搭配
166、手柄使用,未来作为生产力工具使用需要进一步精进手部交互,最终目标是裸手交互。ARAR交互:交互:SLAMSLAM实现虚拟信息和现实世界的结合实现虚拟信息和现实世界的结合SLAM(Simulataneous Localization and Mapping),同步定位与地图构建,指在运动过程中通过重复观测到的环境特征定位自身位置和姿态,再根据自身位置构建周围环境的增量式地图,从而达到同时定位和地图构建的目的。SLAM 在AR 中的主要应用是1)现实物体与虚拟物体的有效交互,2)实现语义理解,优化智能辅助功能。实现虚拟世界和现实世界之间坐标叠加实现虚拟世界和现实世界之间坐标叠加、实现几何物理信息交
167、互实现几何物理信息交互。与电脑、平板、手机的3D 显示不同,AR 更注重虚拟信息与真实信息的无缝融合,即图像出现的平面位置与景深准确、带来沉浸感的良好体验。这就需要利用SLAM 算法,准确叠加虚拟坐标系和真实坐标系。同时,真实环境中有高低起伏、有障碍物、有遮挡关系,AR 可以让虚拟信息跟这些真实环境中的物理信息进行交互。实现语义理解实现语义理解,优化智能辅助功能优化智能辅助功能。随着机器学习和深度学习的发展,虚拟信息可以“理解”真实世界,让二者的融合更趋于自然。当前计算机已经可以已经可以认出图片上的内容,但没有理解内容之间的关系,当前的一项研究方向是,应用SLAM+AI 技术,通过特征提取,实
168、现机器的语义理解,优化AR系统的辅助功能。芯片:从芯片:从XR2XR2到到AR2AR2,高通,高通XRXR芯片持续迭代芯片持续迭代早期,高通主要基于手机芯片骁龙820、835、845研发VR开发套件,2018年发布XR专用芯片XR1,2019年推出全球首个支持5G的XR专用芯片XR2,相比上代CPU和GPU性能提升2倍、视频带宽提升4倍、单眼分辨率提升6倍、AI性能提升11倍,并多方面定制化升级。据青亭网,2022年推出全球首个AR专用芯片AR2。骁龙AR2 Gen1 平台,以彻底改变头戴式眼镜的外形,并为现实世界/虚拟世界的组合开创一个空间计算体验的新时代。资料来源:青亭网芯片:定制化开发成
169、为最新发展趋势芯片:定制化开发成为最新发展趋势目前VR/AR平台中,高通芯片一家独大,国产芯片正奋力追赶。多方竞相开发,有望持续推动XR芯片向高性能、定制化方向升级。手机芯片平台商:手机芯片平台商:高通:与Meta已签署协议,为Meta的Quest生产定制芯片组。AIOTAIOT专业芯片商:专业芯片商:瑞芯微16年推出RK3399,算力2.4TOPS,21年发布新一代RK3388,算力提升至6TOPS;全志科技16年发布H6VR入门芯片,17年推出VR9,支持4K60fps解码,主要用于中低端VR设备。品牌厂商:品牌厂商:华为海思针对XR领域开发3796V300芯片,集成8核64位Cortex
170、-A73 CPU和Mali-G52 MC6GPU,算力达到9TOPS;三星推出Exynos 芯片,配置Mali-G71 MP20 GPU;苹果预计将推出定制化M2 Staten芯片与协处理器Bora 芯片以运用在MR新品。硬件与内容硬件与内容/应用应用/场景互为增长飞轮场景互为增长飞轮硬件与内容硬件与内容/应用应用/场景相互螺旋式渐进场景相互螺旋式渐进。沉浸式体验只是表象,各种前沿的技术也只是辅助手段,内容/应用/场景才是VR有别于其他娱乐方式的内核。硬件硬件内容内容/应用应用/场景场景/硬件对内容硬件对内容/应用应用/场景的促进:场景的促进:硬件参数提升到合格的水准,内容/硬件/场景的体验才
171、具备合格的底层;硬件达到优秀的水平(性能优秀、价格大众化)为内容/应用/场景的繁荣创造条件;硬件的进步与升级能够刺激为内容/应用/场景的创新。内容内容/应用应用/场景对硬件的反向促进:场景对硬件的反向促进:杀手级内容/应用/场景是推动硬件普及的最核心力量;内容/应用/场景的创新倒逼硬件升级。资料来源:安信证券研究中心国内外对国内外对XRXR的两种认知的两种认知国内停留在娱乐与体验国内停留在娱乐与体验,则对应的硬件出货量的天花板为游戏主机则对应的硬件出货量的天花板为游戏主机。海外认知已上升至生产力工具海外认知已上升至生产力工具,则对应的硬件出货量的天花板至少为个人则对应的硬件出货量的天花板至少为
172、个人PCPC。国内外对XR的两种认知会随着国内VR硬件的起量与内容的丰富逐渐追平。PICO 4 VS Quest Pro就是这两种认知的最佳体现。PICO 4Quest Pro资料来源:Pico官网,Meta官网娱乐元宇宙娱乐元宇宙游戏将是元宇宙沉浸式体验的先行者。游戏相比其他场景在行业规律、用户属性及技术准备方面有着最高的综合准备度。游戏与Metaverse重叠的需求点众多,包括虚拟身份、真实沉浸的社交系统及独立开放的经济系统。同时,受疫情影响,许多线下音乐节、演唱会和各种展会被迫取消,在线娱乐方式激增。AR/VR技术的普及和5G网络的高速发展,促进了虚拟演出与展会市场的火热,沉浸式体验越来
173、越受到大众的接受与青睐。平台性整个游戏就是一个开放性平台,不仅包含了游戏,还包含大量的非游戏内容,比如社区活动,音乐节和生日聚会等。用户创作作为一个开放性平台,用户将具有极高的自由度,可以创作大量内容。虚实结合元宇宙不是空中楼阁,大多数现实场景也会同步映射到元宇宙中。持久身份同现实世界一样,身处元宇宙中的用户也是唯一的,因此与ta关联的一切资产也拥有唯一恒久归属权。区块链加成区块链的不可修改,唯一归属权属性恰好适配上一条持久身份,因此区块链与元宇宙的联系也会在元宇宙游戏中体现得更为深刻。元宇宙游戏特性iBox元宇宙演唱会ROBLOX:全球最大的互动社区之一及大型多人游戏创作平台虚拟沉浸式影院第
174、一视角沉浸式射击游戏资料来源:Roblox,安信证券Metaverse,游戏先行社交元宇宙社交元宇宙作为元宇宙的关键要素,社交一直被视为“短期内构建元宇宙的现实入口”。目前元宇宙的发展处于初级阶段,至少在未来10年,元宇宙的概念将依旧集中于社交网络、游戏、内容等领域。元宇宙对传统社交的颠覆在于“数字拟真世界”,在连接范围更广、沟通效率更高、沟通方式更拟真的优势下,改变以往文字或视频的沟通交流模式,双方可以用更真实的数字形态进行交流互动。虚拟社交与元宇宙社交的区别就在于社交形式的改变,虚拟社交突破了时间和空间的限制,拉近了社交的距离,而元宇宙社交在突破时间和空间的基础上又增加了沉浸感。社交角色社
175、交角色社交空间社交空间社交场景社交场景不同于被局限在屏幕之中的互联网交互,元宇宙增加了空间和时间维度,提供了一个全景式、开放式、全天候的社交空间。角色塑造是元宇宙社交的基础特点。在线上交流中,身体作为社交“媒介”的具象感被弱化了,而元宇宙社交将通过虚拟化身重新拾起这一部分。场景的搭建是实现元宇宙愿景的重要部分,拟真社交功能和可供创造的虚拟空间带来了与人交互相关的更多场景,也意味着在服务业、商业和工业领域落地的可能性。元宇宙社交的核心要素元宇宙社交的核心要素资料来源:Horizon Worlds,青亭网,映维网办公元宇宙办公元宇宙工作场所将再次面临新的“进化”,对比我们当下的远程办公,元宇宙技术
176、对于办公的最大改变就是增加了临场感和沉浸感。与传统办公相比,元宇宙办公中所配备的虚拟化技术,让企业员工通过各种端口随时随地登录并访问元宇宙办公平台;不断提升的运行效率以及交互、协同能力,使得其可以完美地适用于各类复杂的办公场景,进一步提升办公效率。网上办公远程会议元宇宙办公通过网络通讯软件,实现远程办公。解决总公司与下属分公司之间的沟通问题。缺点:只有文字形式,交流时间成本较高。自2020年全球新冠疫情爆发以来,远程会议软件市场迎来了新的发展。缺点:受网速、身处空间等因素的影响,参与感不强目前部分公司可通过建设线上元宇宙数宇办公楼等方式,实现元宇宙办公扎克伯格曾在2021年底展示了全息虛拟会议
177、,预计为元宇宙办公的一种新形式元宇宙办公发展历程Com2uS号称首个实现“元宇宙上班”的公司,依托Com2uS去年底发布的Com2Verse平台,公司员工的打卡、开会、演讲均可以在元宇宙中进行。现阶段元宇宙办公还不能完全替代实体办公,除了技术上的局限,长时间的虚拟办公员工的心理健康状况、人与人之间的联系和社群的建立都是未知的,很难衡量。韩国初创公司Zigbang 推出了一款虚拟办公室产品“Soma World”,在这个虚拟世界中,有30层高的办公大楼、可容纳 3,000 人的会议中心、网络中心等和现实世界相仿的办公设施。在Office World办公中使用日程表管理行程资料来源:Meta Co
178、nnect 2021,青亭网PART 02PART 02硬件之“交互范式”硬件之“交互范式”人机交互范式的变与不变人机交互范式的变与不变回溯互联网的交互回溯互联网的交互键鼠、触控、手势、语音键鼠、触控、手势、语音前瞻的交互方向:裸手交互、脑机接口、情景感知等前瞻的交互方向:裸手交互、脑机接口、情景感知等由虚实交互展望下一代硬件由虚实交互展望下一代硬件新硬件关键在全新体验,体验关键在交互新硬件关键在全新体验,体验关键在交互我们认为,下一代下一代XRXR硬件不等于一系列硬件参数的升级硬件不等于一系列硬件参数的升级,核心在于重新定义核心在于重新定义(产品端产品端)和体验升级和体验升级(用户端用户端)
179、。重新定义(产品端):以iPhone为例,初代iPhone完全抛弃键盘,而是采用全触摸屏幕,配合独特的外观设计、拟物化界面与重力感应等。体验升级(用户端):功能体验上,iPhone可看做是iPod+手机+Internet浏览器的融合产物,将手机从通讯工具升维为信息处理工具;交互方式上,由键盘转为触控,更符合人的操作习惯。新的交互会是什么样?无法事前预测,需要被逐渐定义出来。产品端:重新定义智能手机产品端:重新定义智能手机用户端:更丰富的功能,更自然的交互用户端:更丰富的功能,更自然的交互 iPhone重新定义智能手机资料来源:Apple官网,安信证券研究中心当前的当前的VR/ARVR/AR还无
180、法达到“新硬件”的标准还无法达到“新硬件”的标准下一代新硬件的核心在于重新定义下一代新硬件的核心在于重新定义(产品端产品端)和体验升级和体验升级(用户端用户端)。VR:Quest 2已经是一款成功的VR产品(销量超千万台),但是距离“新硬件”(重新定义+体验升级)尚远。Quest 2是迄今为止销量最高的VR产品,双手柄的交互设计也基本奠定了当前的VR产品形态,但VR仍然存在过重、晕眩、适用范围有限等问题,消费端渗透率短期难以提高到手机的量级。AR:AR的应用范围更加广阔,长期看市场潜力更大,但AR产业链成熟度相比VR更低,光学、交互等环节尚存技术难点,目前2B/2G的AR成熟度更高,而消费级A
181、R的功能主要局限于作为手机配件/扩展屏使用。Quest 2Quest 2 极高的性价比,产品体验较均衡;渗透率与普及率仍然不足,局限于娱乐体验。HoloLensHoloLens 造价昂贵,多用于B端辅助生产、G端军队辅助训练;语音、手势交互,不够自然。资料来源:PICO官网,HoloLens官网,安信证券研究中心交互的本质:信息感知交互的本质:信息感知-决策决策-输出输出新技术背景下人机交互的信息感知与输出、信息处理和交互对象正在发生变化。交互的本质仍然是信息感知交互的本质仍然是信息感知-决策决策-输出输出。1.信息感知:机器已经可以感知语音、手势等指令;2.信息处理:和人的决策相对应,机器开
182、始借助人工智能技术进行信息处理和决策;3.信息输出:机器逐步普及语音输出通道,并出现简单的触觉信息输出;4.身份识别:在人机交互的过程中对人进行身份认证;5.交互对象:虚拟人开始作为交互主体出现在人机交互过程中。信息接收信息接收显显示示人的决策人的决策控制控制机机器器控制器控制器人机界面输出环境输出输入环境人机多种感知方式1机器决策2多通道输出3身份认证4虚拟人交互5输入资料来源:中移智库新型人机交互体验演进与未来数字生活PCPC互联网时代的交互互联网时代的交互键盘键盘+鼠标鼠标个人电脑的结构基于冯诺依曼体系结构的图灵计算机,包括运算器、控制器、存储器、输入设备以及输出设备。其中,输入和输出设
183、备是人机交互的方式,输入设备包括鼠标鼠标、键盘键盘、手柄,输出设备包括显示器、音箱、耳机。关键产品的出现一举奠定个人关键产品的出现一举奠定个人PCPC的产品范式:的产品范式:1)1981年,IBM公司推出第一台IBM PC,正式名称为IBM 5150型,成为第一台被业界广泛采用的PC,从此点燃了个人电脑市场的快速增长,并彻底改变了商业计算。2)1983 年,Apple Lisa 作为世界首款图形用户界面电脑问世,Lisa 的出现引领了操作系统的发展方向。苹果的Lisa机鼠标(A9M0050)是第一个完全商业化的鼠标,并投入到市场。IBM PC,1981年发布,商业意义上第一款PC。Apple
184、Lisa,1983年发布,图形用户界面,键盘+鼠标输入。1995年,微软发布Windows95,微软操作系统外观基本定型。图形用户界面极大降低了用户门槛。资料来源:个人计算机的发展史与关键节点移动互联网时代的交互移动互联网时代的交互触控、手势、语音触控、手势、语音触控交互、手势交互和语音交互是当下智能终端的三种主要交互方式。其中,触控交互最为精简高效,已经成为最基本的交互方式,语音交互在IoT领域应用广泛,手势交互也越来越多地走进大众视野(这里的手势交互是指通过计算机视觉识别出的手势动作,无需和实体进行接触)。交互效率:触控交互语音交互手势交互。触控交互最符合人的操作直觉,操作路径最简洁。语音
185、交互中唤醒设备+清楚表达指令的过程通常会花费更多的时间。手势交互的指令性内容的表达同样需要更多时间。学习成本:手势交互触控交互语音交互。语音交互最自然,触控交互已经普及,手势交互的学习成本最高。指令准确性:触控交互语音交互手势交互。触控交互是三种交互方式当中唯一与载体发生接触的,准确度更高。触控交互技术不断迭代,精度与灵敏度越来越高,由单点触控进化为多点触控华为Mate30提供AI手势交互功能,作为核心卖点之一手势交互的学习成本太高,偏离用户直觉,短期难以普及资料来源:华为官网,安信证券研究中心触控交互效率最高,学习成本较低触控交互效率最高,学习成本较低一般来讲,当前的触控交互需要满足三项:1
186、)触摸式屏幕,2)单指或多指直接接触该屏幕(或近距离接触,如果显示器具有邻近感应传感器并支持悬停检测),3)触摸接触时移动(或不移动,具体取决于时间阈值)。相比鼠标、键盘、触笔交互,触控交互是更高级别的交互方式,有更高的交互效率和较低的学习成本。因子因子触控交互触控交互鼠标、键盘、笔鼠标、键盘、笔/触笔交互触笔交互PrecisionPrecision指尖的接触区域大于单个 x-y 坐标,增加无意中激活命令的几率。鼠标和笔/触笔提供了精确的 x-y 坐标。接触区域的形状在整个移动过程中不断变化。鼠标移动和笔/触笔笔划都提供精确的 x-y 坐标。键盘焦点非常清晰。没有鼠标光标来帮助确定目标。鼠标光
187、标、笔/触笔光标以及键盘焦点都可以帮助确定目标。人体解剖学人体解剖学指尖移动并不精确,因为使用一个或多个手指沿直线移动非常困难。这是由于手关节的曲率和运动涉及的关节数量导致的。使用鼠标或笔/触笔进行直线移动就很容易,因为控制它们的手所移动的物理距离要比光标在屏幕上移动的物理距离短。由于手指的姿势以及用户对设备的控制,显示设备触摸表面上的某些区域可能很难接触到。鼠标和笔/触笔可以达到屏幕的任何一个部分,同时任何控件都应该可以通过键盘按照Tab 键顺序进行访问。一个或多个指尖或用户的手可能会遮住对象。这称为封闭。间接输入设备不会造成封闭。对象状态对象状态触摸使用两个状态的模型:显示设备的触摸表面为
188、已触摸(打开)或未触摸(关闭)。没有可以触发其他视觉反馈的悬停状态。鼠标、笔/触笔以及键盘全都显示三种状态的模型:向上(关闭)、向下(打开)以及悬停(聚焦)。悬停允许用户通过与 UI 元素关联的工具提示来了解信息。悬停和聚焦效果都可以传达哪些对象是交互对象,并且还可以帮助确定目标。丰富交互丰富交互支持多点触摸:触摸表面上的多个输入点(指尖)。支持单一输入点。通过手势(点击、拖动、滑动、收缩和旋转)支持的直接操作。不支持直接操作,因为鼠标、笔/触笔以及键盘为间接输入设备。资料来源:Windows App交互设计,安信证券研究中心手势交互适配非接触式用户界面手势交互适配非接触式用户界面TUITUI
189、用户界面的进化方向是从文本用户界面到图形用户界面(GUI)再到自然用户界面(NUI),非接触式用户界面(TUI)是自然用户界面的一个分支。图形用户界面限制了用户需要使用键盘、鼠标等输入设备或触摸屏幕,而非接触式用户界面(TUI)是通过身体动作和手势命令计算,无需触摸键盘、鼠标或屏幕的过程,可以更自然的传递信息或与环境互动。手势的分类手势的分类手势识别的技术实现手势识别的技术实现指示类:用于指示物体或方向的手势技术本质:手势识别通过数学算法理解人的手势。大多使用传感器、相机、雷达等设备采集用户手势信息。信号类:传达一些意义的手势或动作传感器:典型案例是可穿戴设备情景演绎类:无对象执行的特定任务演
190、示相机:深度感知相机,由于它们的近距离能力,可以有效地检测手势标志类:用于传达特定对象或实体店信息的手势雷达:微型雷达捕捉细微的手部动作,利用无线电波的反射成像操控类:手势可以在较短的反馈循环中引导运动资料来源:CSDN智能手势交互知识地图,安信证券研究中心语音交互是最自然的交互方式之一语音交互是最自然的交互方式之一在触控交互、手势交互和语音交互三种交互方式当中,语音交互1)是最自然的交互方式,学习成本几乎为零,2)语音交互也是非接触交互,不需要直接接触载体,3)语音交互中AI的参与程度非常高。因此,我们认为语音交互会是下一个时代广我们认为语音交互会是下一个时代广泛应用的交互方式之一泛应用的交
191、互方式之一。一次完整的语音交互需要经历ASRNLPSkillTTS的流程。ASR,用于将声学语音进行分析,并得到对应的文字或拼音信息,一般分训练和解码两阶段。NLP,用于将用户的指令转换为结构化的、机器可以理解的语言。Skill即AI时代的APP,、作用是处理NLP界定的用户意图,做出符合用户预期的反馈。TTS,语音合成,从文本转换成语音,让机器说话。ASRNLPSkillTTS1指令语音2指令文本4回复文本5回复音频3用户意图资料来源:人人都是产品经理语音交互知识总结:从原理、场景到趋势,安信证券研究中心XRXR时代的交互时代的交互接近自然的交互接近自然的交互人机交互演进的一个原则是人机交互
192、演进的一个原则是,不断接近人类现实世界信息获取和流动的方式不断接近人类现实世界信息获取和流动的方式。区分于真实世界的2D内容/场景,元宇宙当中的3D内容/场景是一种格式上的升维,在时间和空间两大维度重构。无论是PC还是智能手机,交互集中于人体的上半身,聚焦于视觉听觉的所听所感,但元宇宙强调高度的沉浸感,这就要求除了上半身的人体肢体也参与到交互当中,VR/AR/MR/智能汽车等新硬件就必须承载更多肢体参与、更接近自然状况的交互形态。3D界面的交互:3D界面有着区别于2D界面的特殊属性,包括但不限于1)交互空间:空间大小、平面类型、遮挡关系,2)输入方式:语音、手势、控制器、外部传感器,3)呈现信
193、息类型:3D模型、图片、2D界面,3)音效:空间音效、界面反馈音效,4)信息与环境的融合方式:无中生有、真实物体与虚拟信息叠加、遮挡真实环境。(5点要素由 8ninths 团队整理而成)2D界面3D界面VS PC桌面操作:键盘、鼠标、点击Click 智能手机移动操作:单/多点触控、滑动、语音 视觉、听觉、触觉(震动反馈)Outside-in追踪,6DoF 空间大小、类型、遮挡 手柄输入 视觉、听觉、触觉(震动反馈)、手势、眼球、面部资料来源:8ninths,安信证券研究中心XRXR时代的交互时代的交互接近自然的交互接近自然的交互按照器官及输入方式的不同,交互方式大致可以划分为头部运动追踪、眼动
194、追踪、面部/表情识别、控制手柄、手势识别、全身动捕、脑机接口等。器官器官输入方式输入方式定义定义应用情况应用情况头部头部头部运动追踪对用户头部方向和位置的定位是VR/AR中最基本的输入手段,也是一种自然的输入方式眼球追踪一般由眼动摄像机、光源和算法共同完成新一代VR/AR设备逐步加入眼动追踪面部/表情识别分析用户的面部肌肉运动新一代VR设备逐步加入眼动追踪声音输入语音聊天、VR音效、语音控制等AR很多采用语音输入,部分VR设备搭载语音识别功能脑波控制将大脑电波作为输入信号仍处于实验室阶段手部手部控制手柄通过对手柄的位置追踪,可以实现更自然、更具沉浸感的互动体验Oculus、HTC、索尼等都有自
195、己的体感手柄手势识别直接识别手部骨骼与节点代表性产品之一Leap Motion,但还不精确力反馈手套通过空气的膨胀来为手部提供虚拟现实的感官触觉尚未广泛推广应用数据手套手套上安装有多个感应点,因而可以更精确地识别手部动作相当于手势识别的另一种形态触摸板通过滑动和点击位于头显侧面的触摸板来控制VR中的行为三星Gear VR和PICO 1采用了这种输入方式肢体肢体全身动作捕捉通过在身体各个运动关键部位穿戴感应器,可以实现对用户全身动作的检测识别,并将动作信息在虚拟世界中表现出来主要应用于B端游戏和影视制作中跑步机能解决用户在VR场景中较大范围走动及跑动的需求,也能通过“所动即所感”来解决晕动症问题
196、小范围出货体感体感蛋椅/赛车/飞行模拟仓好的体感设备可同时实现VR的输入和输出功能,能够给用户提供最好的体验主要应用于VR线下体验使用综合综合位置追踪/可穿戴设备结合以上各种交互方式形成的新的交互设备资料来源:VR产业人公众号,安信证券研究中心颠覆式创新总是诞生于人机交互的变革颠覆式创新总是诞生于人机交互的变革颠覆式创新 VS 渐进式创新:渐变式创新着眼于技术,改良现有产品;而颠覆式创新着眼于产品,直接面向需求创造出新的更好的产品。李善友复盘数字经济百年创新史,堪称颠覆式创新的产品屈指可数,但几乎每次颠覆式创新的源头都是人机交互的变革。第二次颠覆式创新:第二次颠覆式创新:乔布斯在手机上再次突破
197、边界,基于触屏交互技术革新性推出iPhone,成为即个人电脑后电子消费品领域第二次颠覆式创新。第三次颠覆式创新:第三次颠覆式创新:谁能创造出更好的产品、提供更佳的体验?第一次颠覆式创新:第一次颠覆式创新:个人电脑的早期是字符交互,乔布斯和比尔盖茨基于图形用户界面开发的麦金塔和Windows是电子消费品领域的第一次颠覆式创新。资料来源:安信证券研究中心VRVR典型的交互范式:一体机典型的交互范式:一体机+手柄手柄头盔:从分体式头盔:从分体式VRVR到到VRVR一体机一体机。以Oculus Quest为首的6DoF VR一体机推出以来,整个VR行业的产品形态逐渐转为以一体机为主。据VR陀螺统计,2
198、020年开始,VR一体机发布数量陡增,第一次超越分体机;2021年,VR一体机数量几乎为分体机的一倍。手柄:从手指追踪到手势追踪手柄:从手指追踪到手势追踪。VR手柄最开始主要为棒状,代表是HTC Vive以及PSVR的手柄,后有Oculus与Valve进一步优化,推出Oculus Touch和Valve Index的Knuckles,向更优秀的手部追踪迭代进步。Valve Index KnucklesIndex手柄的代号为Knuckles。配备宽大的塑料跟踪条、操纵杆、小型触控板、几个面部按钮和一个可挤压的辅助输入。内置87个传感器,能更精确、更全方位地触摸、运动,以及捕获压力和光学数据。Oc
199、ulus Touch支持空间定位和体感追踪功能。类似HTC Vive的环形设计,不遮挡LED。具备“电容传感电路”以及“接近感控制”两大黑科技,能够识别用户大拇指、食指和中指的不同姿态。资料来源:Meta官网,Valve官网,安信证券研究中心VRVR典型的交互范式:一体机典型的交互范式:一体机+Portal+Portal2022年11月,小派科技推出了一款创新型VR设备Pimax Portal。据介绍,Pimax Portal 是一款4合1通用产品,可在掌上游戏设备、面对主流人群的VR头显、便携式PC游戏系统以及客厅娱乐中心之间切换。Pimax Portal是VR终端设备的创新与尝试,有助于进
200、一步扩大用户群体,但本质上还是没有脱离VR的范畴,属于“老技术、新玩法”。游戏掌机:Pimax Portal 的核心为一个搭载高通骁龙 XR2 的安卓游戏掌机,最高配备 4K 144Hz QLED 屏。VR形态:屏幕和手柄部分可拆开,分别放入 VR 头显和 VR 手柄中使用。屏幕部分配备 6DoF 追踪,直接变成 VR 设备,VR 头显部分还可以更换不同 PPD 和视角的版本。便携式PC游戏系统:Pimax Portal XL 模式下,掌机能连接一个搭载 AMD R7 6800U 的 Mini Station,该硬件配有 32GB+1TB 存储,可通过 WiGig 无线传输 PC 游戏到掌机游
201、玩。客厅娱乐中心场景:Pimax Portal 掌机可插入一个底座中,从而实现体感游戏的游玩,还能当作机顶盒观看视频。资料来源:Pimax Frontier 海外发布会,安信证券研究中心ARAR典型的交互范式:标定、跟踪、交互典型的交互范式:标定、跟踪、交互AR眼镜中涉及到的技术包括:1)标定技术,帮助用户看得准;2)跟踪技术,帮助用户走得稳;3)交互技术,实现信息多交换。三类技术彼此相关、共同协作。标定技术:标定技术:鉴于光学透视型的AR眼镜的特殊原理,我们往往不能直接获得人眼在目标空间中的坐标位置,而需要对人眼和AR眼镜的跟踪系统进行标定,实现“物理环境”-“跟踪系统”-“人眼成像”这条通
202、路,保证人眼能看到准确的虚实融合效果。跟踪技术:跟踪技术:AR眼镜想要实现物理环境与虚拟元素的融合,必须要做到的就是能够跟踪虚拟环境。主流的视觉跟踪技术包括基于图像标记点的跟踪(Image-based Tracking)、基于物体的跟踪(Object-based Tracking)和同步定位与地图构建(SLAM)。交互技术:交互技术:AR眼镜比较方便的交互方式是语音、手势和遥控器。语音交互属于人工智能的重要研究领域,其中科大讯飞等已经做出了比较出色的语音交互产品,这对于AR眼镜的交互具有重要意义。手势交互因为不需要引入额外的交互设备,只需要用户做出手势就可以输入指令,也在一定程度上促进了AR眼
203、镜交互技术的发展。遥控器作为传统的输入手段,虽然简单但是却能保证准确高效的输入,很多AR眼镜产品还是配了遥控器或者触控板作为交互设备。资料来源:CSDN雁回晴空,增强现实(AR)智能眼镜的关键技术:标定、跟踪与交互ARAR典型的交互范式:眼镜典型的交互范式:眼镜+语音语音+手势手势目前市面上流行的光学透视型的AR智能眼镜主要有2种:1)一体式智能眼镜。这类眼镜的计算单元、电源、显示单元都集成在一起,技术难度高,价格昂贵。一体式智能眼镜的典型代表是HoloLens;2)分体式智能眼镜。这类眼镜通常将电源和计算单元独立为一个类似手机的处理单元,但是将显示单元做成眼镜。分体式智能眼镜的典型产品是Ma
204、gic Leap One、NED+Glass X2、Nreal Light等。语音交互即通过语音完成对AR眼镜的操控和输入。用户与AR眼镜间通过语音可以完成从简单到复杂的指令,复杂一点的语音指令需要人工智能,包括NLP的介入。手势交互的实现,需要AR设备配备多种深度传感器来感知环境与用户的手势,用户直接通过手势控制虚拟的AR数字内容。手势交互一定程度上摆脱了控制器的束缚,让交互体验更加自然。HoloLens:手势型交互 手势交互的定位机制是凝视。凝视和空中点击(Air tap)结合起来构成了凝视与行动这种交互方式。HoloLens目前能够识别两种核心手势空中点击和Home手势。复合手势是通过将
205、点击、保持、释放和手的位移进行结合,HoloLens可以表现出含义更复杂的复合手势。资料来源:微软HoloLens官网,安信证券研究中心WMIPWMIP四大元件的更迭:四大元件的更迭:PCPC-PhonePhone-ARAR-VRVRPCPhone AR(HoloLens)VRW(Windows)I(Icon)M(Menu)P(Pionter)N/A(Pointer 控制)WIMP是由“视窗”(Window)、“图标”(Icon)、“选单”(Menu)以及“指标”(Pointer)所组成的缩写,其命名方式也指明了它所倚赖的四大互动元件。资料来源:CSDN,2D 到 3D 的跨越,探索最佳 AR
206、 交互设计之道人机交互的变与不变:变的是范式,不变的是本质人机交互的变与不变:变的是范式,不变的是本质新技术背景下人机交互的信息感知与输出、信息处理和交互对象正在发生变化。交互的本质仍然是信息感知交互的本质仍然是信息感知-决策决策-输出输出。1.信息感知:机器已经可以感知语音、手势等指令;2.信息处理:和人的决策相对应,机器开始借助人工智能技术进行信息处理和决策;3.信息输出:机器逐步普及语音输出通道,并出现简单的触觉信息输出;4.身份识别:在人机交互的过程中对人进行身份认证;5.交互对象:虚拟人开始作为交互主体出现在人机交互过程中。信息接收信息接收显显示示人的决策人的决策控制控制机机器器控制
207、器控制器人机界面输出环境输出输入环境人机多种感知方式1机器决策2多通道输出3身份认证4虚拟人交互5图:传统的人机交互流程图:传统的人机交互流程输入资料来源:中移智库新型人机交互体验演进与未来数字生活未来人机交互的主体将拓展为人未来人机交互的主体将拓展为人-机器机器-虚拟人三方虚拟人三方未来人机间将建立起人-机器-虚拟人三方互动的交互模型。目前人与机器交互正在经历转变,人与虚拟人交互处于起步阶段。每种交互模式均遵循信息感知-决策-信息输出的交互流程。信息感知信息处理信息输出信息输出信息处理信息感知人机界面输入输出输出输入人机器/虚拟人身份认证人身份认证虚拟人虚拟形象机器感知输出处理感知输出处理感
208、知输出处理人与虚拟人交互人与机器交互资料来源:中移智库新型人机交互体验演进与未来数字生活人与机器的交互:人与机器的交互:Tesla BotTesla Bot人形机器人人形机器人Tesla AI Day 2022会上,Tesla Bot发布。我们认为,Tesla Bot之于机器人行业与汽车行业都是一个颠覆式创新的角色。Tesla选择人形双足双手方案,是因为其定位是生产力机器人。指令输入处理输出人形双足双手?第一性原理,即通用原则。不具备双手手部机构和双足机构的机器人解决方案,可能在各自的实用场景内能达到最优化部署,但是兼顾多个场景就决无可能。资料来源:Tesla AI Day人与机器的交互:拟人
209、化是为了“通用”人与机器的交互:拟人化是为了“通用”随着人机交互技术的发展与演进,机器人与人机交互体验均需要重构。对于机器人而言,人工智能机器人是社会发展的第三代机器人,第三代机器人将具有识别、推理、规划和学习等智能机制,可以把感知和行动智能化结合起来,因此能在非特定的环境下作业,故称之为智能机器人。对于人机交互体验而言,拟人化的机器人能够主动交流、情感交互、协同智能。拟人化存在一定的伦理风险,但真正的目标是为了实现机器人的“通用”。拟人化:1、外观像人,双足双手2、具有通用智能小米CyberOne身高177cm体重52kg自由度21有双手,无十指视觉Misense视觉空间系统人工智能:视觉传
210、感器、听觉传感器、音频算法、语义识别、情绪识别Optimus身高172cm体重56.7kg自由度40有双手,有十指Autopilot cameras人工智能:自动驾驶FSD系统,搭配多摄像头视觉架构的深度神经网络架构资料来源:Tesla AI Day,小米官网人与虚拟人的交互:人与虚拟人的交互:AIAI加持下趋于无界加持下趋于无界“多模态交互”:融合了人的视觉、听觉、触觉等多种感官,计算机利用多种通信通道响应输入,并充分模拟人与人之间的交互方式。现被广泛运用到各种智能产品的交互设计中,人类通过语音、手势、表情等模态输入信息,计算机通过计算机视觉、听觉等通道响应就是典型的多模态交互。进化之前:语
211、音助手Siri、小爱同学。进化之后:多模态交互的智能助手,具象化的三星虚拟助手Sam。三星虚拟助手三星虚拟助手SamSam 由三星旗下营销公司Cheil Worldwide,与巴西视觉艺术制作公司Lightfarm共同打造。Sam与一般语音助手最明显的区别,在于它(或者她)首次有了自己专属的虚拟形象。资料来源:三星官网人与虚拟人的交互:人设是关键和灵魂人与虚拟人的交互:人设是关键和灵魂人有人格人有人格,虚拟人也有人设虚拟人也有人设。语音助手是没有人设的,人与语音助手的交互是单向的指令;虚拟人有人设,人与虚拟人(具有人设)的交互是双向的“交流”。人与虚拟人的交互按照对象的不同可以分为三类:人与人
212、的数字化身,人与虚拟人,数字化身与虚拟人。虚拟人的制作可以拆分为两端,一端是技术端,打造虚拟人的模型与形象,另一端是运营端,树立虚拟人的人设和行为。虚拟人数字化身人 A-Soul虚拟偶像团体,字节跳动负责开发,乐华娱乐负责运营。五位成员嘉然、贝拉、向晚、珈乐、乃琳拥有各自的人设。资料来源:BiliBiliVRVR与与ARAR在交互领域相通,目前处于拓荒期在交互领域相通,目前处于拓荒期长期来看,VR和AR设备在交互领域是相通的,目前处于拓荒期。操作界面正在从二维平面转移到三维空间,但是还未形成类似PC时代下鼠标键盘、移动时代屏幕触控等公认的交互范式。据华为VR领域技术专家张梦晗,将VR/AR的交
213、互范畴划分为以下三类:一类是由人主动发起的交互动作由人主动发起的交互动作,比如手部交互、体感交互等等,这类交互往往发出的都是确定性的指令性信息,要求准确达成某些特定的目的,也会耗费最多的精力和体力。还有一类则是由机器主动发起的交互动作由机器主动发起的交互动作,比如眼球跟踪、脑电肌电、头部位置跟踪、表情识别等等,这类交互是机器来感知使用者的状态来进行交互,很多时候使用者自身不需要牵扯太多精力。再有一类是机器对环境的感知交互机器对环境的感知交互,比如三维重建、情景感知、物体分割识别等等,很多时候尤其在AR中,只有先做好对外在环境的感知,人与机器之间的交互才能顺畅。交互探索方向交互探索方向裸手识别裸
214、手识别裸手识别就是不需要任何介质的手部交互,具体案例包括Leap Motion(基于计算机视觉),Google Soli(基于毫米波雷达),此外还有一些基于超声、红外的解决方案。当前基于计算机视觉的裸手交互发展得最成熟,效果也最好。VRVR中非裸手交互更有优势中非裸手交互更有优势,ARAR中反之中反之。VR中3DoF或6DoF手柄已有广泛应用,非裸手具备优势,VR中人和虚拟物体和环境交互,通过某个媒介能提高交互的真实感。而在AR里,人不仅仅要与虚拟物体交互同时也能看到现实场景和物体,裸手情况在AR中更多。计算机视觉方案肌电控制方案数据手套方案Leap Motion,微软HL2的手部追踪,Ocu
215、lus Quest的手部追踪,代表计算机视觉手部追踪的最高水准。肌电信号反映的是肌肉收缩所产生的生物电,用户个体肌肉生理差异大。该技术领域的代表公司为CTRLLabs,已被Meta收购。Meta Reality Lab公布一款数据手套,触觉交互位置被布置在贴合佩戴者手掌、手指下侧和指尖等位置上。资料来源:Leap Motion官网,Meta官网交互探索方向交互探索方向体感交互体感交互体感交互是通过3D体感摄影机(体感互动专用的智能投影机)的采集、追踪、控制完成的。首先,3D体感摄影机发射红外线,从而对整个房间进行立体定位,摄像头则可以借助红外线来识别人体的运动。然后,动作感应器能追踪你全身的动
216、作,并且会根据数据建立用户的数位骨架,它可以对人体的20个部位进行实时追踪。此外,体感互动系统还能利用即时动态捕捉、影像辨识、麦克风输入、语音辨识等功能丰富操作模式。区分于传统的界面交互(WIMP),体感交互强调利用肢体动作、手势、语音等现实生活中已有的知识和技能进行人与产品的交互,通过看得见、摸得着的实体交互设计帮助用户与产品、服务以及系统进行交流。体感游戏智能“魔镜”智能驾驶控制资料来源:微软Xbox官网,新浪VR交互探索方向交互探索方向表情识别表情识别表情识别的技术底层包括面部捕捉表情识别的技术底层包括面部捕捉、眼球追踪以及人工智能眼球追踪以及人工智能。实时面部捕捉存在技术难题实时面部捕
217、捉存在技术难题。实时面部捕捉的运行过程大致如下,人的表情先被传感器追踪到,经数据处理后,通过高速宽带网络传输至社交对象的VR设备中并被在其虚拟环境中重现。追踪脸部表情并在虚拟画面中重现是同步的,所以其技术实现难度较大,主要在于:追踪与重现(映射到虚拟化身)的延迟、设备数据处理能力、追踪传感器的敏感精度、社交网络的带宽等等。此外此外,表情识别对于提升虚拟世界社交的真实感很关键表情识别对于提升虚拟世界社交的真实感很关键。人类在社交中的信息传达只有30%是通过语言实现的,剩余70%则是通过表情和肢体动作实现。MindMaze社最新面部识别VR组件MASK 据映维网,MindMaze社提供的最新解决方
218、案是“在VR眼镜周围安置高灵敏电极,通过捕捉玩家的面部肌肉动作产生的电气信号来还原识别面部表情。”传统的表情识别解决方案是通过摄像机拍摄用户的面部然后去捕捉识别。这一方案的缺陷在于永远有延迟,难以同步。资料来源:映维网交互探索方向交互探索方向数据手套数据手套数据手套是指通过在手套内置传感器数据手套是指通过在手套内置传感器,采集手部运动数据的硬件设备采集手部运动数据的硬件设备。使用硬件设备操作虚拟信息:鼠标使用硬件设备操作虚拟信息:鼠标+键键盘盘,数据手套数据手套。数据手套相比手柄数据手套相比手柄,与真实世界的互与真实世界的互动更加真实动更加真实。有别于传统的VR控制手柄,数据手套通过与VR设备
219、相连接运用手套上的弯曲感应传感器实时记录并模拟手部动作,让佩戴者通过手部活动实现与虚拟物品的真实互动。力反馈设备模拟真实物品感受力反馈设备模拟真实物品感受。而由于力反馈设备的加入使得数据手套在现在能够让佩戴者充分感受到虚拟物品的材质以及触感。资料来源:Leap Motion官网交互探索方向交互探索方向肌电信号肌电信号肌电信号肌电信号,据维基百科给出的解释据维基百科给出的解释,当肌肉细胞被生物电或者神经激活时产生的电能当肌肉细胞被生物电或者神经激活时产生的电能。将单个或者多个肌肉细胞或者部分肌肉组织活动时产生的生物电变化,经电极引导,放大、记录和显示所获得的电压变化的一维时间序列信号图形,就是肌
220、电图(electromyogram,简称EMG)。肌电手环是使用肌电信号控制设备的仪器。通常的肌电手环从获取信号到变成功能,需要经历:获取肌电信息处理信息(降噪、放大等)翻译处理器能够识别的信息传输到终端翻译成具体操作输出等复杂流程,不仅每一步都需要大量运算,跨平台数据传输,而且在过程中还可能产生误差。资料来源:VR陀螺交互探索方向交互探索方向脑机接口脑机接口“脑机接口脑机接口”的定义的定义=“=“脑脑”+机机“+”+”接口接口”。即,在人或动物脑(或者脑细胞的培养物)与外部设备间创建的用于信息交换的连接通路。“脑”意指有机生命形式的脑或神经系统,而并非仅仅是“mind”(抽象的心智)。“机”
221、意指任何处理或计算的设备,其形式可以从简单电路到硅芯片到外部设备和轮椅。“接口”=“用于信息交换的中介物”。脑机接口同样符合交互的本质,包括信息的感知-决策-输出。资料来源:CSDN脑机接口社区,非侵入式非侵入式 易穿戴,无需手术 信号空间分辨率查 不能有效利用高频信号 使用前需校准半侵入式半侵入式 植入于头皮与大脑皮层之间 信号质量介于侵入式与非侵入式之间 手术风险比侵入式小侵入式侵入式 恢复视觉、听觉、肢体运动 植入大脑皮层手术风险比侵入式小交互探索方向交互探索方向情景感知情景感知情景感知的构建过程是:传感器提供有关现实世界中活动和事件的数据。感知算法理解这些刺激并将其在情境中予以分类。根
222、据观察到的情境,系统的动作将被触发。情景感知当前应用较为成熟的两大领域是智能家居与可穿戴设备情景感知当前应用较为成熟的两大领域是智能家居与可穿戴设备。未来的情境感知将更加智能化,设备会主动与周边的世界进行交互,成为用户与周边世界互动的门户。通过分析用户所处环境、状态甚至情感的信息,运用眼动追踪、触觉反馈等技术看懂和识别身体语言或手势,并更有预见性的做出相应准备。情景感知情景感知+智能家居智能家居 情景感知应用环境中智能设备的情境感知概念是指“智能化家居主要处于一种具备流动性、开放性、动态性的智能化空间环境当中”。基于用户家庭环境改变情况,智能家居需要合理地对侦搜的情境信息进行针对性的理、创设。
223、智能家居除了具备学习、模仿功能外,还能够通过分析环境及相关因素变化,对用户的真实需要进行预测,从而实现自主工作。情景感知情景感知+可穿戴设备可穿戴设备 智能手机和平板电脑将最终支持情景感知功能,但可穿戴设备更有优势。可穿戴设备中的感应器突破智能手机感应器监测功能,将成为情景感知平台最为重要的数据来源之一。情景感知的个性化具体指:给消费者他们想要的东西,知道他们何时、何地需要这种东西,它将虚拟在线世界和现实世界连接起来。由虚实交互展望下一代硬件由虚实交互展望下一代硬件进化的路径与阶段:虚拟建设-由虚向实-虚实交互(虚实融合)。三个阶段中,硬件载体相应变化。虚拟建设由虚向实虚实交互(虚实融合)虚拟
224、建设(现已起步,VR为主,AR尝试):云计算、AI运算、网络等基础建设高速发展,游戏、影视娱乐、社交等内容不断丰富,硬件载体VR设备率先落地,提升沉浸感,由此吸引更多用户加入元宇宙,虚拟世界加速建设。根据Mob研究院数据,2020年人均使用手机时长5.72小时/天(非睡眠时间占比约36%),预计未来将进一步提升,其中部分转化为虚拟世界沉浸时间。这个阶段硬件设备以VR设备为主,AR硬件及初级应用开始出现。初期涉及领域:游戏、影视娱乐、社交、广告等领域率先落地,硬件载体以VR为主,AR尝试,计算方式以端为主,云为辅。从虚拟到现实(五年维度,MR融合,AR落地):虚拟世界建设丰富,元宇宙的发展不再局
225、限于以娱乐和社交为主的虚拟世界,而是反馈现实世界,提高生产效率。实现了虚拟现实与现实的初步融合,进而拓展了轻办公等丰富的应用场景。虚拟现实设备也继续增强沉浸感,市场需求不断增加。虚拟现实/MR设备的用户规模和使用时间将显著提高用户粘性。AR在VR的基础上发展,真正落地(社交、健康、时尚、互动等)。随着基础设施和技术水平的不断提高,AR可以实现更直接、更自然的虚实融合。中期涉及领域:拓展电商、教育、旅游等轻度办公场景,硬件载体以MR融合,AR落地,计算方式以云为主,端为辅。虚实融合(十年维度,VR沉浸,AR常在):用户未来在虚实融合世界的时间占比有望超过80%,为提升真实世界生产效率,AR/VR
226、并行发展。VR成为专家场景,作为生产力工具以拓展更多应用,更强调沉浸式应用场景;AR成为主流场景,覆盖生活各个角落,专注强交互场景。远期涉及领域:拓展医疗、工业、设计等重度办公场景,硬件载体为VR沉浸,AR常带,计算方式为云。我们判断,未来AR设备有望成为类似手机、手表的主流强粘性终端(作为眼镜长时佩戴);而VR设备继续发力强沉浸场景,设备使用频率和粘性进一步提升。资料来源:侯利强元宇宙进化三阶段:虚拟建设由虚向实虚实融合由虚实交互展望下一代硬件由虚实交互展望下一代硬件虚拟世界真实世界数字孪生万物互联内容/应用/场景硬件载体底层技术5G云计算AI区块链VRAR脑机接口数据手套娱乐办公社交消费资
227、料来源:各公司官网,安信证券研究中心PICO 4&4 ProPICO 4&4 Pro:力求走通消费级:力求走通消费级VRVR叙事叙事产品名称产品名称PICO Neo 3PICO Neo 3PICO 4PICO 4PICO 4 ProPICO 4 Pro产品示意图产品示意图重量重量395g295g电池容量电池容量5300mAh5300mAh5300mAh分辨率分辨率单眼 1832*1920单眼2160*2160单眼2160*2160PPIPPI77312001200视场角视场角可视角98度可视角105度可视角105度无级瞳距调节无级瞳距调节不支持不支持支持镜片方案镜片方案菲涅尔镜片Pancake
228、Pancake感知感知/交互交互4*鱼眼单色摄像头1600万像素RGB全彩摄像头、4*SLAM灰度跟踪摄像头1600万像素RGB全彩摄像头、4*SLAM灰度跟踪摄像头手柄手柄6DoF,红外光学6DoF、宽频线性马达、红外传感器、全手掌握把、真实触觉/振动反馈6DoF、宽频线性马达、红外传感器、全手掌握把、真实触觉/振动反馈裸手识别裸手识别支持支持支持面部识别面部识别/支持眼球追踪眼球追踪/支持彩色透视彩色透视/16MP全彩透视16MP全彩透视价格价格1999元2499元(128G)/2999元(256G)/资料来源:PICO4发布会,安信证券研究中心Quest ProQuest Pro:强调:
229、强调MRMR,升维切入办公场景,升维切入办公场景 Quest ProQuest Pro与与Quest2Quest2相比,光机厚度减少相比,光机厚度减少40%40%,PPIPPI增加增加37%37%,对比度增加,对比度增加75%75%。1)芯片芯片:采用Snapdragon XR2+处理器,这是第一款与高通深度合作开发的芯片,算力提升50%且散热更好。2)光学光学:用Pancake折叠光路技术,光机厚度减少40%。3)显示显示:采用具有局部高光功能的LCD类型面板(MiniLED),还包含一个量子点层以改善 LCD 的色域。4)交互交互:手柄中新的传感器能自追踪手柄位置不需要头显介入,可以360
230、转动使用,手柄还搭载新的触觉触控,能够给更精准的反馈。5)全彩透视、全彩透视、眼动追踪、面部捕捉眼动追踪、面部捕捉:Quest Pro搭载高分辨率摄像头传感器,获取4倍于Quest2分辨率的透视影像;有一颗红外深度传感器切换Passthrough和全彩模式。头显内部有5枚摄像头,用于眼动追踪和面部追踪。Quest ProQuest Pro的产品定位是办公场景,其设计重点考虑协作与生产力。的产品定位是办公场景,其设计重点考虑协作与生产力。Meta拟深度合作微软加速未来办公,计划引入微软多生产力工具,包括Mesh for Microsoft Teams、Microsoft 365、Microsof
231、t Intune和Azure Active Directory等。定价1500美元。资料来源:Meta Connect 2022,映维网,安信证券研究中心图:Quest Pro示意图及核心参数图:Microsoft Teams Meeting in VRPSVR2PSVR2:成熟内容生态是优势也是限制:成熟内容生态是优势也是限制硬件方面硬件方面,采用 4K 120Hz HDR 显示屏、110视场角和注视点渲染技术,其 OLED 显示屏将提供每眼 20002040 的分辨率和 90/120hz 刷新率,内置眼动追踪功能、重新设计的手柄、触觉反馈以及各种其他改变游戏规则的增强功能。此外,PSVR2
232、支持透视视图。索尼的PSVR2透视视图可以让玩家保持佩戴头显的同时观察周围环境,这要归功于头显前部嵌入的摄像头。索尼高级产品经理Yasuo Takahashi解释说:“当用户想要轻松检查PSVR2 Sense控制器在房间内的位置时,它会派上用场,而无需摘下头显。”内容方面内容方面,PSVR2的护航游戏作品将达30多款,包括地平线:山之呼唤、黑相集:Switchback VR、生化危机8VR模式、莫斯1&2和穿越火线:Sierra Squad等。PSVR的最大优势来源于成熟而丰富的内容生态,但这也在一定程度上限制了PSVR的场景局限于娱乐与体验,难以破圈。The Dark Pictures:Sw
233、itchback VR Crossfire:Sierra Squad The Light Brigade Cities VR 增强版 Cosmonious High Hello Neighbor:Search and Rescue Jurassic World Aftermath 系列 Pistol Whip VR 资料来源:Playstation VR官网,映维网HoloLensHoloLens 2 2:主攻:主攻B B端场景,搭载端场景,搭载WindowsWindows系统系统HololensHololens的交互方式简单自然的交互方式简单自然。HoloLens以真实自然的方式实现全息图的
234、触摸、抓握和移动。使用 Windows Hello,只需使用虹膜信息即可立即安全登录 HoloLens 2。通过智能麦克风和自然语言语音处理,它甚至可以在嘈杂的工业环境中执行语音命令。HoloLens在在艺术、工业、汽车、娱乐等方面均有广泛应用。其中,HoloLens目前最大的应用场景是与工业的结合,比如远程协助、工业维修等。光学:透明全息透镜(波导)分辨率:2k 3:2 光引擎 全息密度:2.5k 辐射点(每个弧度的光点)基于眼睛位置的呈现:基于眼睛位置的3D显示优化 头部追踪:4台可见光摄像机 眼动追踪:2台红外摄像机 深度:1-MP飞行时间(ToF)深度传感器 IMU:加速度计、陀螺仪、
235、磁强计 HoloLens 2搭载了特殊版Windows,并引入了新的手势交互系统,支持在空气中点击、缩放,操作系统,并且 HoloLens 2 还加入了人眼追踪功能,用户可以通过注视来完成一些操作。资料来源:HoloLens官网,映维网苹果苹果MRMR:最有希望重新定义交互:最有希望重新定义交互 苹果的首款苹果的首款MRMR设备或将设备或将1)自有操作系统realityOS(据App Store上传日志和苹果开源代码);2)显示器的配置将包括两个微型OLED显示器和一个AMOLED面板(据显示器分析师Ross Young);3)芯片将采用代号Staten的M2芯片衍生版本,外加一个协处理器Bo
236、ra芯片(据芯片供应链专家Mobile chip Expert);4)将配备14个摄像头,可以追逐头、手、甚至腿部(Quest pro10个摄像头,PICO4 5个摄像头);5)价格被预测为3000美元级别,需要额外的月度订阅(据TrendForce),Quest pro 1500美元。苹果最有希望重新定义交互:苹果最有希望重新定义交互:据 The Information,预计苹果的设备将支持虹膜识别苹果的设备将支持虹膜识别。这样用户只需将设备戴在头上,就可以快速登录自己的账户。该功能将有助于苹果多用户系统的出现,哪怕好几个人使用同一设备也不会产生影响。资料来源:The Information
237、,青亭网图:苹果MR产品概念图图:虹膜识别是一种生物特征提取新硬件的交互范式亟待重构,猜想苹果新硬件的交互范式亟待重构,猜想苹果MRMR的三种交互的三种交互 第一种,基于第一种,基于Apple WatchApple Watch的交互。的交互。Apple WatchApple Watch的的Assistive TouchAssistive Touch功能可通过检测手的握紧和捏紧以及基于加速度计的控功能可通过检测手的握紧和捏紧以及基于加速度计的控制来实现对手表的单手控制。该系统看起来与制来实现对手表的单手控制。该系统看起来与AppleApple和和FacebookFacebook在在XRXR输入上
238、所做的工作非常相似。输入上所做的工作非常相似。第二种,基于第二种,基于Apple RingApple Ring的交互。的交互。自2019年以来,苹果已经为可戴在手指上并用于控制VR或AR眼镜的设备申请了多项专利。Apple Ring描述了一种带有SMI传感器的指环。它们发出的激光被物体反射并干扰传感器中的光。这些干扰信号可用于测量到附近物理物体的距离。SMI Sensors传感器可以在空间上定位并检测附近的物体。因此,VR或AR眼镜可以准确地知道手指在哪里以及它如何在空间中移动。Apple Rings与SMI传感器,相比目前的控制手柄,重量和体积都明显减小。第三种,基于手套的交互。第三种,基于
239、手套的交互。苹果的VR手套能够测量手指和拇指骨骼的运动,这款由智能织物技术制成的VR手套可用于许多应用,包括游戏、教育和军事训练。在苹果这项被授予的专利中,可以使用一个或多个电子设备来模拟VR/AR/MR技术。一种电子设备可以是VR头戴式设备,用户可以在其中使用VR头戴式设备查看模拟的虚拟环境。另一电子设备可以包括VR手套,VR手套可以戴在用户的手上,并且可以允许用户实时触摸、感知和握持虚拟对象,这可能需要能够准确地检测用户手和手指的位置以及运动。图:Apple Watch支持腕带式输入资料来源:三次方AIRX关于苹果MR三种交互方式的猜想,VR陀螺图:Apple Ring指环专利图:Appl
240、e VR手套专利交互范式交互范式2323年将被定义年将被定义裸手交互正成为裸手交互正成为VR/ARVR/AR的一个重要交互方式,尤其是基于腕带的裸手交互的一个重要交互方式,尤其是基于腕带的裸手交互MetaMeta:根据肌电图信号来实现裸手输入的腕带式设备;AppleApple:两只手或两根手指接触的方法和系统“微手势”来控制设备的方法,如将拇指贴在食指的指根关节,并将其作为一种虚拟摇杆来进行方向选择,这与Meta的腕带方案接近;苹果的方案在腕带式设备的基础上增加手套,手套搭载的四个感测电极350A-350D可布置在手掌的大约四个角处,并可通过相应的感测电路感测,启用多方向滑动手势,例如向上滑动
241、、向下滑动、向左滑动、向右滑动和对角滑动等从而提升感知精度。交互范式的定义之所以重要,还有一个原因:还有一个原因:“后面的”场景应用模式内容将快速得以呈现未来AI基本上触及了一切,用户只需要描述出来就可以构建整个世界,相关技术将允许一个有想法的普通用户实现自己的愿景。基于新一代硬件基于新一代硬件/计算平台计算平台,开发无处不在的输入技术开发无处不在的输入技术1)可用于一天中遇到的各种情况;2)这个系统需要负责任地构建,从一开始就考虑隐私和安全,为人们提供有意义的方式来个性化和控制AR体验;3)界面同时需要直观、始终可用、不突兀和易于使用;4)理想情况下,它同时需要支持丰富的、高带宽的控制,适用
242、于从操纵虚拟对象到编辑电子文档的所有操作;5)另外,它同时需要一个足够舒适的形状参数,可以穿一整天,并且足够节能,可以长时间使用。资料来源:36氪、映维网交互范式交互范式2323年将被定义年将被定义基于上述基于上述5 5点,有两条思路变得非常清楚点,有两条思路变得非常清楚1)当时没有任何接近于所述标准的现有产品;2)任何最终出现的解决方案都必须穿戴于手腕。为什么是手腕?为什么是手腕?其他同样有用的输入源,声音十分直观,但由于背景噪音的影响,它在公共领域不够私密或不够可靠;诸如智能手机或游戏控制器这样的独立设备则需要存储在口袋里,从而在你和你的环境之间增加了一层摩擦。当探索潜在的可能性时,在手腕
243、放置一个输入设备成为了一个明确的答案:1)手腕常用于佩戴手表,已经对这一点已经非常习惯和熟悉习惯和熟悉,这意味着它可以合理地适应日常生活和社会环境;2)这是一个舒适的位置,适合全天穿戴;适合全天穿戴;3)它就在你用来与世界交互的主要工具的周围:手,这种接近度手,这种接近度将允许我们把丰富的AR控制能力带给你的双手,并实现直观,强大,令人满意的交互;4)可以轻松地作为计算、电池和天线的平台平台,同时支持广泛的传感器阵列。缺失的一块拼图缺失的一块拼图是寻找一条通向丰富输入的清晰路径寻找一条通向丰富输入的清晰路径,而一个潜在的理想解决方案是肌电图:1)肌电图(EMG)利用传感器将通过手腕传递到前掌的
244、电机神经信号转换成数字命令,并允许你用来控制设备的功能,所述信号可以允许你将清晰的一位元命令传达给设备;2)这是一种高度个性化的控制,可以适应多种情况;3)通过手腕的信号非常清晰,肌电图可以理解手指仅一毫米的运动,这意味着输入可以不费吹灰之力,就像点击一个虚拟的、随时可用的按钮一样轻松,而且最终甚至可以感觉到大脑移动手指的意图。资料来源:映维网交互范式交互范式2323年将被定义年将被定义利用肌电图直接在桌面或膝盖高速打字利用肌电图直接在桌面或膝盖高速打字一开始,肌电图只提供一位元到两位元控制,我们称之为“点击”,它相当于点击一个按钮。这是基于动作的手势,比如拇指和食指的捏和放。走路、说话或就坐
245、、双手放在身体两侧或口袋里,无论你在哪里或在做什么,捏放拇指和食指都非常容易执行。这样的操作永远可行,无需口言一字,从而使之成为第一个无处不在的超低摩擦AR交互方式;但这只是第一步,肌电图最终将发展成更丰富的控制,最终,非常有可能能利用肌电图直接在桌面或膝盖高速打字,而且速度甚至可能比键盘的速度更快。利用神经界面来支持你直接控制机器利用神经界面来支持你直接控制机器利用神经界面来支持你直接控制机器,利用负责手和手指肌肉的周围神经系统的输出,特别是脑外神经。这样理解:你拍摄了大量的照片,但选择只分享其中的一部分;同样地,你会有大量的想法,但你只选择执行其中的一部分。当这种情况发生时,大脑会向手和手
246、指发送信号,告诉它们以特定的方式运动,以便执行诸如打字和刷卡之类的动作。重点是在手腕位置解码所述信号(即你已经决定要执行的动作),并将它们转换为设备的数字命令;与在手机屏幕点击选择歌曲、单击鼠标或在键盘上键入内容相比,这种根据意图来执行操作的方式会更为迅速;神经界面的目标是改变人机交互的长久历史,并使之成为人类对机器具有更多控制权的开始。资料来源:映维网交互范式交互范式2323年将被定义年将被定义过往的交互外设也会改变如键盘:它可以随着时间的推移学习并适应你独特的打字风格,包括打字错误等;结果是键盘将慢慢地向你靠拢,与你合二为一,而不是与世间相同的物理键盘;这将比任何机械式打字界面都快,而且始
247、终可用,因为你就是键盘;虚拟打字和点击等控件的优点在于,我们已经能够熟练地使用它们。同时需要一种方法来闭环反馈回路:触觉允许系统与用户进行反馈,让虚拟对象感觉有形,这就是触觉发挥作用的地方用手和手指执行各种操作,然后你的手和手指会获得各种感觉;我们已经进化到利用这种触觉信号来理解世界触觉允许我们使用工具和实现精细控制、触觉同时可以传达不同的情绪;在正确的语境中,不同类型的触觉反馈可以对应流行的表情emoji,这可能是一种可以实现更佳社交的新奇又好玩的方式;大脑会将视觉、听觉和触觉刺激结合起来,并赋予虚拟体验全新的维度;基于触觉维度的增加,一个全新的空间刚刚开始向我们开放,而许多可能都是从手腕丰
248、富的触觉系统开始。资料来源:映维网PART 03PART 03硬件之“操作系统”硬件之“操作系统”PCPC操作系统的演进操作系统的演进WindowsWindows、Mac OSMac OS智能手机操作系统的演进智能手机操作系统的演进SymbianSymbian、AndroidAndroid、iOSiOS由此推演由此推演XRXR操作系统的竞争格局?操作系统的竞争格局?寡头垄断格局,寡头垄断格局,AppleApple、微软、谷歌、微软、谷歌、MetaMeta?PCPC操作系统发展操作系统发展MilestoneMilestone个人计算机面世之初,人机交互最早的形式是命令行命令行。AppleAppl
249、e IIII问世问世。在70年代末开创了个人计算机的产业。IBMIBM兼容机兼容机+DOS+DOS操作系统操作系统。每次操作计算机,都要从记忆中抓取命令字符,准确输入,才能准确输出。AppleApple MacintoshMacintosh问世问世,图形用户界面图形用户界面(GUIGUI)开始成为主流开始成为主流。图形用户界面彻底改变了计算机信息呈现和交互。鼠标来回轻点,随便拖曳窗口,极大地降低了操作难度。Macintosh使用独立的MacMac OSOS操作系统操作系统,微软研发的WindowsWindows操作系统操作系统发力兼容机市场,二者合力推动了个人电脑的大规模运用,也改变了人类的生
250、产和生活方式。PCPC操作系统发展初期由硬件厂商主导操作系统发展初期由硬件厂商主导90年代初期的个人电脑市场主要由三部分构成:1)来自IBM的IBM PC以及OEM厂家的IBM PC克隆机:运行MS-DOS、Windows3.0或是OS/2操作系统;2)苹果Macintosh:运行苹果System 6.0/7.0操作系统;3)其他PC厂家(Atari、Commodore、Amiga、NeXT)。此时操作系统主要由硬件厂家主导,硬件厂家可以一手包办硬件设备与软件操作系统。84.2%7.0%1.5%3.5%3.8%0.1%图:1990年个人电脑市场份额IBM PC compatibleAppleA
251、tari STCommodore 64AmigaNeXTIBM PCIBM PCAPPLEAPPLE其他PCPC厂家IBM PC与其克隆机占据了主要的市场份额,这部分电脑运行微软MS-DOS操作系统。1985年开始,微软与IBM合作研发OS/2操作系统,旨在代替MS-DOS。1990年双方合作破裂,微软发布Windows 3.0。IBM独立推进OS/2。Windows成为IBM PC与其克隆机的主要操作系统。90年代初期,苹果处于经营困难时期。1996年,乔布斯回归苹果,主持发布了Mac OS 7.6,开创Mac OS 品牌。任务逐渐复杂,需要越来越多软件与驱动支持,中小厂商的自研系统逐渐淘汰
252、。1991年,李纳斯托瓦兹在类UNIX系统的基础上开发出Linux。开源自由免费的Linux迅速代替UNIX占领了专业应用市场。资料来源:Statista微软、苹果双双发力。微软发布Windows 95,Windows 98,Windows Me,Windows XP,巩固市场统治地位。微软的Windows和包括Word、Excel和PowerPoint在内的Office平台的巨大成功,令其占据主导地位。苹果发布第一代iMac与Mac OS 9,随后推出Mac OS X,令苹果在台式机市场重新占据一席之地。个人电脑操作系统“一超(Windows)两强(Mac OS、Linux)”的格局初步形成
253、,其他厂商的操作系统基本被淘汰。系列系列名称名称发布年份发布年份备注备注WindowsWindows消费者用户消费者用户Windows 3.01990Windows 3.21994首个中文版WindowsWindows 951995NT4.0内核,搭载IE1Windows 981998Windows ME2000NT 4.9内核Windows XP2001NT 5.1内核AppleApple消费者用户消费者用户System 7.01991Mac OS 7.61997乔布斯回归,更名Mac OS 8.01998Mac OS 8.51999Mac OS 9.01999iMac G3发布Mac OS
254、 X 2001表:1990-2001年微软与苹果主要个人电脑操作系统发布情况96.9%2.5%0.5%0.1%图:2000年个人电脑操作系统份额WindowsMacLinuxother资料来源:OneStat一超(一超(WindowsWindows)两强()两强(Mac OSMac OS、LinuxLinux)格局形成)格局形成一超(一超(WindowsWindows)两强()两强(Mac OSMac OS、LinuxLinux)格局稳固)格局稳固WindowsWindowsMac OS XMac OS XLinuxLinux2007年,微软发布Windows Vista,激进的技术路线尝试阻
255、碍了Windows Vista的推广。2009年,微软发布Windows 7。这是迄今为止最成功的个人电脑操作系统。截止2021年,仍然有18.3%的电脑在运行Windows7。2008年,苹果发布Mac OS X 10.6,该版本系统只支持x86架构。至此,苹果放弃了使用了近20年的PowerPC芯片,x86架构统一个人电脑市场。同时,iPod、iPhone等产品的走红成功带动了苹果电脑的销售,Mac OS X的市场份额从2004年的2.6%增加到2012年的7.6%。2004年,Linux Ubuntu发布。同年,中国企业也推出了Linux Deepin。成熟的商业化Linux系统已经可以
256、满足基本的办公需求。Linux系统可以更好的兼容RISC指令集的芯片,打破一些国家对x86架构芯片的垄断,从而吸引许多对安全性有要求的政企用户。90.9%7.58%0.87%00.10.20.30.40.50.60.70.80.91图:2012年个人电脑操作系统份额WindowsMacLinuxother资料来源:Statista、w3schools、statcounter一超:Windows的统治地位稳固,Windows7及以后版本连续成功,常年占据90%以上的市场份额。一强:苹果手机、电脑产品热销,助力Mac OS仍占据一席之地。一强(逐渐式微):Linux专业性较强,适用于特定场景。0%
257、10%20%30%40%50%60%70%80%90%100%2003200420052006200720082009201020112012图:2003-2012年个人电脑操作系统份额WindowsmacOSChrome OSLinuxOther0.0%1.0%2.0%3.0%4.0%5.0%6.0%7.0%8.0%87.0%88.0%89.0%90.0%91.0%92.0%93.0%94.0%95.0%96.0%2003 2004 2005 2006 2007 2008 2009 2010 2011 2012图:2003-2012年全球Windows与Mac OS市场份额变化Windows
258、macOS左坐标轴右坐标轴Windows 7发布资料来源:Statista、w3schools、statcounter一超(一超(WindowsWindows)两强()两强(Mac OSMac OS、LinuxLinux)格局稳固)格局稳固面向未来继续发展,多屏融合的尝试面向未来继续发展,多屏融合的尝试随着技术的不断发展,手机和平板已经逐步成为了比个人电脑更重要的屏幕。更好的连接手机、平板和电脑,弱化设备之间的隔阂。从用户体验上来说,这一阶段操作系统的发展趋势主要有如下特点:1.1.平板与电脑的统一:平板与电脑的统一:从Windows 8采用Modern UI,提供更好的触摸支持。平板电脑出现
259、窗口化多任务。2.2.移动设备与电脑的互联:移动设备与电脑的互联:2013年OS X 10.9升级实现了AirDrop功能。3.3.应用通用:应用通用:2021年发布的macOS12操作系统可以直接运行手机端iOS应用程序。同年推出的Windows 11中可以直接运行手机端安卓应用程序。0%10%20%30%40%50%60%70%80%90%100%2013 2014 2015 2016 2017 2018 2019 2020 2021 2022图:2013-2022年个人电脑操作系统份额WindowsmacOSChrome OSLinuxOther系列系列名称名称发布年份发布年份备注备注W
260、indowsWindows消费者用户消费者用户Windows Vista2006支持64位芯片Windows 72009Windows 82012Modern UIWindows RT2013支持ARM架构Windows 8.12013Windows 102015Windows 112021支持安卓应用AppleApple消费者用户消费者用户Mac OS X 10.42005开始支持x86架构Mac OS X 10.62008结束支持Power架构OS X 10.92013扁平化设计,AirDropmacOS 112020支持ARM架构(M1)macOS 132021支持iOS应用表:2001
261、-2022年微软与苹果主要个人电脑操作系统发布情况资料来源:Statista、statcounter面向未来继续发展,多屏融合的尝试面向未来继续发展,多屏融合的尝试 轻量级开源操作系统出现轻量级开源操作系统出现搭载Chrome OSChrome OS的电脑,即ChromeBook依靠网页端应用来实现各种功能,不需要在本地进行复杂的数据处理。Chrome OS的电脑相较于普通电脑硬件成本较低,同时更加轻便,续航时间更长。不同设备之间的互联互通愈加重要不同设备之间的互联互通愈加重要消费者会更倾向于购买同一生态链同一生态链内的产品。封闭生态系统的苹果将获得巨大的优势。苹果操作系统的市场占有率从201
262、2年的8%上涨到2022年的15%。0.0%5.0%10.0%15.0%20.0%200320042005200620072008200920000022图:2003-2022年全球Mac OS市场份额变化macOS75.48%15.17%2.49%2.30%00.10.20.30.40.50.60.70.80.91图:2022年个人电脑操作系统份额WindowsMacChromeOSLinuxUnknown资料来源:Statista、statcounterPCPC操作系统市场份额变化操作系统市场份额变化0
263、%10%20%30%40%50%60%70%80%90%100%200320042005200620072008200920000022图:2003-2022年个人电脑操作系统市场份额WindowsmacOSChrome OSLinuxOther资料来源:Statista、w3schools、statcounterWindows占比90%以上Windows占比逐渐降低至70%以上,份额主要由Mac OS、其他轻量级操作系统蚕食智能手机操作系统发展智能手机操作系统发展MilestoneMilestoneSym
264、bian与诺基亚一同成就了功能机的巅峰,也一同消弭于智能机的浪潮。iPhoneiPhone重新定义了智能手机重新定义了智能手机,触摸取代键盘成为人机交互的主流触摸取代键盘成为人机交互的主流。iPhone所搭载的iOS操作系统只能为苹果硬件服务,市场上其他的硬件厂商必须选择搭载其他操作系统来满足终端用户的需求。谷歌组建OHA联盟,Android操作系统成为适配多元硬件的开放生态中最大的赢家。智能手机一超一强格局延续至今,基本是Android(70%),iOS(20%+),其他(10%-)。但近几年,Android份额下降而iOS份额提升,主要是苹果在高端智能手机市场的优势进一步拉大。0%10%2
265、0%30%40%50%60%70%80%2009200016图:2009-2016年智能手机操作系统市场份额AndroidiOSWindows PhoneBlackBerrysymbian OS智能手机操作系统鏖战,智能手机操作系统鏖战,AndroidAndroid、iOSiOS突出重围突出重围Symbian OSiOSiOSAndroidAndroid2007年,Symbian历史上最为成功的产品之一诺基亚N95正式发布,标志着Symbian巅峰时代。2009年始,LG、索尼爱立信、三星等众多厂商逐步宣布退出Symbian平台,转投Android阵
266、营。2010年以后,由于Symbian先天性的设计缺陷(为键盘机而设计),导致其在触屏手机上的运行始终显得笨重而臃肿,不能和Android以及iOS系统抗衡,无法扭转颓势。2013年,诺基亚正式宣布808 Pure View成为最后一款搭载Symbian系统的手机。意味着Symbian系统正式退出竞争舞台。2007年,iPhone问世,重新定义了智能手机。2012年6月,iOS 6亮相WWDC 2012,提供了超过200项新功能。2013年6月,iOS 7亮相WWDC 2013,重绘了所有的系统APP,去掉了所有的仿实物化,整体设计风格转为扁平化设计。2007年11月5日,Google公司正式
267、推出了其基于Linux 2.6标准内核的开源手机操作系统,命名为Android。Google以Apache免费开源许可证的授权方式,发布了Android的源代码。开源的设计取得了硬件厂商的支持与响应,Android系统的市场份额快速放大。目前销量最好的手机厂商如华为、中兴、小米、阿里、OPPO、Vivo、联想、魅族、360、TCL、酷派等所使用的操作系统,均基于Android进行定制改造。资料来源:statcounteriPhoneiPhone的闭环生态:自研芯片的闭环生态:自研芯片+iOS+AppiOS+App StoreStore苹果iPhone以“自研芯片+iOS操作系统+App Sto
268、re”构建软硬件一体的闭环生态。闭环生态的突出优势在于软硬件整合程度高、可升级、安全性高。软硬件整合程度高:软硬件整合程度高:iOS操作系统的软硬件整合度高,实现从“自研芯片+iOS操作系统+应用软件”的完美适配,避免兼容性差异等常态化问题,大幅提升系统的稳定性。与之对照,Android系统的分化程度较高,碎片化程度较高。系统可升级:系统可升级:通过FOTA(Firmware Over the Air,固件空中升级)技术,苹果用户摆脱了过去仅允许连接iTunes才能进行系统更新的限制,使其第一时间在联网状态下就能完成iOS系统的在线升级,以获得更强的手机性能。安全性高:安全性高:在闭环生态下,
269、苹果能够快速捕捉到系统中存在的安全漏洞,并通过FOTA方式及时推送给用户以实现在线修补。同时,应用软件开发商仅能通过苹果提供的工具包进行应用开发,并在其严格的审核机制下才能推出应用功能。A16仿生处理器+iOS16 +Apple Store资料来源:Apple官网AndroidAndroid的联盟生态:开放硬件的联盟生态:开放硬件+开源软件开源软件由于自身软硬件能力的缺乏,Android采取了与苹果不同的开源策略建立联盟生态建立联盟生态:联合手机制造商、软件开发商、芯片制造商等多方势力,共同成立OHA(Open Handset Alliance,开放手持设备)联盟,基于Android源代码构建
270、包含操作系统、中间件、应用程序在内的开源软件框架,以实现Android系统与不同手机终端及芯片间的兼容与适配,形成从“芯片+操作系统+应用+终端”的Android联盟生态。OHA联盟中成员可分为五类:通信运营商、手机制造商、半导体公司(芯片厂商)、软件应用开发商、商业公司。Pros:实现了Android系统的快速普及,实现了应用软件在不同终端中的良好兼容。Cons:手机厂商为保持对Android系统的兼容性,而抹杀了自身的差异性,只能比拼硬件。Pros:基于开放性原则兼容了更多的应用软件开发商,应用矩阵也更丰富。Cons:对用户而言,通过SOTA方式即能实现应用软件在不同终端以及不同渠道的获取
271、(渠道可以是官方应用商城,也可以是腾讯应用宝、360等第三方应用平台)。资料来源:datuopiniom开放硬件开放硬件开源软件开源软件塞班的没落与微软的失利塞班的没落与微软的失利一是用户体验极差,塞班系统为了防止恶意的程序进入降低系统流畅度,就推出了一个签名机制,下载一个软件必须要使用签名机制,过程复杂,体验感差。二是生态缺乏,开始时索爱和三星手机都可使用塞班系统,后来诺基亚将授权收回,其他的手机品牌都不能够使用塞班的系统,导致生态进一步衰落。一是微软已经失去移动市场的先发优势,在大局已定的情况才进入,此时Android与iOS已经占据市场,微软下拉式菜单的使用习惯也给客户习惯切换带来难度;
272、二是无法形成一个完整的手机生态体系。与Android、iOS相比,Windows 10系统的生态系统过于匮乏,微软也曾通过基金池的形式鼓励开发者加入Windows平台,但效果不佳。一是三星Tizen起步较晚,开发者Android、iOS已形成粘性,故 APP在这个系统上的适配问题不断显现。二是三星与其他品牌是竞争关系,很难说服手机厂商使用自己的系统,而谷歌并不会威胁到其它手机厂商的业务。近五年近五年AndroidAndroid统治地位有松动迹象统治地位有松动迹象Android市场份额由2018年的75.45%下滑至2022年的71.44%,降低4个百分点;同期,iOS市场份额则由20.47%增
273、长至27.88%,增加7个百分点,与苹果手机全球市占率的提升相匹配。外因:华为1)受到制裁后芯片短缺,已无力参与高端手机市场的竞争,这部分用户转向苹果手机;2)华为手机自研鸿蒙OS,所有搭载华为麒麟710芯片及其以上的机型均可升级。内因:OHA成员需要保持对Android的兼容性,导致安卓手机同质化较严重、用户体验待优化,难以攻克高端机市场份额。0%5%10%15%20%25%30%64%66%68%70%72%74%76%200022图:2016-2022年全球Android与iOS市场份额变化AndroidiOS左坐标轴右坐标轴资料来源:stat
274、counterOHAOHA联盟出现内部利益分化,谷歌联盟出现内部利益分化,谷歌VSVS手机厂商手机厂商OHA联盟中成员可分为五类:通信运营商、手机制造商、半导体公司(芯片厂商)、软件应用开发商、商业公司。其中,各个环节内部互有竞争,手机厂商之间、芯片厂商之间、软件开发商之间,但仅手机厂商的发展与谷歌普及Android存在潜在冲突。一方面,AndroidAndroid的兼容性制约了手机厂商的差异化的兼容性制约了手机厂商的差异化。手机厂商只能通过销售硬件获得收入,同质化竞争严重、利润率低。另一方面,手机厂商尝试多平台策略以增强竞争力手机厂商尝试多平台策略以增强竞争力。谷歌收购摩托罗拉给其他手机厂商
275、带来危机感,HTC、三星等推出一两款机型转向Windows Phone操作系统。VS资料来源:谷歌官网,各手机厂商官网闭环生态日臻纯熟,闭环生态日臻纯熟,iOSiOS与与Mac OSMac OS全面融合全面融合统一化统一化、平台化是苹果闭环生态一直以来追求的目标平台化是苹果闭环生态一直以来追求的目标。苹果的生态策略是希望将手机、平板、电脑三款不同的硬件平台融合,对应到执行层面是硬件、软件(系统)两大维度齐齐发力。硬件:推出基于硬件:推出基于ARMARM架构的架构的M M1 1、M M2 2芯片芯片。ARM为移动端而生,M系列芯片的综合性能及部分性能已经不落后甚至超过PC端主流的intel和AM
276、D芯片。未来,随着苹果研发的跟进,iPad甚至iPhone都有可能搭载苹果M系列芯片。软件软件(系统系统):苹果体系内三大系统平台:苹果体系内三大系统平台iOSiOS、iPadiPad OSOS、MacMac OSOS已实现全面融合已实现全面融合。首先,iOS和iPadOS的软件兼容自诞生以来就可以。其次,2019年iPadOS独立,标志着苹果移动端和PC端系统融合正式开始。最后,2020年Mac迁移到自研芯片,开发者可以在不经修改的情况下让iOS、iPadOS App在Mac中可用。资料来源:Apple官网,新浪VR0%100%2009200016
277、2002020212022图:2009-2022年智能手机操作系统市场份额AndroidiOSWindows PhoneBlackBerrysymbian OSSamsungSeries 40其他智能手机操作系统市场份额变化智能手机操作系统市场份额变化资料来源:statcounterSymbian快速没落,Android后来居上Android、iOS两强继续相争,近几年iOS份额扩大智能手机操作系统721格局相对稳定XRXR操作系统:操作系统:VRVR安卓占据主流,安卓占据主流,ARAR则乾坤未定则乾坤未定 VR一体机目前主要使用安卓系统。早期的VR一体机基本沿袭手机端的
278、计算芯片与操作系统,如Oculus Go采用高通骁龙821芯片,Vive Focus采用高通骁龙835芯片,操作系统则是在安卓系统的基础上进行优化及定制。类似地,分体式VR包括PC VR、PS VR以及华为VR Glass、创维V601等超短焦手机VR,其运行的操作系统仍以连接的主机为主,包括微软WMR、索尼PS及安卓系统。AR操作系统系生态占领制高点。目前市场上的创业型公司AR眼镜自身缺乏系统研发能力,当前仍以多以安卓系统为基础进行优化与定制。科技巨头将AR操作系统视为战略制高 点,如 微 软 HoloLens 采 用 以Windows NT 为 基 础 的 Windows 10Hologr
279、aphic系统,HoloLens 2则采用 全 新 多 平 台 操 作 系 统 WindowsCore OS;Magic Leap自研专为空间计算设计的Lumin OS。国内企业虹宇科技2020年发布自研VR/AR 3D多任务系统Iris OS,可以呈现2D、3D的窗口及全景应用,支持多人多设备协作,兼容各类芯片平台及光学模组。VR设备:安卓占据主流AR设备:生态制高点,乾坤未定AndroidWindows 10 HolographicWindows Core OSLumin OSIris OSWMRPSOpenXROpenXR行业标准已经出现行业标准已经出现OpenXR是一个由Khronos
280、组织联盟开发的开放式、无版权费用的XR行业标准规范,旨在简化VR/AR软件开发,打通游戏引擎及内容底层连接,塑造具备互通性的开放生态。OpenXR最大的意义是,游戏开发者使用一个API接口就能让游戏在不同品牌的VR/AR中运行;硬件厂商则可利用现有OpenXR内容降低市场进入门槛,为消费者提供更丰富的内容体验。目前微软在HoloLens、WMR头显均提供OpenXR支持;Unity推出OpenXR支持预览版;Epic宣布虚幻引擎5不再支持SteamVR、Oculus等平台,转而支持且仅支持OpenXR标准;Oculus推荐游戏引擎使用OpenXR等。国内厂商中华为、兆芯、Pico等也加入Ope
281、nXR联盟参与标准的讨论与制定工作。资料来源:Khronos开端:开端:XRXR区分于区分于PCPC、智能手机的最本质差异、智能手机的最本质差异VR(Virtual Reality 虚拟现实)是指,由计算机创建、渲染一个仿真三维空间并呈现信息;AR(Augmented Reality增强现实)是指直接以真实的三维空间为背景将信息投射其中。VST VR,它以VR相对成熟的硬件为基础,添加能够捕捉真实世界的摄像头,将真实世界重构于用户眼前,达到一种类似AR的效果,也称之为MR。传统VR类似于游戏机,而VST VR(MR)更像是PC的延伸,AR更像是手机的延伸。相比上一代移动互联网相比上一代移动互联
282、网,VR/ARVR/AR带来的最本质的变化是带来的最本质的变化是,用户能够在三维空间中与立体用户能够在三维空间中与立体、逼真的信息进行互动逼真的信息进行互动。通讯技术交互形式应用模式内容分发PC/PC/笔记本笔记本智能手机智能手机XRXR终端终端Internet3G/4G5G鼠标多点触控空间交互3D,手柄“Windows”App云应用Cloud浏览器应用商店环境感知、AI资料来源:虹宇科技XR时代需要什么样的操作系统?中场:中场:XRXR时代需要怎样的操作系统?时代需要怎样的操作系统?XR需要一套全新的原生的操作系统。专门基于XR特性设计的包含交互方式、应用模式、内容分发的操作系统。XR设备、
283、内容有着区分于PC或智能手机的显著差异,3D化、空间化、多任务等,对算力和功耗的要求也更苛刻。基于现有Android系统改造的XR操作系统长期难以适应XR的发展需求。内容分发应用模式交互方式XR内容的特性:脱离屏幕、3D化、空间化、多任务对应交互方式的重构:手势、眼动、空间感知等空间交互方式XR设备的特性:更大的算力需求和更受限的功耗对应应用模式的适配:超级APP体验下降,需要能够和和真实空间进行结合,基于场景的服务,类似于“3D小程序”结合交互方式与应用模式的变化,下一代的智能终端能够产生更加丰富的内容分发机制,像智能助手一样根据环境感知实时进行信息推送。资料来源:虹宇科技XR时代需要什么样
284、的操作系统?终局:终局:XRXR操作系统之争,谁的胜率更大?操作系统之争,谁的胜率更大?四大巨头角逐操作系统霸主四大巨头角逐操作系统霸主。复盘复盘PCPC及移动操作系统历史及移动操作系统历史,寡头垄断可能是最终格局寡头垄断可能是最终格局。争夺XR操作系统霸权的战争已经开始。下一代硬件仍在演进,但四家重要的参与者苹果、微软、谷歌和Meta针对VR、AR头显提供操作系统的竞争已经非常激烈。参与过两场操作系统之争,Mac OS、iOS至今占据稳固份额强大的产品能力始终是压舱石独有的闭环生态效率与安全性双高,但同时也是普及的限制因素Mac OSiOSARKit苹果MR胜于PC操作系统之争,落后于移动操
285、作系统之争基于Windows的VR/AR操作系统已有应用积极寻求第三方合作,如MetaWindowsHoloLensWindows Core OS基于Android系统改写的操作系统占据VR主流未直接研发VR/AR产品(Google Glass已宣告破产),具备再建开源生态的条件Android无硬件开源生态从硬件来看,是VR/AR设备的先行者,VR全球市占率第一新秀,未参与过操作系统之争积极寻求第三方合作,如微软VR产品线AR产品线(在研)策略最激进资料来源:各公司官网,安信证券研究中心目录目录20232023版元宇宙研究框架版元宇宙研究框架、元宇宙的上半场与下半场元宇宙的上半场与下半场202
286、32023:硬件的:硬件的“大大”年年硬件之硬件之“沉浸感沉浸感”、“交互范式交互范式”、“操作系统操作系统”元宇宙之百舸争流元宇宙之百舸争流 虚拟人:交互世界的新物种;NFT:数字世界的魔法棒 Web 3:内核是“治理”,“去中心化”实则为“反抗有理”AI与后端基建:2023年迎来景气上行 场景:2024-2025年的“八面来风”研究研究思路思路01020304PART 01PART 01虚拟人:交互世界的新物种虚拟人:交互世界的新物种NFTNFT的魔法棒:从数字内容到数字资产的魔法棒:从数字内容到数字资产虚拟人最重大意义之所在虚拟人最重大意义之所在NFTNFT的魅力在于孵化与孕育未来的各类
287、“明星”的魅力在于孵化与孕育未来的各类“明星”虚拟人与虚拟人与NFTNFT对当下的重构,亦会重塑企业的三张报表对当下的重构,亦会重塑企业的三张报表虚拟人与虚拟人与NFTNFT的交叉之处,是新一轮的的交叉之处,是新一轮的IPIP孵化与商业化孵化与商业化虚拟人:交互世界的新物种虚拟人:交互世界的新物种根据安信最新的逻辑架构图,元宇宙是实现真正智能的路径之一,即重构一套新的时空,架构在真正的智能实现上、元宇宙上的虚拟人,它是新物种,“新物种”是相对于“人”而言,从这个角度,新物种不仅包括虚拟人(人的数字人、虚拟数字人),也包括机器人(现实物理世界中的机器人,在元宇宙中一定会有虚拟形象)。从这个角度,
288、“人”在元宇宙时代,软件硬件均需要升级,因为混合平台的实现,技术路径之一,即以人为硬件载体。元宇宙对“人”的挑战,是“人”的软件需要适配升维至3D的虚拟现实(元宇宙);智能的真正实现,亦需要“人”硬件的升级(甚至是重塑)。从用户的角度,互联网时代的PC、智能手机是人的一个器官,努力去拉近人与网络(虚拟世界)的距离,虽然在努力拉近,但最大的限度只能去靠近、逼近,元宇宙则是将用户直接拉进虚拟世界中,故虚拟人的职能有三故虚拟人的职能有三:第一,是人的数字人,肩负着将人拉进元宇宙的使命;第二,是在现实物理世界中不存在实体的虚拟数字人;第三,是机器人,机器人的存在对于智能的真正实现(通用人工智能平台的构
289、建)非常重要,未来现实物理世界中很多的角色、职能、功能将由机器人来协助甚至代替人来承接;浅层次上,机器人的存在将在经济学意义上降低商品与服务的价格,尤其是服务,解决诸多日益沉重的社会问题。人人 VS VS 人的数字人、虚拟数字人、机器人人的数字人、虚拟数字人、机器人从交互对象的角度,未来元宇宙囊括现实物理世界后,人的交互对象增加了三类,分别为人的数字人、虚拟数字人、从交互对象的角度,未来元宇宙囊括现实物理世界后,人的交互对象增加了三类,分别为人的数字人、虚拟数字人、机器人。其中,机器人。其中,AIGCAIGC即即AIAI创作,这里的创作者可以是人的数字人、虚拟数字人、机器人创作,这里的创作者可
290、以是人的数字人、虚拟数字人、机器人他们本质上都是他们本质上都是AIAI,其创,其创作均可以称为作均可以称为AIGCAIGC。当前由CG建模或AI驱动的我们自己的数字人。数字人与现实物理世界中的人存在对应关系,又可进一步分为化身与分身,人在现实物理世界中具有唯一性,但可以在数字空间中映射出来数个数字分身与数字化身在元宇宙中数字原生出的虚拟人,原生之前并不存在于现实物理世界中。数字原生是元宇宙底层架构中较高级的阶段,需要与数字孪生相区分存在于现实物理世界中的智能交互硬件,如特斯拉的人形机器人。未来也将会出现一种机器人虚拟数字人反向映射回现实物理世界的硬件显现人的数字人虚拟数字人机器人互联网互联网元
291、宇宙元宇宙2D3D人人人的数字人虚拟数字人机器人交互种类交互种类人与人交互,人与人交互,1 1种种6 6或或1212种种资料来源:安信证券研究中心整理人的数字人:分身与化身人的数字人:分身与化身元宇宙是虚实融合的世界,那人如何进入元宇宙参与各类活动?人进入元宇宙的数字空间需要有一个数字身份,数字元宇宙是虚实融合的世界,那人如何进入元宇宙参与各类活动?人进入元宇宙的数字空间需要有一个数字身份,数字人是构建数字身份的基础。人是构建数字身份的基础。数字化身(数字化身(avataravatar):给人的空间移动加杠杆):给人的空间移动加杠杆数字分身(数字分身(separationseparation)
292、:给人的时间利用加杠杆):给人的时间利用加杠杆元宇宙中人的存在表现为三个层次元宇宙中人的存在表现为三个层次现实维度的人现实维度的人人的数字人:化身、分身人的数字人:化身、分身现实物理空间的真身/硬件。作为拥有生物意义上“肉身”的真身,其在现实空间有社交关系、独立的人格与心智(世界观、人生观、价值观)、政治/文化/经济地位或属性等人在元宇宙虚拟现实空间中还会以数字化身与数字分身而存在数字化身与数字分身应用的场景不同数字人的化身解决空间问题,应用于有互动需求的场景,如远程虚拟大会在元宇宙中,用户的身体并不缺席,其真身通过技术“扩展”在场,以数字化身感知在场能够在最大限度上接近现实中“面对面”的沟通
293、效果分身的存在实现了对时间的多线并发使用,人的数字分身可以有数个,并在不同情景中进行沉浸式交互,进而实现给人的时间利用加杠杆动作、表情等以AI进行驱动数字分身与真身的人,在认知水平、能力、表达等方面会趋向于一致,可以在不同的场景中与环境发生互动数字分身与数字化身的存在,让人在时空环境中均能加杠杆。工作效率、劳动生产率因而得以成倍扩大、增长,这就是元宇宙可数字分身与数字化身的存在,让人在时空环境中均能加杠杆。工作效率、劳动生产率因而得以成倍扩大、增长,这就是元宇宙可能带来的增量价值。分身与化身不是目的,能带来的增量价值。分身与化身不是目的,杠杆作用于人的创造力、放大这种创造力的效用与效益杠杆作用
294、于人的创造力、放大这种创造力的效用与效益才是目的。才是目的。机器人也将会是虚拟数字人在现实世界的显现机器人也将会是虚拟数字人在现实世界的显现元宇宙的后半场元宇宙的后半场,现实物理世界中的人现实物理世界中的人、物物、空间这三者均会被重塑空间这三者均会被重塑,未来将会出现基于情感需求投射的分布式垂类未来将会出现基于情感需求投射的分布式垂类硬件硬件,机器人是分布式垂类硬件之一:机器人是分布式垂类硬件之一:一是,人在元宇宙中将会被开发出新需求,尤其是非物质需求,未来元宇宙中的 AI 将会发挥越来越重要的作用,2022年AIGC发展迅速且获得市场广泛的关注,AIGC即人工智能自动生成内容,被认为是继专业
295、生产内容(PGC)、用户生产内容(UGC)之后的新型内容创作方式,人的潜在需求会越来越多的被 AI 的供给所满足,另外 AI 将更进一步,显现在现实物理世界中,以新硬件的形式承接人在未来现实物理世界中的更多需求;二是,虚拟数字人有望反向映射回现实物理世界,即显现为机器人/新硬件而存在,其在与人共享的现实物理空间中的需求与体验同样需要被满足,也就是说,分布式垂类硬件的产生,以“现实物理世界”为空间,以 AI 为生成与驱动的机制,是“人”与“物”受“机器人”与“新硬件”供给与重塑的结果。在我们看来在我们看来,机器人或新硬件仅是外在的表现形式机器人或新硬件仅是外在的表现形式,内核仍然是服务于人交互的
296、内核仍然是服务于人交互的 AIAI,包括各类主体之间基于情感或包括各类主体之间基于情感或利益需求的交互利益需求的交互。元宇宙较上一轮移动互联网元宇宙较上一轮移动互联网,增加了增加了 AIAI 生成与驱动的机制生成与驱动的机制,移动互联网时代移动互联网时代,交互的内容交互的内容/对象基本上都是由真对象基本上都是由真实的人实的人(软件工程师软件工程师、创作者等创作者等)设计与渲染出来的设计与渲染出来的,但在元宇宙时代但在元宇宙时代,AIAI 成为元宇宙世界里的一大新增生产要素成为元宇宙世界里的一大新增生产要素,将会大量存在于供给将会大量存在于供给、需求的各个环节需求的各个环节,数字人数字人、虚拟人
297、等就是虚拟人等就是 AIAI 的诸多应用之一的诸多应用之一。案例:案例:北京冬奥会上的各类机器人、特斯拉人形机器人“擎天柱”、人形仿生机器人CyberOne人与人的交互人与人的交互 VS VS 新增新增6 6类交互类交互我们认为人与自然的交互、人与物的交互,是人对外交互的基本层面,人与人的交互则是人对外交互的更高层面,故研究序列中,人与人的交互在绝大多数情况下,是我们关注的重点。通过梳理人与人交互的历史脉络,我们发现在历史进程中,任何一个方向的升维都有可能推动人与人的交互发生翻天覆地的变化,呈现出愈加复杂的特性。整体而言,人与人交互脉络最为核心的主线,是技术的发展推动人与人交互的空间范围不断扩
298、大,交互的反馈变得迅速(交互时间缩短),在交互空间折叠、交互节奏持续加杠杆过程中,人与人交互的媒介、渠道持续迭代,交互行为的范式也变得更加丰富与复杂。(一)传统农业时代:主要依赖面对面交流,重要信息靠书信传递(二)电报/电话时代:即时、在线沟通交流逐渐成为普通老百姓的常态(三)PC互联网时代:真正实现了全球用户的连接,由通讯走向娱乐等多元的交互行为(四)移动互联网时代:随时随地线上交互,基于位置衍生出一系列全新的交互行为人类交互历史梳理人类交互历史梳理1919世纪中期世纪中期2121世纪前后世纪前后2010s2010s空间空间范围范围元宇宙反馈反馈周期周期交互交互行为行为传统农业时代传统农业时
299、代电话电话/电报时代电报时代PCPC互联网互联网移动互联网移动互联网元宇宙元宇宙邻居亲友面对面交流特定阶层可远游(大航海)邻居亲友面对面交流远距离电信/电话沟通与世界各地的人交互(存在上网场景限制)与世界各地的人交互(随时随地)线下实时交互书信往返约半个月写信5-10天电话/电报可即时在线交流(费用高,适用于部分人)实时在线交互(文字、图片、视频)实时在线交互(图文、视频、直播)贸易农业生产18441844年年莫尔斯发出人类历史上第一份电报18771877年年第一条电话线路连接了波士顿和萨莫维尔19931993年年中国无线寻呼业务向社会开放19941994年年广东开通第一个省级数字移动通讯网1
300、9991999年年BBS、QQ上线20052005年年博客上线20092009年年微博上线社社交交娱娱乐乐电电商商19981998年年网文第一次的亲密接触在BBS连载20年年视频网站PPS,土豆、优酷网相继上线20072007年年传奇最高在线人数突破60万20032003年年淘宝网上线20092009年年首次举办双十一购物节社社交交其其他他娱乐娱乐电商电商20112011年年微信上线20102010年年快手上线20162016年年抖音上线20102010年年爱奇艺上线20年年直播大战20202020年年手淘改版 推出逛逛2021202
301、1年年抖音兴趣电商外卖外卖打车打车移动支付移动支付资料来源:安信证券研究中心整理人类交互历史梳理人类交互历史梳理透过上述从传统农业时代到移动互联网时代四个阶段的历史梳理透过上述从传统农业时代到移动互联网时代四个阶段的历史梳理,我们总结人与人的交互沿着四条脉络发生了翻天覆我们总结人与人的交互沿着四条脉络发生了翻天覆地的变化:地的变化:(1)从交互空间范围来看,从亲人邻里的面对面沟通,到远距离交流,再到互联网时代能够与世界范围内的人自由交互,交互的范围不断扩大;(2)从交互时间来看,人与人进行远距离时,从最开始的书信、电报,到电话、微信时代,交流的反馈周期越来越短,信息的交互越来越同步;(3)从交
302、互媒介来看,从阅读文字、图片、视频到直播,承载交互信息的媒介实现了从一维到三维的升级,现形式更加立体,用户在单位时间内能够看到的信息量变得更加丰富,也调动了更多的感官进行交互,包括视觉、听觉等,使我们能够更好的感受对方的情绪、表情等。(4)从交互内容来看,从最早的获取资讯,发展到线上娱乐、购物,甚至衍生出许多原来并不存在的行为,比如线上打车、外卖等,涵盖了生活的方方面面,行为的复杂性有了全方面的提升,而且交互的需求也从满足物质性需求的目的发展至服务于精神性需求的目的。这四条脉络里人与人交互的空间、时间、感官的变化是表层的原因,而交互内容的升级及丰富度的提升是前三个层面的升级所导致的结果,每一个
303、维度的升级都会带来现实物理世界的生活,其巨大的变化甚至是变革。交互空间的变革交互空间的变革交互时间的变革交互时间的变革交互内容的变革交互内容的变革面对面沟通远距离交流移动互联网时代的随时随地书信、电报电话、微信反馈周期越短,信息的交互越同步书籍电视/PC/智能手机VR/AR一维二维三维交互媒介的变革交互媒介的变革图文音频、视频直播、购物内容越来越丰富元宇宙时代新增元宇宙时代新增6 6类交互类交互元宇宙时代将沿着前序的脉络元宇宙时代将沿着前序的脉络,进一步重构人所处的空间与时间进一步重构人所处的空间与时间,人与人交互的场景的复杂度将全方位被放大人与人交互的场景的复杂度将全方位被放大。首先,现实与
304、虚拟的3D融合,人更被裹挟入虚拟时空里,一方面是空间上会出现与现实世界孪生的虚拟世界,另一方面基于用户的创造将衍生出现实世界不存在的空间,而且在不同虚拟空间中用户可以自由移动。其次,在时间层面,虚拟与现实的边界被消融,人随时随地甚至无感进入虚拟空间,在线时长将不受限制,甚至可以24小时沉浸式进入线上。这种空间的自由流动与时间的极限沉浸叠加,有望创造出极为繁荣的新场景,从而释放出巨大的产业价值。仅从人与人的交互仅从人与人的交互,我们就可预见未来将出现的不可思议的变化我们就可预见未来将出现的不可思议的变化,更何况在元宇宙这一计算平台上更何况在元宇宙这一计算平台上,交互主体已经不交互主体已经不限于人
305、与人之间限于人与人之间。元宇宙中的人元宇宙中的人、人的数字人人的数字人、虚拟数字人虚拟数字人、机器人这四类用户机器人这四类用户,能衍生出能衍生出6 6类交互方式:类交互方式:人与人的数字人的交互人与人的数字人的交互人与虚拟数字人的交互人与虚拟数字人的交互人与机器人的交互人与机器人的交互人的数字人与虚拟数字人的交互人的数字人与虚拟数字人的交互人的数字人与机器人的交互人的数字人与机器人的交互虚拟数字人与机器人的交互虚拟数字人与机器人的交互元宇宙时代新增元宇宙时代新增6 6类交互类交互除了以上三对交互关系外,还存在人的数字人与虚拟数字人的交互、人的数字人与机器人的交互、虚拟数字人与机器人的交互。因而
306、,元宇宙实现了社交主体的拓展,交互对象的范围也扩展至虚拟人与机器人这一非生物类群体,达到万物互联,这意味着人在社交生态中的身份、地位与功能都将发生变化。最重要的是社交主体的拓展必然带来社交主体之间关系的重构,社交生态更为丰富,社交关系也更为复杂。元宇宙时代,在各种非生物类群体成为人的交互对象的背景下,这些以往的“物”也就不再只是交往的客体,而具有了全新的主体身份。这对于社交生态而言,具备颠覆性意义,一切均将被重构。人与虚拟数字人的交互人与机器人的交互人与人的数字人的交互在二维平面的互联网/移动互联网中,人的身份象征体现为一个数字头像或数字人物,人与数字头像或数字人物之间的交互感很弱,源于二维屏
307、幕不足以重建现实。而在虚拟实现或元宇宙中,我们人的身份象征则体现为人的数字人,是非常具象的、立体的形象,因而此时人与人的数字人之间的交互感,则体现得较为强烈且真实。如初次体验VR头显设备时,注册登陆设备账号时,需要构建一个或数个3D的虚拟形象,来适配于不同的应用场景,以西装的形象参加线上会议,以休闲的形象参与线上社交活动,以运动的形象参与线上健身等。虚拟数字人特指在虚拟世界中数字原生出的虚拟人,与现实世界的人不存在对应的关系。虚拟数字人将会是元宇宙中的重要组成元素,原因在于元宇宙中的交互界面不可能再依赖于文字,而必然要回归人与“人”之间的交流,虚拟数字人便承担了连接元宇宙虚实共生世界的主体作用
308、。但目前,人与虚拟数字人之间的交互仍然存在壁垒与差异,因为虚拟数字人的本质是人工智能,人与虚拟数字人之间的交互非常依赖于人工智能的发展进程,以及配套的算力算法,人与虚拟数字人之间的交互未来会趋向自然与顺畅。与虚拟数字人的本质相同,机器人的内核也是人工智能。人与机器人之间的交互并不是新鲜事,目前我们可以在商场、餐厅、酒店等地方看到诸多的移动机器人,这些机器人大多都是起到客服或导航的作用。当前绝大多数的机器人还无法做到与真人一样进行自然的交互,但方向是明确的,即拟人的设计、更加的智能化,甚至是情感表达与交流。随着深度学习技术的发展,2022年智能机器人发展提速,如特斯拉人形机器人“擎天柱”,代表了
309、人工智能技术落地的新方向。未来,人与机器人之间的交流将逐步从指令交流升级为无特定具体指令的正常交流,这种交互的进化过程中,将伴随着系列化的难题与众多挑战。虚拟人首先是人进入元宇宙的身份虚拟人首先是人进入元宇宙的身份总结人的身份特征的变化,我们可以梳理出较为清晰的主线,即从书信时代的笔名、PC互联网的QQ头像、QQ秀,到移动互联网时代的微信头像、脸萌、ZEPETO,代表人们进入虚拟世界的身份角色形象逐步向更立体的方向升级,从一维文字到二维的图片,目前逐步在向三维形象升级。QQQQ头像头像QQQQ秀秀脸萌ZEPETO虚拟人人进入虚拟世界时身份演进的变化人进入虚拟世界时身份演进的变化特特征征静态平面
310、图仅含头像动态图包含头像、形体、服饰、动作等基于人脸生成卡通图片包含头像、手势、形体、服饰等3D立体卡通形象包含面部特征(精细打磨)、形态、穿衣搭配3D写实、3D卡通全身还原真人模特,或精细化定制分身智能语音交互资料来源:QQ、脸萌、ZEPETO、相芯科技、百度智能云虚拟人首先是人进入元宇宙的身份虚拟人首先是人进入元宇宙的身份随着元宇宙计算平台的发轫,更多的互联网平台在打造自己的虚拟空间,比如Horizon Worlds、Decentraland、百度希壤等,每个用户进入虚拟空间就会拥有至少一个可个性化装扮的虚拟化身(avatar),用以在虚拟空间中行动体验,或与其它用户交流互动。这些化身可以
311、理解为虚拟人的初级形态,但是这也像我们展示了未来人进入元宇宙世界的一种可能的交互形态。如多人在线VR社交游戏VRchat的大火,游戏借助外置可穿戴设备,支持音频唇形同步、眼球眨眼追踪、运动范围捕捉等多方面的状态采集。元宇宙这一计算平台的持续发展,预计虚拟人在表现形式上将继续呈现出巨大的升级,其关键的方向包括以下几个方面:第一,虚拟化身形象将进一步由2D、2.5D向3D方向的升级;第二,不同主体间的交互将得到全面的实时反馈。元宇宙未来元宇宙未来经典内容的经典内容的四个发展阶段四个发展阶段(以游戏为例)(以游戏为例)数据量级倍增,对底层技术要求越高单机体验单机体验式的内容式的内容小范围的小范围的交
312、互内容交互内容大规模多人大规模多人涌现式体验涌现式体验多人实时在线、多人实时在线、可交互的元宇宙可交互的元宇宙虚拟人其次是用户又一轮匿名化社交的开始虚拟人其次是用户又一轮匿名化社交的开始从PC互联网到移动互联网的发展,虚拟世界中的用户的对应身份由匿名化走向实名化,表现为微信的熟人社交属性、基于现实职场的在线办公等线上化交互场景都在将真实世界的用户身份与虚拟世界进行对应,且线上的交易行为需进行实名认证。实名化趋势在过去十余年,受益于移动互联网的快速普及,到目前为止几乎完全实现了所有人的身份在现实物理世界到虚拟世界的一对一对应。我们认为虚拟人的价值不仅仅是作为人进入虚拟世界时所需要的身份,延续从P
313、C互联网时代的QQ到移动互联网时代的脸萌、ZEPETO所展现出的表现形式升级,其更深的价值在于:一方面,虚拟人作为人的化身进一步突破现实物理世界时空的限制使人更沉浸于虚拟世界,从而增加在线时长;另一方面,虚拟人作为人的分身,通过撬动时间杠杆的方式帮助用户通过创作增加可支配收入。其中,我们认为最重要的,则是继PC互联网时代的匿名化社交、移动互联网时代的实名制社交后,元宇宙是新一轮匿名化社交的开始,叠加2D向3D的升维、更多感官体验的增加,匿名化社交预计能释放出更多的社交活力,去新一轮的抢占用户“时长”与“可支配收入”。用户在线时长将进一步提升,借助分身去创作进而增加可支配收入用户在线时长将进一步
314、提升,借助分身去创作进而增加可支配收入交互场景更多元且复杂,将衍生出更具吸引力的业态交互场景更多元且复杂,将衍生出更具吸引力的业态新一轮匿名化社交的开始新一轮匿名化社交的开始元宇宙带来的机遇元宇宙带来的机遇虚拟人再次是虚拟人再次是AIAI的定向产业化:的定向产业化:AIAI生成与驱动生成与驱动虚拟人的本质是AI,这里的AI与“AI作画”的AI未来是同样的通用平台。故,虚拟人可以看作AI的定向产业化,即定向于元宇宙中人的身份映射这一方向的产业化过程,背后包括AI生产虚拟人形象、AI驱动虚拟人表情、动作等。上游虚拟人的生成涉及计算机图形学、图形渲染、动作捕捉、深度学习与语音合成、人工智能等诸多技术
315、,根据制作过程可归纳为建模、驱动、渲染三大关键环节。其中虚拟人的建模生成是核心步骤之一,也是较为困难的一环,奠定了未来使用的基石。目前虚拟数字人的建模生成主要有三种,按照人工参与程度的高低,依次为纯人工建模、借助采集设备进行建模、以人工智能进行建模。同时涉及到相关的软硬件,包括建模软件、驱动软件、渲染引擎、拍摄采集设备、光学器件、显示设备等。因此,虚拟人的上游投入集中在专业人才与相关的软硬件件成本。虚拟形象虚拟形象构思构思建模建模驱动驱动渲染渲染虚拟虚拟数字人数字人成本投入:数十万至百余万元人民币成本投入:数十万至百余万元人民币纯人工建模借助采集设备进行建模以人工智能进行建模按照人工参与程度的
316、高低按照人工参与程度的高低图:虚拟人的生成主要分为建模、驱动、渲染三大环节资料来源:安信证券研究中心整理纯人工建模方式纯人工建模方式成本高、产能低成本高、产能低纯人工建模分为三个步骤:纯人工建模分为三个步骤:1)运用电脑软件画设计稿,描绘建构出人物的三视图;2)根据设计图纸确定人物三维的图形,运用MAYA、3DMax、Zbrush等三维建模软件建立基本的三维模型;3)除了建模师,虚拟人的运营需要团队的协作,虚拟人制作的其他环节还涉及到贴图师、绑定师、动画师、道具师、三维场景设计师等。纯人工建模方式人工制作周期较长纯人工建模方式人工制作周期较长,且成本非常高且成本非常高。目前纯人工建模方式仍在广
317、泛使用,市场上一些超写实的虚拟人均可以基于这种建模方式做出来,但人工制作周期较长,且成本非常高,源于该种建模方式的成本主要跟人力相关,一是取决于制作团队的配置大小,二是取决于建模的精度要求,虚拟人越逼真、越精细,所需建模时间与成本越高。虚拟数字人相关制作人员平均薪资涨幅明显虚拟数字人相关制作人员平均薪资涨幅明显。2021年平均薪资涨幅明显,随着元宇宙热度的升温而一路走高,虚拟人相关制作人员的平均薪资水平在2021年涨幅明显,随着元宇宙热度的升温而一路走高,建模师、绑定师、动画师、道具师、3D场景设计师的月平均薪资水平分别为10-15k、10-30k、10-20k、8-15k、15-30k。图:
318、2021年建模师、绑定师、3D场景设计师的平均薪资水平出现明显的上涨资料来源:职友集借助采集设备进行建模借助采集设备进行建模成本适中、应用广泛成本适中、应用广泛市场上大多数虚拟数字人是成本相对低的卡通画风形象,各类游戏中的游戏角色是早期的虚拟人,可以被称为次世代游戏级别。次世代游戏级别的虚拟人的渲染在电脑端/手机端就可以完成,其与超写实虚拟人在细节上有一定差距,即牺牲了一定的精细度,保证了画面的实时渲染。次世代游戏级别虚拟人的建模大多是借助于外部扫描设备采集模型数据次世代游戏级别虚拟人的建模大多是借助于外部扫描设备采集模型数据,数据的输入方式大致分为两种:数据的输入方式大致分为两种:1 1)相
319、机阵列扫描相机阵列扫描:使用上百台相机进行360度的环绕拍摄,构建三维模型,基于模型进行数据的处理,然后转化成可以编辑的格式,再去进行相关的贴图、绑定等操作。2 2)结构光扫描结构光扫描:利用三维扫描仪对人体、外部环境等进行扫描,建立点云数据(point cloud data),扫描精度越高,得到的点云数据越多,制作出的模型就越精细。借助采集设备进行建模的成本主要为设备与人员成本借助采集设备进行建模的成本主要为设备与人员成本,在几十万至一两百万元不等在几十万至一两百万元不等,可以应用于游戏、电影(不需要超写实、高精度)等领域。图:相机阵列扫描与结构光扫描的原理资料来源:西博三维科技、Wikip
320、edia利用利用AIAI进行建模进行建模成本低、技术有待提高成本低、技术有待提高人工智能建模的优势在于能够大幅降低成本人工智能建模的优势在于能够大幅降低成本。通过人工智能技术进行建模,依据的是算法与机器学习,能将人力成本与时间成本都将降到最低。人工智能可以在很短的时间内快速生成虚拟数字人,建模的过程无需人工,后期修缮环节需要人工参与,进而将建模成本控制在极低的范围。以近期大火的AIGC(人工智能生成内容)为例,相比于人进行绘画的创作,以Stable diffusion、Disco Diffusion为代表的AI作画工具只需要数秒就可以依据文字描述生成图片内容,一定程度上可以辅助人进行创作,节省
321、大量的时间与成本。“AIAI作画作画”是人工智能生成内容是人工智能生成内容、技术落地的典型应用案例之一技术落地的典型应用案例之一,展示了AI技术的突破进展,虽然还较为局限于二维的图片,随着技术的迭代,AIGC也会在三维建模方面发挥越来越大的作用。更重要的是,AIGCAIGC会引导相关行业完成生产力会引导相关行业完成生产力与生产关系的重构与生产关系的重构。人工智能建模的难点在于关键技术的突破人工智能建模的难点在于关键技术的突破。人工智能生成与驱动的虚拟数字人所呈现的效果受到语音识别、自然语言处理、语音合成、语音驱动面部动画等技术的共同影响。目前人工智能建模还远不能完全取代纯人工建模与借助采集设备
322、进行建模的结果。人工智能建模结果就像Siri等虚拟助理对话一样,存在一些差距,但仍在不断改进之中。我们认为,未来虚拟数字人的发展方向在于其能够应用于广阔的C端领域,因此:I.I.未来想要实现批量化生产虚拟数字人未来想要实现批量化生产虚拟数字人,重要前提是大幅降低制作门槛与成本;重要前提是大幅降低制作门槛与成本;II.II.人工智能技术是推动虚拟数字人规模化应用的重要基础人工智能技术是推动虚拟数字人规模化应用的重要基础,以人工智能为代表的技术将决定未来虚拟数字人的高度以人工智能为代表的技术将决定未来虚拟数字人的高度。交互型虚拟人的驱动,交互型虚拟人的驱动,AIAI的重要性突显的重要性突显虚拟人的
323、驱动同样也涉及到技术路径的选择。虚拟人可以分为交互型、非交互型两种,其中交互型虚拟人则需要靠驱动技术来驱动动作、表情等,以达到虚拟人和外界环境进行互动与反馈。交互型虚拟人的驱动进一步又包括传统驱动方法与智能驱动方法。传统驱动方法分成光学动作捕捉、惯性动作捕捉、Track 设备+IK 算法的动作捕捉等方法。现阶段,光学式和惯性式动作捕捉占据主导地位。传统驱动方法一般需要”真人+动捕设备”来进行驱动,这个后台的真人又称为“中之人”;智能驱动方法是指通过AI技术,例如CV、ASR、TTS等来对虚拟人进行驱动的方法。该方式造价成本低,可以无限拓展,在未来有很大的想象空间。不过现阶段AI技术有限,一般需
324、要结合合适的场景,通过较多垂直领域的训练才能达到商业可用的效果。AI驱动的虚拟人所呈现的效果受到语音识别(ASR)、自然语言处理(NLP)、语音合成(TTS)、语音驱动面部动画(ADFA)等技术的共同影响。AIAI驱动的虚拟人技术驱动的虚拟人技术领域内相关公司领域内相关公司语音识别语音识别领域内的公司如科大讯飞、百度、腾讯、阿里均有布局语义理解语义理解国内外在语义理解领域的进步较慢,语义理解这一交互环节的难度比语音识别高了数倍,相对做的好的公司如谷歌、IBM沃森机器人语音合成语音合成诸多大公司的客服机器人已能做到语音回复,但还不够真实、自然。若要做到每个人的声音个性化,并且能够快速生成自己的声
325、音,仍有较大的工作量人的形象驱动人的形象驱动目前市场上的巨头公司,如搜狗、科大讯飞、百度、腾讯等推出虚拟人的难度并不大,但难度在于,1)不同于卡通形象,在高逼真、高拟人的要求下,用AI驱动高仿真虚拟人的表情或动作仍有较大提升空间;2)快速生成虚拟人的同时,如何能够降低成本以及提高精确度资料来源:安信证券研究中心整理20222022年虚拟人市场持续升温年虚拟人市场持续升温2021年,国内虚拟人市场热潮开启,经过近两年的发展,新的虚拟人不断涌现,新的入局方不断加入,依靠自身的资源禀赋切入,或基于AI能力、运营能力等,探索行业应用发展。与此同时,虚拟人相关投融资市场一直维持着高景气。根据雷报统计数据
326、,截至2022年9月,今年国内虚拟人领域共计发生22起相关投融资事件(2021年全年为25起),其中世优科技与魔珐科技均于2022年完成了过亿元的融资,其中魔珐科技两轮融资共计1.3亿美元。时间时间名称名称开发项目开发项目2022.9.262022.9.26高德地图宣布推出虚拟人导航“小高老师”,在现有的导航语音基础上融入了智能预测、AI学习、情绪感知力2022.9.12022.9.1快手在世界人工智能大会上推出“快手虚拟演播助手(Kuaishou Virtual Studio(KVS)”2022.7.212022.7.21百度百度计划推数字人直播平台。2022百度世界大会正式开启,AI数字人
327、希加加重磅带来百度智能云曦灵数字人直播平台,聚焦电商直播、品牌营销、互动娱乐等领域,实现超写实数字人24小时纯AI直播2022.6.152022.6.15华为在合作伙伴暨开发者大会推出数字内容生产线MetaStudio,以及全新版的数字人“云笙”,满足了各行业对数字内容生产、协同、融合以及应用的广泛需求2022.4.272022.4.27快手上线虚拟偶像歌手“神奇少女张凤琴”2022.2.42022.2.4央视推出专业服务类虚拟数字人AI手语主播2022.1.222022.1.22京东首个智能数字人客服芊言正式上岗2022.1.12022.1.1蓝色光标首个自有知识产权的虚拟人“苏小妹”正式推
328、出并在北京卫视春晚亮相资料来源:各公司官网和公众号表:2022年新推出的虚拟人项目(部分大厂)虚拟人将是时空构造中基础设施建设的“圆心”虚拟人将是时空构造中基础设施建设的“圆心”元宇宙的技术路径元宇宙的技术路径,严格意义上是尚未定型的严格意义上是尚未定型的(目前仅基于视觉的技术探索目前仅基于视觉的技术探索),但目标是实现虚拟现实但目标是实现虚拟现实,即模糊掉虚即模糊掉虚拟与现实之间的边界拟与现实之间的边界。目前主流的技术路径为,一是直接以AR的技术路径去实现,但现阶段AR相关技术均非常不成熟;二是先VR再迭代至MR,以MR作为过渡。布局元宇宙较为激进的巨头Meta选择了以VR为主的技术路径,同
329、时探索AR的发展;Apple预计将于2023年推出首款MR头显。从从2 2D D到到3 3D D,交互界面需要重构交互界面需要重构,一方面是交互范式需要重构,另一方面是交互体验更贴近于现实物理世界的交互。交交互的设计思路则是以互的设计思路则是以“人人”核心核心,最大限度的去实现人与周围环境的自然交互。这里的“人”不止是真实的人,还包括虚拟人(人的数字人、虚拟数字人)、机器人。参照现实物理世界的交互方式,虚拟人很可能是元宇宙时空构造过程中,基础设施建设的“圆心”,虚拟数字人的作用在于最广泛承接2D(图文)升维成3D(视频)的交互界面;换个角度,任何入局方,无论是平台生态的构建方、B端企业的入局方
330、案,以虚拟人为切入口或虚拟人的交互脉络为建设的主脉络,将是被普遍采用的方式。元宇宙的元宇宙的技术路径技术路径VRVRARAR相关技术非常不成熟以微软Hololens为代表过渡至MR以Meta为代表技术路径虽未定,但确定的方向是由2D升维为3D内容由2D升维为3D交互对象与交互方式革新交互界面需重构交互的设计思路则是以“人”核心现实的人人的数字人虚拟数字人机器人NFTNFT:数字世界的魔法棒:数字世界的魔法棒NFTNFT的魔法棒:从数字内容到数字资产的魔法棒:从数字内容到数字资产 NFT是数字世界的“注册制”NFT作为一种机制,金融属性最为突出 NFT是元宇宙世界运行的精髓之所在 NFT作用于“
331、未来”的魅力更大NFTNFT的魅力在于孵化与孕育未来的各类的魅力在于孵化与孕育未来的各类“明星明星”NFT的命门一定是“向前看”,去孵化与孕育新“明星”旧有的IP+NFT模式,效用仅能发挥出四分之一 NFT的交易链条越长,价值重估空间越大 NFT机制下,警惕顶级IP的过度泡沫化20年年NFTNFT市场行情复盘市场行情复盘根据根据NonfungibleNonfungible数据显示数据显示,20222022年以来年以来,NFTNFT交易量持续下滑交易量持续下滑,尤其是自尤其是自3 3月以来月以来,NFTNFT交易量相较去年最高点时交易量相较去年最高点时(202120
332、21年年9 9-1010月月)缩水了缩水了8080%。海外相关上市公司的股价走势也相应走低海外相关上市公司的股价走势也相应走低,如如CoinbaseCoinbase、RiotRiot BlockchainBlockchain、MARATHONMARATHON DIGITALDIGITAL等等。00500600055404550月成交额(亿美元,左轴)月成交数量(万个,右轴)图:2021年1月-2022年11月NFT月度成交额与成交量资料来源:NonfungibleNFTNFT是元宇宙世界运行的精髓之所在是元宇宙世界运行的精髓之所在当下国内仍处于深度数
333、字化的过程中。数字经济时代,新型生产要素数据一跃成为这一时代下的核心生产要素之一。社会经济随着生产要素的变革,快速推进从生产要素到生产力再到生产关系的全面、系统变革。但数字化程度越高,安全的挑战就越大。在数字化时代,区块链提供了一个很好的信任机制。社会的数字化程度越高,对于区块链的依赖性越高、应用范围越广。未来元宇宙中数据资产将暴增。元宇宙一个高度立体且复杂的数字化时空,相应的数字资产也前所未有的丰富,若没有新技术、新机制的加持,数字资产的安全性、流动性都会面临系统风险。如何来衡量各个创作者对于数字世界的贡献程度?目前来看,NFT的去中心化属性及金融属性,天然就与元宇宙的开放性相契合,区块链技术背书的NFT可以为元宇宙中的数字资产实现高效确权、交易。Web1.0时代Web2.0时代Web3.0时代文字社交文字社交图片、视频社交图片、视频社交VR“面对面”社交二维空间三维空间 元宇宙是新的计