《商汤:元宇宙:亚太新经济之路(2022)(30页).pdf》由会员分享,可在线阅读,更多相关《商汤:元宇宙:亚太新经济之路(2022)(30页).pdf(30页珍藏版)》请在三个皮匠报告上搜索。
1、 目录目录 导言.3 认知篇.5 从技术视角认知元宇宙本质.5 传统互联网到元宇宙的三大变迁.6 变迁一:媒介入口的变迁带来更沉浸、更自然的人机交互新体验.7 变迁二:数字原住民的认知(用户的变迁)决定元宇宙的未来.7 变迁三:Web3.0 对数据权利界定或将改变平台价值创造模式.8 一张图“解构”元宇宙.9 创设篇.11 三大原力构建虚实融合的元宇宙世界.11 创造力:加速元宇宙虚拟世界的创造.11 连接力:实现数字世界和物理世界的连接.11 融合力:推动元宇宙虚实间的融合和智能化发展.12 三大基建筑牢元宇宙生产力底座.12 引擎基建:打造“低门槛、跨终端”的创设环境.12 算法基建:加速
2、“创造”、实现“连接”、推动“融合”.12 算力基建:支撑元宇宙天量级的计算需求.13 赋能篇.14 SenseMARS 火星混合现实平台:创设元宇宙世界的引擎基建.14 SenseMARS Avatar:元宇宙世界中的“我们”.15 SenseMARS Agent:元宇宙世界中的 Ta 们.16 SenseMARS Reconstruction:物理世界的数字重建.17 SenseCore 商汤 AI 大装置:支撑元宇宙世界的算法和算力基建.18 案例篇.20 数字人:未来人类超级助手.20 案例:永旺商城打造亚洲“无人化”咨询台.20 Avatar:穿梭于元宇宙中的数字分身.21 案例:Z
3、EPETO 快速捏脸打造个性化虚拟化身.22 数字空间:重新定义空间的价值.22 案例:泰国素万那普机场 AR 导航体验.23 案例:日本某棒球场 AR 互动观赛.24 案例:中东利雅得季 AR 沉浸之旅.25 数字内容:打造虚实结合的内容交互.27 案例:德国施华蔻 AR 染发试色.28 案例:中国敦煌 AR 数字文创.28 结语.30 导言导言 如果说,2021 年是“元宇宙”出圈及建立认知的一年。那么,2022 年则是“元宇宙”被认可及肯定的一年。短暂的两年间,全球各国、各方资本、各地政府、各大科技巨头不约而同的纷纷涌向元宇宙赛道,掀起一轮群雄逐鹿的盛况。图:Global Metaver
4、se Investments,by Region,2021-2025(USD Million)尤其是亚太地区国家,对元宇宙相关的产业布局更为看中,包括中国、印度、日本、韩国、新加坡、马来西亚、泰国、越南等国家都将元宇宙作为新兴的经济形式在本国范围内积极推广,并在 2022 年进入快车道,投资规模从 2021 年的 7800万美元增长至 3.51 亿美元。麦肯锡预测,到 2025 年,亚太地区元宇宙投资规模将达到 41.65 亿美元,占全球投资总额的 22.5%,投资增速将超过 128%,高于全球增长水平。图:Global Metaverse Market,by Region,2020 VS 2
5、030(USD Million)亚太地区拥有全球 60%的人口、47.4%的 GDP 产量和 52%的技术增长,得益于用户对新兴技术的亲和度,使得元宇宙在亚太地区发展拥有巨大的市场潜力。麦肯锡预测,到 2030 年亚太地区元宇宙市场规模将达到 311.3 亿美元,复合增速为62.2%。Analysis Group 发布的元宇宙报告也显示,未来十年元宇宙技术将为全球 GDP 贡献 3 万亿美元,其中三分之一,即 1 万亿美元来自于亚太地区。也就是说,未来十年,元宇宙产业每投入 1 美元,将会为亚太地区带来 3.16 美元的经济增长,投资回报比超过 3 倍。那么什么是元宇宙?如何去构建一个元宇宙世
6、界?商汤作为一家人工智能企业,我们将如何赋能亚太地区乃至全球元宇宙世界的创设和发展?白皮书将围绕元宇宙认知、创设、赋能、案例四大篇章为大家展现一个正在踏浪而来的新赛博世界。认知认知篇篇 从技术视角认知元宇宙从技术视角认知元宇宙本质本质 关于元宇宙到底是什么,从字面上来看元宇宙英文 metaverse 由 meta 和universe 两部分组成meta 意为超越,universe 意为宇宙,即是在现实世界基础上搭建一个超越现实的平行世界。美国元宇宙概念公司 Roblox 曾用了八个关键词来描述元宇宙的主要特征,分别是“Anywhere、Immersive、Low Friction、Variet
7、y、Identity、Friends、Economy、Civility”。基于这个八个特征,我们可以看到 Roblox 描述下的元宇宙应是一个平行且持续存在的虚拟世界,人们可以通过虚拟化身的形式随时随地进入到这个世界中获得高度沉浸式的内容和体验,并在其中进行社交和生活,同时建立起一套完整运行的社会和经济系统。除了从关键特征上去描述元宇宙,我们还可以从技术视角更进一步去认知元宇宙的本质。我们认为,元宇宙从技术演进的角度出发,它是通信网络、计算/存储、交互终端等信息基础设施迭代所引领的、继移动互联网后的又一场网络变革。图:底层信息基础设施迭代引发虚实融合网络变革 来源:商汤智能产业研究院 随着更高
8、宽带、更低延时的 5G 通信网络的发展,我们将有能力去传输更高维度、更大通量的信息数据;而智能计算中心、边缘计算等计算/存储基础设施的规模化建设和能效提升,我们可以对这些海量复杂的信息数据进行更高效的存储和计算,以及包括 AR、VR 等媒介终端在大众生活和生产中的普及应用,我们有理由相信新一轮的网络变革一定会为人们带来更高沉浸感、更强交互性以及更开放的数字世界新体验。与此同时,随着人工智能、AIOT(智能传感、物联网)、区块链等技术的应用和深入结合,在数字世界和物理世界之间架起一座连接的桥梁,将进一步延展出虚实共生、虚实融合的社会经济新形态,从而带动数字世界和物理世界、数字经济和实体经济、数字
9、身份和真实身份、数字生活和社会生活,以及数字资产和实物资产走向融合和统一。因此,从技术视角所认知的元宇宙将不仅仅是一个平行的“次元化”时空,更是一个与真实世界交互且融合的“跨次元”新世界。人工智能AIOT(智能传感器、物联网等)区块链(NFT等)图:Sectors leading metaverse adoption today also plan to dedicate a significant share of their digital investment budgets to metaverse 来自麦肯锡调研数据显示,随着与真实世界的连接逐步深入,各行各业开始拥抱元宇宙,在未来的
10、三到五年,越来越多的行业将会把一定比例的数字预算分配给元宇宙方向,其中能源、汽车和机械装备、高科技、旅游业、媒体娱乐等将成为元宇宙价值创造的先行者。传统互联网到元宇宙的三大变迁传统互联网到元宇宙的三大变迁 从传统互联网秩序到虚实融合的元宇宙新秩序,一定会涌现出一系列的可预见的和不可预见的裂变和变迁。在此,我们仅从技术发展的经验推断,简单总结了三大可预见的变迁媒介的变迁、用户的变迁、网络范式的变迁。这些变迁或许只是元宇宙发展大势下的冰山一角,在冰山之下隐藏着巨量的、不可预见的变化正等待着人类创新的火花将其点燃,这将会是元宇宙带给整个人类社会发展的惊喜和期待。变迁一:媒介入口的变迁带来更沉浸、更自
11、然的人机交互新体验变迁一:媒介入口的变迁带来更沉浸、更自然的人机交互新体验 图:媒介变迁带来人机交互体验变化 来源:商汤智能产业研究院 新的媒介入口变化意味着人类感官数字化的进一步发展。正如麦克卢汉所说,每一代媒介升级是人类感官的延伸。从传统 PC 到智能手机,再到 ARVR 眼镜、触觉手套等智能穿戴终端,随着媒介迭代和其所集成的数字技术的发展,人们的视觉、听觉、触觉,甚至嗅觉、味觉将逐步的被数字化模拟出来,使得我们在数字世界中可以逐步获得并享受逼近于真实世界的感官感受和沉浸式体验。此外,在人机交互上也越来越直接、自然。过去我们需要通过键盘鼠标来浏览网页,之后我们通过触摸屏幕来切换手机 APP
12、,今天我们通过在智能穿戴设备上加载微型传感器、摄像头就可以利用眼动、表情或姿态的变化在虚拟世界里畅游。未来,随着脑机接口技术的发展,我们甚至可以直接用思维来进行人机交互。所以,媒介变迁背后其实是数字技术的发展,并在用户终端带来了体验升级。变迁二:变迁二:数字原住民的认知(用户的变迁)决定元宇宙的未来数字原住民的认知(用户的变迁)决定元宇宙的未来 未来主宰元宇宙发展的主体将会是与元宇宙相关技术一起成长起来的年轻群体,更具体的来说就是我们现在消费的生力军 Z 世代年轻人,以及正在长大的 世代的年轻群体。媒介革命媒介形式 推广年份网络效应信息时延沉浸感人机交互听觉视觉触觉嗅觉味觉信息维度古登堡书报1
13、5世纪1:1月v一维电力媒介电报18401:1天v一维间接、双向电话18801:1实时v一维间接、双向广播19201:N实时v一维间接、单向电影19101:N实时vv二维间接、单向电视19501:N实时vv二维间接、单向数字媒介PC1990M:N实时vv二维间接、双向(鼠标/键盘)手机2010M:N实时vv二维间接、双向(触屏)XR2020M:N实时vvv三维自然、多向(眼动、姿态)脑机接口?M:N实时vvvvv 多维自然、多向(脑电波)图:数字原住民更倾向于元宇宙里的“在场”体验和消费 来源:商汤智能产业研究院 我们把这两波群体统称为“数字原住民”。因为他们从出生起就生活在一个数字化的网络世
14、界里,他们的沟通和交流以及绝大部分生活都建立在数字化之上,所以与其他群体(也被称为“数字移民”,包括 Y 世代、X 世代等)的世界观不同,数字原住民们世界观是虚实融合的天然统一。他们更加喜欢在元宇宙里的“在场”体验和消费根据 Ypulse 数据调研显示,Z 世代相对 Y 世代更喜欢创建虚拟化身,和朋友一起在游戏里见面交流,也更愿意为虚拟商品买单。正是因为数字原住民更倾向于虚拟世界的行为习惯和时间花费,我们看到在现实中一些商业品牌开始和元宇宙平台进行合作,围绕年轻群体的消费需求提供相应的虚拟产品和服务,并将针对年轻群体的营销阵地搬到了元宇宙中,不断创新出新的营销玩法,面向未来与数字原住民们建立连
15、接。譬如,在Fortnite中去开演唱会;Balenciaga 等高端品牌和Fortnite联名推出虚拟服装;BVLGARI联袂“Z 世代的游戏乐园”在 ZEPETO 上打造专属虚拟世界 BVLGARI ZEPETO World 等。可见,数字原住民们在元宇宙中的需求将直接影响现实商业行为的转变,进而演变出新的商业模式、新的商业业态,最终将颠覆传统互联网所建立的价值体系。变迁三:变迁三:Web3.0Web3.0 对数据权利界定或将改变平台价值创造模式对数据权利界定或将改变平台价值创造模式 随着区块链技术的应用和发展,元宇宙的网络范式将最终演变到 Web3.0 形态。相对 Web1.0 的只读,
16、Web2.0 的可写可交互,Web3.0 的最大的特点是去中心化我们可以在一个共享账本中存储和读写数据,而这个账本不受任何中心化实体控制和所有。这些数据被分布存储在众多节点上,任何节点发生问题都不会影响原住民Z和世代“在场”移民X世代“在地”移民Y世代“在线”数字世界物理世界二元世界观统一世界观到其他节点的数据记录,所以也就不太可能被任意篡改和删除;同时,我们在区块链上所发生的所有行为是可被追溯的,因此在理论上数据权利(包括所有权、使用权、收益权等等)是可以被确认的,这相对 Web2.0 数据权利边界无法认定而被中心化平台垄断将带来了底层逻辑的变化,也将对未来元宇宙平台的商业模式带来颠覆性的改
17、变。换句话说,未来平台要想创造价值,首先必须将数据权利和收益分配界定清楚;其次通过数据垄断获取收益的模式将很难行得通,平台需要通过进一步的开放连接为用户创造更大价值。一张一张图“图“解构解构”元宇宙元宇宙 图:元宇宙结构 来源:商汤智能产业研究院 在认知元宇宙本质和与传统网络形态差异化的基础之上,我们通过一张简化的结构图来初略的描摹下元宇宙系统的面貌。首先,数字化基础设施建设是元宇宙发展的底座。元宇宙的“Immersive、Low Friction、Anywhere”特征对网络传输和的存储/计算能力都提出了很高的要求;高效的人工智能算法生产可以加速内容的生产和分发进程,极大丰富元宇宙的内容生态
18、;区块链支撑经济系统的有效运行,在保障数字资产和数字身份安全的同时,实现数字资产的价值交换,以及系统规则的透明执行。规则标准安全边界伦理观念创设系统经济系统产业元宇宙消费元宇宙人工智能算法生产超大型网络连接大规模数据存储/计算区块链数字化基础设施建设虚实融合产消互动驱动元宇宙生态发展的核心引擎网络安全数据安全用户隐私资产安全符合人类文明发展的伦理观念:以人为本可持续发展技术可控法律法规技术标准市场秩序终端交互媒介内容/应用其次,在数字基建之上,创设系统和经济系统是驱动元宇宙运行的核心动力引擎。基于前者,人们围绕“人、物、场”要素设计创造元宇宙世界,并向其中源源不断的输入丰富、多元化的数字内容,
19、再通过交互终端获得体验,最终在消费和生产领域创造价值。而基于后者,即运转有序的经济系统可以帮助实现元宇宙生态的价值交换(做大蛋糕)和价值分配(分好蛋糕),形成从内容生产侧到应用侧的价值“飞轮”,推动和促进元宇宙生态的蓬勃发展。最后,树立牢固的安全边界、规范的规则标准和正确的伦理观念保障元宇宙运行有底线、有秩序、可持续,是元宇宙文明发展的基础。安全是底线,它既包括个体的隐私安全、机构/组织的数据安全、网络安全等,也包括数字内容本身是否涉及违规、违宪,以及数字资产的安全保护等问题。有了良好的规则标准约束,元宇宙才能有序发展,而符合人类文明发展需要的伦理观念不仅为元宇宙技术发展划定伦理的边界,也是元
20、宇宙可持续发展的前提。创设创设篇篇 三大原力三大原力构建构建虚实融合的虚实融合的元宇宙世界元宇宙世界 图:三大原力创设元宇宙世界 来源:商汤智能产业研究院 创造力:创造力:加速加速元宇宙虚拟世界元宇宙虚拟世界的的创造创造 一方面,我们基于 3D 引擎,围绕“人、物、场”三大基本要素进行三维数字建模,并通过图形渲染和物理等仿真引擎技术使得模型的形态或动画效果更逼近于真实环境的视觉呈现,再结合 XR 交互引擎技术来创造 VR/AR 等用户终端体验。总而言之,我们通过 3D 引擎来创造一个平行于真实世界的虚拟世界。另一方面,为了进一步加速虚拟世界的创造效率,3D 引擎也可以引入 AIGC(AI Ge
21、nerated Content)能力快速生成虚拟内容,降低内容生产门槛,减少内容创作成本和周期投入,从而让元宇宙应用走出游戏行业,向更多行业和领域进行规模化的推广和应用。例如,结合 AIGC,英伟达画布(Canvas)功能只需简单的几笔涂鸦,或者文本、语音输入就能够快速“脑补”生成高逼真场景,商汤科技仅通过数张人物相片拍摄就能够在一周左右生成一个高精度的人物模型,而传统 CG制作至少要花费数月周期及百万量级的制作成本。连接力连接力:实现数字世界和物理世界的连接实现数字世界和物理世界的连接 我们通过3D 引擎、AIGC 等方式构建的虚拟世界本身不与现实世界产生直接联系,我们需要将现实世界中的信息
22、“搬迁”到虚拟世界中,这样虚拟世界可以同步反映出真实世界的运行状态。这个过程其实就是今天人工智能技术正在如火如荼展开的工作真实世界的数字化,即结合 AI 感知智能将真实世界中不同物联网设备采集的原始(非结构化)数据转化为机器能读懂的结构化数据,并将处理后的数据精准映射到虚拟世界中,打破“次元壁”,从而建立数字世界与物理世界的相互连接。创造虚拟世界物理世界虚拟世界数字化过程物理世界虚拟世界虚实融合和智能决策创造力连接力融合力人物场融合力融合力:推动推动元宇宙元宇宙虚实间的融合和智能化发展虚实间的融合和智能化发展 在虚实连接的基础上,结合物理世界映射的实时数据,通过在虚拟世界里进行低成本试错的仿真
23、模拟、测试等,将最优策略和决策结果反向指导物理世界的优化和运行,从而实现元宇宙赋能真实世界经济发展的现实意义。例如,我们通过虚实连接可以“可视化”观测道路交通状况,同时结合人工智能决策类算法对实时交通数据进行分析预测,形成最优交通策略,并通过控制路面红绿灯等信号对现实交通情况进行同步优化,以缓解道路拥堵问题。可见在元宇宙创设和发展过程中对人工智能技术的引入意义重大,它即是虚拟世界创造的加速器,也是数字世界和物理世界的连接器,同时也是促进元宇宙虚实融合和智能化发展的推动器。三大三大基建筑牢元宇宙基建筑牢元宇宙生产力生产力底座底座 引擎基建引擎基建:打造“低门槛、跨终端”的创设环境打造“低门槛、跨
24、终端”的创设环境 开放的元宇宙必然将内容的创作权利交付于用户之手。低门槛、开源开放的创设环境,并融入 AIGC 能力的 3D 智能引擎将成为元宇宙内容创设的基础设施,在此之上形成的规模化的创作者/开发者生态,将帮助快速响应新的、海量的元宇宙内容需求。同时,通过建立引擎跨终端的内容“移植”能力覆盖更广泛的用户群体。例如,开发者在 Unity 上创建的内容可以一次创建并部署到 20 多个交互终端,包括 Windows、Mac、iOS、Android、PlayStation、Xbox、Nintendo Switch 以及 AR 和 VR 平台等。商汤科技的 SenseMARS 火星混合现实平台不仅可
25、以兼容app、小程序及 H5 等不同应用形式,还能支持超过 200 款手机、平板电脑、AR/VR眼镜、智能电视及无人机等多种终端设备。通过跨终端的兼容不仅可以减少创作者/开发者工作,同时用户使用任一系统终端都能够无缝获取元宇宙内容和体验。算法基建算法基建:加速“创造”、:加速“创造”、实现实现“连接”“连接”、推动推动“融合”“融合”正如上文所述,元宇宙的创造、连接和融合需要海量的人工智能技术支持,从而加速内容“创造”、推动虚实间的连接和融合。例如在虚实连接这一环节,也就是真实世界数字化过程,会涉及大量的 AI 感知算法。我们推算如果要实现整个真实世界的数字化,大概需要百万量级的算法模型。这种
26、算法需求水平,需要匹配高效的算法生产模式。因此,我们需要搭建工业级的算法生产平台,一方面从数据存储、标注、训练、推理到部署整个过程实现流水线、标准化,从而缩短算法创新的周期,提升算法生产效率,快速响应元宇宙场景数字化的需要。另一方面,针对海量低频、长尾的“碎片化”场景的数字化,围绕“AI 大模型”构建算法基础设施所具备的泛化能力,可以有效缓解碎片化开发反复建模的困境,降低开发门槛的同时,满足元宇宙构建中长尾场景的数字化需求。算力基建算力基建:支撑元宇宙天量级的计算需求:支撑元宇宙天量级的计算需求 算力是元宇宙发展的基石,未来元宇宙体验所追求的真实感、实时性、智能化,以及内容创作将对计算资源形成
27、天量需求。根据 IDC 预测,到 2030 年,元宇宙总算力(包括 AI、VR/AR、物联网、区块链等)需求将是当前规模的百倍之上。英特尔高级副总裁也表示要实现像雪崩或头号玩家里所描绘的元宇宙体验,算力规模将需要提高 1000 倍。大算力时代到来!与此同时也将带来计算部署方式的结构性变革。一是,消费元宇宙和产业元宇宙所产生的超高并发的海量非结构化数据的实时处理和分析,传统以 CPU 为核心的计算架构将无法满足需求;二是,在算力需求不断增长的大背景下,受限于网络技术发展及网络带宽成本,边缘端的算力部署将成为必然的演进方向,来填补算力需求的错配。因此,围绕智能(异构)计算(简称 AIDC)的“云-
28、边-端”协同模式将成为元宇宙计算升级的主要趋势。赋能篇赋能篇 商汤依托 SenseMARS 火星混合现实平台,围绕着“人、物、场”三要素,结合人工智能技术,赋能开发者们低门槛、高效的来创设虚实融合的元宇宙世界,并为人们打造交互式增强及混合现实的沉浸式体验。同时,SenseCore 商汤 AI 大装置为创设元宇宙过程提供高效的算法和计算资源支持,加速元宇宙的创造、强化虚实间的连接、推动虚实间的融合和智能化发展。S SenseMARSenseMARS 火星混合现实平台火星混合现实平台:创设创设元宇宙世界的元宇宙世界的引擎基建引擎基建 图:SenseMARS 火星混合现实平台技术架构 围绕“人、物、
29、场”三大要素,SenseMARS 对外输出功能和服务既有快速生成元宇宙虚拟化身的 SenseMARS Avatar,帮助人们走进元宇宙,在虚拟世界里自由穿梭;也有支持数字人等智能体开发的 SenseMARS Agent,为元宇宙中添加更多的智能化角色,可以与人进行智能化交互的同时,为我们在元宇宙中提供各式各样的智能化服务;以及通过 SenseMARS Reconstruction 实现物理世界的 3D数字重建,打造物理世界的虚拟副本。图:SenseMARS 三大赋能方向 S SenseMARS AvatarenseMARS Avatar:元宇宙世界中的“:元宇宙世界中的“我们我们”Avatar
30、 是我们进入元宇宙世界的数字身份,是我们在元宇宙世界中的“第二人生”。每当进入不同的虚拟场景,我们都可以选择使用不同风格的虚拟形象作为虚拟化身,在元宇宙世界里充分表达不同个性的自我。而 SenseMARS Avatar 则是赋予我们高效塑造虚拟化身的关键引擎。基于 SenseMARS Avatar,我们可以结合个人影像素材利用 AIGC 快速生成不同风格的虚拟形象,从二次元、卡通、拟真人到 3D 超写实等;与此同时,基于全球领先的计算机视觉技术与 AI 动作意图分析,可以在不依靠专业光学摄像头或穿戴式传感器的前提下,仅用普通 RGB 摄像头实现动作数字化,让每个人都能在元宇宙场景里轻松将自己独
31、有的身体、面部等动作语言,赋予任何元宇宙的数字分身。SenseMARS人物的虚拟化SenseMARS Avatar虚拟智能体SenseMARS Agent三维世界的虚拟化SenseMARS Reconstruction 图:AIGC 快速生成不同风格的虚拟形象 S SenseMARS AgentenseMARS Agent:元宇宙世界中的:元宇宙世界中的 TaTa 们们 元宇宙世界中除了“我们”,还存在着一群聪明的 Ta 们,即虚拟智能体。Ta 们可以与我们进行智能化交互,提供各类智能化服务。而 SenseMARS Agent 则是创造元宇宙智能体的关键技术引擎。SenseMARS Agent
32、 集成计算机视觉、语音识别、自然语言理解和生成、语音合成动画(Speech to Animation)、决策智能以及深度学习等一系列人工智能技术,为元宇宙虚拟智能体装上“智慧的大脑”,从而让我们与 Ta 们之间可以互动起来。例如,智能体的代表 Digital human,Ta 不仅可以“听懂”人话,还能够通过语言、表情、肢体动作等与我们进行交流。同时,经过不同领域知识数据的训练学习,数字人可以晓通百事,成为我们在各个领域的“超级助手”。图:商汤 3D 超写实数字人效果 SenseMARS ReconstructionSenseMARS Reconstruction:物理世界的数字重建:物理世界
33、的数字重建 元宇宙世界中大量的虚拟场景我们可以通过对真实世界的三维重建来实现,而SenseMARS Reconstruction 则是赋能我们快速复刻真实世界的关键引擎。SenseMARS Reconstruction 借助多算法融合(譬如三维语义分割算法、稠密三维重建算法等),赋能用户利用消费级移动设备(包括手机、运动相机及无人机等)即可以高效重建物理世界的三维模型,从小物体到购物商场、交通枢纽乃至城市都可以做到厘米级高精度复刻。同时,结合 SenseMARS 高精度的空间映射及视觉定位能力,可以通过 AR 眼镜、智能手机等终端设备,将视觉内容叠加在物理世界中,实现物理世界与虚拟世界的精准叠
34、加和无缝融合。图:物理世界中某场景的数字重建和 MR 效果 Physical World3D ReconstructionMixed Reality in MetaverseSenSenseCoreseCore 商汤商汤 AIAI 大装置:大装置:支撑元宇宙世界的算法和算力基建支撑元宇宙世界的算法和算力基建 图:SenseCore 商汤 AI 大装置的结构图 SenseCore 商汤大装置为创设元宇宙过程所需要海量的 AI 模型及计算资源提供底层能力的支撑。首先,首先,S SenseCenseCo orere 的的超大规模、集约化的算力部署,可以降低计算和超大规模、集约化的算力部署,可以降低计
35、算和 A AI I 模型研模型研发发成本成本。截至 2022 年 6 月 30 日,商汤已在主要区域市场建立了 23 个智能计算集群,拥有超过 20000 块 GPU,总算力达到 1170Petaflops。同时,2022 年初在上海临港建成的人工智能计算中心 AIDC,拥有 3740Petaflops 的峰值算力,是目前全亚洲最大的人工智能计算中心之一,能满足四个 20000 万以上人口的超大规模智慧城市的计算需求。商汤通过自主研发的全套 AI 调度系统和分布式 AI 存储系统,打造简洁、高效、统一的 AI 应用开发架构,可让 AI 研发人效提高 60 倍,TCO(总体拥有成本)降低 70%
36、以上,加速人工智能与元宇宙应用场景的结合。其次,其次,S SenseCoreenseCore 打通了从数据处理、模型生产、模型训练、高性能推理运算,打通了从数据处理、模型生产、模型训练、高性能推理运算,以及模型部署等等各个环节以及模型部署等等各个环节,通过流程标准化、自动化实现,通过流程标准化、自动化实现 A AI I 模型的批量级生模型的批量级生产。产。相较行业动辄数周的研发周期,SenseCore 赋能 AI 模型生产全流程,大幅提高了 AI 模型的生产效率,研发周期可被缩短至数个小时。随着 SenseCore 算法平台生产能力的不断提升,能够将算法的训练研发效率提高 12 倍,部署研发效
37、率提升 40 倍,还支持多种云边端的推理设备,结合算法模型推理优化,可使推理性能提升 10 倍,让 AI 生产研发更简单、更快捷。截至目前,商汤已经积累生产了超过 49000 个 AI 模型,覆盖多个垂直行业的数字化场景。第三,第三,S SenseCenseCo orere 支持对高性能、高精度的支持对高性能、高精度的 A AI I 基模型的训练和研发,进一步加基模型的训练和研发,进一步加速速 A AI I 模型生产,解决模型生产,解决复杂长尾问题复杂长尾问题。商汤基于 SenseCore 也在持续投入对基模型的研发,即通过“大算力+大数据”训练产生具有泛化和通用能力的预训练模型,从而进一步提
38、升 AI 模型的生产效率,同时帮助解决现实中存在的大量长尾场景数字化问题。目前,基于 SenseCore所训练的 CV 基模型已具有高达 300 亿个参数,是目前 CV 领域公开信息中最大参数量的模型。案例案例篇篇 商汤基于 SenseMARS 引擎基建,以及 SenseCore 商汤 AI 大装置所提供的算法和算力基建,构筑元宇宙生产力底座,赋能各行各业高效创设虚实融合的元宇宙世界。目前商汤已在在亚太地区乃至全球范围内积极探索元宇宙场景创新,赋能当地数字经济的可持续发展,并为人们带来更好的虚实结合生活体验。数字人数字人:未来人类超级助手未来人类超级助手 数字人是具有独立决策能力的智能体,是
39、AI 系统综合能力的应用体现。当前数字人产品被广泛的应用于强交互类场景。例如,数字人代替真人在银行大厅内担任客户经理、在文旅场景中变身导游、在医疗领域扮演陪护员、在商场和企业担任前台问询、在健身房化身健身教练等等。数字人的应用已进入全面产业化阶段。数字人不仅可以应对大量标准性和重复性工作,解放真人劳动力,做到 7x24 小时全年无休、微笑服务,还能赋能企业打造更多创新服务形态和与众不同的用户体验。譬如,通过不断学习及跨领域知识拓扑,数字人可以升级成为“百事通”,为用户各类问题答疑解惑;也可化身为企业的“形象代言人”,扮演着客勤维护、日常沟通等重要纽带,大大降低真人“翻车”风险。同时,数字人技术
40、的应用也带来了一定的社会价值。通过与用户的语音交互,手把手指导人们解决各类问题,可以大幅降低了老年群体获取虚拟服务的门槛,帮助老年群体积极融入美好的智慧生活。案例案例:永旺商城打造亚洲“无人化”咨询台:永旺商城打造亚洲“无人化”咨询台 图:永旺梦乐城(中国)广州新塘数字人“小糖”永旺(AEON)是亚洲领先的综合零售及服务企业集团,有日本、中国、东南亚三大总部体制。主要以经营购物中心、综合零售业(综合百货超市、食品超市)为主,还从事专卖店、金融服务、物业服务、便利店等业务。目前,永旺在全球拥有约300 家企业、19,094 家店铺。在新零售浪潮的推动下,以永旺为代表的传统商业正在积极寻求数字化转
41、型,利用新技术、新理念重构“人、货、场”关系打造流量和场景增长的双引擎。从对“人”的服务和体验出发,当前永旺商场经营主要存在三大痛点亟待解决:1)商场空间大、店铺多分布广,商场内虽在各层设有多媒体大屏提供地图导览、品牌广告、活动推广等信息类服务,也同时会在空间各处置入平面硬广,但纯屏幕视频播放或平面展示缺少与顾客的主动交互,服务体验一般,营销转化效率也难以统计;2)咨询台作为商场线下服务的主要窗口,面临人工成本高,人员流失大,服务质量参差不齐,且服务延展性不高等诸多困境;3)此外,在新零售趋势下,商场亟需与顾客建立直接连接,精准把握顾客消费需求和兴趣风向,以更科学的数据化方式赋能商场运营决策和
42、服务提升。基于上述问题及 SenseMARS 火星混合现实平台技术能力,永旺梦乐城(中国)广州新塘与商汤联合打造了超写实型数字人“小糖”,主要承担购物中心内客服咨询、导航导购等多项服务工作。例如,作为虚拟客服人员,“小糖”可以随时随地为顾客提供准确、快速的店铺位置导览、停车路线指引、积分兑换等问询服务。当遇到“超纲”问题时,后台管理人员可以及时进行远程接管,远程接管的问题 80%为寻人或寻物等需要人类参与辨别真伪的信息。作为虚拟导购员,“小糖”通过与顾客的自然交互和意图理解,判断顾客的实地需求,将新品上线、新店开业、优惠活动等商场或店铺信息更有效的向顾客进行精准推荐,有助于营销转化效果的提升。
43、目前,“小糖”的知识库已经覆盖寒暄类、用户吃喝玩乐意图类、购买某特定品类、门店导航类多个内容体系和对应内容的扩展问题,每天回答问题超 1170 条,服务客户超 100 人,每次回答问题达 10 轮以上,针对顾客的日常问题,语义理解水平达到 92.7%,回答准确率超过 95%,并在日常“学习”中逐步提升。永旺正在全亚洲打造“无人化”咨询台,初步估计,在客服环节至少能够帮助商场节约 50%以上的人力成本。随着更多的“小糖”替代传统服务窗口成为与用户线下连接的重要触点,通过在商场空间内多点设置与用户形成多点、多维交互,全方位收集用户数据信息,从而建立商场的私域流量和数据库,帮助商场基于科学的数据分析
44、更进一步的提升服务的精细度,以及对场内店铺品牌的管理效率。AvatarAvatar:穿梭于元宇宙中的数字分身:穿梭于元宇宙中的数字分身 同样围绕“人”的要素,虚拟化身(Avatar)与具有独立决策能力的“数字人”不同,其背后是通过对真人面部、姿态等动作捕捉,驱动虚拟化身的各种表现。譬如在直播类节目中,很多二次元虚拟主播背后其实是由真人驱动与粉丝互动,背后的真人演员又被称“中之人”。Avatar 可以作为我们进入元宇宙世界中的数字分身,通过不同的虚拟形象赋予我们在虚拟世界中展现与众不同的第二人生。案例案例:ZEPETOZEPETO 快速捏脸打造个性化虚拟化身快速捏脸打造个性化虚拟化身 图:Zep
45、eto 结合 AI 快速捏出个性化虚拟形象 Zepeto 是韩国 SNOW 公司 2018 年推出的一款风靡全球的社交应用,上线至今全球累计用户超过 3 亿,是亚洲最大的元宇宙平台。用户可以通过“捏”出个人立体卡通形象、装扮个人空间的方式,创作出属于自己的“虚拟形象”,以此呈现个人的兴趣和品味,实现陌生人交友。作为一款以“形象”为主打的娱乐社交软件,最忌讳缺乏个性化特色、千篇一律。为满足用户对捏脸、换装等虚拟形象创作的个性化需求,商汤科技与 SNOW 联手打造第一个虚拟世界的捏脸换装方案。用户可以拍照识别面部特征,结合 AI、AR技术,快速创建出与照片相似的虚拟形象作为基础,再针对面部轮廓和五
46、官进行精细打磨,塑造自己独特的虚拟形象。数字数字空间空间:重新定义空间的价值:重新定义空间的价值 围绕元素“场”,SenseMARS 打破与现实世界的“次元”壁垒,基于数字孪生、数字原生和虚实融生为用户带来全新的空间体验,同时将重新定义空间价值,深刻影响和重塑人与空间的关系。在 AI、MR 等技术驱动下,空间不再局限于物理尺度,而是“物理空间”和“虚拟空间”的结合,具有“可延展、可创作、可定制、可交互”的主要属性,成为新场景、新模式、新业态的创新乐园物理空间不再只是一成不变的功能性载体,人们可以根据个人喜好、兴趣来自由定义空间形态、创造空间内容,创新出各种新颖的交互式玩法。案例案例:泰国:泰国
47、素万那普素万那普机场机场 A AR R 导航导航体验体验 多年来,泰国政府一直强调数字化发展。自 2016 年以来,泰国政府对数字经济的支持一直以“泰国 4.0”计划为指导,这是泰国迈向“价值导向和创新驱动型经济”的 20 年路线图,专注于数字改进,以提高泰国人民的生活质量、生产力和效率。机场作为航空运输和城市的重要基础设施,在“泰国 4.0”计划指导下,将承担起国家数字经济发展和数字化转型的重任。据泰国机场管理公司(AOT)常务董事尼迪乃曾表示,AOT 通过加快推进技术发展改善服务,使机场成为有活力的机场,数字化颠覆终究会发生,“这对交通部来说也是一大挑战”。素万那普机场是 AOT 下辖的六
48、座机场之一,占地 32 万平方公里,每年接待旅客吞吐量、飞机起降架次全国第一,是东南亚乃至亚太地区最重要的航空枢纽之一。2019 年商汤科技与 SKY ICT 合作,针对素万那普机场的 50 万平方米大尺度物理空间,结合 AI、MR 技术进行数字化改造,优化机场旅客的服务体验。AR 导航。基于大空间数字重构、视觉定位和 MR 技术,可以实现旅客在机场内的实时定位和 AR 实景导航。结合 AOT 手机 APP,旅客抵达机场后,打开 APP 中的AR 导航功能,扫描机场环境即可定位并获取便利的路径指引服务,跟随着 AR 箭头和虚拟导游,旅客就可以轻松到达目的地,办理签证办理、货币兑换、出租车租赁、
49、购物等机场服务。同时,AR 导航与旅客乘机系统打通,一键导航登机口。相对传统问询台或二维平面地图导览,AR 导航效率更高,帮助旅客在机场内精准直达,节省有限的机场活动时间。图:机场 AR 导航效果 AR 营销。在 AR 导航路程中,融合展现沿途商铺的 AR 广告牌,用户可以实时了解商铺的优惠活动、商品推荐、人均消费等关键信息,为旅客进店购买提供直观、快速的信息参考,带来便捷的购物体验,同时也进一步促进了机场商铺的营销转化。图:机场 AR 广告效果 通过 AI、MR 技术实现机场大空间场景高精度导航是航空业的一大创新。机场场景下的传统导航,多基于 GPS 定位或蓝牙信标,无法回避定位误差大、硬件
50、成本高、维护繁琐等问题。而基于商汤 SenseMARS 平台领先的计算机视觉和 MR 能力,可快速打造出适应多种室内大空间定位、室外复杂场景导航、应急情况定位、跨楼层定位、地下停车场定位,功能服务区定位等综合性服务工具,为旅客带来快速、便捷、强自助性的机场导航服务,助力机场数字化转型和智慧机场建设。案例:案例:日本某棒球场日本某棒球场 A AR R 互动观赛互动观赛 棒球是日本的国民运动,作为继相扑之后为日本体育第二大国技,日本职业棒球主管机关公布数据,2019 年日本职业棒球主场比赛观众人数一度超过 2653 万人,平均每场 30928 人。不过,2020 年突如其来的疫情,为日本棒球产业的
51、发展蒙上一层阴影。体育消费疲软、机构场馆停业、体育赛事延期,体育产业遭遇前所未有的挑战。场均观赛人数在 2020 年降至 7805 人,观赛人次同比下降 82%。风靡全日棒球赛的观赛人次急剧下降,造成体育场馆及球会收入下滑。2022 年 5 月,商汤与当地合作伙伴为日本某知名棒球场提供 AI、MR 技术支持,通过在棒球馆现场提供 AR 平台,融入具有科技感的 AR 效果为疫情后的棒球赛事增添活力、吸引更多人流的同时为观看赛事的在场观众带来不一样的互动体验。当前该项目落地的 AR 效果主要分布在球场入口和场内两大区域。在球场入口处,由真人驱动的 AR 棒球女孩形象担任起赛事迎宾员,观众通过 H5
52、扫描入口实景就可以与棒球女孩的虚拟形象互动拍照,并分享到社交媒体上为赛事制造更多热度话题。同时,在棒球女孩身后的实景墙上,还可以结合 MR 技术展示 AR 广告,将人们的注意力转化为商业价值。在棒球场内,通过 AR 展示平台,观众可观赏集体“放飞”的 AR 喷气气球,“绿色”体验赛场氛围的喧闹,也能实时看到 AR 增强后的棒球运动轨迹以及球速等投球分析数据,进一步提升观赛体验。图:棒球场内“放飞”AR 喷气气球和 AR 广告 在 2022 年 5 月的赛事中,该棒球馆的 AR 应用在 3 天内总计被 2000 人使用约4000 次,通过体验和分享,在社交媒体中为赛事获得了更大的关注度。案例:案
53、例:中东中东利雅得季利雅得季 ARAR 沉浸之旅沉浸之旅 作为“2030 愿景(Vision 2030)”的重要组成部分,近几年,沙特着力促进文旅产业发展,在重点旅游城市持续举办主题文旅季活动,向全球游客展示动人的自然风光与文化风情。利雅得季(Riyadh Season)活动是沙特、乃至中东地区最大规模的文化娱乐活动,同时也是沙特大力发展数字文旅产业和沙特实现“2030 愿景”举措的重要组成部分。利雅得季设有 90 万平米的活动园区,被划分为 14 个主题,包含近 7500 场活动,是一场集音乐、艺术、文化、餐饮等为一体的娱乐盛宴。据娱乐管理局(GEA)数据披露,利雅得季游客人数已超过 110
54、0万人,其中 160 万为海外游客。为了持续不断的吸引更多游客,在全球范围内制造更大的人气和热度,促进文旅产业在当地的可持续发展,商汤科技与沙特文旅赛事管理公司 Sela 合作,基于SenseMARS 的 AI、MR 技术赋能利雅得季活动,在 Riyadh Boulevard、Combat Field、Winter Wonderland、Safari 和 Riyadh Front 五大活动区域,为本地居民和全球游客打造一场盛大的沉浸式文娱之旅,带来身临其境的互动游乐体验。当前该项目落地主要场景包括 AR 导航、AR 主题路线、AR 景点和 AR 营销四大功能模块。AR 导航。针对景区范围大、景
55、点分散的特点,商汤利用 AI 和 MR 技术,在园区内构建 AR 实景导航服务,涵盖了游玩景点、祷告室、医疗服务点和公厕在内的各项园区服务,用户只需打开手机 app,就能随时获得高精度的 AR 路线指引,帮助游客快速、方便找到景点设施,并轻松获得电子导览介绍,让游览活动更方便、有趣。同时,结合视觉感知技术对景点排队人数的实时分析,与 AR 导航功能结合,方便游客随时查看排队情况,更好的安排游览行程。图:Time Square 区域的 AR 导航 AR 景点。在商汤 MR 技术的支持下,园区在 Time Square 的恐龙和喷泉两大区域分别设置了 AR 景点。游客通过手机 app 扫描恐龙区域
56、实景就可以看见一头虚拟的城市霸王龙在广场上来回踱步、张望吼叫;扫描喷泉实景,就会呈现出空中海洋世界的景观,一只“鲸鱼”从喷泉中高高跃起,溅起一片浪花,给游客带来的极具真实感的视觉冲击。游客可以和这些 AR 景点合影留念,并分享到社交媒体上,为园区吸引更多关注。图:AR 恐龙主题和 AR 海洋世界主题 AR 营销。园区在为游客提供 AR 导航的同时,在导航路线的沿途置入 AR 广告功能,在游览途中为游客推销景点周边的商铺,在 AR 广告牌上展现商铺优惠活动、折扣商品推荐等,为园区商铺营销导流,将 AR 营销与传统营销相结合,提升游客进店转化效率。图:AR 广告营销 AR 主题路线。在 Boule
57、vard 区域,由于地形较为复杂,园区基于 AR 导航功能为游客提供 AR 主题路线推荐,将 AR 景点、AR 营销点位等串联成一条游览路线,降低用户的行动成本,引导用户游览相关项目,并结合 AR 打卡拼图游戏,集图兑换优惠券,连带为园区商铺引流。基于商汤 SenseMARS,园区通过富有科技感的视觉呈现和生动有趣的沉浸式交互设计,为全球游客带来高效、便捷的游览体验,让游客有机会以生动、有趣的视角来体验和拥抱沙特,为文旅季活动增添人气和话题。数字数字内容内容:打造虚实结合的内容交互:打造虚实结合的内容交互 围绕元素“物”的虚实交互,当前也有非常多的行业实践。譬如,一些复杂的购买决策需要结合线下
58、体验,二维视图展示往往不够直观。很多电商平台已经开始推出 AR 试妆、AR 试鞋、AR 试衣功能,不用上身就能呈现直观效果,让线上也能达到与线下一致的真实体验。例如,以日本统计数据为例,使用 AR 试装 APP 用户的购物转化率是不使用 APP 用户的 1.6 倍,前者的购买力是后者的 2.7 倍。APP 中的 AR 试用功能使得美妆的销售额提升了 26 倍。再譬如,结合 AI+MR 技术,人们可以对历史文物、古建筑等进行 1:1 的高精度还原,将已经不复存在,或只能躺在博物馆橱窗里的文化古物活灵活现的带入眼前,让人们能够身临其境感受历史文化气息,与历史古人进行对话交流,促进历史文化之传承。案
59、例案例:德国施华蔻德国施华蔻 ARAR 染发试色染发试色 长久以来,“理想与现实的差距”是追求时尚的染发人群需要面对的一大难题。这款颜色是否真的适合我的肤色?明明看着不错,可染完之后的实际效果怎么差别这么大?拥有 140 多年历史的德国施华蔻与商汤科技合作,为顾客提供沉浸式的 AR 染发试色体验,顾客通过 Web 端、主流第三方平台等线上渠道或是线下的 AR 试妆镜可以虚拟试发色,通过屏幕直观、精准的展现染发后的完整效果,令消费者在染发前变得更有底气,免除了后顾之忧;同时 AR 染发试色支持染色前后对比,让“染发”前后的差别一目了然。图:AR 染发试色及前后对比 与此同时,在运营后台,结合商汤
60、 AI 技术,业务人员仅需要输入 RGB 色号就可以自动生成具有真实纹理和光泽的 AR 染发效果,不需要进行后期的调色处理,大大提升了后台运营效率,使得新染发产品上线时间减少了 90%。汉高 DX(数字业务)全球首席技术官 John Gao 表示:“AR 染发试色需要高精度的图像识别,无缝的运动跟踪和渲染。”结合商汤 AI+AR 等技术,汉高不仅能为用户呈现染发的确切颜色,还能真实反映头发光线和质地的多维变化,解决消费的关键痛点,加速购买决策的同时也有助于优化购物体验。案例:案例:中国中国敦煌敦煌 A AR R 数字文创数字文创 文创消费市场中 Z 世代已占据主流,他们所带来的消费影响力,体现
61、在消费方式上不再仅是满足于单向的商品购买和使用,更乐意开展互动性消费。但传统以 IP授权的方式与文创机构合作,无论以实体形式还是数字形式发布,虽然赋予了传统文化一定的商业价值,但大多只能作为摆设或是收藏起来,互动性不强,难以与新消费群体建立有效的情感连接,将文化理念更好的传递给年轻一代。商汤与敦煌文旅集团旗下敦煌文创品牌合作,双方围绕“敦煌文创”IP 推出的首个 NFT 数字藏品千年一瞬-敦煌九色鹿限定数字壁画,以可互动的 AR 数字文创作为“钩子”,实物文创底座为载体,将传统文化、现代科技和潮流时尚相互结合,打动 Z 时代消费群体,让更多人对灿烂的敦煌文化遗产,产生更加深刻的认知。图:AR
62、实物文创摆件(左)和敦煌九色鹿壁画展示效果(右)千年一瞬-敦煌九色鹿限定数字壁画既可以作为实物摆件供于欣赏,又融合了商汤 AI+AR 技术带来创新的沉浸式体验。通过手机 APP 扫描产品实物,便会开启一扇虚实穿梭的“任意门”,将人们从现实带到敦煌莫高窟 257 窟数字空间中,敦煌壁画鹿王本生图即会浮现而出,并在缓缓流动的数字光效修复下,逐步呈现出原本光鲜靓丽的色泽。壁画中的九色鹿也如同获得新生,动听的声音、矫健的身影,神话故事中的经典仿佛近在眼前。结语结语 元宇宙正“碎片化”的出现在我们的身边。正如时光倒流十年,我们无法预估移动互联网对人们生活带来颠覆性变化一样,今天站在元宇宙元年,我们也很难
63、为大家描摹出一幅元宇宙的未来全景。但可以确认的是,科技发展的趋势是有迹可循的,也是可以被预测的。元宇宙的大门已经打开,在政策、产业、科研、资本、市场的共同推动下,随着底层技术和相关规则制度的建设和完善,一个开放开源、丰富多彩、创新涌现的元宇宙“大航海时代”即将到来。元宇宙发展是一个渐进式过程,可大致分成四个阶段:“碎片化的 1.0 时代”、“系统化的 2.0 时代”、“生态化的 3.0 时代”、“一体化的 4.0 时代”。1.0 阶段是元宇宙产业发展的早期阶段,主要围绕碎片化的场景进行应用和内容上的“点”状创新。在过程中积累经验、打磨技术,一旦实现持续的价值闭环,企业将会加大对元宇宙技术应用的
64、投入,由“点”连“线”,横向打通各个场景,走向系统化的 2.0 阶段。而随着行业内数据标准逐步统一,数据壁垒被逐一打破后,行业内上下游企业或是生态内企业之间将形成要素间的纵向联通,在“生态化的 3.0 阶段”,元宇宙的边界将越来越宽。实现“一体化”的 4.0 阶段是我们今天的美好愿望,人们可以随时随地、自由地出入或穿梭于元宇宙各个场景之间获得极致体验。从 1.0 到 4.0 是一个长期的、渐进式的发展过程。在这个过程中,技术因素是非常重要的,同时,还有其他因素,例如元宇宙中的伦理治理、隐私和数据安全、现实与虚拟经济系统的融合、产业资源组织模式等,都会影响到元宇宙的发展进程。向高等阶段发展,我们时下并没有明晰的路径可依,需要亚太地区各国政府、企业、高校等多元力量“摸着石头过河”,在一边发展的过程中一边合力探索问题的答案。