《计算机行业全球生成式AI应用全景图:AI应用进入大爆发时代-230906(95页).pdf》由会员分享,可在线阅读,更多相关《计算机行业全球生成式AI应用全景图:AI应用进入大爆发时代-230906(95页).pdf(95页珍藏版)》请在三个皮匠报告上搜索。
1、1/95请务必阅读正文之后的免责条款部分2023 年 09 月 06 日行业研究证券研究报告全球生成式全球生成式 AI 应用全景图应用全景图行业深度分析行业深度分析AI 应用进入大爆发时代应用进入大爆发时代投资要点模型、算力、生态推动投资要点模型、算力、生态推动 AI 应用进入大爆发时代:应用进入大爆发时代:1)算法及模型的快速进步:)算法及模型的快速进步:2017 年 Transformer 模型及 2022 年 ChatGPT 的发布标志着生成式 AI 在文本领域的重大飞跃,并在多项能力上超越了人类基准,未来随着更强大的语言大模型(如 GPT-5),以及多模态生态和视觉大模型的技术持续突破
2、,将推动 AI 应用的持续进化。2)算力基础设施将更快、更便宜:)算力基础设施将更快、更便宜:虽然短期内大模型训练需求的激增推高了算力成本,但随着英伟达 GPU 性能的持续升级,以及微软、亚马逊、谷歌和Facebook 等巨头正在加大对 AI 算力云服务的资本开支,并积极布局自研 AI芯片,未来 AI 算力将更快、更便宜,以更好的支撑应用层的快速发展。3)AI 生态的逐渐成熟生态的逐渐成熟:AI 组件层(AI Stack)的完善和产业分工细化,为 AI应用在模型训练、数据整合、应用开发、应用部署等环节提供全生命周期的支撑。全球科技股复盘:算力基础设施层公司率先受益于本轮全球科技股复盘:算力基础
3、设施层公司率先受益于本轮 AI 产业浪潮,应用层公司同样有所演绎,从兑现节奏上晚于基础设施层。产业浪潮,应用层公司同样有所演绎,从兑现节奏上晚于基础设施层。在基础设施层中,英伟达是AI“掘金买铲”逻辑的核心受益者,其次为微软、Google、AWS、Oracle 等头部云服务厂商和大模型厂商。在应用层中,美股年初至今涨幅靠前的 AI 应用公司 有:Palantir(136%)、Duolingo(109%)、Shopify(92%)、Palo AltoNetworks(74%)、Salesforce(67%)、adobe(67%)、ServiceNow(52%)。相较于 AI 基础设施厂商已经能够
4、从模型训练所产生的巨大需求,订单和业绩也得到了持续验证,B 端应用还处于早期,大多数 AI 应用厂商还尚未进入到商业化阶段,从兑现时间来看预计要晚于基础设施层 2-3 个季度。全球生成式全球生成式 AI 项目及投融资现状:项目及投融资现状:1)AI 项目数量激增:项目数量激增:GitHub 上 AI 开源项目截止 8 月底数量达到了 91 万,相较于去年全年的增幅达到 264%。根据 Replit 的数据,23 年二季度 AI 项目环比增速达 80%,相较于去年同期同比增长了 34 倍;2)OpenAI 在大模型上依然具备统治级地位:在大模型上依然具备统治级地位:95%以上的应用项目均是基于O
5、penAI 的模型来构建,同时开源项目数量也开始大幅增长;3)2023 年是生成式年是生成式 AI 投融资创纪录的年份投融资创纪录的年份:根据 CB Insights 的数据,截至2023 年第二季度,生成式 AI 的投融资相较于去年全年的 25 亿美元,增长了 4.6倍;4)生成式)生成式 AI 应用层融资金融仅占三成:应用层融资金融仅占三成:目前约七成资金投向了包括大模型开发在内 AI 基础设施层。而从应用层的融资中,AI 数字代理获得融资最多,其次投资评级领先大市-A维持首选股票首选股票评级评级688111.SH金山办公买入-A002230.SZ科大讯飞买入-A002410.SZ广联达增
6、持-A300496.SZ中科创达买入-A688023.SH安恒信息买入-A一年行业表现一年行业表现资料来源:聚源升幅%1M3M12M相对收益-2.67-11.0724.31绝对收益-7.86-11.9119.24分析师方闻千SAC 执业证书编号:S相关报告相关报告金山办公:订阅业务快速增长,看好 AI+办公的深度融合-金山办公业绩快报 2023.8.24四维图新:看好公司智驾、智芯的长期驱动力-四维图新业绩快报 2023.8.24计算机:数据资源并表发布,加速数据要素商业化-计算机行业快报-数据资源暂行规定发布,加速数据要素商业化 2023.8.23广联达:收入端稳定增长,看好 AI+建筑的产
7、业布局-广联达业绩快报 2023.8.23中科创达:智能汽车保持高增,大模型+边缘计算彰显长期价值-中科创达业绩快报 2023.8.20天融信:收入端稳定增长,新业务开始发力-天融信业绩快报 2023.8.20科大讯飞:二季度经营全面改善,AI 布局国内领先-科大讯飞业绩快报 2023.8.19行业深度分析2/95请务必阅读正文之后的免责条款部分为文本、图像、代码及音频的生成工具。生成式生成式 AI 应用按应用领域可以分为工具型应用、通用软件、行业软件、智能硬件四大类,从产品形态上将沿着应用按应用领域可以分为工具型应用、通用软件、行业软件、智能硬件四大类,从产品形态上将沿着 AIGC(内容生成
8、)、(内容生成)、Copilot(智能助手)、(智能助手)、Insight(知识洞察)、(知识洞察)、Agent(数字代理)四个重要的方向演进。(数字代理)四个重要的方向演进。1)工具型应用:)工具型应用:包括聊天机器人、搜索引擎、文本工具、AI 作画以及代码工具等,主要集中在 C 端,产品的同质化程度较高,对于大多数文本、图像、视频、代码、3D 模型等 AIGC 工具,模型/算法的能力决定了产品的受欢迎程度,对底层模型特别是 GPT-4 存在高度依赖。目前行业进入第一轮洗牌期,竞争优势的构建来自于差异化的产品定位以及持续训练更强大的底层模型和算法。2)通用软件:)通用软件:包括办公软件、企业
9、服务、IT 运维、软件开发、网络安全、数据智能等领域,各领域头部厂商均已出现标杆产品,最常见的产品形态主要是 AI智能助理(Coplilot),代表有 Office 365 Copilot、Salesforce Einstein GPT 及Adobe Firefly。目前各个赛道竞争格局变化不大,各个赛道的龙头厂商依然率先受益于生成式 AI 所创造的新的产品功能,未来的竞争关键在于 AI 与场景/工作流的深度融合,目前通用软件头部厂商预计将在四季度进入商业化落地的关键阶段;3)行业软件:)行业软件:涉及金融、医疗、教育、工业、游戏、法律等多个行业,生成式AI 在游戏、法律、教育、电商等 C 端
10、场景有较多的结合,而在医疗、金融、工业等 B 端场景下生成式 AI 产品的成熟度仍然偏低。AI 助手(Copilot)同样得到了广泛应用,而未来在金融、医疗、工业等领域,最具前景的应用来自于数据分析和知识洞察(Insight)工具。同时,目前各行业头部厂商也在开始自建垂类大模型,包括彭博社的金融大模型 Bloomberg,以及 Meta 蛋白质大模型ESMFold,当前垂类大模型在其专业领域的性能普遍超过通用大模型。4)智能硬件:)智能硬件:包括智能汽车、机器人、智能终端等,目前生产式 AI 与智能硬件的结合主要分为两个方面:一是语音助手,应用场景包括智能座舱、智能音箱、家用机器人等各类智能终
11、端,相较于过去的语音交互模式,大模型和生成式 AI 技术提升了感知和生成能力,进而带来了用户体验的提升,但是总体而言产品门槛相对较低,另一类则为数字代理 AI Agent,主要应用包括自动驾驶、智能机器人等,具备更加广阔的应用空间。目前 AI Agent 在感知与决策能力上仍存在瓶颈,未来应用空间打开的关键在计算机视觉、具身智能等底层技术的突破。生成式生成式 AI 产品目前的商业模式主要包括功能订阅、按量付费、产品销售等,其中产品目前的商业模式主要包括功能订阅、按量付费、产品销售等,其中 C 端应用以功能订阅和按量付费为主,商业化已经趋于成熟,而端应用以功能订阅和按量付费为主,商业化已经趋于成
12、熟,而 B 端应用则主要为功能订阅、解决方案和产品销售,即将进入全面商业化阶段。端应用则主要为功能订阅、解决方案和产品销售,即将进入全面商业化阶段。目前第一批生成式 AI 应用包括 Jasper AI、Notion AI、MidJourney 等均已经成功实现商业化。其中 Office 365 Copilot 的定价为每个用户 30 美元/月。相较于 Office 主线产品 15-30 美元/月的定价,最高提升了 2 倍以上。Salesforce 的生成式 AI模块服务 GPT 和销售 GPT 分别单用户每月付费为 50 美元。此外,Palantir、Palo Alto Networks 的
13、AI 产品已经在实际场景中得到应用且已经带来了明显的收入贡献,四季度 AI 应用将正式进入商业化落地阶段。投资逻辑:投资逻辑:生成式 AI 相关标的涉及模型、算法、应用、算力四大类型厂商,重点看好具备明确商业化前景,能够基于行业纵深,场景卡位,数据资源的来构建竞争壁垒的应用厂商公司。同时,看好 AI Infra 中应用上游工具链头部厂商,行业深度分析3/95请务必阅读正文之后的免责条款部分能够通过产品横向一体化来不断扩大自身的竞争优势。相关标的:1)办公软件:金山办公、福昕软件;2)企业服务:泛微网络、致远互联;3)教育:科大讯飞;4)创意工具:万兴科技;5)金融:同花顺、恒生电子;6)网络安
14、全:安恒信息、深信服、奇安信;7)法律:金桥信息;8)工具链:星环科技;9)智能汽车:中科创达、德赛西威。与此同时,我们看好大模型训练及推理所带来的的算力需求的持续增加,看好芯片、服务器、云服务及算力租赁厂商,相关标的:云赛智联、寒武纪,海光信息、浪潮信息、紫光股份、中科曙光、优刻得、青云科技。风险提示:风险提示:技术发展风险、贸易摩擦加剧风险、数据安全风险、道德和伦理风险。行业深度分析4/95请务必阅读正文之后的免责条款部分内容目录内容目录一、生成式一、生成式 AI 应用进入大爆发时代应用进入大爆发时代.71)驱动因素:大模型、算力与生态的共振.72)产业现状:一二级视角看 AI 应用的演进
15、.163)应用框架:应用的四大赛道与产业逻辑.24二、生成式二、生成式 AI 应用细分赛道梳理应用细分赛道梳理.371)AI+办公软件.372)AI+创意工具.433)AI+企业服务.474)AI+网络安全.525)AI+IT 运维.566)AI+软件开发.607)AI+数据智能.648)AI+数字代理.679)AI+金融.7010)AI+医疗.7511)AI+教育.7912)AI+工业.8313)AI+汽车.8614)AI+机器人.90三、投资策略三、投资策略.93四、风险提示四、风险提示.93图表目录图表目录图 1:人工智能产业发展浪潮.8图 2:模型、算力、生态推动为 AI 应用进入大爆
16、发时代.9图 3:GPT 模型的迭代过程.10图 4:GPT-4 是目前最强大的大模型.10图 5:大模型家族的不断丰富和技术演进路演.11图 6:生成式 AI 应用与多模态模型.13图 7:当前视觉大模型相当于 20 年前后的语言大模型.14图 8:算力芯片万倍增长.15图 9:云服务解决方案数量对比.15图 10:AI 产业生态的逐渐成熟.16图 11:生成式 AI 应用的发展阶段.18图 12:海外科技股价复盘:基础设施层公司率先受益 AI 产业浪潮.19图 13:海外科技股价复盘:应用层公司股价同样有所演绎.20图 14:Github 过去十年 AI 项目数量.21图 15:Repli
17、t 的 AI 项目数量激增.21图 16:约 95%的项目是 OpenAI 的模型构建(Replit).21图 17:Replit 开源模型项目数量快速增长(Replit).21图 18:2023 年生成式 AI 投融资金额涨幅高达 464%.22行业深度分析5/95请务必阅读正文之后的免责条款部分图 19:已有 15 家生成式 AI 独角兽达到 10 亿美元+估值.22图 20:生成式 AI 项目大部分处于早期.23图 21:生成式 AI 投融资金额分布.23图 22:生成式 AI 应用层融资分布(22Q3-23Q2).24图 23:生成式 AI 应用产业地图.25图 24:AI 应用的基础
18、能力与演进方向.26图 25:通用软件标杆产品与发展路径.27图 26:通用软件市场应用进展.30图 27:行业应用:C 端场景成熟,B 端处于起步阶段.33图 28:AI+生产力工具变革主要体现在三个层面.40图 29:AI+办公应用的标杆:微软 365 Copilot.41图 30:微软 Office 办公套件产品的竞争者.42图 31:AIGC 依赖于生成算法、大模型与多模态三大底层技术的进步.45图 32:Adobe firefly 的主要功能.47图 33:赛富时 AI 产品组合.49图 34:销售 GPT 的主要功能:销售电子邮件将为每次客户互动自动生成个性化且包含数据的电子邮件.
19、50图 35:服务 GPT 的主要功能:自动化回复.51图 36:Dynamics 365 Finance 充分利用 ERP 数据来加速洞察.52图 37:AI+安全的最大机会来自于提升安全运营的自动化程度.54图 38:Security Copilot AI 提升安全运营自动化.55图 39:XSIAM 是集成了 AI 的基于云交付的集成 SOC 平台.56图 40:Servicenow 将生成式 AI 集成到 NOW 平台.58图 41:Datadog 推出了针对 OpenAI 的性能监控产品.59图 42:Datadog 可监控和跟踪 GPT 及其他大模型的 token 消耗.59图 4
20、3:Github copilot X 是目前最强大的 AI 编程开发工具之一.62图 44:Microsoft Power Apps 的 AI 能力进化路线.63图 45:OutSystems 低代码平台.64图 46:AIP 产品的三大基础模块.66图 47:AIP for Defense:分析战场中敌方军队的详细情报.67图 48:AIP for Defense:给出作战行动计划的相关建议.67图 49:AIP for Business:查询飓风对配送中心的影响.67图 50:AIP for Business:查询运输线路的最优化路径.67图 51:AI Agent 的组成模块与实现原理.
21、69图 52:AutoGPT 的工作流程.70图 53:Finchat 基本面分析功能.73图 54:Finchat 股票筛选功能.73图 55:Finchat 财报摘要生成功能.74图 56:AI+金融公司分类.75图 57:AbSci 通过生成式 AI 构建抗体.76图 58:AI+医疗公司分类.79图 59:Duolingo Max 两大全新功能“解释我的答案”、“角色扮演”.81图 60:Khanmigo 具备辅导教学、教案生成、写作训练、编程练习四大功能.82图 61:达索四大 AI 设计助手:选择助手、匹配助手、草图助手、智能配接.84图 62:智能座舱词汇激活系统.87图 63:
22、生成式 AI 赋能自动驾驶框架.88 行业深度分析6/95请务必阅读正文之后的免责条款部分图 64:特斯拉自动标注原理.89图 65:特斯拉 Occupancy Network 模型结构图.89图 66:1Xtechnologies 旗下 EVE 实体机器人.91图 67:Richtech Robotics 旗下餐饮机器人 Adam.91表 1:生成式 AI 访问量统计排行.28表 2:工具型应用各赛道主要产品.29表 3:通用软件各赛道主要产品.32表 4:行业软件各赛道主要产品.34表 5:智能硬件各赛道主要产品.35表 6:C 端 AI 应用工具的商业化情况.36表 7:B 端 AI 应
23、用工具的商业化情况.37表 8:AI+办公软件标杆产品.39表 9:AI+金融产品目录.41表 10:AI+创意工具标杆产品.44表 11:三类文生图工具的商业模式.46表 12:AI+企业服务标杆产品.48表 13:AI+网络安全标杆产品.53表 14:AI+IT 运维标杆产品.57表 15:AI+软件开发标杆产品.61表 16:AI+数据智能标杆产品.65表 17:AI+数字代理标杆产品.68表 18:AI+金融标杆产品.72表 19:FinChat 收费标准.74表 20:AI+医疗标杆产品.78表 21:AI+教育标杆产品.80表 22:AI+教育产品商业化案例.82表 23:AI+工
24、业标杆产品.86表 24:AI+汽车标杆产品.90表 25:AI+机器人标杆产品.92 行业深度分析7/95请务必阅读正文之后的免责条款部分一、生成式 AI 应用进入大爆发时代1)驱动因素:大模型、算力与生态的共振生成式人工智能是自个人生成式人工智能是自个人 PC 出现和互联网诞生以来最具颠覆性的技术创新出现和互联网诞生以来最具颠覆性的技术创新,随着大模型以随着大模型以及及 ChatGPT 等一系列等一系列“杀手级杀手级”应用的诞生应用的诞生,生成式生成式 AI 在在文本文本、图像图像、代码代码、音频音频、视频和视频和 3D模型模型等领域展现出了强大的能力等领域展现出了强大的能力。当前当前生成
25、式生成式 AI 的发展的发展仍处于起步阶段仍处于起步阶段,未来有望为未来有望为全球经济全球经济创造创造数万亿美元的价值数万亿美元的价值,并对各行各业的工作方式产生重大影响并对各行各业的工作方式产生重大影响。在生成式在生成式 AI 产业突变的背后产业突变的背后是人工智能技术数十年的积累和酝酿,其演进历程具体可分为四个阶段:是人工智能技术数十年的积累和酝酿,其演进历程具体可分为四个阶段:1)专家系统:)专家系统:上世纪 50 年代前后,人工智能开始萌芽,基于规则的专家系统占据主导,这一时期,使用复杂的逻辑规则,能够处理包括字符匹配、词频统计等一些简单的任务,机器翻译以及语言对话的初级产品,1966
26、 年 MIT 发布的世界上第一台聊天机器人 Eliza 可以看作生成式 AI 最早期的产品之一。Eliza 能够根据接收到的文本,遵循简单的语法规则来模拟与人类用户的对话。与此同时,专家系统存在词汇量有限、缺乏上下文和过度依赖规则等缺点,生成创造性内容的能力非常有限;2)机器学习与神经网络机器学习与神经网络:1980 年美国的卡内基梅隆大学召开了第一届机器学习国际研讨会,标志着机器学习在全世界兴起,20 世纪 90 年代以后,神经网络作为一种新的生成人工智能方法出现了。神经网络受到人脑的启发,能够以基于规则的系统所不能的方式从数据中学习,带来了AI 技术的突破,AI 可以开始基于神经网络创建逼
27、真和有创意的内容;3)深度学习:)深度学习:2012 年后,深度学习在人工智能领域中的应用将生成式 AI 带入了一个新的高度。深度学习作为一种基于神经网络的机器学习方法,通过大规模的数据特征学习,对不同场景具备很强的自适应性,同时可以通过增加层数和节点数,实现对更复杂的问题的解决,提升了模型的准确性和真实性,并且基于分布式计算和 GPU 加速等技术,能够训练更大规模的数据和更大尺寸的模型。直到现在,生成式 AI 依然建立在深度学习的基石之上;4)大模型:)大模型:2017 年,Google 发布著名论文Attention is All You Need,提出了基于一种新的神经网络Attenti
28、on 注意力机制所构建的模型 Transformer,2018 年 OpenAI 和谷歌分别推出了 GPT 模型以及 BERT 模型,均是在 Transformer 的基础上构建,Transformer 及 GPT模型标志着生成式 AI 在文本领域的重大飞跃。与此同时,伴随着 VAEs、扩散模型、神经辐射场、CLIP 等一系列生成算法和多模态模型的不断成熟,生成式 AI 的时代正式开启。行业深度分析8/95请务必阅读正文之后的免责条款部分图 1:人工智能产业发展浪潮资料来源:真格基金、华金证券研究所模型、算力、生态推动为模型、算力、生态推动为 AI 应用进入大爆发时代:应用进入大爆发时代:1)
29、算法及模型的快速进步:)算法及模型的快速进步:2017 年 Transformer 模型及 2022 年 ChatGPT 的发布标志着GenAI 在文本领域的重大飞跃,并在多项能力上超越了人类基准,随着未来更强大的语言大模型(如 GPT-5),以及多模态大模型和视觉大模型的技术突破,将带动 AI 应用的持续进化。2)算力基础设施将更快、更便宜:)算力基础设施将更快、更便宜:虽然短期内大模型训练需求的激增导致了算力成本的持续上涨,但是随着英伟达算力芯片的不断更新迭代,微软、亚马逊、谷歌等在 AI 云服务资本开支的不断加大,AI 应用的发展将得到更加强有力的支撑。3)AI 生态的逐渐成熟:生态的逐
30、渐成熟:AI 组件层(AI Stack)的完善和产业分工细化,为 AI 应用在模型训练、数据整合、应用开发、应用部署等环节提供全生命周期的支撑。行业深度分析9/95请务必阅读正文之后的免责条款部分图 2:模型、算力、生态推动为 AI 应用进入大爆发时代资料来源:华金证券研究所绘制本轮生成式本轮生成式 AI 的技术的最大突破来自于底层大模型的技术的最大突破来自于底层大模型,GPT 作为当前全球最强大的语言大模作为当前全球最强大的语言大模型,从型,从 2018 年年 5 月月 GPT 初代版本,到初代版本,到 2023 年年 3 月的月的 GPT-4,仅,仅 5 年时间模型的性能就产生年时间模型的
31、性能就产生了质的飞跃了质的飞跃。在 GPT 模型快速进化的背后,一方面是对训练方法的持续迭代,从 GPT-1 的半监督式学习,到 GPT-2 舍弃了微调阶段,再到 GPT-3 的 In-context 学习和海量参数,以及引入了基于人工反馈的强化学习之后的 ChatGPT;另一方面,在模型参数规模扩大背后,是 OpenAI对研发和算力的持续高投入,通过“大力出奇迹”的方式,支撑了模型参数和训练数据的快速膨胀。GPT-4 相较于之前版本的 GPT 模型,在推理能力、文本生成能力、对话能力等方面有了大幅提升之外,在许多能力上已经超越了人类基准。同时大模型作为能够在海量、广泛、非结构化数据集(例如文
32、本和图像)上进行训练的大规模深度学习模型,它的强大之处不仅在于文本生成,大模型可以适应各类不同的任务,不仅可以用于聊天机器人,同时也可以用来创建新的蛋白质序列,并且当前已经成为了图像、代码、音频、音乐、视频和 3D 模型等各种模态应用的底层框架。行业深度分析10/95请务必阅读正文之后的免责条款部分图 3:GPT 模型的迭代过程资料来源:Wikipedia、CSDN、华金证券研究所图 4:GPT-4 是目前最强大的大模型资料来源:GPT-4 Technical Report、华金证券研究所随着大模型家族的不断丰富,出现了单向随着大模型家族的不断丰富,出现了单向/双向、开源双向、开源/闭源等不同
33、的技术路线。闭源等不同的技术路线。1)单向单向/双向:双向:在 Transformer 模型 2017 年诞生之后,2018 年 OpenAI 和 Google 发布的GPT-1 和 BERT 采用了 Transformer 不同的框架,6 月 OpenAI 发布的 GPT-1 仅使用了Transformer 的 Decoder 框架(单向架构),10 月,Google 发布的 BERT 模型采用 Transformer的 Encoder 框架(双向架构),作为一个拥有 3 倍 GPT 参数量的更大体量的语言模型,BERT 行业深度分析11/95请务必阅读正文之后的免责条款部分在当时的多项测评
34、以及业内影响力等方面,要领先于 GPT 的初代版本。2020 年,随着 GPT-3的惊艳表现,单向模型在语言生成方面的优势开始展现(特别在大参数情况下),Decoder 路线逐渐占据主导,当前主流大模型大多采用 Decoder 框架或大 Decoder 小 Encoder 框架。2)开源开源/闭源:闭源:大模型的开源/闭源,与 iPhone/Android、Windows/Linux 有类似之处。包括 GPT-4,以及谷歌的 Bard、Claude 等大模型均是闭源模型,优势在于性能强大和易于上手,目前依然是绝大多数海外主流生成式 AI 应用的首选;而 LLaMA2、Stable Diffus
35、ion,Eleuther,GLM130B,OPT,BLOOM 引领的开源模型优势在于灵活性和低成本,特别 llama2 的发布,宣布支持商业化,让应用层的公司可以以非常低成本来使用大模型,可以基于开源模型进行私有化部署并实现差异化功能的开发。在过去的一年里,开源阵营模型的能力和数量有了显着的提高,开源框架目前也正在成为越来越多应用的选择。图 5:大模型家族的不断丰富和技术演进路演资料来源:Harnessing the Power of LLMs in Practice:A Survey on ChatGPT and Beyond、华金证券研究所 行业深度分析12/95请务必阅读正文之后的免责条
36、款部分目前大模型的应用已经不局限于目前大模型的应用已经不局限于 NLP 领域,包括领域,包括图片、语音、视频、代码等多种模态的应图片、语音、视频、代码等多种模态的应用开始涌现用开始涌现,而大模型而大模型、生成算法与多模态等底层技术的突破成为了生成算法与多模态等底层技术的突破成为了 AIGC 的质变的关键的质变的关键。一方面,目前大模型可以广泛适用于各类下游任务,当前已经成为了 AIGC 的底层框架。许多跨领域的 AI 应用均是构建于大模型之上,能够解决多任务、多场景、多功能需求,支撑各种模态的生成;另一方面,包括生成对抗网络(GAN)、变分自编码器(VAE)、扩散模型(Diffusion Mo
37、del)、神经辐射场(Nerf)等快速涌现的生成算法,以大模型为基础,能够创造出文字、图片、语音、视频、代码等各种模态的内容,而基于此之上的多模态应用开始涌现。1)文本生成:)文本生成:目前技术最成熟的领域,随着新一代大模型的发布,未来将看到更高质量的输出、更长形式的内容和更好的垂直特性;2)图像生成图像生成:过去一年技术进化速度最快的领域,2014 年出现生成对抗网络 GAN 是图片生成的主流算法,但一直存在对输出结果控制力弱,难以生成新图像等缺点。随后扩散模型、CLIP 模型等技术的成熟,文生图的能力大幅增强,包括 DALL-E2、Stable Diffusion 等主流文生图应用均是基于
38、扩散模型所构建;3)视频生成视频生成:目前尚未有非常成熟的视频生成算法,许多应用还是依赖于图像生成的算法;4)3D 模型生成:模型生成:3D 模型生成还处于早期,其中这一领域关键算法神经辐射场(NeRF)于 2020 年于 ECCV 会议上提出,目前已经成为 3D 模型构建的主流算法,并广泛应用于游戏、数字人、虚拟现实、增强现实、电子商务等领域,未来具备广阔的应用空间;5)代码生成代码生成:GPT-4 等大模型具备很强的代码能力,未来将会对软件开发人员生产力产生重大影响,同时能够使非专业开发人员更容易生成代码;6)音频生成:)音频生成:音频合成在技术和商业化上已经非常成熟,近年来大模型和优化算
39、法的成熟能够基于大量音乐数据集训练和优化算法来创建 AI 虚拟歌手,更加趋近于真人发声效果,典型应用如:AI 孙燕姿;7)其他:)其他:从生物蛋白质分子模型到其他垂直领域,许多行业都在进行垂类模型的研发。行业深度分析13/95请务必阅读正文之后的免责条款部分图 6:生成式 AI 应用与多模态模型资料来源:Generative AI:A Creative New World、华金证券研究所在语言大模型和多模态多模态大模型快速取得质变的同时,视觉领域的基础大模型在语言大模型和多模态多模态大模型快速取得质变的同时,视觉领域的基础大模型 VisionTransformer(VIT)在)在 2020 年
40、诞生后,近三年语义分割、目标检测、图像分类、实例分割等年诞生后,近三年语义分割、目标检测、图像分类、实例分割等主要视觉任务上的能力均有明显提升。主要视觉任务上的能力均有明显提升。Vision Transformer(VIT)于 2020 年由 Google 提出,可以看成是 Transformer 的图形版本,在尽可能少的改造下将标准的 Transformer 模型直接迁移至图像领域变成 Vision Transformer 模型。Vision Transformer 最初用于处于图像分类任务,2020年很多后续的视觉模型都是基于 VIT 建立。为了将 Transformer 模型适用于图像,
41、VIT 将图像切分成很多子块并将这些子块组成线性嵌入序列,然后将这些线性嵌入序列作为 Transformer 的输入以模拟在 NLP 领域中词组序列输入。当前视觉大模型相当于当前视觉大模型相当于 20 年前后的语言大模型:年前后的语言大模型:1)Transformer 于于 2017 年由年由 Google 提出,提出,Vision Transformer 于于 2020 年提出;年提出;2)当前最大的语言模型已经超过万亿参数量级当前最大的语言模型已经超过万亿参数量级,当前最大的视觉模型刚刚达到百亿参数量当前最大的视觉模型刚刚达到百亿参数量级;级;3)从从 GPT-2(2019)开始开始,语言
42、模型开始具备通用能力语言模型开始具备通用能力,而当前视觉模型基本仍只能处理而当前视觉模型基本仍只能处理特定视觉任务。特定视觉任务。行业深度分析14/95请务必阅读正文之后的免责条款部分图 7:当前视觉大模型相当于 20 年前后的语言大模型资料来源:GPT-4核心技术分析报告、华金证券研究所巨头持续加码算力基础设施巨头持续加码算力基础设施,未来未来 AI 算力将更快算力将更快、更便宜更便宜,并更好的支撑应用层的快速发并更好的支撑应用层的快速发展展。多年来,英伟达 GPU 性能的突破的基本遵循摩尔定律,GPU 的晶体管数量每两年增加一倍。近年来,随着芯片架构的进步以及张量核心和 Transfome
43、r 引擎等功能的引入进一步提高了英伟达 GPU 的吞吐量和效率,GPU 进化的速度超越了摩尔定律。同时除了硬件之外,英伟达围绕CUDA 构建的软件生态系统,为开发人员提供端到端的解决方案,简化了人工智能应用的开发、部署和管理,已经成为了各行业人工智能的操作系统层。除英伟达外,全球科技巨头均在加速算力侧的布局,其中软件厂商开始自研芯片,而硬件厂商则在搭建算力平台,包括微软、亚马逊、谷歌、甲骨文和 Facebook 等软件及云服务巨头正在加大对 AI 算力云服务的资本开支,并提供更丰富的 AI 云服务模块、涉及 NLP、机器学习、计算机视觉等各个领域;另一方面,微软、亚马逊、谷歌等均在加大自研 A
44、I 芯片的投入。因此虽然短期来看,大模型训练的需求的急剧增加推高了算力成本,但随着未来芯片性能的快速进步以及 AI 算力供需的逐渐平衡,应用层的发展将得到更好的支撑。行业深度分析15/95请务必阅读正文之后的免责条款部分图 8:算力芯片万倍增长图 9:云服务解决方案数量对比资料来源:英伟达投资者PPT、华金证券研究所资料来源:Khaveen Investments、华金证券研究所AI 组件层组件层(AI Stack)是是 AI 生态的重要组成部分生态的重要组成部分,为模型训练为模型训练、数据整合数据整合、应用开发应用开发、应应用部署等提供支撑用部署等提供支撑,AI 组件层的完善和产业分工细化组
45、件层的完善和产业分工细化,代表代表 AI 生态的逐渐成熟生态的逐渐成熟。AI 组件层具体包括了模型训练、数据整合、应用开发、应用部署等几个关键环节,各环节均已经初步跑出了一系列组件工具,可预见随着各个头部工具厂商不断拓展自身的产品线,AI 组件层的一体化和平台化程度会越来越高。除了新兴厂商之外,IBM、埃森哲、德勤等 IT 咨询公司也推出了 AI 解决方案,来支撑 AI 应用的开发与部署,具体来看:1)应用框架:)应用框架:通过提供了一套组件和接口,将开源模型、API 和数据库等不同的外部组件链接在一起,能够帮助应用开发快速构建基于大模型的 AI 应用,来简化应用的开发和创建过程,代表厂商包括
46、 LangChain,Dust.tt,Fixie.ai,GPT Index 和 Cognosis。2)数据整合:)数据整合:由于基础模型仅限于对训练它们所依据的事实进行推理,而应用和垂类模型需要使用时效性强以及垂直领域和私有数据来推出面向专业领域的应用,特别是在金融、医疗等专业性强以及天气、体育、新闻等实效性强的领域,应用程序开发人员需要模型调用外部数据源,通过外挂等方式来实现数据整合,而非再次训练底层大模型。涉及工具包括了向量数据库Pinecore、Chroma、Redis 等、上 下 文 窗 口 LangChain、LlamaIndex 等、数 据 加 载器 Unstructured.io
47、、Databricks 等。3)模型训练模型训练:应用开发对底层模型有多种选择,可以选择由 Open AI、Anthropic 或 Cohere等供应商创建的闭源模型,或者使用开源模型,以及可以选择训练自己的模型,而且模型尺寸、模态、输出质量、上下文窗口大小、成本和延迟各不相同,最佳设计通常需要开发人员在使用多个模型的组合。涉及到的 AI 组件包括:模型库 Hugging Face、Replicate 等、深度学习框架TensorFlow、PyTorch、DeepSpeed 等、训练工具 Mosaic、TOgether、Cerebras 等,托管服务 OctoML、Vertex AI 等。行业
48、深度分析16/95请务必阅读正文之后的免责条款部分4)评估工具:)评估工具:一方面,在模型训练过程中,开发人员需要使用多种工具来实现模型的快速开发和迭代,基于数据来驱动提示工程、超参数、微调、模型相关的实验,相关工具包括 Statsig、Comet、Mlflow 等;另一方面,在应用部署后,应用厂商需要跟踪底层大模型的性能、成本、延迟和行为随时间的变化,了解模型输出的质量,防止恶意使用以及控制大模型的成本,相关工具包括 WhyLabs、datadog 等。5)应用部署应用部署:将 AI 应用部署到实际应用环境中,可以采用 Fixie、Gradio 等框架,或者采取第三方厂商的服务来完成应用的部
49、署实施。图 10:AI 产业生态的逐渐成熟资料来源:Menlo Ventures、华金证券研究所2)产业现状:一二级视角看 AI 应用的演进随着随着 GPT 以及扩散模型等底层模型和算力能力的突破,生成式以及扩散模型等底层模型和算力能力的突破,生成式 AI 应用在近应用在近 3 年来取得了年来取得了跨越式的发展。当前时点,跨越式的发展。当前时点,B 端应用场景逐渐成熟,端应用场景逐渐成熟,AI 应用即将进入全面商业化阶段。应用即将进入全面商业化阶段。1)2021:GPT-3 催生出第一批生成式催生出第一批生成式 AI 应用。应用。2021 年第一批生成式 AI 应用诞生得益于2020 年 5
50、月 GPT-3 的发布,相较于 GPT-2 及其他语言模型,GPT-3 在机器翻译、聊天问答和 行业深度分析17/95请务必阅读正文之后的免责条款部分文本填空上等语言任务上有着非常出色表现,并且开始能够完成一些比较困难的 NLP 任务,比如生成新闻报道和撰写文章。因此从 2021 年开始,包括 Jasper AI 在内第一批基于大模型生成式人工智能应用诞生,大多是基于 GPT-3 的能力,并以类 SaaS 服务的形式进行收费。Jasper Ai在成立当年就收获 7 万名用户、营收额达到 4500 万美元,2022 年翻倍达到 8000 万美元,仅用18 个月时间速成为一家估值 15 亿美元的
51、AIGC 独角兽。2)2022:AI 作画的爆发与作画的爆发与 ChatGPT 的发布,的发布,22 年是生成式人工智能的元年。年是生成式人工智能的元年。22 年随着扩散模型等生成算法的突破,一系列 AI 作画应用相继诞生,其中包括了 MidJourney、Dall-E2、Imagen 等在线文生图应用,以及 Stability AI 的开源模型 Stable Diffusion,AI 图像生成的效率与精度提升到了前所未有的量级。22 年底,生成式 AI 的“杀手级应用”ChatGPT 正式发布,基于对超大规模数据的深度学习,ChatGPT 在文本生成领域的能力得到了空前提高。除此之外,各种视
52、频生成(Make-a-Video、Imagen Video),以及 3D 模型生成(DreamFusion、Magic3D和 Get3D),包括代码生成工具 GitHub Copilot 开始受到广泛关注。3)2023:C 端应用面临洗牌端应用面临洗牌,B 端应用即将进入全面商业化端应用即将进入全面商业化。23 年生成式年生成式 AI 在在基础模型实现了持续的突破,GPT-4 发布的大语言模型在多项任务上进一步提升,而开源模型 Llama 为初创企业和其他企业提供了一个强大的免费选择,和 OpenAI 的闭源模型阵营形成竞争。在模型能力快速进化的同时,一方面是各类生成式 AI 的项目数量开始激
53、增,另一方面,B 端应用在处在商业化的前夜,自 3 月微软发布了基于 GPT-4 的 AI 办公助手 office Copilot,此后包括企业服务、营销、低代码、安全、教育、医疗、金融等领域的 AI 应用开始陆续发布。7 月份,Microsoft365 Copilot 公布定价,为每个用户 30 美元/月,同时全球 CRM 龙头 Salesforce 宣布正式向所有用户开放 AI 产品,并给出了单个产品每用户每月 50 美元的定价。随着两大软件巨头 AI 功能定价发布,AI 应用将正式进入商业化落地阶段。行业深度分析18/95请务必阅读正文之后的免责条款部分图 11:生成式 AI 应用的发展
54、阶段资料来源:华金证券研究所绘制年初以来,海外科技股在年初以来,海外科技股在 AI 引领下持续上涨,引领下持续上涨,AI 算力基础设施层公司率先受益于算力基础设施层公司率先受益于 AI 产业产业浪潮浪潮,其中英伟达是其中英伟达是 AI“掘金买铲掘金买铲”逻辑的核心受益者逻辑的核心受益者,其次为微软其次为微软、Google、AWS、Oracle等头部云服务厂商和大模型厂商。等头部云服务厂商和大模型厂商。当前生成式 AI 中的很大部分收益流向了基础设施层,根据海外风险投资机构 Andressen Horowitz 的粗略估算,应用厂商平均需要将 20-40%的收入支付给云服务商或大模型厂商,同时大
55、模型厂商通常也会将近一半收入用于支付云基础架构。因此总体上,当前生成式 AI 总收益的 10-20%流向了云服务商,其中大部分集中三朵云上:亚马逊云(AWS)、谷歌云(GCP)和 Microsoft Azure。而在更底层的则是英伟达的 GPU,其主力 AI 芯片 A100、H100 承载了绝大多数 AI 模型训练与开发,占据 AI 服务器硬件成本的近 90%,英伟达凭借强大的芯片性能以及 CUDA 软件生态系统,围绕 AI 算力建立了深厚的护城河,毫无疑问是本轮生成式 AI 的最大受益者。此外包括网络设备(Marvell、Arista、博通),数据存储(MongoDB、Teradata、Sn
56、owflake),服务器(Smci)等环节的基础软硬件厂商也均有不同程度的受益。行业深度分析19/95请务必阅读正文之后的免责条款部分图 12:海外科技股价复盘:基础设施层公司率先受益 AI 产业浪潮资料来源:wind、华金证券研究所目前目前 AI 应用特别是应用特别是 B 端的应用还处于早期端的应用还处于早期,应用层从商业化以及兑现时间来看预计要晚基应用层从商业化以及兑现时间来看预计要晚基础设施层础设施层 2-3 个季度,今年以来头部应用厂商股价同样也有所演绎。个季度,今年以来头部应用厂商股价同样也有所演绎。今年年初至今涨幅靠前的AI 应用公司有:Palantir(136%)、shopify
57、(92%)、Salesforce(67%)、ServiceNow(52%)、Palo Alto Networks(74%)、Adobe(67%)、Duolingo(109%)、LegalZoom(46%)、TTD(78%)。相较于 AI 基础设施厂商已经能够从模型训练所产生的巨大需求,来验证到订单和业绩,美股 AI 应用公司业务基本集中在 B 端,大多还处于产品打磨阶段或者商业化早期。部分赛道上龙头公司包括 MS、Salesforce、ServiceNow、Shopify 已经发布了生成式 AI 产品,其中MS、Salesforce 公布 AI 产品的定价,预计从今年 Q4 到明年 Q1 能够
58、看到 B 端应用商业化的初步落地,此外也有部分公司如 Palantir、Palo Alto Networks 的生成式 AI 产品已经在实际场景中得到应用且已经带来了明显的收入贡献,但大多数 B 端的 AI 应用厂商还尚未进入到实质性商业化阶段,因此总体来看,AI 应用层厂商从兑现节奏来看要明显晚于基础设施层。行业深度分析20/95请务必阅读正文之后的免责条款部分图 13:海外科技股价复盘:应用层公司股价同样有所演绎资料来源:wind、华金证券研究所今年以来今年以来 GitHub、Replit 等开发者社区的等开发者社区的 AI 项目实现了爆发式的增长。项目实现了爆发式的增长。根据斯坦福大学在
59、 22 年底发布的2023 年人工智能指数报告中的数据,全球最活跃的开发者社区 GitHub 上的 AI 相关项目数量近 10 年以来稳步增加,从 2011 年的 1536 个增加到 2022 年的 347934 个,而在今年以来,GitHub 上 AI 开源项目迎来了大幅度的增长,截止 8 月底数量达到了 91 万,相较于去年全年的增幅达到 264%。同时,根据另一开发者社区 Replit 的数据,2022 年第四季度以来,人工智能项目激增,23 年第二季度末 AI 项目数量达到了 30 万个,其中 16 万个项目是在23 年第二季度创建的,相较于 23 年第一季度环比增速达 80%,而相较
60、于去年同期数量增长了34 倍,且现在仍处于加速增长的趋势。行业深度分析21/95请务必阅读正文之后的免责条款部分图 14:Github 过去十年 AI 项目数量图 15:Replit 的 AI 项目数量激增资料来源:2023 AI Index Report、华金证券研究所资料来源:Replit、华金证券研究所OpenAI 在大模型上依然具备统治级地位在大模型上依然具备统治级地位,同时基于开源模型项目数量正在快速增长同时基于开源模型项目数量正在快速增长。根据开发者社区 Replit 的数据,截止 2023 年二季度,95%以上的应用项目均是基于 OpenAI 的模型来构建,而包括 Cohere、
61、Cohere 以及 Google 在内的其他模型合计占 5%。同时,开源模型的数量正在快速增长,Hugging Face 和 Replicate 作为开源模型的 API 和 SDK 提供商,是开源模型的重要入口。23 年二季度,Replit平台上开源模型的项目超过 5000 个,相较于Q1 增长了141%,其中超过 70%的项目使用了 Hugging Face,但 Replicate 的使用量增速更快,Q2 相较于 Q1 达到了约 6 倍的增长。此外,截至 23 年二季度,Replit 上有近 25000 个活跃的 LangChain 项目,其中 2 万个是在二季度创建的,比一季度增长了近 4
62、 倍。图 16:约 95%的项目是 OpenAI 的模型构建(Replit)图 17:Replit 开源模型项目数量快速增长(Replit)资料来源:Replit、华金证券研究所资料来源:Replit、华金证券研究所 行业深度分析22/95请务必阅读正文之后的免责条款部分从投融资情况来看从投融资情况来看,2023 年是生成式年是生成式 AI 创纪录的年份创纪录的年份。根据海外知名投融资数据平台 CBInsights 的统计数据,截至 2023 年第二季度,生成式 AI 的投融资数量达到 86 笔,总金额超过141 亿美元,相较于去年全年的 25 亿美元,增长了 4.6 倍。其中,今年以来筹资金
63、额最多的五家公司分别是:1)OpenAI:全球人工智能研发的领导者,今年 1 月获得了微软的 100 亿美元融资;2)Inflection:于 6 月宣布完成 13 亿美元的最新一轮融资,由微软、英伟达和三位亿万富翁牵头投资,Inflection 于 5 月推出了首款产品即个人 AI 助理 PI,主打陪伴以及为用户提供情绪价值,成为人工智能领域融资量仅次于 Open AI 的第二大初创公司;3)Anthropic:由前 OpenAI 员工创办,语言模型 Claude 的开发商,是 ChatGPT 的主要竞争对手,今年以来融资金融达到 8.5 亿美元,其中年初谷歌投资了 3 亿美元,5 月完成了
64、 4.5 亿美元 C 轮融资;4)Adept:发布了自研的大模型 Action Transformer(ACT-1),今年 3 月宣布获得来自包括微软、英伟达在内的 3.5 亿美元 B 轮融资;5)Cohere:主要业务是给用户提供应用大语言模型的 API,帮助用户创建特有使用场景和独有数据的大模型,今年 6 月获得了 2.7 亿美元的 C 轮融资,投资者包括英伟达、甲骨文和Salesforce。根据 Turing Post 的数据,截止 23 年 8 月已经 15 家生成式 AI 公司达到了 10 亿美元+的估值,主要为大模型的开发商及 AI 工具厂商。其中,这 15 家公司达到独角兽估值门
65、槛的平均时间仅近 4 年,而平均而言达到独角兽门槛的需要 7 年左右的时间。图 18:2023 年生成式 AI 投融资金额涨幅高达 464%图 19:已有 15 家生成式 AI 独角兽达到 10 亿美元+估值资料来源:CB Insights、华金证券研究所资料来源:Turing Post、华金证券研究所大部分生成式大部分生成式 AI 项目还处在早期,大部分资金投向了包括大模型开发在内项目还处在早期,大部分资金投向了包括大模型开发在内 AI 基础设施层基础设施层,而应用层资金流向仅占三成。而应用层资金流向仅占三成。根据 CB Insights 的数据,虽然生成式 AI 今年以来有多起超过 1亿美
66、元的大规模融资,但是行业总体上仍处于起步阶段,根据 CB Insights 统计的 360 家以上生成性人工智能公司中,27%尚未筹集任何外部股权融资,且超过一半的公司都处于 A 轮及更早轮次。同时,投融资的分布来看,自 22 年第三季度以来,包括大模型开发,API、MLOps、向 行业深度分析23/95请务必阅读正文之后的免责条款部分量数据库等在内的 AI 基础设施层,在投融资的数量仅占总数的 10%的情况下,投融资的金额占据生成式 AI 融资金额的 70%以上,这一方面突出了 AI 基础设施层资金密集型的特点,另一方面也体现了目前生成式 AI 还处在早期,应用层的项目尚不成熟。同时,约四分
67、之一的生成性人工智能资金流向了通用型的 AI 应用,主要包括文本、图片生成等领域,同时通用型应用的数量占绝对主导,占比达 65%,而相比之下,垂直行业应用目前无论投融资的数量还是金额都要远低于通用型应用。图 20:生成式 AI 项目大部分处于早期图 21:生成式 AI 投融资金额分布资料来源:CB Insights、华金证券研究所资料来源:CB Insights、华金证券研究所从应用层的融资中,人工智能助理(从应用层的融资中,人工智能助理(AI Assistants)获取的的资金最多,其次为文本、图)获取的的资金最多,其次为文本、图像像、代码及音频的生成代码及音频的生成。根据 CB Insig
68、hts 的数据:1)生成式交互(Generative Interfaces)总体上占据了应用层融资的大部分,其中主要包括 AI 助理、通用搜索、生产力和知识管理,自 22年第三季度以来共有 23 笔交易,金额达 27 亿美元,其中绝大多数资金流向了 AI 助理;2)其次为文本类应用,主要包括社交媒体、市场营销、AI 伴侣、文本总结、邮件工具等领域的生成式 AI 工具,自 22 年第三季度以来共有 24 笔交易,融资金额达 6.4 亿美元;3)视觉媒体类应用紧随其后,项目设计图像视频编辑、合成数据、视觉广告,产品营销,产品设计等领域,共有33 笔交易,总金额达 3.9 亿美元;4)代码同样是生成
69、式 AI 的热门领域,应用领域包括代码生成、自动化命令行、代码检查、代码搜索、网站及应用创建等。行业深度分析24/95请务必阅读正文之后的免责条款部分图 22:生成式 AI 应用层融资分布(22Q3-23Q2)资料来源:CB Insights、华金证券研究所3)应用框架:应用的四大赛道与产业逻辑生成式生成式 AI 应用按应用领域可以分为:通过工具,通用软件、行业软件、智能硬件四大类应用按应用领域可以分为:通过工具,通用软件、行业软件、智能硬件四大类。具体来看:1)工具型应用:包括聊天机器人、搜索引擎、文本工具、AI 作画以及代码工具等,应用领域主要集中在 C 端,产品的同质化程度较高,对底层模
70、型的能力存在高度依赖,目前 C 端应用正进入第一轮洗牌阶段;2)通用软件:主要包括办公软件、企业服务、IT 运维、软件开发、网络安全、数据智能等领域,各个赛道上均已出现标杆产品,大多数是智能助理(Coplilot)的形态,预计将在四季度进入商业化落地的关键阶段;3)行业软件:涉及金融、医疗、教育、工业、游戏、法律等多个行业,行业间差异化程度较大,2B 场景下产品目前成熟度仍低于通用软件,金融、医疗等头部厂商开始打造垂类大模型,未来对行业数据价值的充分挖掘是竞争的关键;4)智能硬件:汽车、机器人、智能终端等,无论智能驾驶还是机器人均具备巨大的市场空间,当前的瓶颈在于感知层与决策层,需要计算机视觉
71、等底层技术的进一步突破。行业深度分析25/95请务必阅读正文之后的免责条款部分图 23:生成式 AI 应用产业地图资料来源:华金证券研究所绘制生成式生成式 AI/大模型拥有三大底层元能力:感知、分析和生成:大模型拥有三大底层元能力:感知、分析和生成:1)感知:)感知:对文字内容的感知、对人类输入的需求理解能力,未来进化方向是从文字内容的感知到图像视觉的感知;2)分析:)分析:对信息和知识的检索、归纳与整合能力,未来进化方向是推理和决策。3)生成生成:文本生成能力较为成熟,未来进化方向为图片、视频、3D 等多模态生成能力的进一步提升。基于三大底层元能力基于三大底层元能力,未来的未来的 AI 应将
72、沿着应将沿着 AIGC(内容生成内容生成)、Copilot(智能助手智能助手)、Insight(知识洞察)、(知识洞察)、Agent(数字代理)四个重要的方向演进:(数字代理)四个重要的方向演进:1)AIGC(内容生成):(内容生成):生成式 AI 的最主要变革是它能够生成创造新的内容,包括文本、图像、视频、代码、3D 模型等,AIGC 应用发展将取决于大模型及多模态技术的进一步的提升;2)Insight(知识洞察知识洞察):基于大模型实现对数据、信息、知识的分析与整合,为用户提供洞察并辅助决策,主要应用于金融、医疗、军事等领域的分析、研究和决策工具。行业深度分析26/95请务必阅读正文之后的
73、免责条款部分3)Copilot(智能助手智能助手):将 AI 的能力深入嵌入具体应用场景中,作为应用的 AI 助手,能够主动理解使用者的意图并提供成型的方案,Copilot 是生成式 AI 应用最广泛的产品形态;4)Agent(数字代理数字代理):AI 智能体,相较于 Copilot,Agent 能够自动感知环境,通过自己的独立决策和行动来改变环境,并通过不断学习和自适应来提高性能,主要应用包括自动驾驶、机器人等。图 24:AI 应用的基础能力与演进方向资料来源:华金证券研究所绘制 行业深度分析27/95请务必阅读正文之后的免责条款部分图 25:AI 细分应用的标杆产品与发展路径资料来源:华金
74、证券研究所绘制工具型应用自去年下半年开始迎来爆发工具型应用自去年下半年开始迎来爆发,主要产品包括聊天机器人主要产品包括聊天机器人、搜索引擎搜索引擎、文本工具文本工具、AI 作画以及代码工具,电商、营销、设计是比较常见的应用场景。工具型应用的产品属性决定作画以及代码工具,电商、营销、设计是比较常见的应用场景。工具型应用的产品属性决定了对底层模型存在的高度依赖,竞争的同质化程度较高,主流应用厂商开始寻求差异化的定位了对底层模型存在的高度依赖,竞争的同质化程度较高,主流应用厂商开始寻求差异化的定位并且开始自研底层大模型。并且开始自研底层大模型。目前,聊天机器人、文本生成、代码生成等领域的工具大多是基
75、于GPT-4,但产品功能上与 GPT-4 重叠度较高,比如文本工具 Jasper AI 虽然集成了 GPT 模型的能力,但由于自身的场景化的壁垒不够,因此也在 GPT-4 的冲击下,流量开始明显下滑。而 AI作画应用普遍基于扩散模型,虽然 DALL-E2 的发布早于 MidJourney,但是随着模型能力和视觉表现上的提升,MidJourney 超越了 DALL-E2 成为了目前最流行的文生图在线工具。目前的主流工具型应用一方面会更多寻求差异化定位,比如 Character.AI、Infectetion AI 定位于主打陪伴和虚拟角色的聊天机器人,另一方面也在正在打造自己的大模型。工具型应用自
76、去年下半年以来经过爆发式增长期,在 6 月 ChatGPT 访问流量首次出现下降,在新一代大模型技术迭代前,行业正在进入第一轮的洗牌期。行业深度分析28/95请务必阅读正文之后的免责条款部分表 1:生成式 AI 访问量统计排行20232023 年年 7 7 月月 GenAIGenAI 网站访问量统计网站访问量统计 Top30Top30单位单位:万万/月月序号Name分类7 月上月同比序号Name分类7 月上月同比1ChatGPT聊天机器人150000-9.63%16Talk To Books阅读2997-6.57%2MicrosoftBing搜索引擎1214000.31%17Civitai图像
77、生成2996-1.93%3Canva Al设计工具41840-5.76%18Midjourney图像生成2677-6.17%4Adobe firefly图像编辑26210-0.24%19CheggMate教育2645-9.77%5DeepL写作翻译245700.41%20Perplexity Al搜索247011.16%6Character.AI聊天机器人206008.31%21Miro生产力2368-6.84%7Google bard搜索引擎1891034.52%22huggingface开发者社区2289-0.03%8Notion Al文本工具148103.66%23JanitorAl虚拟
78、角色1849-8.06%9Freepik AlImage Generator图像生成94363.33%24123RF AlSearch Engine设计助理16600.96%10POE聚合平台863922.49%25Al ReverseImage Search搜索引擎16401.31%11AmazonCodeWhisperer编程工具68053.43%26Leonardo.Ai图像生成155410.19%12Remove.bg图像编辑57791.90%27DALL-E2图像生成1540-18.59%13QuillbotParaphraser释义器4957-15.68%28Tome演示文稿类15
79、1633.71%14Khanmigo教育45144.60%29You搜索引擎1451-12.32%15Grammarly协作工具5722-3.03%30Al TimeMachine头像12934.98%资料来源:similarweb、华金证券研究所从工具型应用的几个应用领域具体来看:从工具型应用的几个应用领域具体来看:1)聊天机器人:)聊天机器人:ChatGPT 目前仍是流量最大的 AI 聊天机器人,虽然在今年 6-8 月流量有小幅下降,但总体来看,依托于底层模型的强大能力,市场地位仍非常稳固。另一类是主打陪伴,能够创建虚拟角色的聊天机器人,代表有 Character AI 以及 Infect
80、etion AI 的聊天机器人 PI,这类机器人更注重人格属性,与 ChatGPT 形成差异化竞争,用户可以完全自己创作角色来满足社交、情感、陪伴等需求,目前这类应用的流量还在稳步增长。这一领域的头部厂商大多在开发自己的大模型,其中 Inflection AI 表示计划打造一个包含大约 2.2 万块英伟达 H100 芯片的计算集群,总计算量估计是用于训练 GPT4 全部计算量的 3 倍。未来聊天机器人更具前景的应用是集成于文档、网页、知识库等具体的应用环境中,以 AI 助手(Copilot)的方式与用户进行交互,包括回答问题、提供建议、执行任务等,这也是这类产品未来演进的主要方向。2)搜索引擎
81、搜索引擎:生成式 AI 与搜索引擎的结合具体体现在,传统搜索引擎主要基于关键词匹配,而基于大模型的搜索的核心在于意图理解和内容生成,具备了整合、提炼、串联信息的能力,能更好地应对开放式问题。今年 2 月微软将生成式 AI 整合到了自家搜索引擎中,并命名为“New Bing”。在接入了之后 GPT,Bing 访问量虽然有一定程度的增长,但目前来看还远未能撬动谷歌在搜索引擎市场的绝对领先地位,同时谷歌也推出了 Google Bard 来应对 New Bing 的冲击,除了微软和谷歌等巨头之外,目前硅谷还有不少 AI 初创企业投入到了搜索引擎这一赛道。行业深度分析29/95请务必阅读正文之后的免责条
82、款部分3)写作工具:)写作工具:文本写作类 AI 工具大多是基于 GPT 模型,在模型进行一些定制性的优化,或者通过预先设置 Prompt,来满足一些文案生成的需求,整体上看对 GPT 等底层大模型有较大的依赖,竞争力在于场景化定制的模板和功能。目前头部的应用有 Notion AI、Jasper AI、CopyAI 等,其中 Notion AI 侧重通用写作,主打全面的文本生成和内容编辑功能,而 JasperAI、CopyAI 更侧重于营销工具,内置了广告文案、邮件、博客文章、推文等数十种模板和文案功能。目前来看这一领域的产品同质化程度较高,在 GPT-4 的冲击下,头部的写作类应用包括 Ja
83、sper AI近三个月流量开始快速下滑。4)AI 作画作画:主流三大文生图工具为 DALL-E2、Stable Diffusion、Midjourney,其中 DALL-E2与 MidJourney 是闭源模型,可以实现在线访问,使用门槛低,用户输入一定提示词后即能实现文生图。虽然 DALL-E2 的发布早于 MidJourney,但是随着 MidJourney 在视觉表现上超越了DALL-E2,成为了目前最流行的文生图在线工具。Stable Diffusion 主要走开源路线,可以在用户本地部署与运行。目前开源和闭源工具在商业模式上也存在较大差异,MidJourney 能够通过向用户直接提供
84、订阅服务来收费,而 Stable Diffusion 的基础模型免费,主要通过为企业提供定制模型来实现商业化。5)编程工具编程工具:GPT-4 自身的在编程能力上相较于之前版本有了很大程度的提升,除了代码生成能力之外,在容错空间更大的重构代码、代码测试以及修改 bug 等环节得到了更频繁的应用,能够带来研发过程中显著的效率提升。同时包括 Github、HuggingFace、Replit 等开发者社区今年以来的项目和流量大幅增长,今年 3 月 Github 发布了接入 GPT-4 的新版本编程辅助工具Github Copilot X,在之前的代码生成等基础功能上增加了语音扩展、智能文档、自动告
85、警、自动扩写等功能,是市场上最先进的 AI 辅助编程工具。表 2:工具型应用各赛道主要产品分类分类产品产品聊天机器人OpenAI(ChatGPT)、Inflection(Inflection AI)、谷歌(Bard)、Character AI(Character AI)搜索引擎Google(Google Bard)、微软(New Bing)文本工具Notion AI(Notion AI)、Jasper(Jasper AI)、Copy AI(Copy AI)AI 作画OpenAI(DALL-E2)、Stability AI(Stable diffusion)、Midjourney(Midjour
86、ney)、Canva(Text to Image)代码工具OutSystems(Morpheus)、Mendix(Mendix 10)、Github(GitHub Copilot)、Salesforce(CodeGen)音频工具Deepmind(WaveNet)、aikodex(Deep Voice)、MusicAutoBot(MusicAutoBot)3D 模型Nvidia(Magic3D)、LumaLabsAI(Luma AI)、谷歌(DreamFusion)视频工具Deepfakes Web(Deepfakes APP)、Wilson Yan 团队(VideoGPT)、Gliacloud
87、(GliaStudio)、Meta(Make-A-Video)、谷歌(Imagen video)资料来源:华金证券研究所整理在在通用软件通用软件市场市场,生成式生成式 AI 在办公软件在办公软件、企业服务企业服务、IT 运维运维、软件开发软件开发、网络安全网络安全、数据数据智能等应用已经率先落地,并已经进入商业化的前期。主要赛道上均有标杆产品出现,大多数智能等应用已经率先落地,并已经进入商业化的前期。主要赛道上均有标杆产品出现,大多数是智能助理是智能助理(Coplilot)的形态的形态。包括办公软件领域的 Office 365 Copilot,以及企业服务领域的Salesforce Einst
88、ein GPT,目前产品已经公布定价,预计将在四季度进入商业化落地的关键阶段;行业深度分析30/95请务必阅读正文之后的免责条款部分此外解决方案型的 AI 厂商商业化落地的竞争更快,比如 Palantir、Palo Alto Networks 的生成式AI 产品已经在实际场景中得到应用且已经带来相应的收入贡献。具体来看:图 26:通用软件市场应用进展资料来源:华金证券研究所绘制1)办公软件:办公软件:主流的 AI+办公应用包括微软 365 Copilot 和谷歌 Duet AI,目前全面嵌入了Microsoft Office 及 Google workspace 办公套件,在这一领域的竞争对手
89、主要包括聚焦在文字、表格、演示文稿(PPT)、邮件、笔记等单个应用领域的 AI 生产力工具,头部应用有文本类的Notion AI、jasperAI、Copy AI,表格类的 SheetAI、演示文稿类的 Tome、SlidesAl 等。目前微软作为办公软件巨头,凭借 Office 套件的用户基数和网络效应,在这一赛道占据明显优势。7 月Microsoft 365 Copilot 定价公布,未来 AI+办公具备非常清晰的商业化前景。2)创意软件:创意软件:与办公软件格局类似,目前主流 AI+创意软件包括 Adobe Firefly、Canva AI等套件类产品以及单点工具产品。今年以来 Adob
90、e 股价走势强劲,得益于 AI 的驱动以及业绩的 行业深度分析31/95请务必阅读正文之后的免责条款部分超预期,年初至今涨幅达到 67%。Adobe Firefly 的优势在于与 Adobe 现在有的产品能够实现很好的结合,为用户提供了大量的选项、素材、模板、工具包,进一步降低了用户画图、修图的门槛,而不像 Midjourney 更依赖提示词。同时,Adobe 对于训练数据的要求非常严格,对于必须确保输出图像版权的用户,Adobe Firefly 具备很大优势。但由于训练素材来源受限,这也会导致在生成的性能上弱于拥有一些主流文生图工具公司。目前 Adobe 已经明确提出将启动 AdobeFir
91、efly 的商业化。3)企业服务:企业服务:目前生成式 AI 已经与企业服务领域的主要产品 CRM、ERP、财务、HR、OA 实现了不同程度的结合,短期来看营销、客服领域(CRM)的产品成熟度最高,龙头厂商Salesforce 已经初步实现商业化。同时目前 ERP、财务、HR、OA 已经相对应的 AI+产品推出,主要侧重于利用 AI 进行数据挖掘来实现业务洞察和流程优化,相关产品功能还尚待完善,且还未进入商业化阶段。从参与厂商来看,这一领域的主要参与者仍是各个赛道上的主流玩家,包括CRM 领域的 Salesforce、ERP 领域的 Sap、Oracle,HRM 领域的 Workday。同时微
92、软 3 月发布了 CRM 和 ERP 领域的生成式 AI 产品 Dynamics 365 Copilot,是 AI+企业服务领域的有力竞争者。4)IT 运维运维:而大模型/生成式 AI 能够进一步提升 IT 运维的自动化和智能化水平,体现在其具备更强大的数据分析能力,以及更高效的人机交互模式,目前这一领域的龙头厂 Servicenow已经推出生成式 AI+IT 运维的相关产品,并发布了未来生成式 AI 的产品路线图。同时,针对监控 OpenAI 等大模型 API 的使用情况及 Token 的消耗的需求,Datadog 已经推出了监控各种OpenAI 模型 API 使用模式、成本和性能的产品,帮
93、助用户对于了解内部大模型的使用情况以及控制成本。5)软件开发软件开发:虽然生成式 AI 本身具备很强的代码生成能力,代表包括 GPT-4 以及 Github今年发布的编程辅助工具 Github Copilot X,但是由于生成式 AI 自身存在的幻觉等问题,仍然难以大规模应用于大型软件开发工作流程中。目前行业主流低代码平台中提供了企业级开发工具,具有内置的安全性、性能叉兼容性等方面的机制,可防止开发人员在使用 AI 编程时生成存在安全漏洞或不可靠或未知依赖项的代码。目前头部的低代码厂商包括微软、Salesforce、ServiceNow等企业服务巨头和 OutSystems、Mendix 等第
94、三方厂商均正在布局这一赛道,此前微软低代码套件 Power Apps 就是 GPT-3 首批商业化应用,而 Salesforce、ServiceNow 也将 AI+低代码能力其集成到自身的解决方案之中。6)网络安全:网络安全:生成式 AI+安全的最大机会来自于安全运营的自动化程度的提升。3 月微软发布了首个基于大模型的 AI+安全大脑形态 security copilot,此后 Palo Alto Networks,Crowdstrike,Fortinet 等头部安全厂商均发布了 AI+“安全大脑”产品,其中包括 Palo AltoNetworks 的 XSIAM、Crowdstrike 的
95、Charlotte AI。AI+“安全大脑”所带来的的安全运营能力提升主要体现在两个方面,一是威胁检测,即发现问题的能力,二是响应处置,即解决问题的效率。在 AI 驱动下,今年头部安全厂商 Palo Alto Networks,Crowdstrike,Fortinet 的股价均有强劲表现。7)数据智能:数据智能:数据智能的头部厂商为全球大数据龙头厂商 Palantir,今年推出了生成式 AI平台 AIP,可用于军事和商业领域。目前 AIP 在军事和国防领域已经开始实际应用,军队可以利用 AIP 平台,不仅显示和分析战场的情报,增强对全面作战态势的感知,并参考 AIP 提出的作 行业深度分析32
96、/95请务必阅读正文之后的免责条款部分战计划来辅助决策,拥有改变军事规划和决策的能力。此外,全球主流的综合 IT 服务商和 IT 咨询公司均推出了生成式 AI 相关的产品及解决方案,未来在底层模型和算法普惠的趋势下,这一领域比拼的将是客户资源以及对垂直行业的深度理解。表 3:通用软件各赛道主要产品分类分类产品产品办公软件文本类:Notion AI(Notion AI)、Jasper(Jasper AI)、Copy AI(Copy AI)、Anyword(Anyword);表格类:SheetAI(SheetAI)、Coefficient(Coefficient GPT Copilot);演示文稿
97、类:Slides(SlidesAl)、ChatBA(ChatBA)、Tome(Tome AI)、Gamma(Gamma AI);办公套件:微软(Officce 365 copilot)、谷歌(Duet AI)。企业服务ERP:SAP(SAP Business AI)、Oracle(Oracle AI)、微软(Dynamics 365 Copilot);CRM/财务:Salesforce(Einstein GPT)、COMPASS(Compass CMA)、HubSpot(ChatSpot)、Monday(monday AI Assistant)、Sprinklr(Sprinklr AI+);H
98、RM/OA:Workday(Workday Skills Cloud)、CloudApperI(hrGPT)。IT 运维Servicenow(ServiceNow Generative AI Controller&Now Assist for Search)、Atlassian(Confluence)、Aisera(AiseraGPT)、BMC(HelixGPT)、Workday(Workday Skills Cloud)、Bits(Datadog)、Splunk(Splunk AI)、AppDynamics(AppDynamics.v23.6)、Dynatrace(Davis AI)软件开发
99、Pegasystems(Pega GenAI)、Appian Corporation(Appian AI Copilot)、UiPath(UiPath Apps)、Mendix(Mendix10)、OutSystems(Morpheus)、微软(Power Apps)、UiPath(UiPath Apps)网络安全PALO ALTO NETWORKS(AIOps for NGFW)、crowdstrike(Charlotte AI)、FORTINET(FortiAIOps)、谷歌(SecurityAI Workbench)、微软(security copilot)、Lookout(Lookou
100、t SAIL)、crowdstrike(Charlotte AI)数据智能Palantir(AIP)、C3(C3 生成式 AI 产品套件)、NTT(行业生成式 AI)、ATT(Ask AT&T)、雷神(Raiven)资料来源:华金证券研究所整理目前生成式目前生成式 AI 在游戏在游戏、法律法律、教育教育、电商等电商等 C 端场景有较多的结合端场景有较多的结合,而在医疗而在医疗、金融金融、工工业等业等 B 端场景下生成式端场景下生成式 AI 产品的成熟度仍然偏低。产品的成熟度仍然偏低。在行业类应用场景中是 AI 助手(Copilot)同样得到了广泛应用,而未来在金融、医疗、工业等领域,最具前景的
101、应用来自于数据挖掘和知识洞察(Insight)类工具。同时,相较于通用大模型,垂直行业大模型在金融、医疗等领域有着更加深度的应用,一是由于安全及隐私保护等要求,行业数据大多存储在本地,通用大模型在缺乏必要的训练数据,二是垂直行业的数据量级大,涉及系统又比较复杂,通用大模型在解决专业问题的能力上不如垂类大模型。包括彭博社推出的金融大模型 Bloomberg,以及 Meta 公司推出的蛋白质大模型 ESMFold 均证明了垂类大模型的专业性能要超过通用大模型,目前各行业头部厂商也在开始自建垂类大模型。行业深度分析33/95请务必阅读正文之后的免责条款部分图 27:行业应用:C 端场景成熟,B 端处
102、于起步阶段资料来源:华金证券研究所绘制1)金融:)金融:生成式生成式 AI 技术在金融领域的主要应用为数据分析工具,通过对金融大数据的挖技术在金融领域的主要应用为数据分析工具,通过对金融大数据的挖掘来实现知识洞察掘来实现知识洞察,典型应用包括证券领域的智能投顾典型应用包括证券领域的智能投顾,银行领域的智能风控等银行领域的智能风控等。其中,证券侧重于智能投研,功能包括研报生成、财务数据查询、盈利预测、投资组合建议等代表性产品有金融数据分析工具 FinChat 等;银行则侧重智能风控,通过对客户的信用历史、行为特征等数据进行分析,挖掘风险因素,实现信贷风险、反欺诈、反洗钱等行为预警,目前主要有开源
103、模型 FinGPT。同时,今年彭博社推出了专为金融行业从头打造的 500 亿参数大语言模型 BloombergGPT,训练数据来自于彭博社的财务数据,涵盖了金融领域的一系列主题,生成了 7000 多亿个标签的大型训练语料库。BloombergGPT 在金融领域的任务普遍拥有着超过通用大模型的表现。2)医疗医疗:化合物合成、靶点发现等医药研发是此次生成式 AI 变革突破的新场景。其中,医药研发目前主要通过 AI 大模型生成新型小分子、核酸序列和蛋白质,以及识别靶点、药物筛选等,代表性产品包括 AbSci、Integrated Drug Creation、CentaurAI 等;医院诊疗主要用于病
104、历生成、诊疗建议、分析诊疗记录等,以提高诊疗效率。目前,主要有 MyChart、SlicerDicer、DAXExpress 等产品。此外,医疗器械,如 CT、MRI 等与图像相关的一体化器械,在生成式 AI 的赋能下将进一步增强医学图像等非结构数据的处理能力。3)教育:)教育:生成式 AI 目前主要应用于面向 C 端的语言学习和学习工具场景,目前率先实现商业化。其中,语言学习龙头厂商 Duolingo 基于 GPT-4 推出的 Max 版本新增了 Explain MyAnswer 和 Roleplay 两项功能,订阅价格翻了 4 倍,同时带动了 Duolingo 股价的上涨,年初至今涨幅最高
105、超 130%;学习工具 Khanmigo 定价 9 美元/月,Q-Chat 订阅为 7.99 美元/月,行业深度分析34/95请务必阅读正文之后的免责条款部分CheggMate 计划定价在 15.95 美元-19.95 美元之间。此外,在线教育场景旨在改善其现有功能,仍处于探索阶段。4)工业:)工业:当前大模型的应用主要聚焦在研发设计中的创成式设计、草图生成等辅助类设计的应用,以及运维管理中业务流程信息化 CRM、ERP 等软件,生产制造环节由于生产环境的安全性与稳定性要求较高,生成式 AI 技术应用还未完全成熟。目前,工业大模型参与者主要包括工业软件厂商、互联网科技厂商、平台厂商等,但由于工
106、业场景的复杂度,很多数据不可读取,因此工业软件厂商、平台厂商通常与具备大模型能力的互联网科技厂商进行合作。5)游戏:)游戏:游戏创作效率的提高是生成式 AI 赋能游戏行业最显著的特点。一方面,生成式AI 技术能够从现有视频中直接捕获动画,无需通过演员穿戴动作捕捉服进行记录,节省人力成本。目前,Kinetix、DeepMotion、Move Ai 等公司正在探索这一领域;另一方面,生成式 AI 能够帮助游戏开发者大幅减少游戏设计时间和成本。代表性产品有 Unity 的创建游戏 AI 工具 UnityMuse和推理引擎工具Unity Sentis和Roblox的游戏创建工具CodeAssist和M
107、aterial Generator。此外,初创公司正在探索利用生成式 AI 技术创建游戏中的 NPC 角色,来增加游戏的自由度和体验。6)法律法律:诉讼文书的制作和“示意证据”的生成是目前 AI+法律应用最广泛的领域。其中,诉讼文书的制作是 AI 最早的应用领域,能够有效提高法律文书的审查与制作效率与准确性;“示意证据”能够以生成文本、图片、视频、音频、模型的方式展示证据,辅助司法人员直观地观察和理解证据。表 4:行业软件各赛道主要产品分类分类产品产品金融智能投研:Stratosphere(FinChat);智能风控:AI4Finance(FinGPT);智能投顾:Morgan Stanely
108、(财富顾问聊天机器人)、JPMorgan(IndexGPT);智能营销:Lemonade(AI.MAYA);智能客服:LTX(BondGPT)、Helvetia(Clara)医疗医药研发:AbSci(Integrated Drug Creation)、Exscientia(CentaurAI)、Insilico Medicine(ChatPandaGPT);医院诊疗:Nuance(DAX)、Epic System(MyChart)、亚马逊(AWS HealthScribe)、Hippocratic(Hippocratic AI)、Doximity(DocsGPT)、Nabla(Nabla Co
109、pilot)、Babylon Health(Babylon App);医疗器械:Cleerly(冠状动脉 CT 扫描)、Heartflow(HeartFlow FFRcT Analysis)、Medis medical imaging(Medis Suite MR)教育语言学习:Duolingo(Duolingo Max)、ELSA Speak(ELSA AI)、Speak(AI Tutor);学习工具:Chegg(CheggMate)、Quizlet(Q-Chat)、Qanda(Qanda APP)、Photomath(Photomath APP)、Brainly(Ginny)、EMBIBE
110、(EMBIBE Lens);在线课程:Udemy(Udemy APP)、Khan Academy(Khanmigo)工业研发设计:Autodesk(Fusion 360)、Dassault(CATIA GDE)、Cadence(Cerebrus)、PTC(Creo Generative Design)、Synopsys(Synopsys.ai)Ansys(AnsysGPT);生产控制:Rockwell(FactoryTalk Analytics LogixAI)、SIEMENS(Teamcenter Assistant)游戏Unity(Unity Muse)、Roblox(Code Assis
111、t&Material Generator)法律Legalzoom(Legalzoom)资料来源:华金证券研究所整理 行业深度分析35/95请务必阅读正文之后的免责条款部分AI+智能硬件:目前生产式智能硬件:目前生产式 AI 与智能硬件的结合主要分为两个方面:与智能硬件的结合主要分为两个方面:一是个人助手,应用场景包括智能座舱、智能音箱、家用机器人等各类智能终端,相较于过去的语音交互模式,大模型和生成式 AI 技术提升了感知和生成能力,进而带来了用户体验的提升,但是总体而言产品门槛相对较低,另一类则为数字代理 AI Agent,主要应用包括自动驾驶、智能机器人等,具备更加广阔的应用空间。AI a
112、gent 能够感知环境、进行决策和执行动作的智能实体,接收输入数据(例如传感器信息、文本、图像等),通过分析和处理这些数据,理解环境和任务要求,并做出相应的决策和行动。目前 AI Agent 在感知与决策能力上仍存在瓶颈,未来突破的关键在计算机视觉等底层技术的突破。1)汽车:)汽车:生成式 AI 目前主要应用于智能座舱内的车载语音助手,以及自动驾驶数据标注、算法迭代、仿真系统等场景。其中,车载语音助手在生成式 AI 的赋能下不需要唤醒词即可实现语音交互功能,缩短响应时间。代表性产品为 Cerence Studio;自动驾驶方面,生成式 AI 技术不仅能够提高数据处理环节自动标注的效率,还能加强
113、自动驾驶感知与规控精度,加速自驾算法迭代,以特斯拉 FSD 算法为代表。2)机器人机器人:生成式 AI 对于人机交互能力的提升将率先促进人形机器人、服务机器人成为“具身智能”的载体,而工业机器人由于工业领域的环境复杂度较高,以及与人交互需求较低,更依赖于机器视觉、神经网络等技术的突破。其中,人形机器人已经初步实现商业化应用,1Xtechnologies 研发的 EVE 实体机器人已经作为安保机器人投入使用,而下一阶段将在医院、养老院等场所投放;服务机器人面向 C 端,通常应用于清洁、外送、商场等场景,通过生成式AI 实现语音、图片等多模态方式输入,预测并理解用户当下情感,及时作出反应,旨在降本
114、增效。主要有礼宾机器人 Connie,餐饮机器人 Adam、自主安全机器人 ASR 等。表 5:智能硬件各赛道主要产品分类分类产品产品汽车智能座舱:Cerence(Cerence Co-Pilot)、stellantis(STLA SmartCockpit)、奔驰(第三代 MBUX 读心语音助理);自动驾驶:Tesla(FSD)、Aurora Innovation(Aurora Driver)、英伟达(DRIVE Chauffeur)、Waymo(Waymo Driver)机器人人形机器人:1XTechnologies(EVE)、Engineerd Arts(Ameca)、Tesla(Opti
115、mus);服务机器人:IBM(礼宾机器人 Connie)、Knightscope(自主安全机器人 ASR)、Richtech Robotics(餐饮机器人 Adam);工业机器人:ABB(Genix Copilot)、安川(Alliom)、KUKA(KUKA.Sim)智能终端Innovative Eyewear(首款支持 ChatGPT 智能眼镜)、Petey(Petey App)资料来源:华金证券研究所整理生成式生成式 AI 产品目前的商业模式主要包括功能订阅产品目前的商业模式主要包括功能订阅、按量付费按量付费、产品销售等产品销售等,其中其中 C 端应用端应用以功能订阅和按量付费为主,以功能
116、订阅和按量付费为主,B 端应用则主要为功能订阅和产品销售。端应用则主要为功能订阅和产品销售。由于生成式 AI 应用在调用大模型 API 时会产生固定费用,因此并不适合采取与互联网应用类似的免费获客的商业模式。目前第一批生成式 AI 应用包括 Jasper AI、Notion AI、MidJourney 等均已经成功实现商业化,其中 Notion AI、Jasper AI 等文本类应用大多采取订阅付费的方式,大多定价在 20-50 美元/每月,行业深度分析36/95请务必阅读正文之后的免责条款部分同时 Office 365 Copilot 包含了全部办公套件的 AI 功能,定价 30 美元/月。
117、而在图片生成应用中,MidJourney 采取功能订阅的方式进行收费,区间为 10-60 美元/月,目前已经实现超 1 亿美元收入。同时按量收费也是生成式 AI 应用普遍的收费方式,比如 DALL-E2 采用积分制进行图像生成,每条指令可以生成 4 张,15$可兑 115 积分,相当于每条指令 0.13$或每张图 0.0325$。表 6:C 端 AI 应用工具的商业化情况分类分类产品产品商业模式商业模式商业化商业化聊天机器人ChatGPT功能订阅ChatGPT 免费版由 GPT-3.5 驱动,用户订阅 Plus 版可链接 GPT-4 获得更快的响应并解锁插件、数据分析等功能。Plus 版订阅价
118、 20$/月。GPT-4 API 接口将输入和输出分开计费,输入 0.03$/1K tokens,输出 0.06$/1K tokens。聊天机器人Character AI功能订阅基础服务:免费提供高级版本:每月收费 9.99 美元文本工具Jasper AI功能订阅1、Jasper AI 个人版订阅 49$/月或 468$/年,仅支持 1 人使用;2、团队版订阅 99$/月或 588$/年,支持 3-10 人共用;3、企业版独立定价,支持自定义模块、高级数据管理分析等功能。文本工具Anyword功能订阅Anyword 个人版订阅 49$/月或 468$/年,仅支持 1 人使用;团队版订阅 125
119、$/月或 1188$/年,支持 3-5 人共用;企业版独立定价,解锁数据定制、API 接入等服务。PPT 工具Gamma AI功能订阅Gamma AI 功能内置在 Gamma 中,兑换积分使用。Plus 版订阅用户每月 400 积分,收费10$/月或 96$/月;Pro 版订阅用户积分无限,收费 20$/月或 192$/月。图像工具DALL-E2按量付费DALL-E2 采用积分制进行图像生成,每条指令可以生成 4 张,15$可兑 115 积分,相当于每条指令 0.13$或每张图 0.0325$。图像工具Midjourney功能订阅四种订阅方案:Basic 版 10$月或 96$/年,快速 GP
120、U 时间 3.3h/月,并发作业数 3 个,等待队列数 10 个;Standard 版 30$月或 288$/年,快速 GPU 时间增至 15h/月;Pro 版60$月或 576$/年,快速 GPU 时间增至 30h/月,增加快速作业数 12 个;Mega 版 120$月或 1152$/年,快速 GPU 时间增至 60h/月。音频工具DeepVoicelicense1、个人或小型团队:80$2、大企业或多用户群体:240$文本工具Notion AI功能订阅Notion AI 以附加形式添加在 Notion 的其他付费计划中,订阅标准为 10$/月或 96$/年。PPT 工具SlidesAI功能
121、订阅SlidesAI 轻量版订阅 7$/月或 60$月/年,每月 50 次 AI 生成;专业版订阅 14$/月或 120$/年,每月 200 次 AI 生成;团队版订阅 28$/月或 240$/年,新增主题编辑器、共享媒体库等功能。3D 模型Luma AI按量付费Luam AI 可以免费使用,而使用额外的 API 功能,则收取每个 3D 模型 1$的费用。视频工具GliaStudio功能订阅GliaStudio 的三种订阅模式均为独立定价,专业版最多可创建 50 个视频,分辨率达720P;商业版最多可创建 100 个视频,分辨率达 1080P;企业版创建视频数量不限,且提供多个品牌主题。音频工
122、具WaveNet按量付费每月 0-100 万字符免费使用,超出部分按照每字符 0.000016$的标准收费,即每 100 万字 16$。PPT 工具Tome AI功能订阅Tome AI 免费版提供 500 个 AI 积分用于 PPT 生成;专业版 10$/月或 96$/年,解锁无限积分,AI 使用无限制;企业版独立定价,增加自定义磁铁和白手套模板功能。资料来源:华金证券研究所整理B 端即将进入全面商业化阶段端即将进入全面商业化阶段。7 月微软 Office 365 Copilot,Salesforce Einstein AI 等海外标杆 AI 应用定价公布,且定价超出预期。其中,面向 Offi
123、ce 365 E3、E5、商业标准版和商业进阶版的订阅商户,Office 365 Copilot 的定价为每个用户 30 美元/月。相较于 Office 主线产品 15-30 行业深度分析37/95请务必阅读正文之后的免责条款部分美元/月的定价,此次针对 AI 功能的单独定价显著超出预期,最高提升了 2 倍以上。同时全球CRM 龙头 Salesforce 宣布正式向所有用户开放 AI 产品,服务 GPT 和销售 GPT 两个独立模块分别单用户每月付费为 50 美元。此外,Palantir、PALO ALTO NETWORKS 的 AI 产品已经在实际场景重得到应用且已经带来相应的收入贡献,四季
124、度 AI 应用将正式进入商业化落地阶段。表 7:B 端 AI 应用工具的商业化情况分类分类产品产品商业模式商业模式商业化商业化办公软件Office 365copilot功能订阅适用于 Microsoft 365 E3、E5、Business Standard 和 Business Premium 客户,每位用户定价 30$/月办公套件Duet AI功能订阅Duet AI 订阅标准为 30 美元/月。图像工具Adobe Firefly功能订阅Firefly 测试版目前上线 Photoshop 和 Illustrator 可免费试用,测试结束后将随用户订阅 Adobe 相应产品而开放使用。企业服务
125、Einstein GPT功能订阅Sales GPT 包含在 Sales Cloud Einstein 中,定价 50$/月,Service GPT 包含在 Service Cloud Einstein 中,定价 50$/月软件开发ServiceNowApp Engine项目制按需求进行定制软件开发Mendix 10项目制1)一个应用:Free 版免费,Basic 版 50$/月,Standard 版 800$/月,Premium版独立定价;2)不限制应用数:Free 版免费,Standard 版 2000$/月,Premium 独立定价软件开发Github Copilot功能订阅1、个人版:1
126、0$/月或 100$/年2、商务版:每个用户 19$/月网络安全XSIAM功能订阅BASE-ENT 版包年 120000$,面向拥有 1000 个以内员工的企业;BASE-GB 版包年48000$,限制每日传输 100GB 的上传数据量;PREM-SUCCESS 版需要定制软件开发Power Apps功能订阅Power Apps 定价为每个活动用户 10$/月金融FinChat功能订阅1、个人免费版:每天 10 次提问;个人付费版增加股票筛选器和盈利日历功能,20$/月、200$/年;2、企业用户独立订购,享受图表可视化、编辑,支持外部数据导入等功能。教育Duolingguo功能订阅Duoli
127、ngo 付费订阅包括 Super 版和 Max 版:订阅 Super 版 6.99$/月,享受无广告并解锁全部课程;订阅Max版30$/月或168$/年,基于GPT-4模型新增ExplainMy Answer 和 Roleplay 功能。医疗DAX Express按量付费DAX Express 是在 DAX 基础上接入 GPT-4 打造,DAX 报价每年每位医生约8000-10000$,DAX Express 报价暂未公布。工业Forma功能订阅Forma 的订阅标准为 180$/月,1445$/年。资料来源:华金证券研究所整理二、生成式 AI 应用细分赛道梳理1)AI+办公软件办公软件通常包
128、含了文字、表格、演示文稿(办公软件通常包含了文字、表格、演示文稿(PPT)等工具,是本轮生成式)等工具,是本轮生成式 AI 浪潮中产品浪潮中产品逻辑变化最大的细分领域之一逻辑变化最大的细分领域之一。目前主流的 AI+办公应用可以分为两大类别:一类是办公套件的AI 助手,主要有微软 Copilot 和谷歌 Duet AI,目前全面嵌入了 Microsoft Office 及 Google 行业深度分析38/95请务必阅读正文之后的免责条款部分workspace 办公套件,并已经初步实现商业化;另外一类是单点 AI 工具,通常包括了文本类的Notion AI、JasperAI、Copy AI、An
129、yword,表格类的 SheetAI、演示文稿类的 TomeAI、SlidesAl等,此外还有许多功能更加细分的产品,比如笔记、思维导图、简历制作,协同办公等工具,目前常见的 AI+生产力工具已经达到了上百种,这也是 AI+应用中数量最多的一类。具体来看:1)文本类:在各类单点工具中,目前文本写作类应用占据了半壁江山,这与语言大模型的成熟较高有直接关系,自 GPT-3 发布之后,大量的文本类 AI 工具开始涌现,这些应用普遍大多是基于 GPT 模型,自己再做一些定制性的优化,也有很多是基于 gpt 等模型的 api,通过预先设置 prompt,来满足一些文案生成的需求。目前头部的应用 Noti
130、on AI、JasperAI、Copy AI、Anyword等,主打更加全面的文本生成和内容编辑功能,同时 Jasper AI、Copy AI 更侧重于营销工具,生成广告文案、产品描述、邮件、博客文章、推文,通过内置多达数十种营销模板和文案生成的功能;2)电子表格类:这一领域目前尚未出现大量类似 Notion AI 这类文本工具,主要原因在于电子表格的核心在于计算,目前主要的创新点是将电子表格合并到文档环境中以及强化电子表格的代码和自动化计算能力。目前 Excel 的领先地位仍难以被撼动,其最大竞争对手是 Google Sheets,功能上基本保持一致,主要区别在于在线分发,可以简化协作;3)
131、演示文稿类:生成式 AI 能够帮助使用者快速构思创作框架并流畅展开内容创作,这一领域中 Powerpoint 和 Slides 是最常用的演示文稿工具,新兴工具包括 Gamma AI、ChatBA、SlidesAI、TomeAI 等,其中 GammaAI、Slides AI 强调模板功能,内置多种主题库并提供图文、视频等创作素材,而 Tome 为 AI 原生应用,能够根据自然语言提示生成整个幻灯片,对各个幻灯片进行修改或添加新幻灯片。行业深度分析39/95请务必阅读正文之后的免责条款部分表 8:AI+办公软件标杆产品产品产品分类分类厂商厂商产品特性产品特性Office 365copilot办公
132、套件微软AI 功能内置于 office 办公套件,使用方式:1)嵌入调用,即在 Word、Excel、PowerPoint等应用中调用 Copilot 实现写作辅助,表格、图像、PPT 生成等任务;2)独立使用,Copilot提供 Business Chat 交互功能,用户可以与 Copilot 对话,像与真人助手一样完成任务。Duet AI办公套件谷歌AI 功能内置与于 Google Workspace 办公套件,包括 Gmail、谷歌 Docs、Sheets、Slides以及 GmailMeet 等应用,功能对标微软 Copilot,包括 Docs 和 Gmail 的写作辅助、Slides
133、的图像生成、Meet 的自动会议摘要等,同时推出 Sidekick 侧边栏功能,能跨应用完成任务。Notion AI文本Notion内置于 Notion,主要功能包括自动生成内容、撰写草稿、脑暴创意、修改纠错、翻译内容、内容优化等,支持笔记、编码等基本的在线文档功能,具备团队协作、项目管理等能力。Jasper AI文本JasperJasper.ai 是一款 AI 写作助手工具,能快速生成各种类型的文案和内容,覆盖了博客、推文、媒体广告、产品描述、语言翻译、营销电子邮件、电子书等,提供超过 60 多个模版;Jasper 的 AI 引擎结合了多个大型语言模型,包括 GPT-4。Copy AI文本C
134、opy.aiCopy.ai 利用 GTP-3 技术实现,自动化工具使用户能够在几秒钟内生成营销副本,功能覆盖社交媒体、标题、链接描述、博客创意等。Anyword文本AnywordAnyword 使用预训练和微调模型的组合,包括 GPT3,专为营销人员构建,旨在生成能实现营销目标的文案,能创建广告、博客、网站、电子邮件等,并在发布前预测性能分数。Gamma AI演示文稿GammaGamma AI 是一款基于 OpenAI 技术开发的演示文稿编辑工具,可以基于用户选择的主题生成初稿,也可以在导入大量文本后将其转换为演示文稿、文档或网页。ChatBA演示文稿ChatBAChatBA 是一款 AI 生
135、成 PPT 工具,使用 OpenAl 的 API,根据用户提供的提示或主题快速生成幻灯片。SlidesAI演示文稿SlidesSlidesAI 由 OpenAI 提供支持,能够实现文本辅助修改或翻译以润色文字,并基于主题自动生成 PPT 大纲并配图,还可以自动为整个文档添加注释以便于演讲。Tome AI演示文稿TomeTome AI 基于 ChatGPT 和 Dall-E 开发,可以将人工智能生成的图像和视频添加到演示文稿中,从而生成高质量、专业美观的故事和演示文稿,并与他人共享。CoefficientGPT Copilot表格CoefficientCoefficient 的 GPT Copi
136、lot 使用 AI 工具自动连接数据、构建报告并加速数据分析,内含“=GPTX()”表格函数能基于用户的自然语言实现表格清理、格式化、查询和分析数据。SheetAI表格SheetAISheetAI 使用 OpenAI 的 API,是一款能在 Google Sheets 内部运行的插件,帮助用户自动执行任务。SHEETAI_BRAIN 通过存储和检索信息来简化写作;SHEETAI_LIST 依据指令自动生成公式和答案;SHEETAI_FILL 自动填写产品描述,生成虚拟数据。资料来源:华金证券研究所整理AI+生产力工具的变革主要体现在内容生成生产力工具的变革主要体现在内容生成、人机交互和数据利用
137、三个层面人机交互和数据利用三个层面,短期来看短期来看,生生成式成式 AI 所带来的内容生成效率的提升体现的最为明显所带来的内容生成效率的提升体现的最为明显,长期看长期看,人机交互和数据利用能够为办人机交互和数据利用能够为办公软件的使用体验带来更大幅度的提升:公软件的使用体验带来更大幅度的提升:1)内容生成内容生成:生成式 AI 技术大幅提升了内容生产的效率,文字、图片、PPT、表格等各种内容能够大大节省在日常办公场景中制作 PPT、画 Excel 图、写 Word 文档中相关的内容生成、排版、微调所需要的时间。其中文字内容的生成最为成熟,因此 AI+办公工具中文字、文档、笔记类的工具的数量占据
138、了半壁江山。2)人机交互:)人机交互:从过去菜单、指令、快捷键式的交互方式转向了自然语言、多轮对话的方式进行交互,一方面是能够大幅提升办公软件的使用效率,另一方面是大幅降低了办公应用的使用门槛,能够让使用者以简单自然语言的方式,使用产品中的复杂功能。比如在 EXCEL 中有数千个可用命令,常用的仅数十个,现在可以使用自然语言来解锁更加丰富的功能。”行业深度分析40/95请务必阅读正文之后的免责条款部分3)数据利用数据利用:基于 AI 技术能够充分挖掘出沉浸在用户的历史数据当中的信息,包括对文本、图像、HTML、各类报表等结构化和非结构化数据进行关联分析,实现更加深度的数据利用,比如对于证券行业
139、的用户,可以对自己存储的研究报告,会议纪要等进行充分的关联和分析,来实现数据价值的最大化。图 28:AI+生产力工具变革主要体现在三个层面资料来源:华金证券研究所绘制AI+办公应用的标杆:微软办公应用的标杆:微软 365 Copilot。365 Copilot 在今年 3 月发布,集成了 GPT-4,将大模型(LLM)与 Microsoft Graph 的业务数据、Micros Office 365 中各类应用相互结合。使用方式包括:1)嵌入调用,即在 Word、Excel、PowerPoint、Outlook、Teams 等应用中直接调用 Copilot 完成各种任务,包括在 Word 中的
140、文本内容生成、文字内容优化包括检查错误、风格转换、润色扩写等;Excel 中根据用户的问题生成表格或数据模型,并创建可视化图表等,高级功能包括了数据透视表和生成及趋势解读、SWOT 分析等;PowerPoint 中可以将现有的书面文件转化为带有演讲者笔记和资料来源的演示文稿,或者从一个简单的提示或大纲开始一个新的演示,并使用自然语言命令来调整布局、重新编排演示文稿;2)独立使用,Copilot 还提供了一个全新的独立式交互方式Business Chat。用户可以通过自然语言与 Copilot 进行对话,像与真人助手一样完成各种任务。此外 Microsoft Graph 则是微软提供的一个平台,
141、可以将用户在Office 365 中使用过的日历、邮件、聊天、文档、会议等数据进行整合和分析,并实时反馈到用户现在工作流程包括会议、邮件等,以提供准确、相关的上下文响应。行业深度分析41/95请务必阅读正文之后的免责条款部分图 29:AI+办公应用的标杆:微软 365 Copilot资料来源:微软官网、华金证券研究所表 9:AI+金融产品目录应用应用功能描述功能描述Word可根据一个简短的提示,就能为用户创建一个初稿或者大纲,并根据需要从整个组织获取信息;可以将内容添加到现有的文件中,总结文本,改写部分或整个文件,使其更加简明;可以得到建议的语气:从专业到热情,从随意到感谢,以帮助用户达成正确
142、的音调;可以帮助用户改进写作,建议加强论点或消除不一致的部分Excel用自然语言向 Copilot 提出关于用户的数据集的问题,而不仅仅是简单的公式;揭示相关性,提出假设方案,并根据用户的问题建议新的公式;根据用户的问题生成模型,帮助用户探索用户的数据,而无需修改它;识别趋势,创建强大的可视化图表,或要求提供建议以推动不同的结果。Powerpoint可以将现有的书面文件转化为带有演讲者笔记和资料来源的演示文稿,或者从一个简单的提示或大纲开始一个新的演示;点击一个按钮就能缩减篇幅,并使用自然语言命令来调整布局、重新编排文本和完美的动画时间。Outlook与用户的收件箱和邮件一起工作,减少用户耗费
143、的时间;总结冗长的、错综复杂的电子邮件线程,不仅要了解所讲的内容,还要了解每个人的不同观点以及尚未回答的问题;用一个简单的提示来回应现有的电子邮件,或将快速笔记变成清晰、专业的信息从其他电子邮件或用户已经从整个 Microsoft 365 中获得的内容中提取;使用切换器来调整用户的笔记的语气或长度。Teams帮助用户进行更有效的会议,加快对话速度,组织关键的讨论点,并总结关键的行动,使整个小组知道下一步该怎么做;在用户的聊天中,Copilot 为用户解答具体的问题,或者追问用户错过的任何事情,所有这些都不会打断讨论的流程;将 Copilot 添加到您的会议和对话中,您现在也有一个强大的工具来帮
144、助完成常见的任务,如根据聊天历史创建会议议程,确定合适的人进行跟进,以及安排下一次签到。资料来源:微软官网、华金证券研究所 行业深度分析42/95请务必阅读正文之后的免责条款部分AI 生产力应用普遍依赖大模型的能力,功能同质化程度高,办公套件未来的优势仍将不断生产力应用普遍依赖大模型的能力,功能同质化程度高,办公套件未来的优势仍将不断强化强化。一方面一方面,AI 生产力应用,特别是文本写作类需要直面 OpenAI 的竞争,许多工具本质更多是对底层大模型的“套壳”后的简单应用,本身不具备太高的门槛。在 GPT-4 出台之后,对文本类应用造成了直接了冲击,包括这一领域的头部应用 Jasper AI
145、,随着 GPT-4 的发布,Jasper网站的访问流量在短短 3 个月内下降了近 40%,并在今年在 7 月开启裁员;另一方面,微软Copilot 和谷歌 Duet AI 等办公套件仍具备庞大的用户基础,且随着功能的不断丰富,将直接冲击到单点的 AI 办公应用,同时考虑办公套件工具存在较强的网络效应,未来这一赛道微软仍将占据明显的优势。图 30:微软 Office 办公套件产品的竞争者资料来源:红杉资本、华金证券研究所AI+办公软件具备明确的商业化前景,微软办公软件具备明确的商业化前景,微软 Copilot 定价的公布预示着办公是定价的公布预示着办公是 AI 在在 B 端商端商业化落地最快的领
146、域之一。业化落地最快的领域之一。近期微软在全球合作伙伴大会上宣布,面向 Office 365 E3、E5、商业标准版和商业进阶版的订阅商户,Microsoft 365 Copilot 的定价为每个用户 30 美元/月,相较于不同版本每用户每月 12.50 美元到 57 美元定价,365 Copilot 涨幅达 53%至 240%,超出了此前市场的预期。在此之前微软针对数百家大客户进行了 365 AI 功能的内部测试,这表明核心企业用户在使用 365 Copilot 的过程实现了生产力的显著提高。横向对比其他 AI 工具,Notion AI只提供笔记服务收费 19.8 美元一个月,而 Jaspe
147、r AI 则是每用户 49 美元每月,而微软 Office 365Copilot 包含了全部办公套件的 AI 功能,从定价来看相较于同类型产品并未明显偏高,明确了其他可对标办公类应用的商业化前景。行业深度分析43/95请务必阅读正文之后的免责条款部分2)AI+创意工具创意工具包括了图片创意工具包括了图片、视频视频、音频音频、3D 模型等模型等 AIGC 应用领应用领,在艺术在艺术、设计设计、娱乐娱乐、媒体媒体、电商等领域有非常广泛的应用电商等领域有非常广泛的应用。在多种模态的生成中在多种模态的生成中,现阶段最具前景的现阶段最具前景的是图片和是图片和 3D 模型的生模型的生成。创意工具的核心在于
148、内容的生成,用户会自动选择最优质的内容,因此应用公司必须在底成。创意工具的核心在于内容的生成,用户会自动选择最优质的内容,因此应用公司必须在底层模型和算法上具备很强的能力。当前多模态技术还处于早期,市场格局未完全确定,在英伟层模型和算法上具备很强的能力。当前多模态技术还处于早期,市场格局未完全确定,在英伟达、谷歌、达、谷歌、Adobe 等巨头进入同时,包括等巨头进入同时,包括 Midjourney 等公司同样拥有一席之地。等公司同样拥有一席之地。1)图片:目前 AIGC 中最热门的方向,2020 年后随着扩散模型、CLIP 等技术的突破,在图像生成技术上取得了质变,因此文生图也成为了创意工具中
149、数量最多的一个类别,最具代表性的文生图工具有 DALL-E2、Stable diffusion、Midjourney、Canva Text-to-Image。此外还有图像编辑工具,主要功能包括去水印、风格迁移、图像修复、换脸等的应用。2)视频:视频生成目前在技术上成熟度不高,更多基于图像生成的算法,除了视频生成之外还包括了视频编辑如画质修复、视频特效、视频换脸、视频剪辑等应用,代表应用有 DeepfakesApp、VideoGPT、GliaStudio、Make-A-Video、Imagen video 等。3)音频:音频合成在技术和商业化已经非常成熟,近年来大模型和优化算法的成熟能够基于大量
150、音乐数据集训练和优化算法来创建 AI 虚拟歌手,更加趋近于真人发声效果(如:AI 孙燕姿),这一领域的相关应用包括 WaveNet、Deep Voice、MusicAutoBot 等。4)3D 模型:3D 模型生成还处于早期,其中这一领域关键算法神经辐射场(NeRF)于 2020年于 ECCV 会议上提出,能够基于 2D 图像中生成 3D 图像或场景,目前已经成为 3D 模型构建的主流算法,并广泛应用于游戏、数字人、虚拟现实、增强现实、电子商务等领域,未来具备广阔应用空间,代表应用包括 Magic3D、Luma AI、DreamFusion。5)多媒体工具:综合了到图片、视频、3D 模型等多模
151、态生成的多媒体套件产品,代表为Adobe Firefly。行业深度分析44/95请务必阅读正文之后的免责条款部分表 10:AI+创意工具标杆产品产品产品分类分类厂商厂商产品特性产品特性DALL-E2图片OpenAIDALL-E2 是 OpenAI 旗下的图像生成人工智能工具,可在官网直接访问,能根据文本描述创建原创、逼真的图像,同时具备画布拓展、编辑修复、图像变体等功能。Stablediffusion图片Stability AIStable diffusion 是一款文生图工具,核心数据集在 LAION-Aesthetics 上训练,能在 10GB以下的 VRAM 上运行,可在几秒钟内生成 5
152、12x512 像素的图像。目前开源代码公布在 Github。Midjourney图片MidjourneyMidjourney 使用 DALL-E2 的 AI 算法从文本生成图像,能够接受用户输入并根据其制作独特的图片,以及自定义图像并调整颜色、形状和纹理。最新 V5 版本为更擅长关注图像中的手和皱纹等小细节。用户可以在 Discord 中加入 Midjourney 社区后订阅使用。Text to Image图片CanvaText to Image 是一款生成式 AI 支持的图像生成器,内置编辑器和滤镜混合功能,可供用户在 Canva APP 内免费使用,用户只需输入文本提示,就可以生成如水彩、
153、电影、霓虹灯、彩铅等多种风格的图像。DeepfakesAPP视频DeepfakesWebDeepfakes App 是在云端运行的在线 Deepfake 软件,用户可以在官网访问并上传源视频和目标视频,由 AI 来学习并渲染完成换脸剪辑。VideoGPT视频Wilson Yan 团队VideoGPT 在 Github 上开源,它使用 VQ-VAE 和 Transformers,学习原始视频的潜在表示,使用类 GPT 架构进行自回归建模,并从 UCF-101 和 Tumbler GIF 生成高保真自然图像数据集。GliaStudio视频GliaCloudGliaStudio 是一款人工智能视频生
154、成器,提供各式图片和视频素材,创造互动性高的视频内容,针对商业、新闻、生活等方面简化视频创作,可有效降低 50%的时间成本,供创作团队在官网上订阅后使用。Make-A-Video视频MetaMake-A-Video 由 Mata AI 提供支持,使用公开的数据集训练开发,只需几行文字,它就可以创作出风格多变的视频,还可以从图像创建视频或拍摄现有视频并创建类似的新视频。目前尚未开放使用。Imagen video视频谷歌Imagen Video 是一种基于级联视频扩散模型的文本条件视频生成系统,在给定文本后,使用基本视频生成模型和一系列空间和时间视频超分辨率模型生成高清视频。目前尚未开放使用。Wa
155、veNet音频DeepmindWaveNet 是一种基于语音样本进行训练的生成式 AI 模型,它通过预测声音的相互跟随来创建语音,每秒最多可生成 24000 个声音样本,通过包含语调、口音、情感等沟通层次,生成式语音提供了丰富性和深度。用户可以在 Google Cloud 中订阅 WaveNet 并使用。Deep Voice音频aikodexDeepVoice 是一款文本转语音人工智能解决方案,用户可在官网购买永久使用权。它使用专为 Unity 打造的 AI 生成逼真语音,可以从文本创建音频,修剪、组合和均衡音频文件,有80 多种声音可供选择。MusicAutoBot音频MusicAutoBo
156、tMusicAutobot 是 一 款 音 乐 生 成 模 型,在 Githbu 开 源,是 基 于 TransformerXL、SequenceToSequence 和 BERT 开发,使用互联网上的 MIDI 文件训练,包括古典乐、爵士、流行和舞曲,能实现歌曲生成、和声、生成旋律以及重新混音现有歌曲。Magic3D3D 模型英伟达Magic3D 是一款文本转 3D 内容创建工具,可通过生成式 AI 云服务 NVIDIA Picasso 访问。Magic3D 可以根据输入文本提示创建高质量的 3D 纹理网格模型,能通过微调 NeRF 和 3D 网格模型实现低分辨率到高分辨率的转化。Luma
157、AI3D 模型LumaLabsAILuma AI 是一款移动端的人工智能工具,可在 Apple 商店中下载,能将智能手机捕获的图像转换为 3D 模型,约 30 分钟就能完成。DreamFusion3D 模型谷歌DreamFusion 将预先训练的 2D 图像文本扩散模型 Imagen 转换为 3D 对象合成,并提出分数蒸馏采样(SDS)方法来优化任意参数空间中的样本,将 SDS 与专门用于 3D 生成任务的 NeRF相结合,可以为各种文本生成高保真的 3D 对象和场景。目前尚未开放使用。Firefly多媒体AdobeFirefly 是 Adobe 旗下的生成式 AI 模型,实现了 AI 技术与
158、 Adobe 多元软件的融合,仅需输入简单文字,即可生成图像、声音、向量、视频、3D、笔刷、渐层、视频转换等内容。Firefly与一站式多媒体编辑平台 Adobe Express 结合,让创作者享受便利。资料来源:华金证券研究所整理创意工具作为创意工具作为 AIGC 的关键应用领域的关键应用领域,涉及到多种模态的生成和转换涉及到多种模态的生成和转换,其发展高度依赖于生其发展高度依赖于生成算法成算法、大模型与多模态三大底层技术的进步大模型与多模态三大底层技术的进步:1)生成算法:生成对抗网络(GAN)、变分自编码器(VAE)、扩散模型(Diffusion Model)、NeRF(2020)等算法
159、的涌现,其中关键性的突破来自于近年来图片生成算法和 3D 模型生成算法的进步,2)大模型:大模型可以广泛适用于各类下游任务,当前已经成为 AIGC 的底层框架:3)多模态技术:多模态相关技术使得语言文字、图像、音视频等多种类型数据可以互相转化和生成,比较代表性的包括 Openai 公司的CLIP 模型(2021)。行业深度分析45/95请务必阅读正文之后的免责条款部分图 31:AIGC 依赖于生成算法、大模型与多模态三大底层技术的进步资料来源:华金证券研究所绘制目前由于目前由于 AIGC 产业格局尚未完全确定产业格局尚未完全确定,多模态技术仍处于早期多模态技术仍处于早期,模型和算法的能力决定了
160、模型和算法的能力决定了应用的竞争力,而开源和闭源路线的选择导致了各自商业模式的差异。应用的竞争力,而开源和闭源路线的选择导致了各自商业模式的差异。以主流三大文生图工具DALL-E2、Stable diffusion、Midjourney 为例,DALL-E2 与 MidJourney 是闭源模型,Stablediffusion 是开源模型。DALL-E2、Midjourney 基于 OpenAI 官网及其他第三方网站可以实现在线访问,使用门槛低,用户输入提示词后即能实现文生图功能。虽然 DALL-E2 的发布早于MidJourney,并迅速达到了百万以上用户数,但是随着 MidJourney
161、算法的快速进步,MidJourney在视觉表现上超越了 DALL-E2,成为了目前最流行的文生图在线工具。而 Stable Diffusion 走的是开源路线,可以在用户本地部署与运行。同时 Stable diffusion 的使用门槛较高,除了对算力较高的要求之外,用户需要训练自己想要的模型,涉及到很多参数调整和素材积累的工作,但优点是在模型训练完成之后,也能够更好的满足自身的个性化需求,目前开源和闭源工具在商业模式上也存在较大差异,MidJourney 能够通过向用户直接提供订阅服务(月订阅费在 10-60 美元之间)来收费,目前用户数达到 1600 万以上,实现收入超过 1 亿美元,而
162、Stable diffusion 的基础模型免费,主要通过为企业提供定制模型来实现商业化。行业深度分析46/95请务必阅读正文之后的免责条款部分表 11:三类文生图工具的商业模式应用名称应用名称MidjourneyMidjourneyStableStable diffusiondiffusionFireflyFirefly开发厂商David Holz 工作室Stability AIAdobe发布时间2022.032022.082023.03产品特性1)主要用于图片生成,通过在 Discord的在线机器人提供绘图功能;2)画质的真实性与细节处于领先地位,可以模仿任何知名画家、动漫风格生成图片内容
163、1)主要用于图片生成,支持在 Google的 Codelab 或者本地部署方式生成图片;2)更依赖其图像模型,图片呈现出的实际效果弱于 MidjourneyV5;3)有更丰富的扩展功能,可以对图片进行各种细微调整,包括多种扩展插件1)功能更加丰富,不仅限于图片生成,够进行包括音频、视频、插图和 3D 模型的创建和转换;2)数据目前只拥有有限数量的公共图像,或在Adobe Stock服务中进行训练,数据量远低于 Midhourney和 Stable Diffusion用户数据1600 万+用户数、1 亿美元+收入各渠道累计日活用户超过 1000 万集成于 Adobe Creative Cloud
164、 中,独立付费用户暂无统计盈利模式有基本计划(非专业设计师的工具和艺术爱好者)、标准计划(有一定设计需求)、专业计划(作为专业设计从业者的办公软件)三种订阅方式,分别对应月度订阅价格为 10 美元/月、30 美元/月、60 美元/月,年度订阅价格为 96 美元/年、288 美元/年、576 美元/年。一方面,Stability 通过 StableDiffusion 等 AI 产品和为企业提供 AI咨询服务,另一方面 Stability AI 通过为企业客户提供定制 SD 模型或其他大型生成模型的服务。同时,Stability发布开源供任何人下载和使用。一方面将 Firefly 作为面向消费者的
165、独立免费增值服务,另一方面,为需要生成更多内容的客户提供订阅积分包,同时为开发者社区提供 Firefly API 的访问权限,并允许企业利用其专有内容创建专属定制模型。Adobe 公司将在今年内推出具体定价,预计第四财季能够看到 Firefly 及其他 AI 业务相关收入。资料来源:华金证券研究所整理除了单点工具之外,除了单点工具之外,Adobe 今年推出了生成式今年推出了生成式 AI 创意工具创意工具 Firefly,嵌入,嵌入 Adobe 现有产现有产品组合中,和主流文生图工具形成竞争。且考虑到品组合中,和主流文生图工具形成竞争。且考虑到 Adobe 在创意产业的独特竞争地位,未在创意产业
166、的独特竞争地位,未来来Adobe 很可能成为很可能成为 AIGC 的最大赢家之一。的最大赢家之一。Adobe Firefly 是能够生成包括图像、音频、视频、3D 模型等多种模态,提供包括数码成像、平面设计、影片制作和 3D 建模等多种功能,可以帮助设计师、艺术家和创意工作者快速生成创意,大大提高创意生产的效率。目前 Adobe 已经将生成式人工智能 Firefly 引入到了 Adobe 全产品线中,相较于 Midjourney 等文生图工具,AdobeFirefly 的优势在于与 Adobe 现在有的产品比如 photoshop 能够实现很好的结合,为用户提供了大量的选项、素材、模板、工具包
167、,进一步降低了用户画图、修图的门槛,而不像 Midjourney 更依赖用户输入的提示词。同时,Adobe 对于训练数据的管理非常严格,主要训练素材来自于与Adobe Stock,对于必须确保输出图像版权的用户,Adobe Firefly 具备很大优势,但由于训练素材来源有限,这也会导致在生成的性能上弱于拥有一些主流文生图工具。得益于 AI 的驱动以及业绩的超预期,今年以来 Adobe 股价走势强劲,年初至今涨幅达到 67%,公司管理层也在 2023年第二季度财报电话会议中提出未来将启动 Adobe Firefly 的商业化,作为独立的增值解决方案想企业用户提供,相关收入将在未来几个财季得到体
168、现。行业深度分析47/95请务必阅读正文之后的免责条款部分图 32:Adobe firefly 的主要功能资料来源:Adobe官网、华金证券研究所3)AI+企业服务目前生成式目前生成式 AI 已经与企业服务领域的主要产品已经与企业服务领域的主要产品 CRM、ERP、财务、财务、HR、OA 实现了不同实现了不同程度的结合,短期来看程度的结合,短期来看 CRM 等营销侧的产品成熟度最高,且已经初步实现商业化。同时目等营销侧的产品成熟度最高,且已经初步实现商业化。同时目前前ERP、财务财务、HR、OA 已经相对应的已经相对应的 AI+产品推出产品推出,主要侧重于利用主要侧重于利用 AI 来实现业务洞
169、察和流程来实现业务洞察和流程优化优化,相关产品功能还尚待完善相关产品功能还尚待完善,且还未进入商业化阶段且还未进入商业化阶段。从参与厂商来看,这一领域的主要参与者仍是各个赛道上的传统玩家,包括 CRM 领域的 Salesforce、ERP 领域的 Sap、Oracle,HRM 领域的 Workday,新进入者较少,同时微软 3 月发布了 CRM 和 ERP 领域的生成式 AI 产品 Dynamics 365 Copilot,是 AI+企业服务领域的有力竞争者。1)CRM:CRM 与生成式 AI 在自动邮件,个性化回复、商机洞察、数据可视化等领域有许多结合点。全球 CRM 龙头 Salesfor
170、ce 推出了 CRM+AI 工具 Einstein GPT,并已经成功实现商业化,生成式 AI 成为驱动 Salesforce 今年 股价上涨的关键因素之一。此外这一领域的其他厂商包括 Sprinklr(CCaaS)、COMPASS(地产 CRM)、HubSpot(CRM)也推出了相关 AI产品。2)ERP/财务:ERP 系统长期以来一直都是企业的中枢神经系统,集中数据以从财务、人力资源、采购、资源和供应链等核心职能中获得更好的业务洞察。ERP+AI 主要体现在在能够深入挖掘 ERP 中的庞大数据,包括生产、库存、财务和供应链等,来获得更好的业务洞察来优化企业流程。目前微软发布了 Dynami
171、cs 365 Copilot,将 AI 引入了 ERP 产品组合中,而 ERP巨头包括 Sap、Oracle 也推出了相关 AI 产品。行业深度分析48/95请务必阅读正文之后的免责条款部分3)HRM/OA:与 ERP 类似,主要体现在进行数据挖掘,通过对职业轨迹、证书、学位和技能等信息的挖掘来实现更有效的人才招聘,创建招聘所需的技能模型、经验模型和候选人档案,并在招聘之外,优化薪酬管理、绩效管理等业务流程等,目前全球 HRM 龙头 Workday 已经将相关 AI 功能嵌入人力资源产品中。表 12:AI+企业服务标杆产品产品产品分类分类厂商厂商产品特性产品特性Einstein GPTCRMS
172、alesforceEinstein GPT 将 ChatGPT 技术与 Salesforce 的私有 AI 模型结合,可为销售人员生成个性化电子邮件,为客户服务专业人员生成面向客户的具体响应,为营销人员生成有针对性的内容,并为开发人员自动生成代码。Sprinklr AI+CRMSprinklrSprinklr Al+与 OpenAI 的生成式人工智能相结合,允许企业将来自 30 多个数字信息渠道的非结构化客户体验数据与生成式人工智能相结合,以更快地创建内容、改善反馈和帮助确定后续行动。Compass CMACRMCOMPASSCompass CMA 可以帮助用户在几分钟内创建定价策略,实现更智
173、能的定价和更快的销售。它通过人工智能将相似房产进行对比和排序,生成定价调整,结合用户信息提出原始建议,提供图表化的视觉呈现,帮助做出房屋定价决策。ChatSpotCRMHubSpotChatSpot 是一款对话式 CRM 机器人,基于 OpenAI 的 GPT 模型开发,可接入到 HubSpot 以使用,能实现数据清理、电子邮件数据捕获、通话录音和转录、搜索引擎优化建议、适应性测试等功能。Shopify MagicCRMShopifyShopify Magic 是一款 AI 营销助手,集成在 Shopify 的产品中,为商店建设、营销、客户支持和后台管理等一系列任务提供个性化支持,能根据用户提
174、供的信息生成产品描述、电子邮件主题等内容。Monday AIAssistantCRMMondayMonday 利用 OpenAI 技术开发 Monday AI Assistant,提供项目计划生成、任务公式、自动回复、宣传文案撰写功能,帮助用户完善任务流程提高效率。KokaiCRMTRADE DESKKokai 融合了分布式 AI,将深度学习算法分布到数字媒体购买流程的各个方面。Kokai 每秒能接受超过 1300 万次广告展示,并能在几毫秒内理解,以便帮助广告主以合适的价格购买合适的广告展示次数,在最佳时间接触目标受众。Squarespace AICRMSQSPSquarespace AI
175、利用生成式 AI 帮助用户在网站搭建时提供文案支持,用户可以更具自己的营销需求,在网页的任何位置生成指定语气的宣传文案。Dynamics 365CopilotERP/财务微软Dynamics 365 Copilot 利用生成式 AI 来为员工提供专为销售、服务、营销、运营和供应链构建的 AI 工具,自动执行繁琐重复的任务,接管例如手动数据输入、内容生成和笔记等工作,从而释放员工创造力。SAP Business AIERP/财务SapSAP Business AI 是 SAP 与微软合作开发的生成式人工智能解决方案,在财务端实现发票管理、简化对账;在供应链端实现需求分析、异常检测;在采购端实现基
176、于数据的采购敏捷运营;在人力端实现员工技能提升、劳动力匹配。Oracle AIERP/财务OracleOracle AI 利用 Cohere 的大语言模型,结合 Oracle 独特的行业知识库进行改进,其生成式AI 功能集成在云服务应用中,在财务、人力、零售、营销、软件开发等板块提供支持。Workday SkillsCloudHRM/OAWorkdayWorkday Skills Cloud 嵌入了人工智能和机器学习功能结合生成式 AI 技术,能够了解整个员工队伍的技能和能力,通过提升技能、重新培训、重新部署和雇用新人才,制定更好的人员战略并满足组织的需求。hrGPTHRM/OACloudAp
177、perhrGPT 是一个智能 HRM 自动化平台,使用生成式 AI 来简化员工与人力资源系统的交互,具备对个性化需求的适应性,能针对客户的需要定制自动化工作流程涵盖考勤、休假、入职和绩效评估等多个环节。资料来源:华金证券研究所整理作为全球作为全球 CRM 龙头龙头,赛富时在今年赛富时在今年 3 月月 7 日推出的日推出的 全球首个专用于全球首个专用于 CRM 客户关系管客户关系管理的生成式人工智能理的生成式人工智能 Einstein GPT。产品发布至今赛富时不断丰富。产品发布至今赛富时不断丰富生成式人工智能生成式人工智能的产品功能的产品功能模块模块,目前已经将目前已经将 AI 整合到公司的各
178、个整合到公司的各个产品线产品线包括销售包括销售云云、服务服务云云、营销营销云云、商务商务云云和和 IT 交互交互中,具体来看中,具体来看 Einstein GPT 包括:包括:行业深度分析49/95请务必阅读正文之后的免责条款部分1)销售 GPT(Sales GPT):帮助销售实现自动化销售流程,功能包括电子邮件、通话摘要、会议纪要的自动生成,并能够为销售提供销售见解,跟进建议,后续步骤指导等。2)服务 GPT(Service GPT):极大提升传统人工客服的工作效率,总结和归纳对话的重点和关键信息,根据对话内容为人工客服坐席提示回复建议,生成工作总结等内容3)营销 GPT(Marketing
179、 GPT):在整个营销活动生命周期中嵌入 AI,基于客户数据来制定营销策略,生成个性化营销内容,通过电子邮件、Web、广告等形式吸引客户。4)商业 GPT(Commerce GPT):智能产品推荐,使用强大的数据分析引擎推动更多转化,定制产品排序,生成个性化描述,优惠促销信息等。5)Tableau GPT:工作流程自动化,数据可视化,以使用智能预测、建议和流程来发现关键业务问题的答案。6)Slack GPT:将 Slack 与 CRM 数据(从销售、服务到营销等)连接起来,以便更好地与客户建立联系。目前目前 Einstein GPT 已经初步实现上商业化,服务已经初步实现上商业化,服务 GPT
180、 和销售和销售 GPT 两个独立模块分别单两个独立模块分别单用户每月付费为用户每月付费为 50 美元,此前美元,此前 Salesforce 已针对于全产品线提价已针对于全产品线提价 9%,AI 有望成为未有望成为未来来Salesforce 增长的主引擎。增长的主引擎。7 月 12 日,Salesforce 宣布将销售云、服务云、营销云、行业和Tableau 的定价平均提高 9%,自 8 月起生效,其中专业版的新标价为 80 美元(上涨 5 美元),企业版为 165 美元(上涨 15 美元),无限版为 330 美元(上涨 30 美元)。7 月 19日,Salesforce 公布服务 GPT 和销
181、售 GPT 的两个模块的订阅价格。销售 GPT 包含在 SalesCloud Einstein 中,价格为每个用户每月 50 美元,服务 GPT 包含在 Service Cloud Einstein中,价格也是每个用户每月 50 美元。随着使用量的增长,客户可为其销售和服务团队购买企业扩展包。图 33:赛富时 AI 产品组合资料来源:赛富时官网、华金证券研究所 行业深度分析50/95请务必阅读正文之后的免责条款部分销售销售 GPT 主要针对销售人员,功能包括电子邮件、通话摘要的自动生成,并能够为销售主要针对销售人员,功能包括电子邮件、通话摘要的自动生成,并能够为销售提供销售见解,跟进建议,后续
182、步骤指导等。提供销售见解,跟进建议,后续步骤指导等。具体包括:1)电子邮件:每次客户互动自动生成个性化且包含数据的电子邮件,销售只需单击一下,即可从 Sales Cloud 内部、或通过 Gmail 和Outlook 自动生成包含 CRM 上下文的个性化电子邮件,精简销售过程中耗时但关键的步骤;2)自动记录和总结通话:通过自动转录和总结通话以及后续行动来帮助提高销售人员的工作效率,从而将销售人员从手动记笔记中解放出来;3)销售助理:总结销售周期的每一步,从客户研究和会议准备到起草合同条款,同时自动保持 CRM 的最新状态,为销售提供销售见解,跟进建议,后续步骤指导等。4)客户研究:针对新客户或
183、潜在客户,协助销售工作,完善公司简介,提供公司最近的新闻,根据客户动态拓展合作机会。图 34:销售 GPT 的主要功能:销售电子邮件将为每次客户互动自动生成个性化且包含数据的电子邮件资料来源:赛富时官网、华金证券研究所服务服务 GPT 主要针对客服人员主要针对客服人员,主打自动生成个性化回复主打自动生成个性化回复,帮助客服更快地解决客户问题帮助客服更快地解决客户问题。如顾客向客服发送了一条消息,询问衣服可穿的适宜温度。服务 GPT 组件会根据顾客的问题,自动生成响应,客服只需要发送回复或编辑消息即可。在个案总结过程中,可以自动生成自然语言摘要,客服无需再花费时间记录对话。此外,服务 GPT 还
184、会询问座席是否需要根据聊天对话创建知识库文章,这意味着此信息可以向其他座席和客户开放。同时还能自动邀请客户进入其他协作渠道、在个案总结期间自动生成总结摘要、创建服务案例等。行业深度分析51/95请务必阅读正文之后的免责条款部分图 35:服务 GPT 的主要功能:自动化回复资料来源:赛富时官网、华金证券研究所微软将基于微软将基于 AI 驱动的功能引入了驱动的功能引入了 ERP 产品组合中,覆盖财务、采购和供应链三大模块产品组合中,覆盖财务、采购和供应链三大模块,充分利用充分利用 ERP 数据,来优化预算、运营和财务、采购等企业业务流程。数据,来优化预算、运营和财务、采购等企业业务流程。主要功能包
185、括:1)财务(Dynamics 365 Finance):AI 自动进行财务整合以实现无缝结算,并通过机器学习和人工智能支持的高级预测分析获得高度准确的预测。财务人员可以优化绩效、全面了解现金流动态,有效分配资源并为企业带来更好的财务成果;2)运营(Dynamics 365 Project Operations):大幅减少花在项目状态报告、任务规划和风险评估上的时间,快速为新项目创建新项目计划,持续识别风险并提出缓解计划,识别可能导致项目脱轨的常见项目风险,例如严重延误或预算超支;3)供应链(Dynamics 365 Supply Chain Management):主动标记可能影响关键供应链
186、流程的外部问题,例如天气、财务和地理。然后预测会影响材料、库存、承运商、分销网络等方面的订单。AI 能够高效地处理大规模采购订单的变更,并评估影响和风险,以帮助优化采购决策。同时收款人员可以快速访问信用和付款历史记录,以便他们可以优先考虑和个性化客户沟通,帮助提高成功收款率并主动保持客户的良好信誉;行业深度分析52/95请务必阅读正文之后的免责条款部分图 36:Dynamics 365 Finance 充分利用 ERP 数据来加速洞察资料来源:微软官网、华金证券研究所4)AI+网络安全生成式生成式 AI+安全的最大机会来自于安全运营的自动化程度的提升,类安全的最大机会来自于安全运营的自动化程度
187、的提升,类 Security Copilot 的的AI+“安全大脑安全大脑”将深度改变现有安全管理平台产品形态将深度改变现有安全管理平台产品形态。3 月微软发布了首个基于大模型的 AI+安全大脑形态 security copilot,此后 Palo Alto Networks,Crowdstrike,Fortinet 等头部安全厂商均发布了 AI+“安全大脑”产品,其中 Palo Alto Networks 发布了 XSIAM、Crowdstrike 发布了 Charlotte AI。AI+“安全大脑”所带来的的安全运营能力提升主要体现在两个方面,一是提升威胁检测,即发现问题的能力,二是提升相
188、应处置,即解决问题的效率。可预见随着技术的不断成熟,用户对于安全运营自动化的需求也在不断提升,因此相关厂商在整个安全产业中的地位将逐步提升。在 AI 驱动下,今年头部安全厂商 Palo Alto Networks,Crowdstrike,Fortinet 的股价均有强劲表现,年初至今涨幅分别达到 74%,53%,25%。大模型大模型/生成式生成式 AI 对于网络安全行业的影响与其他行业有所不同,对于网络安全行业的影响与其他行业有所不同,AI 不仅仅是对于安全产不仅仅是对于安全产品形态本身带来改变(防守侧),而且能够通过大幅降低了安全攻击的门槛,赋能攻击方(攻品形态本身带来改变(防守侧),而且能
189、够通过大幅降低了安全攻击的门槛,赋能攻击方(攻击侧),加剧安全威胁,进而带来用户安全预算击侧),加剧安全威胁,进而带来用户安全预算/行业总需求的提升。行业总需求的提升。大模型、GPT、生成式 AI技术将大幅降低黑客攻击的门槛,包括批量钓鱼邮件生成、批量漏洞挖掘、批量恶意代码生成等,将显著加剧整体威胁态势,特别是自从 ChatGPT 推出以来,通过电子邮件网络钓鱼的数量有显著增加。同时,监管侧对于文字、图像内容的监管和审查将成为重中之重,内容安全、数据安全、流量可视等监管侧需求也随之提升。行业深度分析53/95请务必阅读正文之后的免责条款部分表 13:AI+网络安全标杆产品产品产品厂商厂商产品特
190、性产品特性SecurityCopilotMicrosoftSecurity Copilot 将 GPT-4 内置于产品中,并与微软的安全模型库结合,为用户提供恶意代码防护、隐私合规监控等生成式 AI 服务。在使用上,Security Copilot 类似于聊天机器人,用户用自然语言输入安全问题,Security Copilot 输出可操作的回答,并展示来源。XSIAMPalo AltoNetworksXSIAM 是个云交付的集成 SOC 平台,统了 XDR、SOAR、UEBA、TIP 和 SIEM 等关键功能,将多个产品整合到个集成平台中。在功能上,Security Copilot 主要侧重于
191、响应处置,XSIAM 在威胁检测上更进一步。Charlotte AICrowdstrikeCharlotte AI 是一款生成式 AI 安全助手,用户可以用自然语言与其对话,使其回答特定的安全问题,并提供操作建议。Crowdstrike 通过 Falcon OverWatch、Falcon Complete、Services、Intelligence等产品收集多维数据,用以训练 Charlotte AI 的 AI 引擎。FortiGuardLabsFORTINETFortiGuard Labs 为 Fortinet 的 AI 安全服务提供技术支持,兼顾应用安全、内容安全、设备安全、NOC/SO
192、C 安全、网络安全等。Veracode FixVeracodeVeracode Fix 是一款使用了生成式 AI 技术的安全漏洞修复工具,采用的 GPT 技术底层的 transformer架构与 ChatGPT 相同,可以为开发人员提供代码漏洞的修复建议,具体而言,AI 可以自动生成漏洞修复代码,开发人员无需编写任何代码即可查看和实施。CheckGPTAbnormalSecurityCheckGPT 是一款邮件安全工具,用于检测由人工智能生成的邮件攻击,比如使用 ChatGPT 或 WormGPT生成的攻击。CheckGPT 采用了开源的大语言模型,预测邮件内容是 AI 生成的的概率。Reco
193、rdedFuture AIRecordedFutureRecorded Future AI 集成在 Recorded Future 智能云平台中,将 OpenAI 的 GPT 模型与公司的智能云相结合,帮助安全分析师提高效率,主要功能包括:1)通过自然语言互动回答安全分析师的提问,2)总结提炼一段信息的重点,3)进行实时分析并生成分析报告。SOC Co-PilotRadiantSecuritySOC Co-Pilot 是一款使用了人工智能技术的安全运营协助工具,能够提高安全分析师的数据分析和威胁检测能力,主要功能包括:1)对安全警报进行自动化分类,2)采用 AI 技术对安全警报进行挖掘,发现更
194、多的实际威胁,3)为检测到的恶意事件自动制定响应计划。ExposureAITenableExposureAI 是一款生成式 AI 服务,集成于 One Exposure Management Platform 平台上。ExposureAI提供了三个基于生成式 AI 的安全功能:1)允许用户使用自然语言查询分析资产和潜在风险,2)提供缓解威胁的安全指导,3)对风险进行优先级评估。Security AIWorkbenchGoogle CloudSecurity AI Workbench 是一款由 Sec-PaLM 大型安全语言模型提供支持的可扩展平台,构建在 VertexAI 基础架构之上,集成了
195、包括 Mandiant 态势感知、VirusTotal 查杀平台和 Chronicle AI 聊天在内的众多谷歌安全能力。Purple AISentinelOnePurple AI 是一款威胁搜索和响应工具。类似于聊天机器人,用户可以用自然语言要求其查找某类威胁、生成报告,并自动执行补救措施。Purple AI 使用了 GPT-4 等技术来加速威胁调查和响应。资料来源:华金证券研究所整理生成式生成式 AI+安全的最大机会来自于安全运营的自动化程度的提升安全的最大机会来自于安全运营的自动化程度的提升。一方面生成式人工智能被用来以比以往更快的速度创建和变异恶意软件,大大增加了企业安全管理人员响应和
196、处置安全问题的难度,另一方面,在一个网络安全系统的各个组成中,防火墙、端点安全等单点的安全产品已经具备了较高的自动化水平,而安全运营本就是最复杂、自动化程度最低的一环。企业安全管理人员每天都会接收到大量的告警,而依然人工处置的必然导致的结果就是:警报疲劳、调查缓慢以及攻击在网络中隐藏且难以发现。而生成式 AI+与安全的最大机会来自于提升安全运营的自动化程度,具体体现在:1)提升安全人员水平:对于经验不足的 IT 和安全专业人员,AI 可以帮助他们更快地做出更好的决策,使执行更高级的安全操作变得更加容易,能够迅速达到高级安全人员处置安全事件的能力;2)提升安全处置的效率:安全人员水平可自动执行数
197、据收集、提取以及威胁搜索和检测等重复且繁琐的任务,缩短对关键事件的响应时间,同时通过简单的自然语言提示实现任何检测、调查或响应工作流程。行业深度分析54/95请务必阅读正文之后的免责条款部分图 37:AI+安全的最大机会来自于提升安全运营的自动化程度资料来源:CORTEX官网、华金证券研究所微软推出了微软推出了“Microsoft Security Copilot”,是首个基于大模型的,是首个基于大模型的 AI+安全大脑形态的产安全大脑形态的产品。品。Security Copilot 底层模型基于 GPT-4,并结合了 Microsoft 的专有安全模型。SecurityCopilot 的功能
198、与 Office 版 Copilot 类似,是专为网络安全管理人员设计的新型人工智能聊天机器人,定义为网络安全管理平台的 AI 助手。在 Security Copilot 界面上,安全管理人员可以使用自然语言询问与安全相关的问题,例如“公司中发生了哪些安全事件?”。Security Copilot 可以总结出由公司网络安全系统和外部数据生成的威胁报告,同时聊天机器人还可用于帮助安全管理人员进行安全调查、创建报告和总结事件。同时 Security Copilot 还能够将响应和处置固定到共享工作区,以便与可能处理同一事件的同事共享安全处置流程,例如对潜在的恶意脚本处置的同时,将信息发送给另一位同
199、事,后者查看是否需要对其进行标记以供进一步研究。除了使用企业自身的安全数据之外,Security Copilot 还可以使用来自 Microsoft 和其他第三方安全情报和漏洞数据库的回答问题。行业深度分析55/95请务必阅读正文之后的免责条款部分图 38:Security Copilot AI 提升安全运营自动化资料来源:微软官网、华金证券研究所全球网络安全龙头厂商全球网络安全龙头厂商 Palo Alto Networks 近期也推出了首款完全基于近期也推出了首款完全基于 AI 构建的产品构建的产品XSIAM(扩展安全智能和扩展安全智能和自自动化管理动化管理)。XSIAM 是个云交付的集成
200、SOC 平台,统了 EDR、XDR、SOAR、ASM、UEBA、TIP 和 SIEM 等关键功能,将多个产品整合到个集成平台中。XSIAM 是在功能上 Security Copilot 主要侧重于响应处置,XSIAM 在威胁检测上更进一步,功能更加全面,同时也能够与 Palo Alto Networks 现有的产品组合实现更好的绑定。公司管理层表示,自全面推出了 XSIAM 以来,Palo Alto Networks 制定了第一年收入达 1 亿美元的目标,公司在近连续两个季度内均获得了千万美元大单,其中一家大型零售商签署了由 XSIAM 牵头的4000 万美元订单,取代了现有的 SIEM 产品
201、,增加了威胁情报和攻击面管理功能,此外另一家大型技术服务商签署了含 XSIAM 功能的 3000 万美元订单。一年时间还未结束,XSIAM 收入已达 2 亿美元,远远超出了此前设立的目标,XSIAM 正在成为 Palo Alto Networks 在下一代防火墙之外增长最快的产品。行业深度分析56/95请务必阅读正文之后的免责条款部分图 39:XSIAM 是集成了 AI 的基于云交付的集成 SOC 平台资料来源:CORTEX官网、华金证券研究所5)AI+IT 运维生成式生成式 AI+IT 运维主要结合点在于智能运维(运维主要结合点在于智能运维(AIops),提升),提升 IT 运维的自动化和智
202、能化水运维的自动化和智能化水平。平。2016 年 Gartner 首次提出了 AIOps,通过 AI 赋能 IT 运维,能够基于已有的运维数据(日志、监控信息、应用信息等),协助运维工程师更快速精准地发现故障、定位故障,并排除故障,进而提高运维效率,降低运维成本。而大模型/生成式 AI 能够进一步提升 IT 运维的自动化和智能化水平,体现在其具备更强大的数据分析能力,以及更高效的人机交互模式,目前这一领域的龙头厂Servicenow已经推出生成式AI+IT运维的相关产品,并发布了未来生成式AI的产品路线路。目前来看生成式 AI+IT 运维的产品成熟度还不够高,未来还具备很大的提升空间。此外,随
203、着OpenAI 的生成式 AI 模型的应用范围不断扩大,用户对于了解内部大模型的使用情况以增强大模型的性能,同时监控 API 的使用情况及 Token 的消耗以控制相关成本的需求也在快速提升。目前 Datadog 已经推出了监控各种 OpenAI 模型 API 使用模式、成本和性能的应用功能,这一领域的头部厂商还包括了 AppDynamics、Datadog、Splunk、Dynatrace。行业深度分析57/95请务必阅读正文之后的免责条款部分表 14:AI+IT 运维标杆产品产品产品厂商厂商产品特性产品特性Now PlatformServiceNowAI 功能内置于 ServiceNow
204、的 Now 平台中,通过 Now Assist 提供 AI 功能:1)案例总结,即通过生成案例概述提高 agent 的工作效率;2)对话交流,用户可以通过自然语言与 Now Assist 进行对话;3)代码生成,即为开发人员提供智能代码建议。AtlassianIntelligenceAtlassianAtlassian Intelligence 是一款使用了人工智能技术的 AI 办公助理产品,可以帮助理解和加速团队协作,主要功能包括从会议记录中总结工作计划和任务安排、通过自然语言问答为团队成员提供即时帮助和支持、解释公司特定术语。Aisera AIOpsAiseraAisera AIOps 是
205、一款使用了大语言模型和深度学习技术的 AI 运维工具,主要功能包括:1)提供IT 资源的可见性,涵盖网络、基础设施、数据库、应用程序等,2)观测并动态调整 IT 资源的映射关系,3)基于现有问题及历史数据经验,进行自动溯源。BMC AIOpsBMCBMC AIOps 是一套使用了人工智能技术的 AI 运维解决方案,包括 AMI Ops、Helix OperationsManagement with AIOps、Helix Continuous Optimization 等产品,可以智能检测异常值和离群值、自动管控事件、智能管理 IT 资源并预测未来资源需求。Freshservicefor IT
206、OMFreshworksFreshservice for ITOM 是一套使用了人工智能技术的 IT 运营管理解决方案,主要功能包括:1)智能警报管理,即借助 AI 算法剔除噪声、突出关键的安全警报;2)重大事件管理,即通过动态建立作战室、向利益相关者通报最新信息,减少服务中断的影响。BigPandaIncidentIntelligenceBigPandaBigPanda Incident Intelligence 是款基于 BigPanda AIOps Platform 的事件管理软件,主要功能包括:1)自动分析事件,2)基于事件细节实时生成标题和描述,3)分析事件影响面,4)对事件进行溯源
207、。该产品以聊天机器人的形式用自然语言提供以上分析结果。SMAXMirco FocusSMAX 是一款使用了机器学习技术的服务和资产管理软件,能够自动解决运维问题、智能管控各类IT 服务。SMAX 集成了 ChatGPT,用户可选择“Ask ChatGPT”后进行评论,ChatGPT 将提供专业的处理建议,交互方式类似于文章评论和追评。PagerDutyRunbookAutomationPagerDutyRunbook Automation 是一款采用了生成式 AI 技术的 RBA 系统,能够自动运行重复性的手动任务(发送邮件等),AI 技术主要体现在:1)可使用自然语言修改任务描述,重新定义任
208、务,2)可收集任务最新状态并自动生成邮件内容,3)可自动生成安全事件报告。资料来源:华金证券研究所整理ServiceNow 目前已经发布了生成目前已经发布了生成式式 AI 解决方解决方案案 Generative AI Controller和和 Now Assistfor Virtual Agent。ServiceNow 的生成式 AI 的功能集中在两个关键领域:1)意图理解与语言生成:在生成式 AI 的支持下,ServiceNow 平台可以理解人类语言,并解释用户问题、投诉或请求背后的意图;帮助服务交付人员找到更有效地完成工作,更快地解决客户问题所需的信息;2)知识综合和流程自动化:Servi
209、ceNow 能够总结和综合信息,从而更快地为员工或客户提供支持,例如,如果一名员工投诉一台电脑反复死机,ServiceNow 的运营管理平台可以将该投诉综合为事件,为用户提供技术支持,或促成内部/外部技术人员的协助。Servicenow 目前已经发布了生成式 AI 产品路线图,今年 9 月的新版本将包括 AI 增强的虚拟问答助手、加速配置和扩展工具,2024 年新版本将包括完整的自动化服务、自动化知识创建,以及为管理员提供生成式人工智能。行业深度分析58/95请务必阅读正文之后的免责条款部分图 40:Servicenow 将生成式 AI 集成到 NOW 平台资料来源:Servicenow官网、
210、华金证券研究所Datadog 推出了针对推出了针对 OpenAI 公司的公司的 GPT 及其他大模型的性能监控,能全面监测大模型及其他大模型的性能监控,能全面监测大模型的使用情况的使用情况、性能指标的资源消耗性能指标的资源消耗,帮助用户有效提升成本控制和模型利用率帮助用户有效提升成本控制和模型利用率。在 Datadog 中可以全面可视 OpenAI API 的使用情况,包括 API 的总体使用情况、Token 消耗以及按应用、团队和 API 密钥划分的成本。其中,Datadog 能够监控 API 使用的总体速率和数量,并避免违反 API 速率限制或导致过度延迟,并且能够跟踪其正在使用的每个模型
211、的 API 错误率、响应时间和 Token 使用情况等指标,帮助于用户区分真正的异常延迟和请求峰值导致的响应时间延长。企业用户可以为内部各个团队分配唯一的 ID,从而更轻松地跟踪整个团队中每个 OpenAI 模型的使用情况,帮助企业用户了解哪些团队、服务和应用程序最常使用 OpenAI,以及他们依赖哪些模型,进而优化大模型的使用和资源分配。除了 GPT 之外,Datadog 可以跟踪其他 OpenAI 模型(包括 Ada、Babbage、Curie 和 Davinci)的性能、成本和使用情况,未来有望提供跨平台服务商的应用性能监控。行业深度分析59/95请务必阅读正文之后的免责条款部分图 41
212、:Datadog 推出了针对 OpenAI 的性能监控产品资料来源:Datadog官网、华金证券研究所Datadog 可监控和跟踪可监控和跟踪 GPT 及其他大模型的及其他大模型的 token 的消耗的消耗,帮助用户对大模型的使用成本帮助用户对大模型的使用成本进行实时监控。进行实时监控。OpenAI API 的使用主要根据 token 的消耗进行计费,Datadog 通过跟踪总token 消耗、每个请求的平均 token 数量以及每个请求的提示和完成 token 的平均数量,帮助用户了解 OpenAI 使用的主要成本驱动因素,有助于用户发现 OpenAI 成本的峰值,并监控哪些请求、团队和应用
213、产生的成本最高。图 42:Datadog 可监控和跟踪 GPT 及其他大模型的 token 消耗资料来源:Datadog官网、华金证券研究所 行业深度分析60/95请务必阅读正文之后的免责条款部分6)AI+软件开发生成式生成式 AI 具备很强的代码生成能力,有望重塑软件开发产业格局。具备很强的代码生成能力,有望重塑软件开发产业格局。一方面,各类新兴的代码生成工具出现,包括一方面,各类新兴的代码生成工具出现,包括 GPT-4 自身就具备很强的编程能力,同时包括 Github Copilot X。GPT-4 在编程能力上相较于之前版本有了很大程度的提升,除了代码生成能力之外,在容错空间更大的重构代
214、码、代码测试以及修改 bug 等环节得到了更频繁的应用,能够带来研发过程中显著的效率提升。同时包括 Github、HuggingFace、Replit 等开发者社区今年以来的项目和流量大幅增长,今年 3 月 Github 发布了接入 GPT-4 的新版本编程辅助工具Github Copilot X,在之前的代码生成等基础功能上增加了语音扩展、智能文档、自动告警、自动扩写等功能,是市场上最先进的 AI 辅助编程工具。另一方面另一方面;低代码平台低代码平台(LCAP,Low-CodeApplication Platform)与与 AI 的结合能够的结合能够使开使开发人员发人员能够通过少量编程或者无
215、需编程,通过拖放图形界面或自然语言等可视化方式,来实现能够通过少量编程或者无需编程,通过拖放图形界面或自然语言等可视化方式,来实现快速开发和应用部署。快速开发和应用部署。目前低代码市场的主要参与者,包括微软、Salesforce、ServiceNow 等企业服务巨头和 OutSystems、Mendix 等第三方低代码厂商,目前微软的 AI+低代码工具凭借自身在 AI 上的技术储备和产品集成方面的优势,在行业中处于领先地位。此前微软低代码套件Power Apps 就是 GPT-3 首批商业化应用,让开发人员能够通过自然语言语句简单地生成业务查询和逻辑,同时 Power Platform Cop
216、ilot 与其他 Microsoft 产品(例如 Office 365、Dynamics365 和 Azure)以及第三方应用程序和数据源无缝集成,在整体解决方案上也具备明显优势,目前微软已经是企业使用率排名第一的低代码平台,此外 Salesforce、ServiceNow 两大企业服务领域的巨头也具备非常有竞争力的低代码产品,并将 AI+低代码能力其集成到自身的解决方案之中。此外,OutSystems、Mendix 等头部第三方低代码厂商具备各自的优势,目前均推出了生成式 AI+低代码产品。行业深度分析61/95请务必阅读正文之后的免责条款部分表 15:AI+软件开发标杆产品产品产品厂商厂商
217、产品特性产品特性CodeGenSalesforceCodeGen 是一款对话式 AI 编程系统,该系统根据开发人员的提示编写代码,并减轻了编写代码本身的需要,支持连续输入和输出以提高效率。GitHubCopilotGithubGitHub Copilot 能根据项目的上下文和风格提出建议,快速循环浏览代码行,完成功能建议,并决定接受、拒绝或编辑哪些代码。App EngineServiceNowApp Engine 是基于生成式 AI 的低代码平台,能将新企业应用程序推向市场的时间缩短一半,成本降低三分之一。MorpheusOutSystemsMorpheus 具备对话式的即时应用程序生成系统,
218、微调的生成式 AI 编辑器,且实现应用程序更改的实时、全栈、可视化,能让任何水平的开发人员通过快速迭代和生成式 AI 辅助来构建满足独特需求的应用程序。Mendix 10MendixMendix 10 是一款低代码应用程序开发平台,内置人工智能辅助开发机器人和嵌入式机器学习套件,可以提供从构思到开发、部署、测试以及云中或本地应用程序组合的持续管理,预计年底将添加生成式AI。Power Apps微软Power Apps 是首批应用 GPT 的低代码开发平台之一,通过 AI Copilot、预构建模板、简易的拖放操作,能够帮助创造者自动将图纸、图像和 Figma 文档转化为应用程序 UI。Appi
219、an AICopilotAppianAppian AI Copilot 是一个 AI 驱动的软件开发自动化平台,使用生成式 AI 实现应用程序设计,基于用户数据生成私有 AI 模型以大规模应用,利用 AI 技术实现端到端流程自动化。Pega GenAIPegaPega GenAI 是面向企业的低代码开发平台,基于生成式 AI 可以将想法转化为工作流,在几分钟内生成应用程序,还能即时生成测试数据,通过对话式建议指导开发人员操作。UiPath AppsUiPathUiPath Apps 是一个低代码应用程序开发平台,与 UiPath 数据服务系统集成,用户可以访问和管理多个系统中的数据,借助自动化
220、功能快速构建应用程序。随着 UiPath 业务自动化平台接入生成式 AI,UiPath Apps 的能力得到了进一步的提升。资料来源:华金证券研究所整理GitHub Copilot X 是作为目前最强大的编程开发工具之一,允许开发人员用自然语言来完是作为目前最强大的编程开发工具之一,允许开发人员用自然语言来完成代码生成成代码生成、单元测试单元测试、代码分析等一系列工作代码分析等一系列工作。早在 2021 年 GitHub 和 OpenAI 就合作开发了编程开发工具 Copilot,用户可以在使用 Visual Studio Code、Microsoft Visual Studio、Vim或 J
221、etBrains 集成开发环境,面向 Python、JavaScript、TypeScript、Ruby 和 Go 等编程语言,可以协助程序员完成自动补全代码块、消除重复代码,甚至根据代码注释生成可运行代码,底层模型由 OpenAI 提供支持。而今年 3 月发布的 Copilot X 是对 2021 年发布的 Copilot 进行了升级,接入 GPT-4,更新的一系列功能包括:GitHub Copilot Chat,可实现与 AI 对话完成代码生成、代码分析、单元测试、修复 Bug 等功能;Copilot Voice:语音扩展功能;Copilot forPull Requests:协助开发者拉
222、取请求;Copilot for Docs:智能文档编写工具;Copilot for CLI:将自然语言翻译成终端命令。目前 GitHub Copilot 提供按月或按年订阅,个人为每人每月 10 美元,企业端为每用户 19 美元。行业深度分析62/95请务必阅读正文之后的免责条款部分图 43:Github copilot X 是目前最强大的 AI 编程开发工具之一资料来源:Github官网、华金证券研究所生成式生成式 AI 与低代码平台的结合带来了软件开发在使用门槛与低代码平台的结合带来了软件开发在使用门槛,开发效率开发效率、自动化程度上的又自动化程度上的又一次重大提升。一次重大提升。过去低代
223、码平台能够带来:1)应用开发门槛的降低:允许没有技术背景的用户创建自定义应用程序,降低软件开发壁垒;2)速度和敏捷性:凭借用户友好的界面和广泛的预构建组件库,可以快速实现软件开发、测试和部署,从而加快应用上线速度;3)成本效益:企业可以利用现有开发资源来开发应用程序,降低了构建和维护自定义应用程序的总体成本。而生成式 AI 对低代码平台的赋能体现在:1)更强大的交互和生成能力,进一步降低软件开发门槛并提升效率:生成式 AI 能够理解自然语言,并能够自动化生成开发流程,表单、报告等内容,并且能够基于底层数据源,向开发者提供如何实现开发快速更改流程和改进业务运营的实用见解;2)低代码平台能够充分利
224、用生成式 AI 的编程能力,防止单独使用生成式 AI 编写代码可能出现的许多问题:虽然生成式 AI 本身具备很强的代码生成能力,但目前大多只用于针对简单的应用程序编写代码或代码检查,这主要是由于生成式 AI 自身存在的幻觉等问题,难以应用于大型软件开发工作中。低代码平台中提供了企业级开发工具,具有内置的安全性、性能的兼容性等方面的机制,可防止开发人员在使用 AI 编程时生成存在安全漏洞或不可靠或未知依赖项的代码。微软将生成式微软将生成式 AI 全面引入低代码开发平台全面引入低代码开发平台 Power Platform 中,中,3 月月 6 日推出了日推出了 PowerVirtual Agent
225、s 和和 AI Builder 的下一代的下一代 AI 功能功能,3 月月 16 日正式推出了日正式推出了 Copilot,嵌入嵌入 PowerApps、Power Virtual Agents 和和 Power Automate 等模块组件中,让开发者能够实现快速的等模块组件中,让开发者能够实现快速的应用、流程、机器人的自动化创建及商业智能。应用、流程、机器人的自动化创建及商业智能。1)Power Apps(应用应用):使用 Copilot,开发者能用自然语言描述的应用程序的用途,能让系统自动生成应用程序,或者修改、完善应用程序,并且借助丰富的预构建模板和组件库,所有人都可以创建应用,专业开
226、发人员也可以节省更多时间,专注于更复杂的代码、模块和集成;行业深度分析63/95请务必阅读正文之后的免责条款部分2)Power Automate(流程)(流程):允许用户通过 Copilot 创建自定义工作流程来自动执行重复的任务和流程。用户可以通过连接各种数据源和应用程序来设计和实施自动化工作流程,基于微软 2022 年 10 月发布的预览版,使用 Copilot 时 利用 Power Automate 创建工作流程的时间减少了 50%;3)Power BI(商业智能)(商业智能):为用户提供强大的数据可视化和分析工具,以深入了解其业务数据。用户可以创建自定义报告和仪表板,帮助他们做出数据驱
227、动的决策并推动业务增长。3)Power Virtual Agents(聊天机器人聊天机器人):用户只需提供一个网站地址,便可以将自己的 网站内容、知识库等信息进行连接,让 GPT 自动生成回答,帮助用户快速创建人工智能驱动的聊天机器人。图 44:Microsoft Power Apps 的 AI 能力进化路线资料来源:微软官网、华金证券研究所高性能应用程序开发领域的全球领导高性能应用程序开发领域的全球领导者者 OutSystems 在在 2022 年年 11 月发布了月发布了全面的基于人全面的基于人工智能的开发、安全和质量分析工具工智能的开发、安全和质量分析工具,并于,并于 2023 年年 6
228、 月发布了生成式月发布了生成式 AI 的路线图,代号名称的路线图,代号名称为为 Morpheus。OutSystems AI Mentor System 包含了五大包含了五大 AI 模块模块,实现了实现了 AI 辅助软件开发辅助软件开发:1)代码:辅助开发,并将其添加到开发人员的代码中,完全配置并适应业务逻辑和上下文;2)架构:负责审查代码以确保其符合关键架构标准;3)安全:负责审查代码以识别开发过程中引入的代码漏洞;4)性能:负责审查代码以识别可能的性能瓶颈并确保应用始终以最高效率运行;5)可维护性:审查应用程序代码以根除重复代码并建议重构应用程序的机会。而在今年而在今年 6 月发布的生成式
229、月发布的生成式 AI 项目项目 Morpheus 中中,实现了实现了 AI 的能力的重大升级的能力的重大升级,能够让能够让任何技能水平的开发人员(甚至根本没有技能水平)都将开始通过快速迭代和构建满足独特需任何技能水平的开发人员(甚至根本没有技能水平)都将开始通过快速迭代和构建满足独特需求的应用程序求的应用程序。Morpheus 的众多新功能包括的众多新功能包括:1)基于自然语言的应用快速生成:开发人员将 行业深度分析64/95请务必阅读正文之后的免责条款部分使用自然语言输入来描述应用程序,而不是编写代码;2)由 AI 和 ML 提供支持的应用程序编辑器:根据二十年来使用平台的开发人员的数据和模
230、型来提供建议,用 AI 引擎来微调并更改应用程序,而不会造成中断或错误。3)应用程序更改的实时、全栈、可视化表示:使验证生成人工智能的输出变得容易,检测可能导致问题的威胁和代码模式,保证开发的安全性图 45:OutSystems 低代码平台资料来源:Outsystems官网、华金证券研究所7)AI+数据智能生成式生成式 AI 与大模型进一步强化了数据分析和决策智能在各行业的落地。与大模型进一步强化了数据分析和决策智能在各行业的落地。数据智能本质上还是以半定制化,即产品+解决方案/咨询服务的方式向用户提供,这一领域的头部厂商为全球大数据龙头厂商 Palantir,今年推出了面向军队和民用领域的生
231、成式 AI 平台 AIP。同时,全球主流的综合 IT 服务商和 IT 咨询公司均推出了生成式 AI 相关的产品及解决方案,比如 IBM、埃森哲、博思艾伦等都是 Palantir 在这一领域的有力竞争者。其中,今年 5 月 IBM 发布了生成式 AI 平台Watsonx,并提供以 watsonx 为中心的完整咨询服务,帮助客户构建基础模型、AIOps、DataOps和 AI 治理机制。同时,埃森哲也在今年推出了基于生成式 AI 的平台 AI Navigator for Enterprise,能够帮助客户定义业务、做出决策、选择模型及算法,并预构建了 19 个不同行业的模型,来更好的实现 AI 技
232、术的落地。此外,国防外包服务商雷神、BAE 以及电信运营商 ATT、NTT 等,结合自身的禀赋和资源也都推出了相对应的生成式 AI 产品。不同厂商在产品上有各自的侧重点,比如 IBM 侧重于提供底层模型能力,而埃森哲侧重于咨询服务和行业解决方案,Palantir 则是二者的结合。总体来看,数据分析和决策智能市场参与的厂商较多,除了头部厂商之外,包括 C3等许多中小型 AI 厂商都有推出相应生成式 AI 产品。未来在底层模型和算法普惠的趋势下,比拼的重点将是客户资源以及对垂直行业的深度理解。行业深度分析65/95请务必阅读正文之后的免责条款部分表 16:AI+数据智能标杆产品产品产品厂商厂商产品
233、特性产品特性AIPPalantirAIP 使用安全的、AI 优化的数据基础,将 LLMs 和 AI 与部署在用户的专用网络中,通过人机协作构建从管道到应用程序的所有内容,在底层操作系统中实施决策,并捕获决策和结果以进行持续的 AI 验证和改进。WatsonxIBMWatsonx 一个针对基础模型且具备生成式 AI 能力的全新平台,针对代码、AIOps、数字劳动力,提供包括 AI 开发、数据存储和 AI 治理在内的工具包。AI Navigator forEnterprise埃森哲AI Navigator for Enterprise 是一个生成式 AI 平台,帮助客户定义业务、做出决策、选择模型
234、及算法,并预构建了 19 个不同行业的模型,来更好的实现 AI 技术的落地。aiSSEMBLE博思艾伦aiSSEMBL 是一种用于人工智能工程的精益制造方法,首先评估用户需求、现有方案和运营限制,然后确定适当的模式和预制组件,最终分层任务逻辑并使用现代软件交付技术来部署人工智能系统。Raiven雷神Raiven是一种新型光电传感器,其AI驱动的电光/红外系统将能够通过光学和光谱实时识别物体,并生成该区域的图片,实现自动检测和识别威胁。空战训练软件BAEBAE 与美国空军研究实验室合作,为作战人员开发基于 AI 的空战训练程序,通过将 AI 技术引入交互式游戏环境,可以快速生成和审查多个计划并选
235、择最稳健的计划,使作战人员能够在动态环境中探索可能的情况。Ask AT&TATTAsk AT&T 是基于 ChatGPT 开发生成式 AI 工具,在微软的 Azure 租户中运行以确保安全性,可以帮助公司优化网络、升级遗留软件代码、使对接员有效支持客户、通过提供自动摘要来改良工作方式。行业生成式 AINTTNTT 将自主开发 LLM 作为其生成式 AI 的基础,参数量在 70-300 亿间,在金融领域,该模型将学习市场研究和分析的知识以辅助投资决策;医疗领域,该模型将通过患者的病史和当前状况建议最佳药物来协助医生。C3生成式AI产品套件C3C3 生成式 AI 产品套件内置于 C3.AI 平台,
236、允许用户跨企业和外部信息系统访问、定位和检索信息,由 AI 根据相关用户体验自动分析推断并形成结果摘要。资料来源:华金证券研究所整理美国大数据分析龙头美国大数据分析龙头 Palantir 于于 2023 年年 4 月月 26 日推出了集成大模型能力日推出了集成大模型能力 AI 平台平台 AIP,包包含军事含军事(AIP for Defense)和商业和商业(AIP for Business)两大模块两大模块。Palantir 此前长期服务于政府部门(含军队)和超大型企业客户,为其解决大规模,多业务流程、庞大数据和高复杂度问题。Palantir 兼具软件和咨询能力,即在提供标准化工具同时,需要向
237、客户派驻工程师,并根据不同客户需求量身定制解决方案。AIP 作为 Palantir 继 Gotham、Foundry 和 Apollo 之后的第四款平台产品,与 Palantir 此前的商业模式保持一致,有标准化的模块,且需要深入用户的业务流程进行一定的定制化开发与部署。AIP 能够将 OpenAI 的 GPT-4 和谷歌的 BERT 等大模型(LLM)集成到用户私有网络中,产品端由三大核心模块构成:底层是 AIP Code:集成了底层的大模型能力的人工智能系统,汇集了用户端与其业务相关的实时的数据,包括所有操作、决策和流程;中间层是 AIPAction Graph,包含了许多处理的特定任务模
238、型;上层是 AIP Control Plane,与用户通过自然语言等方式进行交互,调用底层平台能力,对需求及数据处理后,面向用户进行可视化呈现。行业深度分析66/95请务必阅读正文之后的免责条款部分图 46:AIP 产品的三大基础模块资料来源:Palantir官网、华金证券研究所AIP 目前在军事和国防领域已经有了实际应用,军队可以利用大模型支撑的目前在军事和国防领域已经有了实际应用,军队可以利用大模型支撑的 AIP 平台,不平台,不仅显示和分析战场的情报,增强对全面作战态势的感知,而且仅显示和分析战场的情报,增强对全面作战态势的感知,而且 AIP 提出作战计划来辅助决策,提出作战计划来辅助决
239、策,拥有改变军事规划和决策的能力。拥有改变军事规划和决策的能力。1)情报搜集与态势感知:AIP 帮助军事操作员收集并分析战场相关信息包括敌方装备的情报,数据来自于不同来源包括卫星图像、情报报告和实时战场信息。并且 AIP 具备强大的数据可视化能力,使用者通过自然语言提出类似“战场中敌方主站坦克情报”“己方部队是否有足够资源来执行任务”等问题,AIP 能够快速展示相对应的图表和详细信息,甚至预测敌方单位的可能情报,让指挥官能够实时监控部队动向、敌人位置和关键基础设施;2)AI 驱动的辅助决策:AIP 能够自动化生成行动计划,比如为作战选择几种最有行动方案,为部队建议最佳行进路线,如何扰乱敌方通信
240、、向高优先级目标分配干扰器等,并且 AIP 还能预测敌方可能的战术,能够让决策者能够快速应对新出现的威胁,且能够准确及时的做出战略选择。此外,AIP 还具备军事任务执行,比如操作无人机干扰通信设备,以及军队训练与模拟,网络威胁检测等多种功能。行业深度分析67/95请务必阅读正文之后的免责条款部分图 47:AIP for Defense:分析战场中敌方军队的详细情报图 48:AIP for Defense:给出作战行动计划的相关建议资料来源:Palantir官网、华金证券研究所资料来源:Palantir官网、华金证券研究所AIP 在商业领域也能够实现广泛应用在商业领域也能够实现广泛应用。根据Pa
241、lantir的演示案例,AIP 能够帮助某制造业企业来分析其配送中心网络在飓风的影响下是否需要加快、延迟或取消客户的订单,是否需要增加额外的卡车来提升交货量,可以采取的其他补救措施,并且 AIP 能够给出建议和模拟行动方案,及其估计费用,并且预测不同情况下对客户订单和收入的影响。全部过程都能够通过自然语言等方式实现交互,并且能够为决策者提供高度可视化的呈现。图 49:AIP for Business:查询飓风对配送中心的影响图 50:AIP for Business:查询运输线路的最优化路径资料来源:Palantir官网、华金证券研究所资料来源:Palantir官网、华金证券研究所8)AI+数
242、字代理AI Agent 指在大模型支撑下能够自主理解指在大模型支撑下能够自主理解、规划规划、执行复杂任务的执行复杂任务的 AI 系统系统。今年 3 到 4 月的 Camel、AutoGPT、BabyAGI、GPT-Engineer、西部世界小镇等多个 AI Agents 集中发布引发了 AI Agent 热潮,特别是热度最高 AutoGPT 在完全无需用户提示具体操作的情况下,就能完成日常的事件分析、营销方案撰写、代码编程、甚至网站创建等复杂任务,在一定程度上展示了以大模型为基础作为来构建 AI 系统的能力,即大模型不仅限于生成各种文本内容,还能够解决 行业深度分析68/95请务必阅读正文之后
243、的免责条款部分各种通用的问题,并可以应用于各个领域。同时,目前已发布的 AIAgent 仍以第三方厂商为主,而 OpenAI、Meta、Google 等人工智能巨头也开始在布局这一领域。至今已发布的 AI Agent 仍以通用 AI Agent 居多,通用 AI Agent 在使用成本、速度、技术成熟度上仍存在一定的局限,能力还在不断完善中。而垂直领域的 AI Agent 相较于其他的通用 AI Agent 在结构和功能上更加简单,速度更快且成本更低,预计将实现更快的落地,比如 8 月初 HyperWrite 开发的 AIAgent 主要侧重于网页端,功能相较于通用 AI Agent 更为简单
244、,能够完成包括订餐厅、订机票等任务,其中包括自行查找地址,填写邮编,付款完成订单等操作。表 17:AI+数字代理标杆产品产品产品厂商厂商产品特性产品特性CamelCamelCamel 是一个基于大语言模型开发的通信助理,由 Nomic AI 提供技术支持。基于新式的角色扮演框架下,Camel 可以接受初始提示来完成聊天任务,同时保持与人类意图的一致性。AutoGPTAutoGPTAutoGPT 由 GPT-4 驱动,是一款自主人工智能助手,可以独立处理任务和项目,无需用户提示,能帮助用户自动化和优化业务流程、生成测试用例、调试代码,甚至产生新的业务创意。BabyAGI中岛阳平BabyAGI 是
245、利用 OpenAI、Pinecone、LangChain 和 Chroma 的技术开发的自主 AI 代理,能像项目经理一样,通过创建任务列表、确定优先级并执行,且能适应变化并进行调整以确保实现目标。JARVIS微软JARVIS 由 OpenAI 等提供技术支持,是一款自动任务协作系统,使用 ChatGPT 分析用户的需求,将其分解为多个可解决的任务,结合任务目标选择 Hugging Face 上托管的专家模型调用并执行,并将结果返回给 ChatGPT,最后整合模型预测,并生成响应。HyperWritePersonalAssistantHyperWriteHyperWrite Personal
246、Assistant 是一位 AI 助手,由 OpenAI 提供技术支持。它能无缝集成到用户的工作流中,了解用户的偏好以提供个性化建议,接管浏览器以实现订票订餐、邮件回复、优化决策等任务。Smallville虚拟小镇斯坦福大学Smallville 中共有 25 个基于 ChatGPT 创造的 AI 居民,他们在虚拟生活中遇到的问题都对应现实社会的实际问题,他们的解决方案和流程展示了生成式 AI 助理在模拟社会互动方面的潜力。WebLLMMLCWebLLM 由 LLaMA、Alpaca、Vicuna 和 Dolly 等开源项目支持,将 LLM 和基于 LLM 的聊天机器人接入网络浏览器,使一切都在
247、浏览器内运行,无需服务器支持,并通过 WebGPU 进行加速,以构建 AI 助手。资料来源:华金证券研究所整理AI Agent 由规划、记忆、工具三大核心功能组件组成。由规划、记忆、工具三大核心功能组件组成。具体来看:1)规划(Planning):Agent 需要将大型、复杂任务分解为多个小型、简单的子任务,需要调用相对应的算法来进行目标制定、目标优先级、目标分解等工作,在此基础上来分配资源和优化决策,同时 Agent 需要具备自我调整和修正的功能,不断优化自身的行为来持续提升决策的质量;2)记忆(Memory):Agent 拥有短期记忆和长期记忆的能力,以完成信息获取、储存、保留、检索的任务
248、,这与人类的记忆结构构成存在相似之处;3)工具(Tool):大语言模型本身具备文本理解和生成能力,代理需要调用外部 API 接口来执行不同的功能,包括搜索引擎、计算器、日历查询等,通过模拟人类使用工具的方式,来完成复杂的任务。行业深度分析69/95请务必阅读正文之后的免责条款部分图 51:AI Agent 的组成模块与实现原理资料来源:Github、华金证券研究所AutoGPT 作为作为 AI Agent 的标杆应用,最大的特点在于拥有自主决策和执行的能力,但同的标杆应用,最大的特点在于拥有自主决策和执行的能力,但同时作为通用时作为通用 AI Agent,目前还存在明显的局限性目前还存在明显的
249、局限性。AutoGPT 主要基于 GPT-4,用户只需写到任务目标,在无需用户提示具体操作,就能独立运行自主完成各种任务,包括日常的事件分析、营销方案撰写、代码编程、甚至网站创建等复杂任务。同时,GPT-4 仍在 AutoGPT 的运行过程中发挥着重要作用,包括理解意图,对话与交流,知识摘要提取,决策、语言翻译、情感分析与情感识别等。当前 AutoGPT 的局限性主要体现在:1)使用成本过高:由于 AutoGPT 需要调用GPT-4,而且在特定任务中需要多次调用,因此每次完成任务的成本都不可控,即使对于小任务;2)经常陷入循环:用户在使用 AutoGPT 时常见问题就是陷入循环,在陷入循环后,
250、用户需要重新启动流程,主要原因在于 AutoGPT 依赖于 GPT-4 来定义和分解任务;3)存在数据泄露问题:使用 AutoGPT 自主运行来访问互联网和内部系统,在没有适当的安全防护措施时,数据泄露的风险较高。行业深度分析70/95请务必阅读正文之后的免责条款部分图 52:AutoGPT 的工作流程资料来源:AutoGPT、华金证券研究所9)AI+金融生成式生成式 AI 技术在金融领域的主要应用为数据分析工具技术在金融领域的主要应用为数据分析工具,通过对金融大数据的挖掘来实现知通过对金融大数据的挖掘来实现知识洞察,典型应用包括证券领域的智能投顾,银行领域的智能风控等。与此同时,金融行业的识
251、洞察,典型应用包括证券领域的智能投顾,银行领域的智能风控等。与此同时,金融行业的特性决定了对比于通用大模型,垂直行业大模型在金融领域有着更加有效的应用,一是由于安特性决定了对比于通用大模型,垂直行业大模型在金融领域有着更加有效的应用,一是由于安全及隐私保护要求金融数据大多存储在本地,通用大模型在缺乏必要的训练数据,二是金融行全及隐私保护要求金融数据大多存储在本地,通用大模型在缺乏必要的训练数据,二是金融行业在风控、精度等方面要求较高,系统又比较复杂,数据实时性的要求很高,通用大模型的金业在风控、精度等方面要求较高,系统又比较复杂,数据实时性的要求很高,通用大模型的金融常识融常识、安全性和准确性
252、都难以达到要求安全性和准确性都难以达到要求,因此今年彭博社推出了专为金融行业从头打造的因此今年彭博社推出了专为金融行业从头打造的 500亿参数大语言模型亿参数大语言模型 BloombergGPT,训练数据来自于彭博社的财务数据训练数据来自于彭博社的财务数据,涵盖了金融领域涵盖了金融领域的的一一系列主题系列主题,生成了,生成了 7000 多亿个标签的大型训练语料库。多亿个标签的大型训练语料库。BloombergGPT 在金融领域的任务普在金融领域的任务普遍拥有着超过通用大模型的表现。遍拥有着超过通用大模型的表现。证券:证券:包括智能投研、智能投顾等。其中,智能投研:通过生成式 AI 技术筛选和提
253、取不同来源的数据,包括财务报表、公司年报等结构与非结构化数据,帮助投资者进行预测、评估、研报生成等工作,以提高资产配置、盈利预测、资产定价等效率。如,投资者平台 Stratosphere金融数据分析工具 FinChat;智能投顾:运用生成式 AI 技术的大数据处理能力,根据客户风险 行业深度分析71/95请务必阅读正文之后的免责条款部分偏好、资产情况、收益目标等条件,为客户提供投资产品组合及投资建议。目前,代表产品有MorganStanley 的财富顾问聊天机器人、JPMorgan 的 IndexGPT 等。保险:保险:侧重于对客户健康数据的分析。一在保险产品设计环节,根据用户需求及市场需求,
254、自动生成定制化保险方案,并提供对应的风险评估与定价策略。如,Angle Health 的健康保险AI 定制平台,能够为客户量身定制综合医疗保健福利计划;二是根据保险条款、索赔信息与历史数据等对疾病进行预测、自动评估、计算理赔金额,提升理赔效率与准确性。比如 DESAISIV推出的 AI 保险决策工具已处理超过 460 万例患者记录,且平均预测准确率高达 95%,帮助现有保险客户将损失率降低了 5%以上。银行:银行:多用于智能风控,应用于信贷风险预警、反欺诈、反洗钱等环节。通过生成式 AI 技术,对客户的信用历史、行为特征及社会关系等数据进行分析,能够有效挖掘风险因素,提高欺诈行为识别的准确率、
255、风险控制的精准度等。目前有 AI4Finance 开源模型 FinGPT,可以应用于管理金融风险、检测金融诈骗等。营销营销/客服工具客服工具:营销方面:生成式 AI 技术不仅能够一键生成金融产品营销文案,还能主动挖掘客户需并推荐适配产品,同时创建报价和安全付款等链接,提高金融产品的营销效率。如,Lemonade 的销售机器人玛雅;客服方面:可应用于信贷、理财、保险产品等多个业务环节,利用生成式 AI 技术分析用户情感,与用户进行多轮复杂对话,为客户提供精准信息。主要产品有Helvetia 的 AI 客服 Clara、Kyber 的自动化保险助手等。行业深度分析72/95请务必阅读正文之后的免责
256、条款部分表 18:AI+金融标杆产品产品产品分类分类厂商厂商产品特性产品特性财富顾问聊天机器人智能投顾Morgan Stanley摩根士丹利接入 GPT-4,打造了内部专用的财富顾问 AI 聊天机器人,帮助其财富顾问团队更便捷高效地检索投资策略、市场研究和评论、分析师洞察等内容信息。BloombergGPT智能 投研彭博BloombergGPT 将帮助彭博改进现有的金融 NLP 任务,如市场情绪分析、命名实体识别、新闻分类和问题回答等。IndexGPT智能投顾JPMorganIndexGPT 使用了以 ChatGPT 为代表的人工智能技术,旨在根据客户需求,量身分析和选择证券标的。FinCha
257、t智能投研StratosphereFinChat 是基于 ChatGPT 研发的金融数据分析 AI 机器人,提供智能图表生成,数据可视化以及自定义 DCF 估值模型等功能。FinGPT智能风控Al4FinanceFinGPT 基于开源 LLM 进行微调而研发,能够生成量化交易决策、构建投资组合、管理金融风险、检测金融诈骗,全方位服务客户。AI 借贷平台智能营销UpstartUpstart 的 AI 借贷平台基于 FICO 开发新式的 AI-ML 模型,通过收集用户的信用数据和教育工作经历等信息,判断用户还款潜力和预测未来可能的行为,并做出贷款决策。AI 保险决策工具保险决策DESAISIVDE
258、SAISIV 通过其 AI SaaS 平台简化了健康保险的各项流程,包括自动化承保程序、定制保单的福利和覆盖范围、预测发展中的疾病、识别高风险行为和减少客户流失等,多方位提高服务质量。健康保险 AI 定制平台保险平台Angle Health在 AI 平台的支持下,Angle Health 通过量身定制的综合医疗保健福利计划,为用户提供数字优先的护理导航体验。该福利计划包括远程医疗、行为健康和其他数字健康解决方案。保险流程 AI 代理保险代理VoyageTechnologiesVoyage 部署人工智能代理,对索赔流程和模式进行系统分析,并提供改进机会,包括优化现金流、提升索赔及时性、优化索赔流
259、程等。BondGPT智能客服LTXBondGPT 由 Broadridge 子公司 LTX 基于 GPT-4 打造,可以解答用户债券相关问题并识别 LTX 交易平台上的公司债券。AI.MAYA智能营销LemonadeAI.MAYA 是基于 GPT-3 打造的销售机器人,它为客户提供个性化的保险推荐和咨询服务。同时,玛雅还能通过向客户提出有限且高质量的问题,并根据回答进行算法调整,大幅度减少客户管理时间。Clara智能客服HelvetiaClara 基于 ChatGPT,使用来自 Helvetia 发布的内容和数据,例如产品页面和信息指南。Helvetia 目前使用 Clara 推进客户服务,客
260、户可以通过Clara 获得有关保险、养老金和房屋所有权的信息。资料来源:华金证券研究所整理AI+金融应用标杆:金融应用标杆:4 月月 20 日日,Stratosphere 推出了金融分析工具推出了金融分析工具 FinChat,FinChat 覆覆盖了超过盖了超过 5 万家公司,以及万家公司,以及 200 多个财务指标等相关数据,具有基本面分析、股票筛选、可视多个财务指标等相关数据,具有基本面分析、股票筛选、可视化数化数据、财报摘要生成等功能,以对话的方式与投资者进行交互。具体来看,据、财报摘要生成等功能,以对话的方式与投资者进行交互。具体来看,1)基本面分析基本面分析:FinChat 基于用户
261、问题,能够提供毛利率、营业利润、营业收入、资本支出、销售量等基本面相关数据,同时以表格、折线图等可视化的形式呈现。如,用户在 FinChat对话框内提出“特斯拉卖了多少辆 Model 3,利润率多少?”,FinChat 则会即时生成特斯拉的Model3 的销售量和毛利率数据,并附上相关数据表格、折线图,同时还能选择季度、年度等时间维度。行业深度分析73/95请务必阅读正文之后的免责条款部分图 53:Finchat 基本面分析功能资料来源:FinChat官网、华金证券研究所2)股票筛选股票筛选:个人付费版内容,用户以自然语言对话的形式,提出相关筛选条件,FinChat则会直接生成筛选后的结果。如
262、,用户提出“提供一份在过去 5 年中收入每年增长超过 10%、回购股票且市值低于 1000 亿的美股。”,FinChat 则会提供对应美股列表,包括市值、每股收益、增长率等数据;图 54:Finchat 股票筛选功能 行业深度分析74/95请务必阅读正文之后的免责条款部分资料来源:FinChat官网、华金证券研究所3)财报摘要生成:)财报摘要生成:FinChat 根据用户的自然语言所提要求可以生成相关财报总结摘要,同时相关财务数据能以可视化形式展现。比如提出“总结微软上一季度的云业务,包括首席执行官萨蒂亚纳德拉的成就。”FinChat 则会根据微软的相关财务数据进行总结,并将数据可视化,生成包
263、括微软整体收入结构柱状图、云业务收入及增速折线图、表格等。图 55:Finchat 财报摘要生成功能资料来源:FinChat官网、华金证券研究所FinChat 目前实现了目前实现了 C 端收费,并根据提问次数和功能的不同分为免费和付费两个版本,端收费,并根据提问次数和功能的不同分为免费和付费两个版本,同时对于企业用户还可提供同时对于企业用户还可提供 API 接口进行产品自建。接口进行产品自建。具体地,1)个人用户:免费版本每天 10次免费提问,包括财务分析、新闻点评、估值分析等基础功能;付费版本 20 美元/月或者 200美元年,在免费功能的基础上扩充了股票筛选器和盈利日历功能,并且问答次数提
264、升至 50 次。2)企业用户:包括个人版的全部功能,同时提供关键绩效指标和细分数据,并支持外部数据导入,且能够为企业提供 API 接口自建 AI 产品,收费标准和提问次数独立独立确定。表 19:FinChat 收费标准个人免费版个人免费版个人付费版个人付费版企业版企业版功能基本面介绍免费版全部功能付费版全部功能 行业深度分析75/95请务必阅读正文之后的免责条款部分个人免费版个人免费版个人付费版个人付费版企业版企业版销售业绩问答基础财务分析估值比率分析新闻点评股票筛选器盈利日历数据图表可视化、可操作关键绩效指标和细分数据支持外部数据导入提供 API 帮助自建 AI 产品收费标准每天 10 次免
265、费提问提问次数升至 50 次包月 20$/月,包年 200$/年提问次数和收费标准独立确定资料来源:华金证券研究所整理AI+金融大模型的参与者主要有金融机构金融大模型的参与者主要有金融机构、金融资讯公司金融资讯公司、互联网互联网/人工智能等初创公司人工智能等初创公司,而而由于金融资讯公司具备海量金融数据积累的先天优势由于金融资讯公司具备海量金融数据积累的先天优势,因此在此次生成式因此在此次生成式 AI 变革中具备明显优变革中具备明显优势势。1)金融资讯公司:以 Bloomberg 为代表,基于其 IT 技术优势,叠加海量金融数据的积累,在 AI+金融大模型浪潮中具备先天优势。如,头部金融资讯公
266、司彭博自建了拥有 3630 亿词例的数据集和超过 7000 亿 token 的大型训练语料库,开创性地采用金融+通用数据混合预训练的方式,生成了一个包含 500 亿参数的金融大模型 Bloomberg GPT,以支持的金融场景的情感分析、命名实体识别、新闻分类和问答等与文本生成相关的任务;2)金融机构:以摩根大通、摩根斯坦利为代表,凭借其强大的资金实力与大量金融数据,采用基于底层通用大模型微调,或者接入ChatGPT 的方式参与竞争,但由于数据隐私、合规、等问题,多用于机构内部;3)互联网/人工智能等初创公司:主要有 AlphaWatch、Wokelo、Bollwerk 等公司,具备一定的 A
267、I 技术与创新能力,但受限于金融数据的不足,通常会与金融行业相关公司进行合作。图 56:AI+金融公司分类资料来源:华金证券研究所绘制10)AI+医疗 行业深度分析76/95请务必阅读正文之后的免责条款部分AI+医疗通常应用于医药研发医疗通常应用于医药研发、医院诊疗医院诊疗、医疗器械等场景医疗器械等场景,其中化合物合成其中化合物合成、靶点发现等靶点发现等为本次生成式为本次生成式 AI 变革的新应用,电子病历、辅助问诊等医院诊疗为变革的新应用,电子病历、辅助问诊等医院诊疗为 AI 常用场景,常用场景,CT、MRI 等等医疗器械在生成式医疗器械在生成式 AI 赋能下进一步增强。赋能下进一步增强。A
268、I+医疗参与者众多,除了谷歌、微软等科技巨头的医疗参与者众多,除了谷歌、微软等科技巨头的加入,还包括加入,还包括 Sensely、Enlitic 等医疗科技公司、医疗科技公司、AbSci、Exscientia 生物医药初创企业,以及生物医药初创企业,以及赛纽仕等赛纽仕等 CXO 企业,市场较为分散。企业,市场较为分散。1)医药研发医药研发:生成式 AI 的数据生成、预处理等功能给药物发现中的靶点发现、化合物合成带来了突破性进展,而化合物筛选、晶体预测等临床前研究的应用还未完全成熟。通过 AI 大模型一是能够根据所需功能和结构生成新型小分子、核酸序列和蛋白质,用于判断不同维度的生物信息,同时能够
269、在计算机中进行拟合优化,以适应特定的靶点;二是生成式 AI 可以生成化合物结构,并生成分子库进行虚拟筛选,但目前化合物筛选领域的应用并未完全成熟。代表性产品包括 AbSci、Integrated Drug Creation、CentaurAI 等。此外,医药研发还包括临床试验、审批上市、销售等环节,利用生成式 AI 技术能够有效提高其生产效率。美国合成生物学公司美国合成生物学公司 AbSci 通过生成式通过生成式 AI 技术技术,在药物开发环节取得了突破性的进展在药物开发环节取得了突破性的进展,开开创性地在零样本的情况下使用生成式创性地在零样本的情况下使用生成式 AI 技术设计并验证从头测序治
270、疗性抗体技术设计并验证从头测序治疗性抗体,提高了候选新药提高了候选新药进入临床的效率以及成功率进入临床的效率以及成功率。在新药开发流程中,确定靶标分子是新药开发的基础,即先确定具备药效且能被药物作用的抗体,再根据抗体中的靶标分子设计候选药物序列。AbSci 通过生成式AI 构建了不同于现有抗体数据库的抗体,包括了所有三重链条 CDR 的从头测序版本,也是靶标检测最关键的抗体区域,并且通过 10 万多种抗体进行验证,发现我们的命中率高出生物基线水平检测的 5 到 30 倍。图 57:AbSci 通过生成式 AI 构建抗体资料来源:AbSci官网、华金证券研究所2)医院诊疗:)医院诊疗:医院诊疗是
271、目前 AI+医疗的常用场景,但多用于电子病历、辅助诊疗、数据分析等对患者影响小、风险低的场景。一方面,院内包括电子病历、辅助问诊、导诊分诊等场景,行业深度分析77/95请务必阅读正文之后的免责条款部分利用生成式 AI 技术整理文字、图像等多模态医疗信息,自动化生成病例、药方、提供诊疗建议等;另一方面,院外包括互联网医院、保险机构等,基于生成式 AI 分析医疗记录、预测病情发展趋势、健康管理等,以提高数据分析效率,以及优化人机交互。主要有 Epic Systems 公司的电子病历 MyChart 和自助报告工具 SlicerDicer、AWS HealthScribe、DAX Express、H
272、ippocraticAI 等。3 月月 20 日,微软旗下语音识别公司日,微软旗下语音识别公司 Nuance Communication 发布了面向医护人员的发布了面向医护人员的 AI临床笔记软件临床笔记软件 DAX Express,具备自动生成临床笔记草稿功能,旨在提高临床医护管理效率,具备自动生成临床笔记草稿功能,旨在提高临床医护管理效率。早在 2020 年,Nuance 就推出了 DAX 应用程序,能够将就诊患者口头就诊记录转化为临床记录,并通过人工审查流程发送,在四小时内传送到病历中。而基于 GPT-4,DAX 应用程序升级为 DAXExpress,在几秒内就能生成临床记录,大幅缩短了
273、临床记录的生成效率,同时医生可以对 DAXExpress 生成的内容进行编辑和审查,以保证临床记录的准确性。Nuance 宣称,DAX Epress能够提升放射科医生 1.5 倍的效率,以及减少 50%患者支持成本。目前,DAX Epress 还未正式定价,未来将视用户数量和卫生系统规模而定。3)医疗器械医疗器械:过去 AI 用于包括 CT、MRI 等与图像类有关的诊疗一体化器械相对成熟,而生成式 AI 在此基础上进一步增强了处理 X 射线、CT 扫描和 MRI 等医学图像的非结构化数据的能力,提高医疗影像分析的精细度。此外,AI+医疗机器人,包括手术机器人、康复机器人、辅助机器人等,通过生成
274、式 AI 技术能够辅助外科医生进行手术、康复训练等,提高医疗质量。目前,主要有 HeartFlow FFRcT Analysis、Medis Suite MR、CVI 42 等产品。行业深度分析78/95请务必阅读正文之后的免责条款部分表 20:AI+医疗标杆产品产品产品分类分类厂商厂商产品特性产品特性DAX Express医院诊疗NuanceCommunicationsDAX Express 结合 GPT-4 开发,是一款工作流程集成的全自动临床文档应用程序,使用对话式、环境式和生成式 AI 的独特组合,可在几秒钟内自动安全地创建临床笔记草稿,并在患者就诊结束后立即提供。MyChart医院诊
275、疗Epic SystemsEpic 通过结合 Azure OpenAI 的来开发生成式 AI 并将其集成到医疗保健。电子病历MyChart 集成的一系列全面的生成式人工智能驱动解决方案,帮助医护人员回复患者信息和分析医疗记录以提高生产力。SlicerDicer医院诊疗SlicerDicer 是一款自助报告工具,可以实现自然语言查询和交互式数据分析,帮助临床领导者以对话和直观的方式探索数据。AWSHealthScribe医院诊疗亚马逊AWS HealthScribe 将语音识别和生成式 AI 相结合,能够实现总结临床笔记、本文转录场景分类、原始数据可溯源、医疗术语识别等功能。Hippocrati
276、cAI医院诊疗Hippocratic AIHippocratic AI 主要提供两大功能:Patient simulator 提供了心血管、呼吸等 8 种模拟病人问答以及考试、笔记、病例录入等学习功能。Flashcard generator 提供了文本切片功能,医生可以上传自己的医学笔记,由系统自动生成医疗问答。DocsGPT医院诊疗DoximityDocsGPT 是基于 GPT-4 开发的医用人工智能写作助手,能起草事先授权信、保险上诉、患者支持信等,节约医生撰写规范性文件的时间。Babylon APP医院诊疗Babylon HealthBabylon 的 AI 病症查询功能可以通过与患者沟
277、通,了解他的具体病症,可以帮助做出有关分诊、症状原因和未来健康预测的决策。据官方表示,Babylon 可以达到 80%的诊断准确率。NablaCopilot医院诊疗NablaNabla Copilot 基于 GPT-3 开发,能实现自动更新病例、即时记录病情、自动生成诊断信等功能,帮助医生减少 40%的书面工作,为病人提供更多关怀。ChatPandaGPT医药研发InsilicoMedicineChatPandaGPT 与 PandaOmics 的知识图谱功能集成,提供了一种更高效、准确和个性化的方式来访问有关分子生物学、治疗靶点发现和药物开发的信息。冠状动脉 CT扫描医疗器械CleerlyC
278、leerly 基于 15 年间收集的 40,000 多名患者超过 1000 万张图像而开发的人工智能算法能够生成患者冠状动脉的 3D 模型,识别其管腔和血管壁,定位和量化狭窄,以及识别、量化和分类斑块。HeartFlowFFRcTAnalysis医疗器械HeartflowHeartFlow 从标准冠状动脉计算机断层扫描血管造影(CTA)开始,利用深度学习训练的算法来创建数字化、个性化的心脏 3D 模型,患者的心脏将变成显示冠状动脉的彩色编码 3D 图像,使医生可以更轻松地无创地确定动脉病症。Medis SuiteMR医疗器械Medis medicalimagingMedis Suite MR
279、用于心脏 MRI 检查后处理的解决方案,其中嵌入了基于 AI 的轮廓检测和预处理算法,在临床常规和科学研究中评估心脏的不同结构和心脏功能,可以对心脏 MRI 的功能、应变、灌注、活力、映射和 2D 和 4D 血流进行定量评估。IntegratedDrugCreation医药研发AbsciIntegrated Drug Creation 利用数十亿个蛋白质相互作用数据以训练机器学习模型,应用生成式人工智能,根据目标亲和力、安全性、可制造性等特征设计最佳候选药物,最后由湿实验室验证 AI 生成的新设计。CentaurAI医药研发ExscientiaCentaurAI 包括两大功能:Centaur
280、Biologist 能识别并评估靶点,与相关疾病关联,根据靶点的结构和生物学特征确定是否能够成药。Centaur Chemist 针对新发现的靶点设计,利用生成式对抗网络和深度学习系统生成全新的小分子化合物。资料来源:华金证券研究所整理AI+医疗参与者包括科技公司医疗参与者包括科技公司、生物医药初创企业生物医药初创企业、CXO 医药服务商等医药服务商等,且其根据自身功能且其根据自身功能优势在生成式优势在生成式 AI 赛道中齐头并进赛道中齐头并进。1)科技公司:包括具有大模型研发能力的谷歌、微软等头部科技大厂,以及 Sensely、Enlitic、Schrodinger 等医疗科技公司。其中,谷
281、歌、微软等科技公司具备大模型研发能力,采取收购/合作的方式,将其大模型应用于医疗行业;Sensely、Enlitic 等医疗科技公司针对辅助问诊等应用,提供个性化的诊断与建议;2)生物医药初创企业:以 AbSci、Exscientia、Hippocratic 为代表的初创企业,多集中于药物发现和临床前研究的开发;3)CXO 行业深度分析79/95请务必阅读正文之后的免责条款部分医药服务商:以 CRO 龙头企业赛纽仕为代表,基于其已有的医疗服务数据,训练生成式 AI 模型以服务临床研究,包括临床方案设计、数据分析、流程管理等。图 58:AI+医疗公司分类资料来源:华金证券研究所绘制11)AI+教
282、育生成式生成式 AI 在教育领域的应用根据功能的不同分为语言学习在教育领域的应用根据功能的不同分为语言学习、在线课程在线课程、学习工具三个层面学习工具三个层面,而目前应用最多的是语言学习和学习工具,主要在于具有多语言理解、多轮对话能力的大模型而目前应用最多的是语言学习和学习工具,主要在于具有多语言理解、多轮对话能力的大模型天然适配语言学习和学习工具场景天然适配语言学习和学习工具场景。同时同时,教育领域的商业化模式较为成熟教育领域的商业化模式较为成熟,生成式生成式 AI 技术的技术的注入将为其带来价值量的跃升。注入将为其带来价值量的跃升。1)语言学习语言学习:语言学习是目前与生成式 AI 最契合
283、的教育场景,技术和商业模式都相对成熟。通过生成式 AI 的多语言理解和多轮对话的能力,学习者不仅可以以多轮对话的形式进行多语言交流、听力、写作等语言训练,还可以生成评估报告并对学习者进行纠错。代表性产品有 DuolingoMax、Elsa AI、AI Tutor 等。2)学习工具学习工具:学习工具在技术上已经具备一定的成熟度,包括拍照搜题、知识检索等场景。基于生成式 AI 技术,学生一是可以针对难题进行拍照搜题,识别并解析正确答案;二是对于不懂的知识点,学生可以通过对话、图片识别等形式进行答案的快速检索。目前,主要产品有 Ginny、PhotoMath、CheggMate、Q-Chat 等。行
284、业深度分析80/95请务必阅读正文之后的免责条款部分3)在线课程在线课程:生成式 AI 技术一方面,辅助教师进行课程规划,并自动生成教案以提高备课效率;另一方面,对学生进行模拟一对一辅导课程,提供个性化的支持。目前产品主要有 Udemy、Khanmigo、Embibe Lens 等。表 21:AI+教育标杆产品产品产品分类分类厂商厂商产品特性产品特性Duolingo Max语言学习DuolingoDuolingo Max基于GPT-4开发,具备两个全新功能“解释我的答案”(Explain my answer)、“角色扮演”(Roleplay)。ELSA AI语言学习ELSA SpeakELSA
285、 AI 是一款具备生成式 AI 功能的语音导师,能基于特定场景进行角色扮演式学习,通过互动性对话和导师式的及时反馈帮助用户提升语言能力。AI Tutor语言学习SpeakAI Tutor 内置在 Speak APP 中,基于 GPT-4 构建,其语音识别功能和 AI 技术能让用户在不需要真人讲师的情况下进行对话训练。CheggMate学习工具CheggCheggMate 将 GPT-4 先进人工智能系统的强大功能与 Chegg 丰富的内容库和主题专家相结合,为用户提供快速、个性化、自适应、准确以及有效的学习指导,通过个性化评估和练习测试,量身定制人工智能导师。Khanmigo在线课程Khan
286、AcademyKhanmigo 是基于 GPT-4 开发的 AI 导师,能为学生提供一对一答疑,帮助学生深入理解;通过辅助课程规划和提供反馈,帮助教师提升教学质量;充当写作教练,推动学生练习写作和辩论;进行代码纠错,帮助学生提高计算机能力。Q-Chat学习工具QuizletQ-Chat 是基于 ChatGPT 并结合 Quizlet 教育内容库构建的人工智能导师,采用基于问题的苏格拉底式方法促进主动学习,能够测试学生对教育内容的了解、提出深入的问题以了解基本概念、测试阅读理解能力、帮助学生学习语言并培养学习习惯。Qanda APP学习工具QandaQanda 是一款人工智能学习平台,用户拍下不
287、会的问题上传,它会在 5 秒内提供解决方案、类似问题、视频解答、概念论文,甚至讲座。Photomath APP学习工具PhotomathPhotomath 是一款人工智能驱动的数学辅导应用程序,使用计算机视觉和智能手机摄像头来读取和解决数学问题,提供动画计算步骤以及有关如何处理这些问题的说明。Ginny学习工具BrainlyGinny 基于 GPT-4 打造,可以利用 Brainly 的数据库,其中包含超过 2.5 亿个高质量且准确的答案,为用户提供作业帮助。Ginny 可以提供“简化”或“扩展”答案并解决用户提出的后续问题,并根据用户的理解产生个性化内容。MemBot语言学习MemriseM
288、embot 是基于 GPT-3 构建的人工智能语言合作伙伴,借助 MemBot,用户将能够随时随地通过多样化的对话、游戏和“任务”按需练习语言技能。EMBIBE Lens学习工具EMBIBEEMBIBE Lens 利用人工智能技术,使用智能手机相机无缝扫描书籍中的段落,通过注释图像和沉浸式 3D 模型轻松解读复杂的概念。Udemy APP在线课程UdemyUdemy 利用人工智能技术增强教师、学生和组织实现更好的学习成果,编码练习功能允许教师发布任务描述,由人工智能自动编写练习所需的代码。Udemy 的人工智能可以根据学生的职业目标从众多课程中向他们推荐课程中的特定视频讲座。资料来源:华金证券
289、研究所整理AI+教育应用标杆一:教育应用标杆一:3 月月 15 日,美国语言学习软件日,美国语言学习软件 Duolingo 基于基于 GPT-4 模型推出模型推出了了Duolingo Max,基于,基于 Super 的订阅服务新增了的订阅服务新增了 Explain My Answer 和和 Roleplay 两项功能,两项功能,按按 30 美元美元/月或者月或者 168 美元美元/年收费。年收费。其中,1)Explain My Answer:扮演个性化导师的角色,即在 Duo 中完成练习后,用户可以选择与 Duo 进行对话,帮助理解自己的答案正确与否的原因,并给出详尽的示例。如,在翻译练习中,
290、当你翻译的答案错误时,Duo 会让你选择解释答案或者继续下一题,若点击解释答案后,Duo 将会告知你是句子中词语的单复数形式错误,并给出什么情况下用单数还是复数,并举例说明。2)Roleplay:用户可以与 AI 角色进行互动并执行多种学习任务。比如,背景故事是在巴黎的咖啡厅,AI 角色为咖啡师,用户可以向咖啡师点单并要求 行业深度分析81/95请务必阅读正文之后的免责条款部分口味等细节,进行日常语言交流训练。且在交流完成后,Duo 会生成此次角色扮演训练的分析报告,并给出改善建议以进一步提高用户语言水平。图 59:Duolingo Max 两大全新功能“解释我的答案”、“角色扮演”资料来源:
291、Duolingo官网、华金证券研究所AI+教育应用标杆二教育应用标杆二:美国在线教育组织美国在线教育组织 Khan Academy 于于 4 月发布了基于月发布了基于 GPT-4 模型模型的的AI 助教助教 Khanmigo,具有辅导教学、教案生成、写作训练、编程练习等功能,需要订阅付费进,具有辅导教学、教案生成、写作训练、编程练习等功能,需要订阅付费进行解锁行解锁,付费标准为付费标准为 9 美元美元/月或者月或者 99 美元美元/年年。其中,1)辅导教学:可以为学生进行一对一辅导,在学生索要答案时,Khanmigo 不会直接给出结果,而是主动引导学生进行答题的思维训练,并解释每一个步骤的正确
292、性,直至学生自己计算得出正确答案;2)教案生成:赋能教育工作者,Khanmigo 能够通过对话的方式,引导教育工作者制定课程计划,有效提升备课的效率与质量;3)写作训练:Khanmigo 可以作为写作指导老师,根据人物特征、故事背景等具体细节提示和建议学生以不同的切入点进行写作、辩论等,释放学生的创造力;4)编程练习:在进行编程练习时,Khanmigo 会给出实时反馈,指出代码中的错误并纠正。行业深度分析82/95请务必阅读正文之后的免责条款部分图 60:Khanmigo 具备辅导教学、教案生成、写作训练、编程练习四大功能资料来源:Khan Academy官网、华金证券研究所生成式生成式 AI
293、 在语言学习和学习工具场景上率先商业化,在线教育场景旨在改善其现有功能在语言学习和学习工具场景上率先商业化,在线教育场景旨在改善其现有功能,这主要与生成式这主要与生成式 AI 在内容生成、多语言理解等能力有直接关系。在内容生成、多语言理解等能力有直接关系。其中,语言学习龙头厂商Duolingo 基于生成式 AI 推出的 Max 版本相较 Super 版本新增了两个 AI 功能,且订阅价格也从6.99 美元/月涨至 30 美元/月,同时也带动了 Duolingo 股价的上涨,年初至今涨幅最高超 109%;学习工具 Khanmigo 功能 9 美元/月,Q-Chat 订阅标准为 7.99 美元/月
294、,CheggMate 计划定价在15.95 美元-19.95 美元之间。表 22:AI+教育产品商业化案例厂厂商商DuolingoDuolingoSpeakSpeakCheggCheggQuizletQuizletKhanKhan AcademyAcademy产品Duolingo MaxAI TutorCheggMateQ-ChatKhanmigo功能Duolingo Max 基 于GPT-4 开发,具备两个全新功能“解释我的答案”、“角色扮演”。AI Tutor 内置在 SpeakAPP 中,基于 GPT-4 构建,其语音识别功能和AI 技术能让用户在不需要真人讲师的情况下进行对话训练。Ch
295、eggMate 将 GPT-4 与Chegg 的内容库和主题专家相结合,为用户提供快速、个性化、自适应、准确以及有效的学习指导,通过个性化评估和练习测试,量身定制人工智能导师。Q-Chat 是基于 ChatGPT 并结合 Quizlet 教育内容库构建的人工智能导师,能够测试学生对教育内容的了解、提出深入的问题以了解基本概念、测试阅读理解能力、帮助学生学习语言并培养学习习惯。Khanmigo 是基于 GPT-4 开发的 AI 导师,能为学生提供一对一答疑,帮助学生深入理解;通过辅助课程规划和提供反馈,帮助教师提升教学质量;充当写作教练,推动学生练习写作和辩论;进行代码纠错,帮助学生提高计算机能
296、力。订阅模式Duolingo Max 方案30$/月或 168$/年Premium 方案88¥/月、588¥/年CheggMate 订阅费用尚未披露,计划为15.95$-19.95$/月Quizlet Plus 方案7.99$/月或 35.99$/年Khanmigo 方案9$/月或 99$/年资料来源:华金证券研究所整理 行业深度分析83/95请务必阅读正文之后的免责条款部分12)AI+工业由于工业场景较为复杂,各细分领域生产流程、配置、产品类型等差异较大,且生成式由于工业场景较为复杂,各细分领域生产流程、配置、产品类型等差异较大,且生成式 AI主要基于自然语言进行代码生成主要基于自然语言进行
297、代码生成、图像生成等功能图像生成等功能,因此当前因此当前 AI 大模型在工业中的应用仍处于大模型在工业中的应用仍处于探索阶段探索阶段,主要聚焦在研发设计主要聚焦在研发设计、生产制造生产制造、运维管理三个层面运维管理三个层面。目前目前,生成式生成式 AI 多用于研发多用于研发设计中的创成式设计、草图生成等辅助类设计的应用,以及运维管理中业务流程信息化设计中的创成式设计、草图生成等辅助类设计的应用,以及运维管理中业务流程信息化 CRM、ERP 等软件等软件,生产制造环节由于生产环境的安全性与稳定性要求较高生产制造环节由于生产环境的安全性与稳定性要求较高,生成式生成式 AI 技术应用还不技术应用还不
298、成熟。从工业大模型参与者来看,研发设计和生产制造仍然是以成熟。从工业大模型参与者来看,研发设计和生产制造仍然是以 Dassault、PTC、SIEMENS、Autodesk 为代表的工业软件厂商,运维管理则是企业服务相关厂商。为代表的工业软件厂商,运维管理则是企业服务相关厂商。1)研发设计研发设计:研发设计端目前是生成式 AI 技术应用最有可能突破的细分领域,其中创成式设计、草图生成、效果图渲染等辅助类设计已经实现初步应用。一方面,生成式 AI 能够根据设计师提供的设计约束条件,包括设计材料、载荷位置等,以更快地速度和更少的错误率生成设计方案,提高研发设计效率;另一方面,生成式 AI 助力草图
299、绘制、结构设计仿真等环节,能够根据工程师的需求生成设计草图,同时快速读取文本数据并提取所需特征及信息,降低图像生成、数据处理等环节成本。目前,Dassault、PTC、SIEMENS、Autodesk 等厂商在其主流的 CAD产品中内置了创成式设计模块,且具备 AI 辅助创建草图功能。Dassault 基于云端协作平台基于云端协作平台 3D EXPERIENCE 构建了构建了 AI 设计助手设计助手,包括选择助手包括选择助手、匹配匹配助手、草图助手、智能配接四个工具,并内置机器学习算法,以帮助工程师自动完成耗时且重助手、草图助手、智能配接四个工具,并内置机器学习算法,以帮助工程师自动完成耗时且
300、重复的工作复的工作,提高工业研发设计效率提高工业研发设计效率。其中,1)选择助手:适用于挑选边缘、圆角或倒角等任务。根据用户已完成的工作预测并建议下一步选择,并优化预测结果,使操作更加高效,在更短的时间完成设计任务;2)匹配助手:能够自动识别重复组件的位置并给出摆放,以帮助工程师减少安装重复组件的时间,节省安装效率;3)草图助手:能识别底层几何图形上的类似特征,预测下一步要绘制的草图,并迅速将选定的草图对象和实体复制到具有类似周边特征的多个位置,同时自动完成绘制;4)智能配接智能配接:帮助用户建立配接时,让组件在拖动至与周围组件配接的位置时保持固定,且将一个组件拖动至另一组件的边缘附近时,智能
301、配接命令会自动启动,识别正确的配接面,以便实时建立完全想要的组合配接。行业深度分析84/95请务必阅读正文之后的免责条款部分图 61:达索四大 AI 设计助手:选择助手、匹配助手、草图助手、智能配接资料来源:实威国际、华金证券研究所2)生产制造:生成式)生产制造:生成式 AI 技术可应用于生产工艺优化、需求分析预测、产品质量检测、生技术可应用于生产工艺优化、需求分析预测、产品质量检测、生产计划调度、自动化控制等环节,但由于工业环境的复杂,对于生产制造环境的安全性与稳定产计划调度、自动化控制等环节,但由于工业环境的复杂,对于生产制造环境的安全性与稳定性要求更高,因此生成式性要求更高,因此生成式
302、AI 技术在该层面的应用较为缓慢。技术在该层面的应用较为缓慢。其中,需求分析检测等与数据分析场景相关的应用将率先落地,而未来随着 AI 大模型鲁棒性能的提升,产品质量检测、生产计划调度、自动化控制等环节也将显著增强。目前,以 SIEMENS 为代表的工业软件厂商已经开始利用生成式 AI 技术进行产品质量检测、自动化控制等。具体来看,一是需求分析预测,工程师可以通过自然语言交互提取历史数据、查找产线信息等,并根据对应数据、信息进行关联分析以制定生产计划,提高生产效能。二是产品质量检测,包括增强视觉检测能力、缺陷样本生成、检测报告生成。其中,增强视觉检测;使用 AI 大模型提高模型的泛化能力,提高
303、视觉检测在质检、安全监测的精确度;缺陷样本生成:生成式 AI 能够生成模拟检测图像缺陷样本,提高工业检测准确性;检测报告生成:自动检测并对结果进行分析,同时生成检测报告;三是生产计划调度,主要应用于工业生产排产与调度,利用 AI 大模型能够优化工业生产的排产、生产、物流调度等流程,提高生产效率;四是自动化控制,基于自然语言自动生成 PLC 控制代码,提高开发效率。行业深度分析85/95请务必阅读正文之后的免责条款部分2023 年年 4 月月,西门子宣布与微软合作西门子宣布与微软合作,在产品生命周期管理在产品生命周期管理、质量检测质量检测、自动化控制三方自动化控制三方面使用生成式面使用生成式 A
304、I 技术技术,以改进其生产制造效率以改进其生产制造效率。其中,1)产品生命周期管理:西门子的产品生命周期管理(PLM)软件 Teamcenter 与微软的协同平台 Teams、Azure OpenAI 服务中的语言模型,以及 Azure AI 功能进行集成,使得工程技术人员能够使用自然语言记录并报告产品设计或质量问题,同时通过 Azure OpenAI 的服务对非正式的语音数据进行解析,自动创建总结报告,并在 Teamcenter 中发送给团队人员;2)自动化控制:主要包括 PLC 代码生成功能,西门子和微软还将合作开发可编程逻辑控制器(PLC)的代码生成工具,基于自然语言输入生成 PLC 代
305、码,有助于维护团队以更快的速度识别错误,提高开发效率;3)质量检测:运用 Microsoft Azure和西门子的 Industrial Edge 平台,借助计算机视觉分析相机和视频捕获的图像识别产品差异,实现对产品质量的实时监控与调整。3)运维管理运维管理:生成式 AI 赋能工业产品研发、生产、服务和管理过程中业务流程信息化的工业软件,包括 CRM、ERP、SCM、QM 等运维管理类软件,大幅提升工业管理效率。目前,CRM、ERP 等管理类软件应用相对成熟,其中,CRM 代表厂商有 Salceforce、Sprinklr、HubSpot 等;ERP 主要包括微软 Dynamics 365 C
306、opilot、SAP 等。AI+应用参与者包括工业软件厂商应用参与者包括工业软件厂商、互联网科技厂商互联网科技厂商、平台厂商等平台厂商等,由于工业场景的复杂度由于工业场景的复杂度,很多数据不可读取,因此工业软件厂商、平台厂商与具备大模型能力的互联网科技厂商进行合很多数据不可读取,因此工业软件厂商、平台厂商与具备大模型能力的互联网科技厂商进行合作,加速生成式作,加速生成式 AI 在工业领域的应用。在工业领域的应用。由于工业场景复杂度较高,且细分领域产品类型差异较大,因此通常采用合作的方式进行工业大模型的研发。其中,工业软件厂商具备工业场景数据优势,而平台厂商具备工业机理与实时生产数据双重优势,通
307、过与具备 AI 大模型能力的互联网科技厂商合作,能够快速渗透工业领域构建大模型。行业深度分析86/95请务必阅读正文之后的免责条款部分表 23:AI+工业标杆产品产品产品分类分类厂商厂商产品特性产品特性Fusion 360研发设计AutodeskFusion 360 内置的 Project Dreamcatcher 提供创成式设计,包含制造感知技术、并行工程支持、开发过程自动化、集中数据、增材制造等多项功能CATIA GDE研发设计DassaultCATIA GDE(功能驱动创成式设计)持续迭代升级,集仿真计算、材料、工艺、生产于一体,由功能规格驱动,旨在创建创新的轻量化产品结构,实现工作流程
308、简化与创新形状结构的短期交付。Cerebrus研发设计CadenceCadence 推出的首款基于 AI 的设计工具 Cerebrus,可以实现数字芯片设计的自动化与规模化,实现 PPA 结果改进,应对设计规模、复杂度的攀升Sensei GenAI运维管理AdobeSensei GenAI 服务使用多种大型语言模型,包括 Microsoft Azure OpenAI 服务和FLAN-T5,供用户生成和修改文本。这些服务以 AEP 为基础,统一于通用语言模型,用户可以据此训练专有的生成式 AI 模型,为特定用例定制输出。CreoGenerativeDesign研发设计PTCCreo Genera
309、tive Design 使用 AI 根据系统的设计要求自主创建最佳设计。借助生成设计软件,工程师可以交互式地指定他们的要求和目标,包括首选材料和制造工艺,生成引擎将自动生成设计。TeamcenterAssistant生产控制SIEMENSTeamcenter Assistant 使用机器学习技术理解用户的使用和偏好,能够理解用户所处的上下文,以建议最相关的命令和数据,使 Teamcenter 超越了传统的 PLM。AnsysGPT研发设计AnsysAnsysGPT 采用 ChatGPT 技术构建,使用 Ansys 公共数据训练,将分布在多个工程师之间的领域专业知识整合到一个虚拟知识引擎中,补充
310、了 Ansys 现有的 AI 集成,包括利用 AI/ML 改进湍流模型的计算流体动力学(CFD)求解器等。Synopsys.ai研发设计SynopsysSynopsys.ai 是业界首个电子设计自动化(EDA)解决方案套件,从系统架构到设计和制造均使用人工智能技术,可实现设计空间探索、验证覆盖范围和测试程序生成等功能,帮助优化功耗、性能和面积,使得工程师能够专注于芯片质量和差异化。FactoryTalkAnalyticsLogixAI生产控制RockwellLogixAI 是为 OT 人员提供的用于异常检测的人工智能工具,可直接安装在控制机箱中,通过背板传输控制器数据以构建预测模型,持续监控生
311、产运营,根据其衍生的理解检测异常,使 OT 人员能够轻松解决产品质量问题并帮助保护流程完整性。资料来源:华金证券研究所整理13)AI+汽车AI+汽车主要应用于智能座舱与自动驾驶两大领域,其中生成式汽车主要应用于智能座舱与自动驾驶两大领域,其中生成式 AI 技术率先应用于座舱内技术率先应用于座舱内部用于人机交互的车载语音助手部用于人机交互的车载语音助手,以及自动驾驶数据自动标注以及自动驾驶数据自动标注、感知规控算法算法的迭代感知规控算法算法的迭代。其其中,智能座舱市场格局较为分散,目前以梅赛德斯奔驰等主机厂,以及中,智能座舱市场格局较为分散,目前以梅赛德斯奔驰等主机厂,以及 Cerence 等语
312、音开发厂等语音开发厂商为代表的座舱语音助手已经实现了生成式商为代表的座舱语音助手已经实现了生成式 AI 与汽车的集成;自动驾驶与汽车的集成;自动驾驶 AI 大模型的研发主要大模型的研发主要有主机厂、科技厂商、初创公司,目前以特斯拉为代表,采用基于有主机厂、科技厂商、初创公司,目前以特斯拉为代表,采用基于 Transformer 模型的占用网模型的占用网络(络(Occupancy Network)感知算法,实现了感知算法端到端的大模型架构开发。)感知算法,实现了感知算法端到端的大模型架构开发。具体地,具体地,智能座舱:智能座舱:生成式 AI 主要带来了座舱内部人机交互的变革,主要体现在车载语音助
313、手。过去座舱内的语音交互需要固定顺序的词汇激活系统作出对应指令,而生成式 AI 能够主动识别用户语言,包括唤醒词在语音指令不同的位置,并根据用户偏好进行反应,大幅增强用户交互体验。目前,梅赛德斯奔驰预计于今年发布的 MBUX“读心语音助理”的升级版本,并在部分豪华车型中接入 ChatGPT。而接入 ChatGPT 的 MBUX 具备更快的响应速度,不需要唤醒词,直接下达指令后 0.5 秒语音助手即刻上线,空调、车窗、娱乐系统只需 1 秒就能执行。行业深度分析87/95请务必阅读正文之后的免责条款部分图 62:智能座舱词汇激活系统资料来源:智能汽车俱乐部、华金证券研究所6 月月 18 日,美国汽
314、车软件提供商日,美国汽车软件提供商 Cerence 推出了推出了 AI 语音开发平台语音开发平台 Cerence Studio,为为OEM 和合作开发人员提供包括语音识别和合作开发人员提供包括语音识别、自然语言理解自然语言理解、对话工具等功能对话工具等功能。Cerence Studio 的自然语言理解能力能够根据用户的情绪变化,创建自然的响应方式与用户进行语音交互,并支持超过 25 种语言。如,用户说出“帮我在 Malibu 找一家有户外座位且评价至少 4 星的意大利餐厅,不要披萨店”,系统能够根据这段语音中的指令和筛选项给出对应选项,且不需要固定的唤醒词。自动驾驶自动驾驶:生成式生成式 AI
315、 技术将从数据处理技术将从数据处理、算法迭代算法迭代、仿真系统三个层面提升自动驾驶性能仿真系统三个层面提升自动驾驶性能,其中数据处理效率的提升最为明显其中数据处理效率的提升最为明显,而由于汽车较低容错率的行业特性而由于汽车较低容错率的行业特性,目前生成式目前生成式 AI 技术在技术在算法迭代方面的应用还处于探索阶段。算法迭代方面的应用还处于探索阶段。1)数据处理:)数据处理:主要在于数据挖掘和数据标注环节。其中,数据挖掘:随着自动驾驶的数据量呈指数级增加,生成式 AI 技术的认知与推理能力能够高效训练数据,使系统具备自主的数据挖掘、处理能力;数据标注:海量数据以及 3D 场景下人工标注较为困难
316、且成本较高,生成式AI 技术能够实现数据的自动标注,以较低成本实现数据处理效率的大幅提升。2)算法迭代算法迭代:生成式 AI 技术能够加强自动驾驶感知与规控的精度,从而加快自动驾驶算法的迭代效率。其中,感知端:目前自动驾驶是以小模型堆砌而成,而运用 AI 大模型,一方面,将其对图像 3D 标注的结果运送给车端小模型,能够提升小模型的认知学习能力;另一方面,AI大模型可以通过知识蒸馏的方式赋能小模型,全面提升其感知性能。规控端:通过生成式 AI 技术,将自动驾驶的车道线、分叉点等车辆环境感知信息转化为大语言模型中的 token 编码进行处理,从而提高自动驾驶路径规划的准确性。3)仿真系统仿真系统
317、:生成式 AI 技术应用于场景构建和仿真测试环节。其中,场景构建:基于生成式 AI 技术,通过路端感知数据进行训练,可以合成大量虚拟场景数据,包括极端天气或者交通 行业深度分析88/95请务必阅读正文之后的免责条款部分场景等 Corner case 等数据,扩大自动驾驶场景的泛化能力;仿真测试:利用生成式 AI 技术可识别出自动驾驶系统中的错误,并自动迭代更新,以提高自动驾驶系统的的安全性与稳定性。图 63:生成式 AI 赋能自动驾驶框架资料来源:华金证券研究所绘制AI+自动驾驶应用标杆自动驾驶应用标杆:特斯拉特斯拉。特斯拉基于 AI 大模型技术,从数据+算法层面对自动驾驶系统赋能。1)数据自
318、动标注:)数据自动标注:特斯拉构建了一个神经网络模型,能够实现向量空间下无监督的自动标注与训练。首先,特斯拉通过车队采集或者影子模式上传的带时间序列信息的图像、IMU、GPS、里程等数据,将其压缩上传至服务器;其次,将收集到的数据经过服务器上的离线神经网络预处理后,利用 Nerf、SLAM 等算法重建三维场景;最后,依托 AI 大模型输出场景重建中不同的 Label,以实现数据的自动标注和训练。2)车端感知算法:)车端感知算法:特斯拉采用基于 Transformer模型的占用网络(Occupancy Network)感知算法,实现了感知算法端到端的大模型架构开发。一方面,特斯拉通过 Trans
319、former 的交叉注意力机制能够实现 2D 特征图到 3D 向量空间的直接转换,且在成功转换后的 BEV 空间内将不同摄像头、不同的时序数据之间的信息融合行程 4D空间,提高车辆感知结果的准确性;另一方面,特斯拉在 BEV 算法基础上进一步升级为占用网络算法,省去 2D 到 3D 转换的过程,直接在矢量空间中输出车辆周围每个 3D 位置被占用的概率,并能够预测瞬时遮挡的障碍物以判断是否需要躲避,大幅减少 Corner case,大幅提升自动驾驶的安全性。行业深度分析89/95请务必阅读正文之后的免责条款部分图 64:特斯拉自动标注原理资料来源:Tesla AI Day 2021、华金证券研究
320、所图 65:特斯拉 Occupancy Network 模型结构图资料来源:Tesla AI Day 2022、华金证券研究所智能汽车中智能汽车中,座舱市场格局较为分散座舱市场格局较为分散,生成式生成式 AI 参与者多以主机厂参与者多以主机厂、车载语音相关厂商为车载语音相关厂商为主主;自驾大模型参与者主要为主机厂自驾大模型参与者主要为主机厂、科技厂商科技厂商、初创公司等初创公司等。目前,1)智能座舱:梅赛德斯奔驰等主机厂在车载语音助手中接入 ChatGPT,Cerence 等语音软件厂商运用生成式 AI 技术进行语音相关产品的升级;2)自动驾驶:一是以特斯拉为代表主机厂,采取自研的方式,运用
321、AI 行业深度分析90/95请务必阅读正文之后的免责条款部分大模型进行车端算法的研发;而 Waymo 为代表的初创公司,与主机厂进行合作,帮助主机厂进行车端自驾算法的迭代,以及数据的处理等工作。表 24:AI+汽车标杆产品产品产品分类分类厂商厂商产品特性产品特性CerenceCo-Pilot智能座舱CERENCECerence Co-Pilot 的核心是主动式人工智能与汽车的集成,分析语音、凝视、手势和触摸输入等实时数据,结合内置智能、用户偏好和车辆传感器信息,让驾驶员随时了解情况,让驾驶员保持安全、舒适、高效和知情。STLASmartCockpit智能座舱stellantisSTLA Sma
322、rtCockpit 由 Mobile Drive 提供支持,将使用基于人工智能的应用程序来提供丰富的功能和服务,例如导航、语音辅助、电子商务市场和支付服务。MBUX 车载系统智能座舱奔驰第三代 MBUX“读心语音助理”接入 ChatGPT 实现升级,用户直接下达指令即可唤醒语音助手,空调、车窗、娱乐系统等绝大多数操作 1 秒就执行,同时具备多意图识别、车辆控制、副驾屏幕交互等功能。自驾系统Aurora Driver自动驾驶AuroraInnovationAurora Driver 是一款自动驾驶系统,选择 AWS 作为云提供商进行 AI 和 ML 训练,依靠先进的感知、运动规划、绘图和模拟系统
323、以及计算机和传感器控制系统,实现自动驾驶。DRIVEChauffeur自动驾驶英伟达DRIVE Chauffeur 是基于 NVIDIA DRIVE AV SDK 的 AI 辅助驾驶平台,该平台使用高性能计算参考架构和 NVIDIA DRIVE Hyperion 8 传感器集,提供主动、安全的自动驾驶功能,并且能够在危险情况下进行干预。Waymo Driver自动驾驶WaymoWaymo Driver 使用 AI 模拟自动驾驶车辆摄像头数据,在公共道路上行驶的英里数达数百万、在模拟环境中行驶的英里数达数十亿、在美国 13 多个州各地进行测试。全自动驾驶(FSD)自动驾驶TeslaFSD 的核心
324、是驾驶员辅助系统(ADAS),结合传感器和摄像头使车辆能够感知周围环境并做出反应,包括从识别路标到检测车辆、行人和障碍物。每辆配备 FSD 的汽车都会不断收集环境数据,深化神经网络的训练,帮助做出更准确的预测并更安全地驾驶。机器人操作系统 MAX自动驾驶PerroneRoboticsMAX 集成了 GPT 的 AI 技术,使公司基于 TONY 的自动驾驶车辆能够在复杂和动态的环境中做出明智决策。通过利用 GPT 的自然语言处理和深度学习能力,MAX 增强了感知、推理和规划能力,从而提高了安全性、效率和适应性。自动驾驶汽车Cruise Origin自动驾驶CruiseCruise 使用微软的云计
325、算及边缘计算平台 Azure 开发自驾技术,Cruise 通过处理数据和反馈,使用 Azure 来操纵其自动驾驶汽车网络,并具备调度和监视所有车队的能力。它的无人驾驶汽车还将通过官方后台和客户端 APP 进行通信,以实现乘车服务。无人配送车R2、Nur自动驾驶NURONuro 与 Google Cloud 建立合作伙伴关系开发自家系统,从远程环境(例如车辆仓库)收集数据,然后执行全天候在线传输,确保云中稳定地提供有价值的数据流,供开发人员在构建中分析和使用。资料来源:华金证券研究所整理14)AI+机器人生成式生成式 AI+机器人将开启机器人将开启“具身智能具身智能”时代时代,根据下游需求的不同
326、根据下游需求的不同,机器人可分为工业机器机器人可分为工业机器人人、人形机器人人形机器人、服务机器人等服务机器人等,其中生成式其中生成式 AI 对于人机交互能力的提升将率先促进人形机器对于人机交互能力的提升将率先促进人形机器人、服务机器人成为人、服务机器人成为“具身智能具身智能”的载体,而工业机器人由于工业领域的环境复杂度较高,以的载体,而工业机器人由于工业领域的环境复杂度较高,以及与人交互需求较低,更多依赖于机器视觉、神经网络等技术的突破。及与人交互需求较低,更多依赖于机器视觉、神经网络等技术的突破。具体来看,1)人形机器人:人形机器人主要以多模态交互为主,在生成式 AI 的赋能下,人形机器人
327、将从机器人的单一智能升级为融合智能,不仅能够完成上下文理解、语义识别等通用语言任务,以及拟合抓取、操作、避障、识别等人类生活场景,同时通过预训练大模型可以实现自动化决策。如,英国机器人厂商 Engineered Arts 推出的人形机器人 Ameca 接入了 GPT-4,语言交流、情绪表达等能力进一步提升;挪威人形机器人公司 1Xtechnologies 研发的 EVE 实体机器人的部分 行业深度分析91/95请务必阅读正文之后的免责条款部分软件功能由 OpenAI 的 ChatGPT 提供支持,增强 EVE 的自然语言、学习等能力,实现 ChatGPT的“实体化”。图 66:1Xtechno
328、logies 旗下 EVE 实体机器人资料来源:1Xtechnologies官网、华金证券研究所2)服务型机器人:服务型机器人主要面向 C 端,具备海量用户数据,同时清洁、外送、聊天等应用场景复杂度相较人形机器人较低,因此大模型最先应用于服务型机器人,进一步降本增效,提高工作效率。包括清洁、外送、聊天等服务场景,服务型机器人通过 AI 实现语音、图片等多模态方式输入,预测并理解不同的场景下用户当下的情感状态,及时作出反应。目前,主要有 Knightscope 的自主安全机器人、Richtech Robotics 的餐饮机器人。图 67:Richtech Robotics 旗下餐饮机器人 Ada
329、m资料来源:Richtech Robotics官网、华金证券研究所 行业深度分析92/95请务必阅读正文之后的免责条款部分3)工业机器人:)工业机器人:工业机器人目前主要应用于工厂生产线、物流、仓储等场景。一方面,AI能够帮助机器人自动进行物体检测、目标识别等交互任务,提升环境交互效率;另一方面,AI可以协助分析生产数据、产品质量等信息,提供质量控制和改进方案。如,瑞士机器人厂商 ABB与微软在其工业数字解决方案业务方面进行合作,将 Azure OpenAI 服务集成到 AAB Genix 工业分析和人工智能套件中,实现代码、图像和文本生成功能。作为作为“具身智能具身智能”的载体的载体,人形机
330、器人人形机器人、服务机器人已经初步实现商业化服务机器人已经初步实现商业化,进行产品零售进行产品零售。目前,OpenAI 领投的 1X 公司推出的医护助理机器人 EVE,已经售出上百台,而 EVE 机器人目前作为安保机器人也已经在美欧国家投入使用,且公司在研的双足机器人 NEO 预计将在2024 年发布,商业化迭代进程加速。同时,特斯拉的人形机器人 Optimus 预计在 2027 年上线,并已公布每台售价 20000 美元/台起。表 25:AI+机器人标杆产品产品产品分类分类厂商厂商产品特性产品特性Genix Copilot工业机器人ABBGenix 平台集成了 GPT-4 等生成式 AI,实
331、现代码、图像和文本生成等功能,由Genix Copilot 提供操作流程的数据流,为工程师提供实时见解,这些见解有可能将资产寿命延长高达 20%,并将计划外停机时间减少高达 60%。Alliom工业机器人安川人工智能技术“Alliom”可以在模拟器上创建接近真实环境的学习数据,训练AI 拣选机拾取不同物体。由于 AI 生成过程在模拟器上完成,大大缩短了包括AI 开发在内的实际操作时间,并提高实际机器引入的准确性。KUKA.Sim(在研)工业机器人KUKAKUKA.Sim 是用于 KUKA 机器人高效离线编程的智能模拟软件,其创建的数字孪生体涵盖了整个规划过程:从流程设计,到物料流与瓶颈的可视化
332、,再到 PLC 代码。KIVI(在研)KIVI 是用于预测工业机器人运行安全和寿命的人工智能,持续监控工业机器人的状态并执行预防性维护,预测精准到单个部件,能避免成本高昂的故障和停产。Ameca人形机器人Engineered Arts3 月底,Engineered Arts 展示了接入 GPT-3 和 GPT-4 后的 Ameca,情绪表达能力进一步提升EVE 实体机器人人形机器人1XTechnologies1XTechnologies由OpenAI领投,旗下EVE实体机器人的部分软件功能由ChatGPT提供支持,实现将 ChatGPT 实体化应用在现实世界的业务场景中。Optimus人形机器
333、人特斯拉采用特斯拉汽车的 FSD 等相关技术,应用于特斯拉机器人 Optimus。自主安全机器人(ASR)服务机器人Knightscope自主安全机器人采用自动驾驶技术、机器人技术、人工智能和电动“车辆”的独特组合,为人类提供额外的眼睛、耳朵和地面声音,可以同时在多个地点,保护人们生活、工作、学习和访问的地方。餐饮机器人 Adam服务机器人RichtechRoboticsAdam 是一款互动餐饮机器人,可以调制各式饮品。Richtech Robotics 为 Adam添加生成式人工智能组件,使 Adam 能够与客户对话,从而更好在酒吧、咖啡吧等场地服务,但公司预计需要六个月才能将此功能添加到 Adam 的能力中。资料来源:华金证券研究所整理 行业深度分析93/95请务必阅读正文之后的免责条款部分三、投资策略生成式生成式 AI 相关标的涉及模型相关标的涉及模型、算法算法、应用应用、算力四大类