《创业邦:2023年H1AIGC产业报告(73页).pdf》由会员分享,可在线阅读,更多相关《创业邦:2023年H1AIGC产业报告(73页).pdf(73页珍藏版)》请在三个皮匠报告上搜索。
1、AIGC的概念AIGC的过去发展阶段、未来发展趋势、现阶段爆发原因AIGC关键技术、AIGC的核心能力AIGC带来的研发范式、生产力、商业化变革AIGC市场空间、企业布局AIGC产业环境:政策、社会情况AIGC产业链框架和图谱产业链细分领域分析上半年产业投融资情况行业总结、投资建议、风险提示研究问题研究问题市场研究及竞争分析思路市场研究及竞争分析思路关注底层技术底层技术发展所带来的应用潜力应用潜力(技术迭代和商业创新、科技成果转化)关注AIGC实际落地实际落地情况(产业发展、细分赛道机会、公司、市场、团队、产品等等)关注与社会环境层面社会环境层面的相互作用(产学研联动、法律法规、政策、商业、劳
2、动市场、伦理)关注技术对人的影响对人的影响(积极和消极)2023开年,ChatGPT的现象级爆红,引发了一场全球互联网巨头关于AIGC的“军备竞赛”,谷歌、微软、百度、Meta等纷纷上场。ChatGPT的问世和不断迭代,让大语言模型这种抽象高端的概念变成了人人都能用上的“个人助理”,一时间风头无两;同时,AI、AIGC带来的冲击也显而易见,社会舆论关于效率、成本、优化、裁员等声音更是不绝于耳在此背景下,创业邦发起2023年H1AIGC产业报告,一方面围绕AIGC带来的变革和发展前景,梳理AIGC产业图谱,总结上半年投融资市场现状;另一方面深入剖析产业链各细分环节的态势,为AIGC技术应用落地和
3、生态发展探索更多的可能性。前 言前 言目录目录0101Industry Overview产业综述0202Industry Analysis产业链分析0303Financing Overview投融资分析0404Investment Advice投资建议0505附录Appendix产业综述产业综述概念:新型内容生产方式产业发展阶段:进入产品破圈爆发新阶段产业机遇:技术赋能内容生产力变革产业潜力:市场空间巨大,科技巨头争相布局产业环境:政策、社会因素影响深远5AIGCAIGC 即 AI Generated Content,利用人工智能技术来生成内容,是继专业生成内容(PGC)和用户生成内容(UGC
4、)之后,利用人工智能技术自动生成内容的新型生产方式。即 AI Generated Content,利用人工智能技术来生成内容,是继专业生成内容(PGC)和用户生成内容(UGC)之后,利用人工智能技术自动生成内容的新型生产方式。其优势在于:大量用户参与,创作效率高,创作成本低,使用门槛低。劣势在于:技术成熟度不足的条件下难以精准满足创作需求和缺乏细节控制力,以及人工智能技术还未解决的算法偏见、信息过载和信息污染、技术依赖等问题。随着专家系统的完善和专业人员的参与,价值对齐,P-AIGC有望成为行业新的曙光。劣势在于:技术成熟度不足的条件下难以精准满足创作需求和缺乏细节控制力,以及人工智能技术还未
5、解决的算法偏见、信息过载和信息污染、技术依赖等问题。随着专家系统的完善和专业人员的参与,价值对齐,P-AIGC有望成为行业新的曙光。概念定义:新型内容生产方式概念定义:新型内容生产方式PGC(专业生产内容)UGC(用户生产内容)PUGC(专业用户生产内容)AIGC(人工智能生产内容)P-AIGC(专业人员指导下的AIGC)?优势:由专业站长或专家提供的内容,可控性强,可以经过多层筛选,呈现在用户面前更具权威,或者更有用。劣势:劣势:“专家”的力量有限,尽管产出内容相对专业,但产出数量却相对薄弱。优势:优势:不必操心网站的内容量。劣势:劣势:内容的质量很难把关,水平参差不齐,控制不好内容的好坏,
6、网站很容易会被广告、垃圾信息所占据。优势:优势:集合了UGC、PGC的双重优势,有了UGC的广度,通过PGC产生的专业化的内容能更好的吸引、沉淀用户。劣势:劣势:内容质量存疑,平台往往需要对于用户进行审核认证,需要建立个人影响力。优势:优势:大量用户参与,创作效率高,创作成本低,使用门槛低。劣势:劣势:难以精准满足创作需求、对细节控制力不够、技术成熟度不够。概念过去发展阶段:早期受制算法算力瓶颈,近年来产品出圈迎来爆发过去发展阶段:早期受制算法算力瓶颈,近年来产品出圈迎来爆发典型事件发展特点早期萌芽阶段沉淀积累阶段快速发展阶段破圈爆发阶段受限于科技水平,AIGC仅限于小范围实验AIGC仅限于小
7、范围实验AIGC从实验性向实用型实用型转变,受限于算法瓶颈,无法直接进行内容生成深度学习与算法不断迭代,人工智能生成内容百花齐放,效果逐渐逼真直至人类难以分辨效果逐渐逼真直至人类难以分辨1950年,艾伦 图灵提出“图灵测试”“图灵测试”,给出机器具有智能的判定方法1957年,第一只计算机创作的弦乐四重奏依利亚克组曲弦乐四重奏依利亚克组曲完成1966年,第一只人机对话机器人“Eliza”对话机器人“Eliza”问世80年代中期,IBM创造语音控制打字机“Tongora”“Tongora”2007年,世界第一部完全由AI创作的小说由AI创作的小说1 The Road问世。纽约大学AI研究员Good
8、win训练了专写小说的神经网络,公路旅行时在车上安放GPS、摄像头、麦克风传感器作为输入2012年,微软首席研究官Rick Rashid在“21世纪的计算大会”上展示全自动同声传译系统全自动同声传译系统,目前,它支持超过50种语言之间的翻译2014年,lan Goodfellow提出生成式对抗网络GAN生成式对抗网络GAN2017年,微软小冰推出世界首部100%AI创作诗集AI创作诗集阳光失了玻璃窗2018年,英伟达发布StyleGAN模型可以自主生成高质量图片自主生成高质量图片2018年,AI生成画作AI生成画作以43.25万美元拍卖成交2019年,DeepMind发布DVD-GAN模型DV
9、D-GAN模型用以生成连续视频20世纪50年代20世纪90年代21世纪10年代中期21世纪20年代初2021年,OpenAI推出了DALL-EDALL-E主要应用于文本与图像交互生成内容2022年5月,推出文本图像生成模型Imagen图像生成模型Imagen2022年8月,开源AI绘画工具Stable DiffusionStable Diffusion发布2022年9月,推出Make-A-VideoMake-A-Video,可以从文字生成视频2022年11月,推出AI聊天机器人ChatGPTChatGPT2023年3月,推出生成式对话产品文心一言文心一言资料来源:中国信息通信研究院,京东探索研
10、究院,创业邦研究中心AI模型取得突破性进展,产品出圈,行业迎来爆发行业迎来爆发发展阶段 行业格局:围绕AIGC的“可供性”。以大模型为主要驱动力,数据和算力也发挥着根本性作用。但受底层大模型接口限制,大部分技术尚未达到稳定进入实际生产环节的水平。围绕AIGC的“可供性”。以大模型为主要驱动力,数据和算力也发挥着根本性作用。但受底层大模型接口限制,大部分技术尚未达到稳定进入实际生产环节的水平。预期:创新触发阶段开始,达到期望膨胀的顶峰。创新触发阶段开始,达到期望膨胀的顶峰。投融资市场:投融资市场:相对活跃。据高盛预测,到2025年,生成式AI投资可能在全球范围内达到约2000亿美元。模型层有并购
11、情况发生。相对活跃。据高盛预测,到2025年,生成式AI投资可能在全球范围内达到约2000亿美元。模型层有并购情况发生。培育摸索期(2023-2025)培育摸索期(2023-2025)行业格局:行业格局:基本价值创造路径和技术思路得到确认,大量可用的AIGC产品涌现,来到寻求可信AI的验证阶段。模型层主要玩家基本确定,整体入局者增多,尤其是大量应用层玩家出现。基本价值创造路径和技术思路得到确认,大量可用的AIGC产品涌现,来到寻求可信AI的验证阶段。模型层主要玩家基本确定,整体入局者增多,尤其是大量应用层玩家出现。预期:预期:技术成熟度曲线进入热度衰退期。技术成熟度曲线进入热度衰退期。投融资市
12、场:投融资市场:初步形成转型效益。初步形成转型效益。应用蓬勃期(2025-2027)应用蓬勃期(2025-2027)行业格局:行业格局:产业生态逐步完善。应用层形成完整解决方案的企业有望产生新的龙头。这一阶段AIGC成为内容领域基础设施、“操作系统”,预计会催生出完全不同的新业态。产业生态逐步完善。应用层形成完整解决方案的企业有望产生新的龙头。这一阶段AIGC成为内容领域基础设施、“操作系统”,预计会催生出完全不同的新业态。预期:预期:攀升至生产力的高原。攀升至生产力的高原。投融资市场:投融资市场:新业态赋能产业转型,成就价值变现。新业态赋能产业转型,成就价值变现。生态繁荣期(2027-203
13、0)生态繁荣期(2027-2030)至2030年,AIGC产业发展共分三个阶段:培育摸索期、应用蓬勃期、生态繁荣期。整体上看,AIGC是未来近10年值得长期深耕的赛道。至2030年,AIGC产业发展共分三个阶段:培育摸索期、应用蓬勃期、生态繁荣期。整体上看,AIGC是未来近10年值得长期深耕的赛道。未来发展趋势:阶段性特征明显,不同类型企业有不同机会未来发展趋势:阶段性特征明显,不同类型企业有不同机会1 12 23 3发展阶段202320252027202320252027培训和开发AI大模型公司提供运行AI应用程序的基础设施的公司开发运行AI应用程序的软件公司为软件和云基础设施服务付费的企业
14、最终用户各种场景应用的产业AI企业ChatGPT是一种基于自然语言处理技术的大型语言模型,使用了深度学习算法和海量数据集来理解人类语言,并且可以生成具有连贯性和逻辑性的文本。ChatGPT爆红开启AI新纪元,它证明:表示维度越高,语义表示越好,网络层次越深,预测能力越强,参数规模越大,模型容量越高,AI的天花板会不断提升;AIGC带来的用户反馈、专家社群共创和训练模型,推动“智慧飞轮”,AIGC 能力不断进步;ChatGPT交互体验效果产生了质的飞跃,能够替代人的部分劳动,能为企业降本增效,体现了AIGC的巨大商业价值。本阶段爆发的导火索:ChatGPT爆红,AIGC进入行业风口期本阶段爆发的
15、导火索:ChatGPT爆红,AIGC进入行业风口期“AIGC”与“ChatGPT”词根的百度指数,ChatGPT带动AIGC板块受到关注,也验证了AIGC出圈的确定性。“在落地和应用上,ChatGPT让普通人也认为是可靠的,然后去使用它,这是一个突破。”“就自身性能还有接受度而言,商业上是个里程碑。”“只有当我们确信它们的影响是积极的并且风险是可控的时候,才应该开发强大的人工智能系统。”“GPT在迭代过程中“偏见”必然存在,它不可能保持完全中立。”相比于技术,ChatGPT更多带来了理论和方法的革命性突破进步,因此引爆网络。ChatGPT爆红以后,正反面的声音不绝于耳,有关AIGC商业价值的潜
16、力和伦理道德的争议,政府、企业、个人都在行动资料来源:百度指数,创业邦研究中心综合整理发展阶段ChatGPT的基础大模型ChatGPT的基础大模型基于海量数据的自监督学习基于海量数据的自监督学习迈向通用性的提示学习迈向通用性的提示学习9本阶段爆发的根因:数据、算力、算法三要素量变产生质变本阶段爆发的根因:数据、算力、算法三要素量变产生质变AIGC主要相关技术应用文本生成文本生成图像生成图像生成音频生成音频生成视频生成视频生成Jasper、copy.ai、ChatGPT、Bard、GTP4、ClaudeEditB4AN、Deepfake、DALL-E2、Stable Diffusion、Midj
17、ourney、Adobe FireflyDeepMusic、WaveNet、Deep Voice、MusicAutoBot、So-Vits-Svc、AudioCraftDeepfake、VideoGPT、GliaCloud、Imagellideo、Runway Gen-2AIGCAIGC资料来源:创业邦研究中心综合整理量变产生质变,数据、算力、算法三要素进行到了一定阶段。本轮最主要的是算法模型和数据训练范式的迭代。从趋势上看,国内外有大量偏同质化的跟进。相关统计数据显示,2022年约新产生90多个大模型,平均4,大多以美国为主。发展阶段资料来源:a16z,Muse labs,Grand Vie
18、w Research,创业邦研究中心AIGC核心能力:孪生、编辑和创作构建出AIGC能力闭环AIGC核心能力:孪生、编辑和创作构建出AIGC能力闭环计算机视觉自然语言处理单模态技术多模态技术孪生能力编辑能力创作能力孪生能力编辑能力创作能力智能增强智能转译语义理解属性控制模仿创作概念创作三维重构音频修复语音合成视觉描述摘要生成数字人智能作画短片创作 AIGC技术演化出三大前沿技术能力:数字内容孪生、数字内容的智能编辑、数字内容的智能创作,三大层面构建AIGC能力闭环。AIGC从辅助人、与人协作,到能独立完成内容生成任务,有望成为数字内容创新发展新引擎。构建现实世界-虚拟世界映射打通现实世界虚拟世
19、界交互通道从数据理解走向数据创作弥补信息损失多种形式呈现属性分离解耦属性修改编辑基于数据创作海量数据训练产业机遇研发范式变革:基础大模型+提示打开大门研发范式变革:基础大模型+提示打开大门过去的 23 年,在大模型蓬勃发展的基础上,AI的研发进入了第三阶段的范式,即基础大模型+应用 提 示(prompt)基础大模型+应用 提 示(prompt),调用 API。每个模型都需要准备自己的海量的训练数据,完成模型的整个训练过程,最后部署模型的推理服务。每个模型都需要准备自己的海量的训练数据,完成模型的整个训练过程,最后部署模型的推理服务。201 4 年,预训练模型+微调的迁移学习技术预训练模型+微调
20、的迁移学习技术开始发展,基础模型在计算机视觉领域首先出现。资料来源:智源研究院,创业邦研究中心 大型语言模型(LLMs)大型语言模型(LLMs)作为一项具有变革性的技术正在兴起,使得开发者能够构建之前无法实现的应用程序。产业机遇过去变革大模型研发范式的变革研发范式变革:当前存在落地难点研发范式变革:当前存在落地难点“基础大模型+提示词”落地难点:“基础大模型+提示词”落地难点:对于许多特定任务或新任务,仅靠提示词,模型记不住、影响推理效率和效果;不能每次都把提示和多轮上文加到下一轮的任务中;难以满足产品设计的进阶需求。解决办法:解决办法:通过指令微调训练,把一个领域的特定任务训练到模型中,变成
21、模型本身就具有的能力。资料来源:智源研究院,创业邦研究中心大模型的研制与开发是易学难精的过程。大模型的研制与开发是易学难精的过程。要想进一步提升工艺,必须在人工智能的基础理论、工程实践以及创新思维人工智能的基础理论、工程实践以及创新思维上不断积累,反复试错、探索,从而实现关键环节上的突破和领先。随着开源生态的完善和AI人才培养的加速,有望出现一批专门调整大模型以适应具体 AI 应用需求的初创企业帮助技术扩散。产业机遇产业格局影响:受限于投资回报的边际递减效应,在基础层建设 AI 大模型的竞争结束,下一个战场有望出现一批专门调整大模型以适应具体AI应用需求的初创企业。未来展望生产力变革:更自动化
22、+降本提质增效+创造力个性化+交互体验生产力变革:更自动化+降本提质增效+创造力个性化+交互体验 生成式人工智能的出现将对人类的生产生活带来颠覆性作用,显著提升各行业的数字化转型速度,重塑人机交互模式。根据OpenAI 官网发布的论文研究结果显示,约80的美国劳动力可能至少有10的工作任务受到大型语言模型(LLM)引入的影响,而约19的工人可能会看到至少50的工作任务受到影响。AIGC生产力主要来自于:AIGC生产力主要来自于:应用层人类需求驱动、技术驱动、企业的业务驱动。这些关系和实践形成共创价值。赋能赋能迭代迭代芯片层芯片层操作系统层操作系统层框架层框架层IT技术栈IT技术栈应用层应用层通
23、用产品通用产品垂直产品垂直产品场景应用场景应用模型层模型层金融、教育、能源、医疗、工业文本、图像、视频、元宇宙/虚拟数字人搜索品类使用数据模型使用模型开发自有数据使用数据模型使用模型开发自有数据企业业务企业业务资料来源:创业邦研究中心综合整理产业机遇更自动化降本提质增效创造力个性化交互体验14商业化变革:规模化赋能中小企业和C端应用场景商业化变革:规模化赋能中小企业和C端应用场景AI四小龙财报情况(部分未披露),在上一轮深度学习技术下发展起来的计算机视觉相关企业曾一度面临商业化困境。资料来源:创业邦研究中心综合整理ToCToC绝大多数AI公司的商业模式都是偏ToB项目制,难以复制和规模化,人力
24、成本高,且商业壁垒低。AIGC让AI公司为更多中小型企业甚至个人提供工具赋能,可规模化地降本增效。ChatGPT等产品的出圈不但给AI技术应用场景提供了可行的思路,也培养了用户习惯。ToBToB缺乏应用场景,难以变现。18.5330.2734.4647388.5412.613.914.848.077.5510.765.263.047.502018年2019年2020年2021年2022年2018-2022年AI四小龙营收变化(单位:亿元)2018-2022年AI四小龙营收变化(单位:亿元)商汤旷视云从依图-34.33-49.68-121.58-171.77-60.45-2
25、8-66.43-33.26-180-160-140-120-100-80-60-40-2002018年2019年2020年2021年2022年2018-2022年AI四小龙净利润变化(单位:亿元)2018-2022年AI四小龙净利润变化(单位:亿元)商汤旷视云从依图人工智能技术长期在科技转化上遇到难题,难以实现商业化落地,导致不少AI科技企业长期处于净利润为负的经营状态。AIGC的爆发,为AI行业带来AI领域新的商业模式的可能性,比如规模化地为中小企业甚至个人提供智能化赋能工具。产业机遇商业化变革:MaaS提供更安全、高效、低成本的模型使用支持商业化变革:MaaS提供更安全、高效、低成本的模型
26、使用支持商业模式商业模式备注备注代表厂商代表厂商MaaS(Model as Service)MaaS(Model as Service)模型即服务,指以模型为核心提供服务。随着人工智能快速发展,模型已经成为重要的生产元素。作为底层平台接入其他产品对外开放,按照数据请求量数据请求量和实际计算量计算。实际计算量计算。按产出内容量收费如按图片张数、请求计算量、模型训练次数等收费。按模型定制开发收费类SaaS服务收费。按软件订阅收费采用付费订阅的模式,按使用时间向用户收取费用。其他模式包括广告/流量模式,依靠产品获取用户点击,从中获得广告流量。资料来源:公开资料,阿里云栖大会,创业邦研究中心AI爱好者
27、AI使用者 AI开发者AI研究者零门槛模型体验简单快速模型使用完整链路模型定制云端模型部署数据集仓库模型仓库算力平台MaaS基本产业架构 MaaSMaaS是大模型最理想的商业模式。一方面,形成服务,2023上半年,云市场竞争白热化,大模型成为新的切入口。但市面上比较成熟的以输出模型为核心商业模式还未跑通,延续了以前帮助大型企业模型开发和训练,以项目制交付服务;另一方面,开拓市场,帮助大型企业模型开发和训练,以项目制交付服务;另一方面,开拓市场,大模型的应用替换过去几年建设的AI应用形成市场,生成式AI赋能也带来了增量市场。大模型厂商MaaS商业落地取决于算力基础设施、通用大模型能力、AI平台/
28、工具能力,从而优化成本结构和计费模式。产业机遇市场空间:整体市场潜力巨大,游戏、直播等行业受益较多市场空间:整体市场潜力巨大,游戏、直播等行业受益较多 AIGC市场潜力巨大。麦肯锡预测,如果将63种生成式AI应用于各行各业,将为全球经济每年带来2.6万亿至4.4万亿美元的增长。这尚不包括所有的生成式AI应用计算在内,否则生成式AI所产生的经济影响可能会翻倍。生成式AI的潜在价值(约75%)主要集中在四个方面:客户运营、营销和销售、软件工程和产品研发。内容类型内容类型市场规模(亿元,2021)市场规模(亿元,2021)*内容/版权成本占收入比重*内容/版权成本占收入比重内容制作成本(亿元,匡算)
29、内容制作成本(亿元,匡算)*未来可AI化制作的比例*未来可AI化制作的比例AlGC市场测算空间(亿元,2021)AlGC市场测算空间(亿元,2021)游戏游戏296525%74130%222.38短视频短视频2255 10%22635%78.93直播直播1936 50%96830%290.4剧集剧集90270%63110%63.14电影电影58360%35020%69.96综艺综艺56475%42325%105.75在线音乐在线音乐44060%26450%132图片版权图片版权28030%8455%46.2网络文学网络文学20935%7320%14.63合计合计10134 10134 37%3
30、760 3760 27%1023AIGC 国内理论市场空间测算产业潜力助手阶段协作阶段原创阶段AIGC用来辅 助 人 类进 行 内 容生产AI GC以虚实并存的虚拟人形态出现,形成人机共生的局面AIGC将独立 完 成 内容创作人与AI的关系转变为寻求合理的协作方式从动态的角度看,随着AIGC带来的自动化水平的提升,将给各行各业带来降本增效的巨大作用。Gartner预测,到 2026 年,将有超 1 亿人与生成式 AI 一起工作,到 2027 年将有近 15%的新应用由 AI 自动生成,无需人工参与。从静态的角度看,在垂直数字内容领域,游戏、直播等行业受益最大。资料来源:创业邦研究中心综合整理国
31、内AIGC主要企业画像国内AIGC主要企业画像企业画像企业画像机会机会威胁威胁代表企业代表企业TMT巨头具备云端技术积淀和应用场景,运用AIGC使得本身业务降本、提质、增效,有产学研联合发展的资源优势相比国外科技公司技术尚有差距,市场饱和度高,增速放缓AI科技公司具备ToB端服务经验和应用场景优势,一旦市场适应新的商业模式MaaS,有利于形成规模效应,进一步吸引人才和构建开源生态在ToC端和初创企业还处于同一起跑线上,容易受到冲击,技术优势在大厂发力下也很难长久保持初创企业中小企业政策扶持;由于ChatGPT的火热很多垂类企业也开始开放数据,对于尚未建立技术壁垒的初创企业来说,是争取合作的良好
32、信号AI科技公司和TMT巨头的市场挤压,抗风险能力弱基础层企业由于算力需求激增,当下属于发展红利期;数据市场需求同样逐年攀升。关键领域面临“卡脖子”问题,市场被国际巨头垄断产业潜力数据来源:创业邦研究中心来源:睿兽分析海外AIGC主要企业盘点(1/2)海外AIGC主要企业盘点(1/2)公司名称公司名称简介简介国家和地区国家和地区最近融资轮次最近融资轮次 最近融资时间最近融资时间最近融资金额最近融资金额最近一轮投资机构最近一轮投资机构OpenAI智能机器人产品研发商美国加利福尼亚C轮2023-04-283亿美元Sequoia Capital、Andreessen Horowitz(A1 6Z)、
33、Tiger Global Management 老虎环球基金、Founders Fund、Thrive Capital、K2 GlobalHugging FaceAI聊天机器人研发商美国纽约D轮2023-08-232亿美元Lux Capital(领投)、Sequoia Capital、Coatue ManagementAddition、betaworksLightricks以色列图片及视频编辑软件开发商以色列D轮2021-09-201.3亿美元Harel Insurance Investments and Financial、Goldman Sachs Asset Management高盛资产
34、管理、Greycroft、ClalTech、Hanaco Venture Capital、Insight Partners、Shavit CapitalJasper人工智能内容平台美国得克萨斯州奥斯汀A轮2022-10-181.25亿美元I nsight Partners(领投)、HubSpot Ventures、Founders Circle Capital、Foundation Capital、Coatue Management、Bessemer Venture Partners(BVP)、Institutional Venture(IVP)Adept人工智能技术研发商美国加利福尼亚B轮2
35、023-03-143.50亿美元Spark Capital 星火资本领投、General Catalyst领投产业潜力资料来源:睿兽分析注:时间截至2023年9月21日公司名称公司名称简介简介国家和地区国家和地区最近融资轮次最近融资轮次最近融资时间最近融资时间最近融资金额最近融资金额最近一轮投资机构最近一轮投资机构Midjourney基于人工智能的艺术品生成器美国加利福尼亚州未融资无无无Stability AI英国AI图像生成器研发商英国伦敦种子轮2022-10-171.01亿美元Coatue Management(领投)、Lightspeed Venture Partners光速创投(领投)
36、、OShaughnessy(领投)Character.AI生成式AI聊天机器人公司美国加利福尼亚A轮2023-03-041.50亿美元A n d r e e s s e n Horowitz(A16Z)(领投)、SVA、A.Capital VenturesElad GilGlean工作助手和知识管理平台美国加利福尼亚州C轮2022-05-181亿美元Sequoia Capital(Sonya H u a n g)(领 投)、General Catalyst、Slack FundLightspeed V enture P a r tn e r s 光 速 创 投、Kleiner PerkinsA
37、nthropic人工智能安全服务商美国加利福尼亚州C3轮2023-08-131.00亿美元Spark Capital 星火资本(领 投)、M e n l o Ventures、G oogle、Sound Ventures海外AIGC主要企业盘点(2/2)海外AIGC主要企业盘点(2/2)产业潜力资料来源:睿兽分析注:时间截至2023年9月21日标杆企业案例:OpenAI的成功之路标杆企业案例:OpenAI的成功之路OpenAI发展历程GPT家族运用了前所未有的训练参数和数据量时 间时 间关键事件关键事件2016年4月27日发布OpenAI Gym的公测版本(加强OpenAI研究领域的平台)20
38、16年12月5日发布Universe,一个用于开发和测试Al的平台,智能能力可以覆盖全球的网站、游戏和其他应用程序2018年6月发布GPT-1,包括预训练+FineTuning两阶段,采取Transformer的decoder作为特征抽取器2019年2月发布GPT-2,模型容量和数据量进一步增大2019年7月微软投资OpenAl 1 0亿美元,双方携手合作为Azure云端平台服务开发人工智能技术2020年7月发布GPT-3语言模型,拓展了之前创建的基于15亿参数的GPT-2语言模型,微软于2020年9月22日取得独家授权2022年11月30日发布基于人工智能的聊天机器人ChatGPT,被认为有
39、可能改变人类使用搜索引擎的方式 资料来源:创业邦研究中心综合整理模型模型发布时间发布时间参数量参数量预训练数据量预训练数据量GPT-12018年6月1.17亿约5GBGPT-22019年2月15亿40GGPT-32020年5月1750亿45TBGPT-42023年3月1.8万亿百T级产业潜力OpenAIOpenAI是一家美国人工智能研究实验室,由非营利性 OpenAI Incorporated(OpenAI Inc.)及其营利性子公司 OpenAI Limited Partnership(OpenAI LP)组成。成立时间:2015 年 创始人:Sam Altman、Reid Hoffman
40、等 主要投资方:微软、Y Combinator、科斯拉风险投资公司,里德霍夫曼基金会、红衫资本、基岩资本、安德森 霍 格威兹、马修布朗公司等。代表产品:ChatGPT 团队:截止2022年,OpenAI拥有约375名员工,业务主要集中在技术能力、安全能力、隐私保护。技术根因:自2018年以来坚持生成式AI、长期技术积累,量变产生质变,ChatGPT是迈向AGI的阶段性成果。技术根因:自2018年以来坚持生成式AI、长期技术积累,量变产生质变,ChatGPT是迈向AGI的阶段性成果。应用潜力大:ChatGPT是以产品思维驱动的重大集成创新成果应用潜力大:ChatGPT是以产品思维驱动的重大集成创
41、新成果 商业化潜力大:商业化潜力大:依托微软的平台资源,让OpenAI的服务真正实现工程化、场景化、产品化工程化、场景化、产品化,甚至包括有望实现商业价值商业价值。生态化水平高:投资+技术优先权策略吸引初创企业成功关键点潜在威胁 用户市场有下降趋势:根据SimilarWeb的数据,ChatGPT在2023年7月的用户数量进一步下降,从6月的17亿下降到了15亿,较之6月下降了约12%。用户市场有下降趋势:根据SimilarWeb的数据,ChatGPT在2023年7月的用户数量进一步下降,从6月的17亿下降到了15亿,较之6月下降了约12%。算力制约:用户反馈关于API的可靠性和速度,大部分问题
42、由于 GPU 短缺引起。算力制约:用户反馈关于API的可靠性和速度,大部分问题由于 GPU 短缺引起。竞争者的崛起:谷歌将生成式AI功能整合到搜索引擎中;Meta开源生态的拓展。竞争者的崛起:谷歌将生成式AI功能整合到搜索引擎中;Meta开源生态的拓展。财务水平堪忧:ChatGPT每天的运营成本为70万美元。财务水平堪忧:ChatGPT每天的运营成本为70万美元。国内外AIGC市场对比:中美各有千秋,中国亟需补齐人才短板国内外AIGC市场对比:中美各有千秋,中国亟需补齐人才短板ChatGPT爆红以后,AIGC应用层出不穷。从世界范围内看,AIGC产业中美为最主要的竞争对手,欧洲有少量企业布局,
43、未来中美竞争会非常激烈。综合来看,中美在AIGC赛道各有千秋,但中国当前AIGC企业相对偏少,高层次人才严重落后于美国。竞争会非常激烈。综合来看,中美在AIGC赛道各有千秋,但中国当前AIGC企业相对偏少,高层次人才严重落后于美国。从技术技术来看,国外科技产业往往注重基础研究和原创性,也即从01的原型搭建;而国内则注重从底层数据算力、中层模型算法、上层应用方面1100的创新。从应用场景应用场景上看,国内的AIGC领域有着更加丰富和多元化的表现,涵盖了文化传媒、游戏、电商、金融、教育等多个行业和领域;国外则更加垂直、场景化。从AI人才AI人才上看,根据2023全球数字科技发展研究科技人才储备实力
44、研究报告,中国人才基数大,但高层次人不足,且严重落后于美国;中国高层次人才集中在高校,而美国高科技公司人才储备不逊色于顶尖高校。从AIGC企业AIGC企业上看,我国目前相对较少,美国约4000余家,中国约1000 余家。产业潜力数据来源:AMiner 科技情报平台政策环境:强调可信AI,解决行业问题,鼓励创新发展政策环境:强调可信AI,解决行业问题,鼓励创新发展资料来源:创业邦研究中心综合整理产业环境 梳理国家层面对AIGC相关政策,不论是推动场景创新的支持性举措,还是分类分级的监管性举措,运用AI技术解决社会问题,发挥AI在加快产业转型与经济发展的促进作用是大势所趋。时间时间政策政策备注备注
45、2023年7月生成式人工智能服务管理暂行办法鼓励生成式人工智能创新发展;对生成式人工智能服务实行包容审慎和分类分级监管。2022年11月工业和信息化部办公厅关于印发中小企业数字化转型指南的通知加大工业互联网、人工智能、5G、大数据等新型基础设施建设力度,优化中小企业数字化转型外部环境。2022年10月鼓励外商投资产业目录(2022年版)包含智能器件、机器人、神经网络芯片、神经元传感器等人工智能技术研发与应用。2022年8月关于支持建设新一代人工智能示范应用场景的通知坚持面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,充分发挥人工智能赋能经济社会发展的作用,围绕构建全链条、
46、全过程的人工智能行业应用生态支持一批基础较好的人工智能应用场景,加强研发上下游配合与新技术集成,打造形成一批可复制,可推广的标杆型示范应用场景。首批支持建设十个示范应用场景。2022年7月关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见场景创新成为人工智能技术升级、产业增长的新路径,场景创新成果持续涌现,推动新一代人工智能发展上水平。重大应用场景加速涌现,场景驱动技术创新成效显著;场景创新合作生态初步形成;场景驱动创新模式广泛应用。20222023年AIGC国家层面相关政策人工智能发展总领性政策新一代人工智能发展规划提出的发展阶段目标。政策特别强调科技创新、产业发展和法律法规与
47、伦理的重要性。其中,大数据智能、跨媒体感知计算、人机混合智能等被列为重点发展方向。20202025人工智能基础理论实现重大突破、技术与应用部分达到世界领先水平。人工智能总体技术和应用与世界先进水平同步。2030人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心。地方政策:强化模型创新和算力供给,促进产业集聚发展地方政策:强化模型创新和算力供给,促进产业集聚发展资料来源:创业邦研究中心综合整理产业环境 近年来,各地方密集出台政策促进人工智能产业的技术突破、落地应用和产业集群发展。此外,北京和上海特别提到将推动大模型发展,深圳和杭州则提到将强化算力供给。地方地方时间时间政策
48、政策备注备注北京2023年5月30日北京市促进通用人工智能创新发展的若干措施北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)提升算力资源统筹供给能力;提升高质量数据要素供给能力;系统构建大模型等通用人工智能技术体系;推动通用人工智能技术创新场景应用;探索营造包容审慎的监管环境。到2025年,基本建成具有全球影响力的人工智能创新策源地。上海2023年7月8日上海市推动人工智能大模型创新发展的若干措施支持研发具有国际竞争力的大模型。围绕“创新能力、创新要素、创新应用、创新环境”4大方向,重点打造“3项计划+5大平台”。深圳2022年12月22日深圳市加快推动人工智能
49、高质量发展高水平应用行动方案(20232024年)强化智能算力集群供给;增强关键核心技术与产品创新能力;提升产业集聚水平;打造全域全时场景应用;强化数据和人才要素供给。杭州2023年7月27日杭州市人民政府办公厅关于加快推进人工智能产业创新发展的实施意见强化普惠算力供给;增强模型创新能力;促进数据开放共享;拓展智能应用场景;推动产业集聚发展;加强企业主体培育;提升创新平台能级;优化产业发展生态。AIGC重点城市相关政策社会环境:迈向AGI,伦理、安全、版权、欺诈问题引发忧思社会环境:迈向AGI,伦理、安全、版权、欺诈问题引发忧思AIGC在尝试巨大的商业价值和社会价值的同时,也带来了伦理、安全、
50、版权、欺诈,甚至是失业等社会层面挑战,成为影响生成式AI发展的重要外部因素。这些问题有些随着技术的发展得到解决,有些也需要仰赖法律的规制、社会的进步。未来,我们期待AGI能力越来越强,使用和开发越来越简单,结果越来越可控,成为人类可靠的工具。AIGC在尝试巨大的商业价值和社会价值的同时,也带来了伦理、安全、版权、欺诈,甚至是失业等社会层面挑战,成为影响生成式AI发展的重要外部因素。这些问题有些随着技术的发展得到解决,有些也需要仰赖法律的规制、社会的进步。未来,我们期待AGI能力越来越强,使用和开发越来越简单,结果越来越可控,成为人类可靠的工具。产业环境12341234伦理问题版权问题伦理问题版
51、权问题 主要集中在AI绘画等领域。目前国外的通行做法会考虑除了AI之外,是否有人的智力或创造性劳动。安全问题欺诈问题安全问题欺诈问题 主要表现为高效生成欺诈信息,并实现跨语言攻击;AI换脸等借助深度伪造的音视频内容以及欺诈勒索等手段的黑灰产。包括AI生成的内容安全、隐私数据的安全。主要表现在信任边界风险、数据管理风险、固有模型风险以及一般安全问题。治理难度体现在数据体量大,需要处理的内容也更加复杂。由于数据集的缺陷,AIGC存在系统性偏见、价值观对抗、“观点霸权”、刻板印象、虚假信息等问题。可以尝试让AI自主学习解决由于数据的不恰当、静态数据带来的风险。产业链分析产业链分析产业链框架和图谱市场
52、竞争格局细分领域分析:基础层/模型层/应用层中国AIGC产业图谱框架1.0中国AIGC产业图谱框架1.0产业链框架中国AIGC产业图谱1.0中国AIGC产业图谱1.0基础设施:算力+数据基础设施:算力+数据通用大模型(闭源/开源)通用大模型(闭源/开源)工具平台+行业大模型工具平台+行业大模型垂直产品垂直产品通用产品通用产品场景应用场景应用应用层应用层模型层模型层基础层基础层文本文本图像图像视频视频游戏游戏音频音频数字人数字人搜索引擎类产品AIGC应用商店内容生成内容设计内容检测营销办公/SaaS客服金融教育工业生物科技法律医疗文娱/传媒行业大模型工具平台算 力数 据产业图谱 资料来源:睿兽分
53、析如果您想进一步查询AIGC图谱相关公司详情,可订阅AIGC产业图谱,一键查询,洞察产业发展。国内市场竞争格局:相互蚕食领地的现象会更加频繁国内市场竞争格局:相互蚕食领地的现象会更加频繁基础层基础层中间层中间层应用层应用层预训练模型垂 直 化、场 景化、个性化图像、语音和文字生成等各种各样的AIGC应用 应用层应用层分为通用产品、垂直产品和场景应用。场景应用中,营销、办公/SaaS、客服属于通用领域,金融、教育等属于行业领域。目前底层技术创新不稳定,之后应用产品非常多,甚至可能与硬件硬件产品结合,在AIOT挖掘新的应用场景挖掘新的应用场景。另外,在用户体验和交互设计用户体验和交互设计上还有很多
54、优化空间,前期比较依赖市场推广市场推广。按商业模式可分为:按商业模式可分为:底座底座(以技术平台输出为主,提供预训练模型,使得应用层企业能够构建和部署AI模型)能力能力(以垂直产品输出为主,提供生成文本、图片、视频或集成服务)应用应用(以行业解决方案输出为主,服务于各垂直行业等)按产业生态体系可分为:按产业生态体系可分为:基础层基础层亟待技术创新和完善生态建设,尤其是AI芯片、算力调度、数据处理,这也是当下制约AIGC产业的发展的主要因素。模型层模型层“大力出奇迹”:通用大模型“大力出奇迹”:通用大模型互联网头部企业具备应用场景等优势,一旦达到应用爆发的节点,可以率先跑起来,弥补高性能现成产品
55、的市场空缺,也保护已占据的资源和应用市场。但同时也有“重复造轮子”风险。初创企业则需要在基础层和研发工具侧发力才可弯道超车,但由于缺乏应用场景还需要提前做好战略合作布局。“大力出奇迹蛮力”:行业大模型”:行业大模型主要聚集传统AI企业和互联网头部企业,具备垂直行业know-how优势和To B业务经验,主打差异化布局,往往和工具平台联系紧密。目前能推出国产大模型的厂商多具有算力储备和数据处理技术基础,而大模型的范式革新能使本身业务降本增效,还能开拓新市场,一举两得。竞争格局数据、算法、算力三要素是AIGC技术发展的根本动力数据、算法、算力三要素是AIGC技术发展的根本动力2021年,OpenA
56、I公司推出跨模态深度学习模型CLIP,相对于GAN,CLIP模型能够将文本与图像进行关联。AIGC算法模型发展阶段算法模型算法模型 多模态多模态是指模型可以处理多种结构/类型的数据;大模型大模型是指模型通过亿级的语料或者图像进行知识抽取、学习进而生产了亿级参数的大模型。人工智能三要素相互作用,共同构成了发展的根本动力AIGCAIGCGANGANTransformerTransformerDiffusionDiffusionCLIPCLIP算法算法数据数据算力算力基础层分析数据数据主要分为AI基础数据服务和数据治理与软件服务。算力算力主要分为AI芯片、AI服务器、智能云等。其中以GPUGPU为代
57、表底层硬件正为AI提供强大的芯片支持。2023年H1中国一级市场获得融资的代表性GPU企业:2023年H1中国一级市场获得融资的代表性AI数据企业:2014年,AIGC的第一代算法生成式对抗网络GAN生成式对抗网络GAN诞生。201 7年,Vaswani等人提出Transformers神 经 网 络 架 构201 7年,Vaswani等人提出Transformers神 经 网 络 架 构,Transformer擅长理解自然语言。2 0 2 0 年,第 三 代Diffusion扩散化模型Diffusion扩散化模型出现。通过学习如何为图片去噪,Diffusion模型所需训练数据更少,精度更高,更
58、具“艺术模仿与创造”的能力。数据:亟需大量高质量数据,合成数据新趋势初现数据:亟需大量高质量数据,合成数据新趋势初现 将大量高质量的数据进行处理将是上游需要关注的重点,需要数据增强、迁移学习、数据合成、数据要素市场实现数据共享、数据反哺加速商业化飞轮,也是AI数据企业的核心竞争力。同时,专业领域、长尾场景数据分布在企业私有数据库。将大量高质量的数据进行处理将是上游需要关注的重点,需要数据增强、迁移学习、数据合成、数据要素市场实现数据共享、数据反哺加速商业化飞轮,也是AI数据企业的核心竞争力。同时,专业领域、长尾场景数据分布在企业私有数据库。AI基础数据服务市场普遍采取分包方式,标注复杂化、自动
59、化、全栈式服务需求以及愈加严格的数据合规需求是AI基础数据服务市场的四大趋势;数据治理与软件服务市场则AI基础数据服务市场普遍采取分包方式,标注复杂化、自动化、全栈式服务需求以及愈加严格的数据合规需求是AI基础数据服务市场的四大趋势;数据治理与软件服务市场则厂商参与更加多元。资料来源:medium网站,摩根大通官网,德勤,创业邦研究中心 合成数据合成数据是运用计算机模拟生成的人造数据,它的用途是用来模拟现实世界的观察与观测。根据Cognilytica数据,合成数据市场规模在2021年大概是1.1亿美元,到2027年将达到11.5亿美元。合成数据市场规模在2021年大概是1.1亿美元,到2027
60、年将达到11.5亿美元。行业新趋势合成数据、大模型自动化标注行业新趋势合成数据、大模型自动化标注 市场现状:普遍采取分包方式AI基础数据服务代表企业:数据治理与软件服务代表企业:产业链:产业链:上游:上游:数据标注公司、线上散兵和小作坊。中游:中游:数据服务商,一类是承接上下游的中介方众包平台,一类是企业为稳定投入产业而选择自建标注基地。下游:下游:科技公司、行业企业、AI公司、科研单位。在2018年左右以互联网企业为主导,现在转至车企、自动驾驶企业。自动化标注案例:特斯拉2D人工标注转为 4D 空间自动标注自动化标注案例:特斯拉2D人工标注转为 4D 空间自动标注基础层分析我国AI数据市场基
61、本情况我国AI数据市场基本情况AI基础数据服务数据治理与软件服务 市场现状:主要应用于金融、零售、医疗和工业四大典型行业依托于数据与AI模型的紧密关联,数据治理与AI应用产品已逐步开展交汇融合,厂商参与更加多元,咨询公司、数据服务提供商和人工智能产品服务商三方阵营构建行业竞合格局。数据治理需求普遍存在,非结构化数据成为价值挖掘的重难点。数据治理需求普遍存在,非结构化数据成为价值挖掘的重难点。我国AI数据市场未来发展趋势我国AI数据市场未来发展趋势 自动标注技术利用存储在数据库属性表中的信息来自动标注主题特征,在标注时可以用主题属性表中任意域的正方便地改变标注属性的位置、字体、风格、大小和颜色。
62、优势:减少人为因素导致的标注错误,显著提高OCR技术的精度.算力:国内高性能GPU稀缺,异构计算有望打开格局算力:国内高性能GPU稀缺,异构计算有望打开格局 算力困境:算力困境:从算力基础设施角度看,从GPT的1.17亿到GPT-3的1750亿,几年来大模型参数量增长了近1500倍,而Google的SwitchTransformer参数量更是达到1.6万亿,海量参数规模所需的庞大算力,是许多企业甚至行业无法提供的。进阶先进算力:进阶先进算力:先进芯片、先进网络、先进存储等一系列的支撑,缺一不可。一方面,通过小样本学习、多模态学习等实现少量数据完成新领域的训练,另一方面,向GPU等硬件基础设施、
63、互联带宽、存储架构等提出了新的要求。产业链:产业链:上游上游:底层设施、设备、软件供应商、网络运营商等;中游中游:基础电信企业、第三方数据中心服务商、云计算厂商;下游下游:互联网企业、工业企业以及各行业的用户,政府投资基金所投资的企业,私募股权和创业投资基金投资的中小企业。产业格局:产业格局:AI芯片以GPU为主,占中国AI芯片总市场份额的AI芯片以GPU为主,占中国AI芯片总市场份额的89%89%。国内AI服务器呈现出一超多强的格局。国内AI服务器呈现出一超多强的格局。光模块:光模块:近5年光模块中国大陆厂商平均每年提升3.2%;预计到2023年底,光模块中国大陆厂商的市占率有望达到56.8
64、%。目前800G和1.6T光模块是最先进的数据中心光通信产品。代表企业:政府布局:政府布局:2022年我国四部门发文同意在在京津冀、长三角、粤港澳大湾区等8地启动建设国家算力枢纽节点,并规划了10个国家数据中心数据中心集群。GPU产业格局:GPU产业格局:国际GPU巨头英伟达英伟达垄断市场。英伟达5月的多项AI相关的产品更新:超级芯片GH200 Grace Hopper已全面投产超级芯片GH200 Grace Hopper已全面投产,发布新型AI超级计算机DGX GH200新型AI超级计算机DGX GH200,以及开发游戏、广告游戏、广告等领域内的生成式AI应用。我国AI算力产业基本情况我国A
65、I算力产业基本情况挑战:关键领域“卡脖子”挑战:关键领域“卡脖子”机遇:异构并行计算机遇:异构并行计算资料来源:公开资料,美国企业硬件设备销售商Thinkmate,财经,创业邦研究中心同时处理多个不同类型指令集和不同体系架构的计算单元组成的系统;采用并行的编程方式。优势:优势:更高效率、更低延迟的计算性能,降低能耗,提高可靠性。各芯片种类性能对比各芯片种类性能对比芯片种类芯片种类通用性通用性平行处理能力平行处理能力处理速度处理速度功耗功耗研发成本研发成本量产成本量产成本交付周期交付周期CPUCPU高低低高低中短GPUGPU高中中高低中中FPGAFPGA中高中中中高中ASICASIC低高高低高低
66、长信创情况:信创情况:高性能的GPUGPU,已经成为了限制中国AI行业发展的最直接因素之一,国产替代势在必行。AIGC相关国产GPU代表企业:基础层分析大模型:升级迭代为AIGC性能跨越式发展奠定基础大模型:升级迭代为AIGC性能跨越式发展奠定基础分析式AI:分析式AI:利用机器学习技术学习数据分布,进行如分类、预测等任务。诞生了卷积神经网络,残差深度网络,Transformer网络结构等。推荐系统:挖掘用户与物品的关联关系 人脸识别:根据输入人脸信息进行身份判别 文字识别:根据文字图片输出文本生成式AI:生成式AI:在学习归纳数据分布的基础上,学习数据产生的模式,并创造数据中不存在的新样本。
67、在分析式AI技术基础上诞生大型Transformer网络、Diffusion等新模型。文字创作:通过提示文本生成完整文案 图像生成:根据关键信息生成风格多样图片,如博客配图,海报图片等 代码生成:根据上下文生成完整代码学习范式更新学习范式更新基于规则的人工智能基于规则的人工智能基于预先定义的统计模型或规则完成任务,模型自身并不具有学习能力自身并不具有学习能力基于损失函数与梯度下降基于损失函数与梯度下降通过损失函数与梯度下降更新模型参数,模型自身可对数据内容进行学习自身可对数据内容进行学习模型结构升级模型结构升级卷积神经网络模型深度变分自编码器对抗生成网络Transformer结构扩散模型卷积神
68、经网络模型深度变分自编码器对抗生成网络Transformer结构扩散模型在视觉识别任务上表现远超传统机器学习算法,开启深度学习序幕开启深度学习序幕通过将隐特征建模为可采样的分布,首次稳定地生成从未观测过的图像首次稳定地生成从未观测过的图像,极大推动AI生成技术发展通过生成器和判别器的不断博弈学习,提高生成样本的清晰度与逼真度,可以生成真假难辨的内容可以生成真假难辨的内容提高上下文建模能力,并行的结构加快训练速度,使得构建超大规模模型称为可能扩散模型在GAN基础上进一步提高样本多样性与逼真度提高样本多样性与逼真度模型层分析33大模型:内容生成与智能涌现展现出强大的应用潜力大模型:内容生成与智能涌
69、现展现出强大的应用潜力 大模型强大的应用潜力主要来自两方面训练能力与推理能力,从而使得内容生成、智能涌现。大模型强大的应用潜力主要来自两方面训练能力与推理能力,从而使得内容生成、智能涌现。在实际应用过程中,除了内容生成外,审核和治理也成为落地的关键环节,在实际应用过程中,除了内容生成外,审核和治理也成为落地的关键环节,因此模型训练能否成功、如何低成本高效率部署、生成内容是否合法合规合乎伦理还需要一系列的解决方案和应用工具。除了预测误差情况、拟合程度、模型稳定性等模型性能,模块化、边际成本等也成为大模型企业重要核心竞争力。除了预测误差情况、拟合程度、模型稳定性等模型性能,模块化、边际成本等也成为
70、大模型企业重要核心竞争力。资料来源:创业邦研究中心综合整理大模型训练流程基础模型预训练基础模型预训练训练通用海量的认知及基础能力基础模型持续训练基础模型持续训练添加领域专业知识,形成专业领域认知能力指令微调训练指令微调训练学会利用基础模型的知识能力,完成指定任务强化学习人类反馈训练强化学习人类反馈训练在生成内容上对齐应用领域的需求喜好思维链思维链(Chain of Thought,CoT)Jason Wei等,Google,2022【背景背景】传统的Transformer架构在处理长文本时,由于其自注意力机制的特性,计算复杂度较高,自注意力机制的特性,计算复杂度较高,因此实际应用中往往需要限制
71、输入的序列长度。这使得模型在处理长篇文章、生成复杂问题回答时容易出现信息丢失、生成结果与上下文不一致信息丢失、生成结果与上下文不一致等问题。CoT通过构建一个特殊的思维链结构,将长文本的处理和生成过程分解为多个连贯的步骤,从而在保持高质量输出的同时,有效解决这些问题。【优势】【优势】推理能力大幅提升;CoT的一大好处是无需微调模型参数,仅仅是改变输入就可以改进模型的性能。【缺点】【缺点】前提是LLM的规模大于10B,否则CoT没用甚至起副作用,成本高。成本高。模型层分析推理训练大模型:科技巨头普遍已经或开始布局大模型(1/2)大模型:科技巨头普遍已经或开始布局大模型(1/2)目前国内对大模型领
72、域的重视,已经到了相当高的量级,且大厂、AI企业,包括很多初创企业都有布局,以通用大模型为主。主要相关企业大模型进展资料来源:创业邦研究中心整理企业 企业 大模型进展大模型进展百度百度百度于2019年发布文心大模型,包括NLP、CV(机器学习)、跨模态大模型和生命计算大模型四个类别36个大模型2023年3月16日,文心一言(ERNIE Bot)发布,是百度全新一代知识增强大语言模型,是中国第一个类ChatGPT产品2023年3月28日,推出文心千帆大模型平台腾讯腾讯2022年4月,腾讯首次对外披露混元AI大模型,集CV、NLP、多模态理解能力于一体2023年2月初,腾讯混元AI大模型团队再推出
73、万亿中文NLP预训练模型HunYuan-NLP-1,目前HunYuan-NLP-IT大模型已在腾讯广告、搜索、对话等内部产品落地,并通过腾讯云服务外部客户2023年6 月 19 日,腾讯云首次正式公布行业大模型研发进展,并发布面向 B 端客户的腾讯云 MaaS服务解决方案。阿里阿里自2021年起,阿里达摩院先后发布多个版本的多模态及语言大模型2022年9月,发布通义大模型系列,并宣布相关核心模型向全球开发者开源开放2022年11月8日,阿里巴巴达摩院公布多模态大模型M6最新进展,其参数已从万亿跃迁至10万亿2023年2月23日,张勇表示,阿里巴巴将全力构建好自己的Al预训练大模型,并为市场上风
74、起云涌的模型和应用提供好算力支撑华为华为2021年,基于异腾AI与鹏城实验室联合发布了鹏程盘古大模型2022年11月,在华为全联接大会2022中国站上,发布盘古气象大模型、盘古矿山大模型、盘古OCR大模型三项重磅服务;2023年4月,华为将公布NLP、CV、多模态、科学计算等多个大模型构成的盘古大模型,通过模型泛化,解决传统AI作坊式开发模式下不能解决的AI规模化、产业化难题模型层分析大模型:科技巨头普遍已经或开始布局大模型(1/2)大模型:科技巨头普遍已经或开始布局大模型(1/2)主要相关企业大模型进展资料来源:创业邦研究中心整理企业 企业 大模型进展大模型进展网易网易2021年,网易推出超
75、大模型推理引攀EET:超速响应,3秒创作一首歌词2022年8月,网易伏羲实验室LOFTER-AI写文和傀偶戏-互动式文字游戏同时入选2022大规模预训统模型优秀应用案例2023年1月17日,网易伏義中文预训练大模型玉言登顶中文语言理解权威测评基准CLUE分类任务榜单2023年3月,网易携手昇腾AI打造玉知-悟空图文理解大模型7月26日,网易有道发布国内首个教育大模型“子曰”。商汤商汤2021年,联合上海人工智能实验室、清华大学、香港中文大学、上海交通大学在2021年11月首次共同发布大模型书生(INTERN)2023年4月,商汤科技董事长兼首席执行官徐立宣布推出“日日新SenseNova”大模
76、型体系宇节跳动2022年7月,清华大学和字节跳动联合推出了新的并行生成模型DA-Transformer。2023年6月28日,字节跳动旗下火山引擎发布大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等全方位的平台服务。2023年8月17日,字节跳动首个AI对话产品传出对外测试消息,产品名为“豆包”。“豆包”是字节跳动公司基于云雀模型开发的 AI 工具。京东京东2023年2月10日,京东云旗下言犀人工智能应用平台将整合过往产业实践和技术积累,推出产业版ChatGPT:ChatJD,并公布ChatJD的落地应用路线图“125”计划;2023年7月13日,在2023京东全球科技探索者大会
77、暨京东云峰会上,京东推出言犀大模型,率先布局产业应用。美团美团2023年3月27日,光年之外通过换股方式收购北京一流科技。2023年6月29 日下午,美团发布公告,称以约 20.65 亿元人民币的价格,完成对光年之外的股权收购。模型层分析大模型:行业大模型+工具平台的工程化能力加速应用落地(1/2)大模型:行业大模型+工具平台的工程化能力加速应用落地(1/2)对比国外繁荣的工具平台生态,我国目前主流工具平台大多分布在互联网大厂、传统AI企业,初创企业参与较少。未来垂直领域应用落地将是大模型主战场。资料来源:中国信通院人工智能研发运营体系(MLOps)实践指南(2023年)关键能力关键能力常用工
78、具常用工具国外国外国内国内数据处理MapReduce、Labelme、CVAT、SOL、HDFS、Amazon Sagemaker、Alluxio、Spark、Pandas百度EasyData智能数据服务平台,百度众测平台、华为 ModelArts、华为云DataArts、整数智能数据平台、云测数据标注平台、九章云极DataCanvas APS机器学习平台、新华三绿洲平台模型训练Amazon Sagemaker、Microsoft Azure、Google Cloud Platform、Databricks百度智能云企业AI开发平台、华为云 ModelArts、九章云极DataCanvas A
79、PS机器学习平台、潞晨科技Colossal-AI构建集成Jenkins、CML(Continuous Machine Learning)、AWS CodePipeline and Step Functions、Azure DevOps腾讯蓝鲸、阿里云效、九章云极DataCanvas APS机器学习平台、华为云 CodeArts模型服务模型服务配置:Kubernetes、Docker;搭建API服务的程序框架:Flask、Kubeflow的KServing、BentoML;批量推理:Apache Spark;云服务工具:Microsoft Azure REST API、AWS SageMaker
80、 Endpoints、IBM Watson Studio和Google Vertex AI推理引擎:TensorRT、TensorFlow Lite百度智能云企业AI开发平台、华为云ModelArts、九章云极DataCanvas APS机器学习平台推理服务化:PaddlePaddle Serving、MindSpore Serving推理引擎:MindSpore Lite(华为)、MNN(阿里)、TNN(腾讯)、MACE(小米)运营监控Microsoft Azure、Algorithmia、Evidently AI和Deepchecks(结构化数据),Seldon Alibi(非结构化数据)
81、、Grafana、Kubeflow、MLfow、Amazon SageMaker 模型监控器、Prometheus+Grafana百度智能云企业AI开发平台、华为云 ModelArts、星环科技Sophon MLOps模型层分析大模型:行业大模型+工具平台的工程化能力加速应用落地(2/2)大模型:行业大模型+工具平台的工程化能力加速应用落地(2/2)资料来源:中国信通院人工智能研发运营体系(MLOps)实践指南(2023年)关键能力关键能力常用工具常用工具国外国外国内国内模型重训Airflow、Prefect、Ploomber华为云ModelArts实验管理MLflow、Neptune AI、
82、Microsoft Azure、Amazon Sagemaker、Weights and Biases、DagsHub百度智能云企业AI开发平台、九章云极DataCarvas APS机器学习平台特征管理Google Feast、Featuretools、AWS Feature Store、Tecton.ai、Hopswork.ai百度智能云企业AI开发平台、九章云极DataCanvas APS机器学习平台、第四范式OpenMLDB模型管理Google Vertex AI、Microsoft Azure AI Builder、AWS SageMaker、Dataiku百度智能云企业AI开发平台、
83、华为ModelArts、九章云极DataCanvas APS机器学习平台流水线管理Airflow、MLflow、Kubeflow百度智能云企业AI开发平台、华为云ModelArts代码仓库GitLab.GitHub和Gitea码云Gitee、华为云CodeArts元数据管理Kubeflow Pipelines、AWS SageMaker Pipelines、Azure ML和IBM Watson Studio、MLflow百度智能云企业AI开发平台数据版本管理Dagshub、Databricks、DVC百度智能云企业AI开发平台、九章云极DataCarvas APS机器学习平台模型安全Clev
84、erhans、DeepRobust、Opacus百度AdvBox、上海交通大学DAmageNet端到端平台Kubeflow、MLflow、Neuro、Microsoft Azure、Google Cloud Platform、Amazon SageMaker、Algorithmia、Neu.roMLOps百度智能云企业AI开发平台、华为终端云MLOps平台、华为ModelArts、蚂蚁AntSecMLOps、腾讯太极机器学习平台、九章云极DataCanvas APS机器学习平台、绿盟科技SecXOps、中国移动九天可视化建模平台模型层分析大模型评测:基础大模型创新的重要壁垒之一大模型评测:基础
85、大模型创新的重要壁垒之一预训练基础大模型的训练过程消耗资源训练过程消耗资源十分昂贵,每天的算力成本动辄都是 10 万人民币以上,所以往往需要通过评测,严格监测严格监测大模型在这个训练过程中,有没有走对每一步。资料来源:CLUE中文语言理解测评基准公众号 定义:定义:针对中文可用的通用大模型的测评基准;来源:由中文语言理解评测基准CLUE推出 评测目标:评测目标:在当前通用大模型大力发展的背景下,中文大模型的效果情况。和传统小模型比较,大模型的能力更加复杂,全面地(不同阶段、不同方面)评估大模型并非易事。而对于生成任务为主的大模型,更是需要引入针对生成任务的主观评测生成任务的主观评测。因此,是否
86、有能力打造一套“自动化+人工主观评测”的大模型全面评价系统,并实现从评测结果到模型能力分析,再到模型能力提升的自动闭环,已经成为致力于基础大模型创新的重要壁垒之一是否有能力打造一套“自动化+人工主观评测”的大模型全面评价系统,并实现从评测结果到模型能力分析,再到模型能力提升的自动闭环,已经成为致力于基础大模型创新的重要壁垒之一。评测的必要性和重要性评测的必要性和重要性大模型评测典型案例大模型评测典型案例中文通用大模型基准(SuperCLUE)中文通用大模型基准(SuperCLUE)评测难点评测难点SuperCLUE大模型综合性评测指标模型层分析技术成熟度现状:文本、音频、图像和视频成熟度高技术
87、成熟度现状:文本、音频、图像和视频成熟度高技术成熟度高技术成熟度高底层技术原理明确底层技术原理明确底层技术原理待明确底层技术原理待明确文本生成音频生成图像生成视频生成跨模态生成其他 结构化写作:新闻播报等 辅助性写作:推荐相关内容 闲聊机器人:虚拟男/女友等 非结构化写作:剧本续写等,需要一定创业和个性化 文本交互游戏:AI dungeon 语音克隆 文本生成特定语音:生成虚拟人声,播报等 歌曲生成:编曲,自动作词 图像编辑工具:去除水印、提高分辨率、特定滤镜等 创意图像生成:随机或按照特定属性生成图像画作 功能性图像生成:根据制定要求生成营销类海报、LOGO 视频属性编辑:删除特定主体,生成
88、特效、跟踪剪辑等 视频部分编辑:视频换脸等 视频自动剪辑:对特定片段进行检测及合成 文字生成图像:根据文字prompt生成创意图像 文字生成演绎视频:拼接图片素材生成视频 文字生成创意视频:完全从头生成特定主题视频 图像/视频到文本:视觉问答系统、自动配字幕/标题等 AI BOT、NPC逻辑及剧情生成 数字资产生成AIGC技术场景交互性文本生成交互性文本生成图像自主生成图像自主生成应用层分析文本生成:商业落地最早技术之一,文本交互成为未来发展方向文本生成:商业落地最早技术之一,文本交互成为未来发展方向应用型文本创作型文本文本辅助文本交互应用型文本创作型文本文本辅助文本交互 文本生成是AIGC实
89、现商业落地最早的技术之一,技术发展显著提高了对于上下文的理解与承接能力、对常识性知识的嵌入能力、中长篇幅生成能力、生成内容的内在逻辑性等,文本生成迎来质的飞跃。现有的落地场景主要集中在应用型文本生成、创作型文本生成,重点关注闲聊型交互文本生成。Narrative Science创始人曾预测,到2030年,90%以上的新闻或将由机器人完成需要创意和个性化,对生成能力要求高基于创作者需求协助爬取相关素材,供给落地最为广泛虚拟伴侣、游戏中的NPC个性化交互等生成类型生成类型落地场景落地场景未来展望未来展望结构化写作为主客服类聊天问答、新闻撰写可替代部分较机械化的人工写作生成类型生成类型落地场景落地场
90、景未来展望未来展望非结构化文本生成剧情续写、营销文本未来4-5年,会出现较优的长文本内容生成类型生成类型落地场景落地场景未来展望未来展望其他定向采集信息素材、文本素材预处理、自动聚类去重精度逐步提升,更好辅助文本写作、文本创意等代表企业:代表企业:Automated Insights、Narrative Science、Textengine.io、Yseop、Arria、Retresco、澜舟科技等代表企业:代表企业:Anyword、Phrasee、Persado、Copy.ai、Friday.ai、Retresco、Conversion.ai、Japper AI、Snazzy AI、彩云小梦
91、等生成类型生成类型落地场景落地场景未来展望未来展望交互性文本生成虚拟伴侣、NPC互动等以ChapGPT为革命点,1-2年会有较大发展突破代表企业:代表企业:小冰公司、聆心智能、Latitude.io、Open AI等代表企业:代表企业:写作猫等应用层分析音频生成:TTS场景基本成熟,AI编曲将成AI音频生成中热门赛道音频生成:TTS场景基本成熟,AI编曲将成AI音频生成中热门赛道 音频生成主要应用于流行歌曲、乐曲、有声书的内容创作,以及视频、游戏、影视等领域的配乐创作,目前在众多场景已获初步发展,在部分场景已广泛 应用、趋于成熟。现有的落地场景集中在TTS、语音克隆、乐曲/歌曲生成。国外索尼计
92、算机科学实验室(CSL)在2021年9月发布一款AI辅助音乐制作应用程序Flow Machines Mobile,利用AI人工智能技术辅助音乐制作,能够根据创作者选择的风格提示旋律、和弦和贝斯线,生成音乐;国内喜马拉雅于2021年用TTS技术完美还原单田芳声音,并首次将单田芳的AI合成音应用于风格各异的书籍,用单式评书腔调,全新演绎听众耳熟能详的经 典之作。TTS(Text-to-speech)场景乐曲/歌曲生成 目前而言,AIGC已经支持基于开头旋律、图片、文字描述、音乐类型、情绪类型等生成特定乐曲。通过这一功能,创作者即可得到AI创作的纯音乐或乐曲中的主旋律。2021年末,贝多芬管弦乐团在
93、波恩首演人工智能谱写完成的贝多芬未完成之作第十交响曲,即为AI基于对贝多芬过往作品的大量学习,进行自动续写。倒映有声与音频客户端“云听”APP合作打造AI新闻主播,提供音频内容服务的一站式解决方案,喜马拉雅运用TTS技术重现单田芳声音版本的毛氏三兄弟和历史类作品。这种场景为文字内容的有声化提供了规模化能力。随着内容媒体的变迁,短视频内容配音已成为重要场景。部分软件能够基于文档自动生成解说配音,上线有150+款包括不同方言和音色的AI智能配音主播。代表公司有九锤配音、加音、XAudioPro、剪映等。作词作曲编曲人声录制整体混音AIGC词曲创作步骤拆解客户机器人语音播报有声读物制作硬件机器人主要
94、应用类型应用层分析图像生成:图像属性编辑普遍应用,创意图像生成应用落地较少图像生成:图像属性编辑普遍应用,创意图像生成应用落地较少 图像生成可简要划分为图像属性编辑、图像局部生成及更改、以及端到端的图像生成。其中,前两者的落地场景为图像编辑工具,而端到端的图像生成则对应创意图像及功能性图像生成两大落地场景。图像属性编辑大量应用落地,图像局部生成及更高目前有部分应用落地,端到端图像生成底层原理明确,未来有望规模化应用。由于图像的生成复杂度远高于文字,在整体生成上,目前仍然难以达到稳定可靠的生成高质量图像。但随着GAN、Diffusion Model等模型的不断迭代,图像生成发展将非常快速。图像属
95、性编辑图像属性编辑图像端到端生成图像端到端生成资料来源:DeepFaceDrawing,量子位,创业邦研究中心可理解成经AI简化的Photoshop;图片去水印、自动调整光影、设置滤镜、修改颜色纹理、复刻/修改图像风格、提升分辨率等已广泛应用。代表公司代表公司具体内容具体内容美图秀秀(美图AI开放平放台)、Radius5、Photokit、Imglarger、Hotpot、Remove.bg、Skylum(Mask AI)、Photodiva图像局部生成及更改图像局部生成及更改代表公司代表公司具体内容具体内容更改图像某部分构成(如英伟达CycleGAN支持将图内的斑马和马进行更改)、修改面部某
96、一特征等。Adobe(InsetGAN)、英伟达(EditGAN)、Metaphysics AI、Deepfake代表公司代表公司具体内容具体内容基于草图生成完整图像、有机组合多张图像生成新图像、根据指定属性生成目标图像等,可用于Logo、海报、模特图制作。阿里鹿班、Deepdream Generator、Rosebud AI、AI Gahaku artbre eder、Nightcafe、Starry ai、Wombo、Deepart、Obvious、Datagrid、诗云科技、道子智能绘画系统等应用层分析视频生成:大量应用集中在视频属性编辑视频生成:大量应用集中在视频属性编辑 视频生成原理
97、与图像类似但更具挑战性,在修改外观的同时,需要保持时间上的一致性;目前视频属性编辑类应用较为成熟,已有大量应用落地,视频自动剪辑和视频部分生成还处于技术尝试阶段。视频属性编辑视频自动剪辑视频属性编辑视频自动剪辑视频部分生成(以Deepfake为典型代表)视频部分生成(以Deepfake为典型代表)视频画质修复删除画面中特定主体自动跟踪主题剪辑生成视频特效自动添加特定内容视频自动美颜基于图像或视频对源视频进行编辑及调试视频生成内容分类视频生成内容分类基于视频画面、声音等多模态信息的特征融合进行学习,按照氛围、情绪等高级语义限定,对满足条件片段进行检测并合成。目前还主要在技术尝试阶段。技术尝试阶段
98、。人脸替换人脸再现环境合成全身合成人脸合成基于语音等要素逐帧复刻应用层分析跨模态生成:文字生成图像/视频应用类工具迈向商业化跨模态生成:文字生成图像/视频应用类工具迈向商业化文字生成图像文字生成视频文字生成图像文字生成视频图像/视频到文本图像/视频到文本 跨模态生成是将一种模态转换成另一种模态,同时保持模态间的语义一致性,主要集中在文字生成图片、文字生成视频以及视频/图片生成文字;目前文字生成图像,文字拼凑式生成视频等较为成熟,文字完全自动生成视频,以及图像和视频到文字的跨模态应用尚在完善。2021年,OpenAI的CLIP和DALLE开启了AI绘画重要的一年。同年,CVPR2021收录的VQ
99、GAN也引发了广泛关注。2022年被称为“AI绘画“之年,多款模型/软件证明了基于文字提示得到效果良好的图画的可行性,Diffusion Model受到广泛关注。视觉问答配字幕标题生成具体应用文本-图像之间的跨模态搜索代表模型:METER、ALIGN助力拼凑式生成完全从头生成按照技术生成难度和生成内容,分为拼凑式生成和完全从头生成两类。基于文字搜索合适的配图、音乐等素材,在已有模板的参考下完成自动剪辑。本质是“搜索推荐+自动拼接”“搜索推荐+自动拼接”,门槛较低,背后授权素材库的体量素材库的体量、已有模版数量模版数量等成为关键因素。由AI模型基于自身能力,不直接引用现有素材不直接引用现有素材,
100、生成最终视频,门槛较高门槛较高应用层分析策略生成:在游戏、智能交互数字人等领域应用价值高策略生成:在游戏、智能交互数字人等领域应用价值高GameAIAIBot,也即游戏操作策略生成NPC逻辑及剧情生成NPC逻辑及剧情生成,也即由AI生成底层逻辑 重点在于生成真实对战策略 以腾讯AI Lab在游戏制作领域的布局为例,人工智能在游戏前期制作、游戏中运营的体验及运营优化、游戏周边内容制作的全流程中均有应用。辅助游戏制造,降低创造新游戏门槛美术设计内容设计测试体验优化提升游戏体验和乐趣运营优化 场景生成 动作生成 超分辨率 AI玩法设计 地图设计 关卡设计 平衡测试 游戏测试 智能NPC 智能BOT
101、掉线托管 违规审判 平衡匹配 对局陪伴游戏前游戏前游戏中游戏中游戏周边游戏周边赋能游戏竞技,带动线上线下同步发展直播训练 集锦自动生成 比赛解说 语音互动 针对性的跟AI team训练 模拟对手打法、风格Deepmind Alpha GODota 2StarCraft 2德扑麻将传统方式NPC逻辑及剧情生成 人工创造驱动脚本 由制作人主观联想 背后为不同的静态分支 个性化与创造性有限 自动化驱动脚本 自动化内容生成 个性化与创造性强资料来源:腾讯AI Lab,创业邦研究中心应用层分析虚拟人生成:多技术综合培育下,拟人化为技术发展目标虚拟人生成:多技术综合培育下,拟人化为技术发展目标虚拟人是应用
102、计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等多种计算机技术,打造综合外观、面部表情、发声习惯等产出全面拟人化的数字内容,目前在虚拟偶像、虚拟主播等领域已有广泛应用。真人驱动型:基于真人行动建模:建模:依据形象要求绘制模型原画及3D建模绑定关键点:绑定关键点:将选定的关键点映射至模型中并进行绑定动捕:动捕:应用动捕设备对真人的行动、表情等进行采集渲染:渲染:对图像进行渲染以提升逼真度,生成虚拟人计算驱动型:基于深度学习模型建模:建模:扫描模特并采集表情、姿态等数据,建模、绑定关键点训练模型:训练模型:利用深度学习,学习模特语言、表情等参数间的潜在映射关系,形成驱动模型内容制作:内容制作
103、:基于语音输入或TTS技术,结合训练后的模型推理得到每帧虚拟人图片,并与语音对应渲染:渲染:对图像进行渲染以提升逼真度,生成虚拟人建模渲染 建模主要为仪器采集模型,或通过3D美术、改变顶点数据“捏脸”等技术构造虚拟人基础形象三大核心技术 渲染分为传统渲染和神经渲染两类,前者以物理世界为基础,利用虚拟相机模拟感知的方式显示模型效果。后者是基于统计学习方法,通过深度神经网络,使计算机学习理解物体空间形态,实现图像合成。深度学习交互技术 旨在通过计算机的自动学习匹配人类在说话时人脸骨骼和肌肉的变化,使虚拟人在动态情况下的表情形态更逼真。深度学习模型输出效果主要受到数据量、计算框架、关键特征点等因素影
104、响。交互技术主要体现在实时互动虚拟人应用中,例如虚拟人主播、虚拟人客服等。虚拟人的交互能力以对话能力为核心,着重应用NLP技术,此外还会受到语音识别能力、知识图谱、预先设置知识库等技术的影响。应用层分析游戏生成:全生命周期优化游戏产品流程,提升体验、降低成本游戏生成:全生命周期优化游戏产品流程,提升体验、降低成本游戏资产生成游戏体验优化辅助游戏测试游戏运营游戏发行游戏资产生成游戏体验优化辅助游戏测试游戏运营游戏发行游戏方案策划程序代码编写游戏地图设计音频音效制作美术原画设计游戏人物生成3D模型构建CG动画生成分析游戏用户需求,协助产品定位及策划方案。自主生成基础简单代码、协助编写复杂代码、代码
105、编写建议,语言切换等。包括地图设计及代码编辑。包括生成游戏背景音、游戏音效及游戏人物语音等。批量生产游戏美术素材。包括协助玩家人物制作、NPC的生成。3D环境搭建、3D素材模型的创造等。游戏内CG动画的生成。NPC对话及交互反作弊及AI托管加持故事剧情语言翻译生成交互式文本、语音等,增强与NPC沟通现实感;让NPC根据玩家行为和环境变化来调整策略和行动。通过学习可无限开展游戏故事的剧情互动,实现千人千面的个性化体验。AI分析玩家行为和游戏数据,预防作弊行为;接管掉线玩家角色,优化玩家体验。通过自然语言处理技术,AI可以实现游戏语言的翻译和本地化,为全球玩家提供更好的游戏体验。伴随游戏生产量的增
106、长以及游戏复杂度的提高,游戏测试的需求爆发,而AI可以在游戏测试中执行一些自动化任务。如执行基本的功能测试、性能测试、兼容性测试等,以实现更高效地测试降低开发成本优化交互体验测试提质降本 协助版本迭代赋能游戏买量降低开发成本优化交互体验测试提质降本 协助版本迭代赋能游戏买量游戏测试质量游戏测试目的是保证游戏质量,减少发布后的风险,并为玩家提供更好的游戏体验。辅助测试可以改变传统需要大量人员长时间体验以实现游戏测试的现状,采用模型自动测试并标记BUG。测试自动化数值分析及版本迭代通过模型分析游戏数值并调试、检验、筛选,协助提高运营人员的分析结果与游戏产品的迭代效率。游戏赛事举办赛事分析:赛事分析
107、:赛前阵容分析、赛后数据分析和赛事回放,并以最快的速度获得最优解。电竞解说:电竞解说:处理游戏数据,实时运算生成多个解说文案,进行内容决策,并选取最优文案进行实时解说。集锦自动生产:集锦自动生产:通过算法最短时间内筛选、剪辑出视频素材。买量素材制作投放效果分析买量投放执行优化创意产出、内容制作环节,从而成倍地赋能广告买量。快速整合投放端及内部转化数据,分析各素材投放效果,进一步优化投放素材及投放策略,提升投放效率及ROIAI能够快速提升广告投放的速度和效率,实现投放业务“7*24小时”批量化与自动化操作。应用层分析AIGC+垂直内容产业:核心价值是优化内容生产的效率与创意AIGC+垂直内容产业
108、:核心价值是优化内容生产的效率与创意AIGCChatGPT文心一言华为盘古.游戏营销影视媒体互联网娱乐其他游戏营销影视媒体互联网娱乐其他让创作者拥有一个更加高效的智能创作工具,优化内容创作,大幅提升效率并降低成本;提升创作效率的同时,同样提升了反馈生成效率,有助于实现实时交互内容。AIGC能够代替人工完成声音录制、图像渲染、视频创作等工作,从而降低内容生产的成本与门槛,使更多用户能够参与到高价值的内容创作流程中。帮助有经验的创作者捕捉灵感,在设计初期生成大量草图,更好的理解创作需求并寻找创作灵感。海量数据提高创造性和开放性,激发创意认知、提升生产多样性。在与其他特定的数据库(例如实时更新数据、
109、特定主体数据等)或AI系统进行联动后,AIGC能够实现更精准的未来预测或更个性化预测基础上调整生成内容。提升内容生产效率降低内容生产成本捕捉激发创作灵感联动实现数据优化提升内容生产效率降低内容生产成本捕捉激发创作灵感联动实现数据优化应用层分析AIGC+其他产业:加快数实融合,产业升级提速AIGC+其他产业:加快数实融合,产业升级提速教育金融医疗工业教育金融医疗工业AIGC赋予教育材料新活力,为教育工作者提供了新的工具,使原本抽象、平面的课本具体化、立体化。AIGC助力实现降本增效。1)实现金融资讯、产品介绍视频内容的自动化生产,提升效率;2)塑造视听双通道的虚拟数字人客服。1)药物研发:1)药
110、物研发:DNA 中的基因链、蛋白质中的氨基酸链;2)医疗信息化3)医疗影像2)医疗信息化3)医疗影像AIGC提升产业效率和价值。1)融入计算机辅助设计CAD,极大缩短工程设计周期;支持生成衍生设计,实现动态模拟;2)加速数字孪生系统的构建,高效创建数字孪生系统。AIGCAIGC应用层分析投融资分析投融资分析投融资趋势融资轮次热点区域热点赛道活跃机构大额融资事件投融资趋势:2021年达到高峰后,近两年相对冷静投融资趋势:2021年达到高峰后,近两年相对冷静 据睿兽分析统计,截至2023年6月30日,国内AIGC行业累计250家企业获得融资,涉及融资事件1077件、融资金额3364.11亿元,参与
111、机构1139家。从2014年开始,生成式对抗网络GAN、深度学习模型CLIP、Transformers神经网络架构等关键技术出现,AIGC逐渐迎来第一波高峰,2018年中国AIGC行业融资金额866.85亿人民币,同比增长171.7%,实现大幅度提升;步入2020年,AI模型取得突破性进展,基于Stable Diffusion等开源模型的上层应用迅速涌现,随着微软、OpenAI、谷歌等科技巨头的产品出圈,行业爆发,2021年融资事件达到高峰(173件);近两年,受整体投融资市场趋冷影响,有所回落。2023年上半年发生融资事件57件,融资金额63.13亿人民币。资料来源:睿兽分析,创业邦研究中心
112、47638.65100.1215.13318.96866.85363.66195.56448.85143.3263.00040050060070080090052000222023H12014-2023H1中国AIGC产业投融资趋势分布2014-2023H1中国AIGC产业投融资趋势分布事件数事件金额(亿人民币)投融资趋势注:融资事件为种子轮至Pre-IPO轮次发生的事件,不含IPO融资轮次:主要集中在A轮等早期阶段融资
113、轮次:主要集中在A轮等早期阶段据睿兽分析数据,2023年上半年,从交易数量看,国内AIGC产业融资事件大多发生在A轮(事件数30,占比53%)、天使轮(事件数13,占比23%)、种子轮(事件数4,占比7%),早期事件数(A轮、天使轮、种子轮)占比达到83%;从交易金额看,国内AIGC产业早期已披露的融资金额占总体的72%,反映AIGC目前尚处在产业发展的早期。资料来源:睿兽分析,创业邦研究中心种子轮,4,7%天使轮,13,23%A轮,30,53%B轮,4,7%C轮,3,5%D轮,2,3%Pre-IPO轮,1,2%2023年H1AIGC产业融资轮次交易数量分布2023年H1AIGC产业融资轮次交
114、易数量分布种子轮天使轮A轮B轮C轮D轮Pre-IPO轮融资轮次种子轮,未披露天使轮,9.96,16%A轮,35.07,56%B轮,1.6,2%C轮,8.5,13%D轮,8,13%Pre-IPO轮,未披露2023年H1AIGC产业融资轮次交易金额分布2023年H1AIGC产业融资轮次交易金额分布种子轮天使轮A轮B轮C轮D轮Pre-IPO轮热点区域:北京融资最为活跃热点区域:北京融资最为活跃资料来源:睿兽分析241276421126.4724.2625.310.490.340051015202530北京上海浙江广东江苏四川山东陕西2023H1中国AIGC产业投资区域分布2023H1中国AIGC产业
115、投资区域分布事件数融资金额(亿元)2023年上半年,国内有58家AIGC企业发生投融资事件,融资事件共57起,已披露金额事件36起,已披露融资总额63.13亿元,涉及投资机构数66家。从热点地区分布来看,2023年上半年,北京融资最为活跃,融资事件数共发生24件,融资金额最高北京与上海居前列。热点区域2426.4724.2620.490.40.410.304.540.3051015202530北京 上海 杭州 南京 深圳 广州 成都 宁波 珠海 青岛 西安2023H1中国AIGC产业投资城市分布2023H1中国AIGC产业投资城市分布事件数融资金额(亿元)热点赛道:通用大
116、模型、元宇宙/数字人、工具平台成为资本青睐的三大方向热点赛道:通用大模型、元宇宙/数字人、工具平台成为资本青睐的三大方向据睿兽分析数据,2023年上半年,国内AIGC产业在通用大模型、元宇宙/数字人、工具平台三个细分赛道最为活跃,通用大模型也是融资金额最多的领域,高达27.29亿人民币。通用大模型与元宇宙/数字人、工具平台两个细分赛道融资事件数量相当,但融资事件远高于两者,说明初创企业技术研发成本和资源投入成本(尤其是算力)很高,需要大量的资金投入。资料来源:睿兽分析9885443332222111127.295.65.82.220.21.9未披露30未披露未披露7.52.20.30.3700
117、5通用大模型元宇宙/数字人工具平台图像文本AI基础数据服务营销医疗AI芯片音频客服办公/Saas生物科技游戏其他场景应用行业大模型智能云/高性能计算2023年H1AIGC产业热点赛道分布2023年H1AIGC产业热点赛道分布事件数事件金额(亿人民币)热点赛道活跃机构:奇绩创坛、红杉中国、联想创投等投融资比较活跃活跃机构:奇绩创坛、红杉中国、联想创投等投融资比较活跃投资机构投资机构类型以VC/PE为主,占比88.4%,大企业创投占比11.6%。奇绩创坛、红杉中国、联想创投三家机构投融资相对活跃。资料来源:睿兽分析54322222220246奇绩创坛红杉
118、中国联想创投金沙江创投GSR Ventures蓝驰创投图灵创投高瓴资本线性资本腾讯投资斯道资本2023年上半年AIGC产业活跃投资机构2023年上半年AIGC产业活跃投资机构事件数88.4%11.6%2023年上半年AIGC产业投资机构类型分布2023年上半年AIGC产业投资机构类型分布VC/PE大企业创投2023年H1海外大额融资事件2023年H1海外大额融资事件资料来源:睿兽分析公司公司简介简介国家和地区国家和地区融资轮次融资轮次融资金额融资金额融资时间融资时间投资方投资方OpenAI智能机器人产品研发商美国加利福尼亚B轮100.00亿美元2023-01-12M12Inflection A
119、IAI语言模型会话API研发商美国加利福尼亚A轮13.00亿美元2023-06-29Bill Gates、Eric Schmidt、NVIDIA英伟达、Reid Hoffman、CoreWeave、Microsoft微软Anthropic人工智能安全服务商美国加利福尼亚C2轮4.50亿美元2023-05-23Spark Capital 星火资本、Menlo Ventures、Google、Sound VenturesAdept AI人工智能技术研发商美国加利福尼亚B轮3.50亿英元2023-03-14Spark Capital 星火资本、General CatalystOpenAI智能机器人产
120、品研发商美国加利福尼亚C轮3.00亿美元2023-04-28Sequoia Capital、Andreessen Horowitz(A16Z)、Tiger Global Management 老虎环球基金、Founders Fund、Thrive Capital、K2 GlobalAnthropic人工智能安全服务商美国加利福尼亚C1轮3.00亿美元2023-03-09Spark Capital 星火资本Anthropic人工智能安全服务商美国加利福尼亚C轮3.00亿美元2023-02-03GoogleCohere自然语言处理平台研发商 加拿大安大略省C轮2.50亿美元2023-05-02In
121、dex Ventures、iNovia Capital、NVIDIA英伟达Character.ai生成式AI聊天机器人公司 美国加利福尼亚A轮1.50亿美元2023-03-04Andreessen Horowitz(A16Z)、SVA、A.Capital Ventures、Elad GilRunway美国图片和视频编辑软件 美国纽约C+轮1.41亿美元2023-06-29Google、NVIDIA英伟达、Rogue Venture PartnersMistral AIAI模型开发平台法兰西堡种子轮1.05亿欧元2023-06-13Lightspeed Venture Partners光速创投、
122、Bpifrance、Headline等DeepL在线翻译工具研发商北莱茵-威斯特法伦 B轮1.00亿美元2023-01-11Bessemer Venture Partners(BVP)、Atomico、World Innovation Lab、Institutional Venture(IVP)大额融资事件2023年H1国内大额融资事件2023年H1国内大额融资事件资料来源:睿兽分析公司简介国家和地区融资轮次融资金额融资时间投资方光年之外人工智能领域服务商中国北京收购20.65亿人民币2023-06-29美团MiniMax多模态AI大模型领域研发商中国上海A轮过2.50亿美元2023-06-0
123、1腾讯投资云知声语音识别技术研发商中国北京D+轮7.00亿人民币2023-06-27中金汇融、历城控股、磐谷创投、来宾鑫隆、华创深大、金达投资基金、水木春锦、挚信资本、好未来战略投资部潞晨科技高性能AI运行平台开发商中国北京A轮数亿人民币2023-05-22未披露澜舟科技认知智能技术服务商中国北京Pre-A+轮数亿人民币2023-03-14中关村科学城、斯道资本、创新工场(李开复)衔远科技产品数智化服务商中国北京天使轮数亿人民币2023-03-01启明创投(周志峰)、经纬创投(左凌烨)Project AI 2.0 大语言模型平台中国北京天使轮数干万美元2023-03-19创新工场(李开复)、红
124、杉中国、高瓴资本、IDG资本Fabarta图智能分析平台开发商中国北京Pre-A轮过亿人民币2023-04-18蓝驰创投、将门创投、朗玛峰创投标贝科技智能语音交互和AI数据服务技术研发商中国北京B2轮过亿人民币2023-04-07巨峰科创、青岛财富中心大额融资事件投资建议投资建议行业总结投资建议未来趋势未来趋势核心技术持续演进关键能力显著增强产品类型逐渐丰富场景应用趋于多元生态建设日益完善核心技术持续演进关键能力显著增强产品类型逐渐丰富场景应用趋于多元生态建设日益完善 数字人开发自由度大幅提高 嗅觉、触觉、味觉、情感等将以数字化形式指导AIGC 应用场景会进一步多元化NLP、翻译模型、生成算法
125、等细分赛道空间较大,需要依托算力、数据的支持,模型、数据和算力的基础能力成为重要关键支撑。将从目前“以辅助内容生成为主”向“以自主内容生成为主”跃进,极大满足未来消费者对内容数量及质量的双重刚性需求。AIGC能极大提质增效、创意释放,降低制作成本,实现高自由度,同时,随着感知交互等技术设备升级产生多样性的感知数据,能更好的指导AIGC。为了让功能更加精确,将会更多地去开发一些垂直类的应用,毕竟垂直类的应用可以更有针对性地为特定功能进行训练,成本相对较低。AIGC的知识产权归属方面和创作伦理问题将得到有效规范,同时,围绕AIGC的技术、内容、应用、服务等生态体系将日趋完善。标准规范、技术研发、内
126、容创作、行业应用、资产服务为核心的生态体系架构将日趋完善 内容孪生、内容编辑、内容创作三大基础能力将显著增强行业总结 向高性能大模型、优质大量的数据、更高效率更低延迟的算力发展面临挑战面临挑战 关键技术不够完全成熟,大规模推广落地尚存痛点、难点 企业核心能力参差不齐,威胁网络内容生态健康安全发展 相关规范指引尚需完善,发展与治理之间存在匹配问题人工智能算法存在固有缺陷:人工智能算法存在固有缺陷:人工智能算法在透明度、稳健性、偏见与歧视方面存在尚未克服的技术局限,算法应用问题重置。AIGC内容编辑与创作技术不够完善:AIGC内容编辑与创作技术不够完善:文本生成方面,简单套用模版、难以产生易读且优
127、质的文本;语言合成方面,声音机械感强、表达不够流畅;视觉生成方面,实时动作捕捉精准度不足,图像处理效果不佳。内容审核能力有待提高内容审核能力有待提高:现行审核方式为“机审+人审”。机审方面审核误报率偏高;人审方面行业内未形成统一标准,人员不足。企业技术管理能力建设不足企业技术管理能力建设不足:诸多切入市场的小型企业技术管理能力不达标,为抄袭侵权、内容造假、恶意营销等灰黑产业链提供温床。企业风险治理能力尚未完善企业风险治理能力尚未完善:AIGC处于发展初期,其风险具有未知性和复杂性等特点,很多企业对于风险的预测、防范和应急处置能力均尚未完善。AIGC版权性有待厘清:AIGC版权性有待厘清:AIG
128、C作品无法获得著作权保护,阻碍AIGC发挥其创作价值;人工智能的海量摹写稀释现有作品权利人的独创性。新技术增加监管难度:新技术增加监管难度:技术滥用导致水军和虚假信息增加,对监管行动造成了严重阻碍。行业总结细分领域分析细分领域分析 基础层:基础层:由于上游人工智能算力、数据基础设施或垄断或资源稀缺,如芯片、服务器等,议价权较高,但下游需求激增,现阶段最先受到裨益,但就目前国产替代情况,真正实现盈利也是相对长期的过程。就目前国产替代情况,真正实现盈利也是相对长期的过程。传统硬件巨头目前在芯片、内存、互联占据绝大部分市场传统硬件巨头目前在芯片、内存、互联占据绝大部分市场,云计算巨头不只是最大的买单
129、方,也和初创企业一样是新技术最主要的探索者。但其市场规模、市场格局和模型压缩技术、定价策略密切相关。100亿150亿参数级别的模型可以覆盖绝大多数生成式AI的用例。100亿150亿参数级别的模型可以覆盖绝大多数生成式AI的用例。若终端已经可以支持那么无需云端处理运算。从英伟达近期的疯狂投资以及高通的技术进展来看,预计年内AIGC产业对云端算力的依赖有望大幅降低预计年内AIGC产业对云端算力的依赖有望大幅降低,届时手机、自动驾驶等终端将会衍生出更丰富的使用场景。模型层:模型层:技术积累以及资金实力都是关键竞争力,当下OpenAI的技术迭代速度快,因此科技巨头更具有巨大的竞争优势科技巨头更具有巨大
130、的竞争优势。随着国资入场,市场可能会有12家有垄断现象,未来可能国有垄断、巨头小垄断,但难以形成大垄断局面。对于大模型企业来说,ChatGPT插件可能成为AI时代的核心入口,从大模型技术赋能者转向平台经济生态入口卡位。这一方面体现为可以接入应用、赋能应用,另一方面可以调用应用、操作应用,以大模型兼具“操作系统”角色,加速海外生态中与其他应用层的精细化分工。对于垂直和通用赛道的初创公司来说,找到差异化的市场定位找到差异化的市场定位是第一要义。工具平台加速大模型工程化和商业化落地,大企业和中小企业之后很可能会有并购出现。应用层:应用层:目前看似繁荣的应用生态很大程度上得益于开源技术目前看似繁荣的应
131、用生态很大程度上得益于开源技术,由于上游模型层和基础层迭代周期快,下游应用层企业,尤其是垂直产品,面临一定程度上的风险,但由于大模型的通用性和开发范式的革新,已给原有业务带来相当大的降本增效的增益。技术扩散越快,越难做到绝对领先,更多竞争在于品牌推广和营销策略。技术扩散越快,越难做到绝对领先,更多竞争在于品牌推广和营销策略。用户体验和模式创新用户体验和模式创新都将成为“杀手锏”,但通用大模型借助插件构建起了直接面向终端用户的细分场景,可能会冲击到一部分原来纯应用层的初创公司,尤其是大厂并购和开发同类型竞品。产业AI和可信A产业AI和可信AI成为政策指导的未来发展方向,垂直领域产业化落地是结构性
132、机会。企业数据隐私问题的解决、大模型的泛化能力企业数据隐私问题的解决、大模型的泛化能力日益变成新的技术壁垒。总结:总结:随着AIGC产业生态不断完善,技术成熟度变高,上中下游相互蚕食领地的现象会更加频繁。行业总结厚雪长坡,AIGC产业具有长期长期的发展潜力。AIGC作为新的内容生产基础设施新的内容生产基础设施,若将多模态大模型底座比作“操作系统”,那么下游To C应用层相当于平台经济,平台型科技企业可能会诞生新的巨头。技术层面,本轮AIGC爆发的导火索为ChatGPT产品出圈,头部企业技术迭代速度快,一方面,大模型的追赶需要时间;另一方面,随着开源生态的繁荣,下游应用打响“百团大战”,将更加考
133、量企业场景应用的专业能力,以及垂直领域的数据和知识储备另一方面,随着开源生态的繁荣,下游应用打响“百团大战”,将更加考量企业场景应用的专业能力,以及垂直领域的数据和知识储备。国内外发展环境对比:国内外发展环境对比:国内消费市场广阔,但由于受到政策规制以及国内互联网行业生态影响,数据流通受阻;相比国外,国内SaaS市场用户付费意识相对较差;人才培养和产学研协同创新是长期发展的必修课。因此,商业落地还需要各行各业共同发展、共建良好生态。市场竞争优劣势对比:市场竞争优劣势对比:不论是大模型厂商自用实现增量或降本增效,还是基础层厂商高性能硬件供不应求所带来的红利,初创企业都天然缺少先发优势,因此当下二
134、级市场相对火热,一级市场相对冷静。但长期来看,随着AIGC上游土壤逐渐肥沃,有望孕育新业态、新巨头。中短期可关注具有ToB端大模型丰富经验的AI科技公司和工具平台,长期可关注To C端的应用层初创企业的颠覆式创新。总结总结行业总结重要的投资因素重要的投资因素 技术成熟度技术成熟度:数据、算力、算法三要素决定能否实现落地和商业化;决定商业化路径,比如提供文、图、视频等一种或多种服务;决定产业链核心的位置;决定技术壁垒的高低。创新潜力:创新潜力:中短期内,大模型应用落地创新实践决定放量空间和市场空间,尤其对于初创企业。商业模式:商业模式:形成商业闭环,取决于技术进步、国家支持、巨头推动、生态建设、
135、市场化教育综合发展水平。推荐关注企业推荐关注企业 基础层:基础层:算力,AI芯片和服务器等硬件,初创企业可关注:推理芯片、片间通讯和训练芯片;数据要素相关企业(包括数据基础服务、数据处理等),初创企业可关注:合成数据、向量数据库。模型层:模型层:(中短期)能提供在算法模型、算力、数据要素发展过程中遇到问题的解决方案的技术企业,比如工具平台;(中长期)打通大模型-应用优势并形成端到端闭环的企业。应用层:应用层:(中短期)目前随着垂类领域的数据开始流向中间层,具有垂直行业know-how基础的企业或与行业巨头合作并具有技术优势的服务商有较大机会,他们能够通过与场景客户的合作,将数据转化为知识,形成
136、独特的竞争优势;(中长期)当基础技术足够满足下游应用层落地,模型开发门槛降低,在用户体验和商业模式方面有颠覆式创新的企业会创造新业态,诞生新巨头。另外,可信AI等解决生产关系层面问题的企业会日益受到关注。投资建议投资建议投资建议风险提示风险提示对于基础层企业,是最先受益的群体,也是创新潜力最旺盛的领域之一,但是结合半导体产业的周期性特征,之后也可能会面对产能过剩的窘境,以及国外企业“卡脖子”的风险。对于中间层大模型企业,随着开源生态建设逐步完善,大模型由诸神之战变成人人可用的“普惠模型”;对于中国市场而言,当产业发展处于需求量大(类似PC、移动互联网发展初期)但较高成本时期可能会有技术破解的黑
137、色产业链出现,安全风险不容忽视。对于应用层企业需关注上游技术的快速迭代以及政策监管、法律法规、道德伦理,以及中间层玩家的蚕食领地(主要体现CVC合作、渠道垄断等等)。投资建议附录(企业案例)附录(企业案例)基础层企业Fabarta通用大模型企业百度行业大模型企业云知声应用层企业达观数据应用层企业特赞应用层企业万兴科技企业案例一:AI 基础设施公司-Fabarta企业案例一:AI 基础设施公司-Fabarta成立时间:成立时间:2021-11-16,北京融资轮次:融资轮次:Pre-A轮,朗玛峰创投领投,蓝驰创投、将门创投跟投。行业定位:行业定位:人工智能基础设施层企业、工具平台主营业务:主营业务
138、:专注于解决大量异构数据环境下通过融合图与向量的多模智能引擎技术挖掘复杂业务价值的问题,打造面向 AI 的技术基础设施。Fabarta 产品矩阵提供多模态智能引擎,与多模态大模型紧密融合在一起,构建AGI的核心技术基础设施;提供企业智能分析平台,可以帮助企业客户快速高效地构建丰富的智能领域应用,用可解释 AI 加速企业的智能化转型;同时基于多模态智能引擎构建企业数据资产的全局地图,打造基于 Data Fabric(数据编织)的下一代企业数据平台的核心。服务对象:服务对象:覆盖金融、电信、制造、能源、互联网、通用等领域的企业海外对标:海外对标:Microsoft graph;Microsoft
139、Fabric;Palantir行业预判:Fabarta观点未来走向真正通用人工智能(AGI)的时代一定是大模型跟大图融合才能产生行业预判:Fabarta观点未来走向真正通用人工智能(AGI)的时代一定是大模型跟大图融合才能产生未来发展趋势:未来发展趋势:我国发展AIGC的优势在于数据、场景、人才,但还需要构建生态,得生态者得天下,AI领域的创业者需要知道落地局限性在哪里,这也是我国弯道超车的途径之一。但还需要构建生态,得生态者得天下,AI领域的创业者需要知道落地局限性在哪里,这也是我国弯道超车的途径之一。解决痛点:解决痛点:在大模型应用场景中,需要连接本地知识库-叠加可解释的智能-形成长效记忆
140、本地知识库-叠加可解释的智能-形成长效记忆,大模型时代需要有记忆和可解释AI的能力记忆和可解释AI的能力。Fabarta提供多模态智能引擎,在记忆能力上,提供具备多模态数据存储能力,同时支持图、向量的数据融合;利用图结构的可解释推理和大模型AI推理的计算能力,同时利用基于图和AI的智能分析平台来加速AI技术在企业的落地。【tips:可解释性可解释性是指人能够理解人工智能模型在其决策过程中所做出的选择,包括做出决策的原因、方法以及决策的内容。例如,可以帮助研究人员有效地理解模型做出的决策,从而发现模型做出的决策偏差并且针对性地纠正错误,提升模型的性能。】技术应用:技术应用:提供ArcNeural
141、多模态智能引擎,以Data-Centric AI为核心构建AI时代的数据基础设施产品,将传统的数据库存储&计算架构演进为记忆&推理架构将传统的数据库存储&计算架构演进为记忆&推理架构。基于ArcNeural,提供企业智能分析平台,用图和AI大模型技术帮助客户重构已有业务;利用多模态数据编织平台,让企业充分发挥数据流动带来的价值。商业化思路:商业化思路:通过头部企业案例打磨产品,增强可规模复制的能力:通过头部企业案例打磨产品,增强可规模复制的能力:以ArcNeural 多模态智能引擎为基础,利用企业智能分析平台和多模态数据编织平台,帮助企业构建支撑AI行业落地的基础设施和工程化平台。1.企业智能
142、分析平台可以为客户提供企业级智能平台,帮助开发者、咨询师以及应用开发人员更快速地将图引擎和大模型的融合能力应用于行业中,加速图智能在企业场景的落地。2.多模态数据编织平台,将图技术与大模型技术应用于企业数据领域,为企业打造基于数据编织技术的下一代数据价值生态的基础设施。企业案例二:综合性搜索引擎-百度-文心千帆、文心一言企业案例二:综合性搜索引擎-百度-文心千帆、文心一言四层架构:四层架构:芯片-框架-模型-应用 服务:服务:覆盖人工智能研发的全生命周期,包括:数据管理、模型训练、模型评估、预测部署和插件服务数据管理、模型训练、模型评估、预测部署和插件服务等,能够端到端地帮助客户开发和部署大模
143、型应用。文心千帆提供公有云服务、私有化部署公有云服务、私有化部署两大交付模式。在公有云服务方面,将提供推理推理(直接调用大模型的推理能力)、微调微调(通过高质量精标业务数据,高效训练出特定行业的大模型)、托管托管(将模型发布在百度智能云,以实现更加稳定高效的运行)三种服务,大幅降低企业部署大模型的门槛。推理:推理:成本降低训练:训练:更快、更收敛合作伙伴:合作伙伴:1 5万企业申请文心一言内测,其中有超300家生态伙伴在400多个具体场景取得测试成效。大模型平台:文心千帆大模型平台:文心千帆知识增强大语言模型:文心一言知识增强大语言模型:文心一言大模型应用大模型应用智能产品升级:智能产品升级:
144、百度智能云六大智能产品基于文心一言升级,经安全评估完成后上线。包括金融、政务、客服、写作等行业和领域。赋能千行百业:赋能千行百业:百度网盘等七大企业级产品基于大模型升级。基于大模型的百度网盘企业版,将为企业提供数字智能管理平台。大模型已经不再是遥不可及的前沿技术,基于它的应用场景正逐渐深入到企业的生产链路中以及人们的日常生活。定位:定位:基于文心大模型的中文生成式对话产品。文心一言(ERNIE Bot)是百度基于文心大模型技术推出的生成式对话产品,于 2023 年 3 月份面向公众开放。业务模式:业务模式:文心一言以文心大模型为底层技术基础,通过百度智能云提供服务,吸引企业和机构客户使用 AP
145、I 和基础设施,共同搭建 AI 模型、开发应用,实现产业 AI 普惠。合作伙伴:合作伙伴:截至目前,已有超 450 家企业宣布加入“文心一言”生态圈。ERINE 3.0多范式统一预训练框架企业案例三:智能语音语言独角兽-云知声-山海大模型企业案例三:智能语音语言独角兽-云知声-山海大模型成立时间:成立时间:2012-06-29,北京融资轮次:融资轮次:D+轮,挚信资本领投、启明创投、磐谷创投行业定位:行业定位:AIGC大模型企业主营业务:主营业务:以智能语音识别、语言理解、知识图谱等全栈 AI 技术为核心,打造云服务和 AI芯片,并基于云芯一体化平台,面向智慧物联与智慧医疗两大领域,提供以对话
146、式AI技术为基础的产品服务与综合解决方案。服务对象:服务对象:北京协和医院、华山医院、中山医院、格力、美的等合作伙伴:合作伙伴:京东、360、中建电子等山海大模型,加速 U+X 战略通用能力拥有语言生成、语义理解、知识问答、逻辑推理、数学和代码等通用能力,并能根据人类反馈进行安全合规对齐。行业落地能力通过插件扩展、领域增强和客户定制,可以连接第三方服务,拓展领域和客户知识(兼顾隐私数据保护),如实时信息获取、个性化知识整合、执行用户操作等。技术路径与优势在“预训练+指令调优+反馈强化”基础上,注重行业应用增强,具备“基础架构+全栈技术+工程应用优化”的完整能力商业战略:U(全栈AI 技术与产品
147、能力)+X(物联/医疗等行业应用场景)商业模式:MaaS(模型即服务)阶段:内测开放最新一代认知智能大模型:山海大模型最新一代认知智能大模型:山海大模型行业预判:云知声观点大模型不是一个科学革命,而是工程革命行业预判:云知声观点大模型不是一个科学革命,而是工程革命有关算力困境:有关算力困境:算力是国内大部分研发企业或多或少都会面临到一些问题算力是国内大部分研发企业或多或少都会面临到一些问题,云知声在这方面有一定储备,有近200P最新的针对大模型的算力。另外,有高效算力调度能力【在分布式计算系统中合理分配和充分利用算力资源的能力】高效算力调度能力【在分布式计算系统中合理分配和充分利用算力资源的能
148、力】,在大模型训练中发挥着更重要的作用。有关技术应用:有关技术应用:在大模型通用能力大模型通用能力基础上,一方面,用优质医疗领域数据优质医疗领域数据进行增强预训练,有效加强大模型的医疗方面语言和知识;另一方面,将物联和医疗等行业积累的真实数据,对大模型进行指令微调提高解决问题能力。同时,通过插件扩展、知识图谱、客户定制插件扩展、知识图谱、客户定制等手段,提高解决行业客户问题的能力。在用户隐私保护方面,会进行数据脱敏,数据脱敏,应用隐私计算隐私计算技术。大模型层如何建立竞争壁垒:大模型层如何建立竞争壁垒:1.有自主研发和训练能力,包括算法能力和算力支撑,可形成先发优势和主动权;2.有应用场景,能
149、形成高效迭代和数据积累;3.成本优化,提高商业竞争力。有关OpenAI:有关OpenAI:单纯从技术整体实力与谷歌等相比,OpenAI 并不算一马当先,但也属于 leading团队,在 ChatGPT 路线上的专注与突破,专注与突破,形成先发优势和深厚积淀。有关开源和闭源的选择:有关开源和闭源的选择:从行业整体上看,开源会占据重要市场份额。这两者各有优劣,开源生态多而杂,可灵活发挥新想法,但离严谨的商业应用往往有些距离;闭源好处在于有比较专业的团队去维护,稳定性和可靠性更有保证;选择上还取决于应用目标和团队能力。企业案例四:智能文本处理专家-达观数据企业案例四:智能文本处理专家-达观数据成立时
150、间:成立时间:2015-05-28,上海融资轮次:融资轮次:C轮,中信证券、招商证券、广发证券、中信建投、深创投等行业定位:行业定位:AIGC应用层企业重要产品:重要产品:曹植大语言模型、达观助手主营业务:主营业务:用先进的自然语言处理(NLP)、智能文档处理(IDP)、光学字符识别(OCR)、机器人流程自动化(RPA)、知识图谱等技术,为大型企业和政府机构提供文档智能审阅、办公流程自动化、文字识别、企业级垂直搜索、智能推荐等智能文本机器人产品,让计算机协助人工完成业务流程自动化,大幅度提高企业效率与智能化水平。服务对象:服务对象:中国银行、招商局集团、国家能源集团、新华社、上汽集团、中船重工
151、等合作伙伴:合作伙伴:复旦大学、优刻得、燧原科技、复深蓝等行业预判:达观观点 做同质化大模型,无太多价值行业预判:达观观点 做同质化大模型,无太多价值有关行业生态建设:有关行业生态建设:举办比赛,因为不管是算力、算法还是数据,其实说到底最后都是要靠人才的。有关行业发展瓶颈:有关行业发展瓶颈:短期在算力,长期在数据。有关商业模式:有关商业模式:MaaS在美国可能会用起来会更方便,在国内的话可能还会有一些障碍的。有关模型训练:有关模型训练:分两个阶段:1.第一阶段,完全无监督的预训练完全无监督的预训练,用垂直领域的大量的文档资料语料和这个通用语料混合在一起,大概是 1:1 的比例。参照了Bloom
152、bergGPT(彭博社在今年的 3 月份推出的一个金融领域的垂直模型,参数规模是 500 亿)2.第二阶段,定向训练,有监督的fine-tuning,定向训练,有监督的fine-tuning,用客户自己的语料库,更加匹配应用需求。有关模型推理:有关模型推理:人类反馈的强化训练(RLHF)非常重要。因为不同的行业的这种客户对模型所生成的文字资料和写作内容有自己的规范和要求,也和所需产品形态密切挂钩。【RLHFRLHF,即使用强化学习的方法,利用人类反馈信号直接优化语言模型。训练步骤分三步:多种策略产生样本并收集人类反馈;训练奖励模型;训练强化学习策略,微调 LM。技术使用了一种交互式学习方法,当
153、模型生成一条文本时,它会请求用户对其进行评估,通过分析用户的反馈,模型可以确定哪些方面需要改进,并尝试生成更高质量的文本。】有关技术路径:有关技术路径:在通用大模型训练阶段的时候,可以把一些垂直领域的这些数据资料填补进去,提升专业能力。另外在使用侧需要有数据闭环数据闭环。大模型带给客户的增益:大模型带给客户的增益:体现在两方面:1.大模型像发动机,赋能原有产品;2.对客户来说能够有一个非常好的大而全的平台去解决它很多各个具体的小的应用点。(赋能和整合作用)大模型带给研发商的增益:大模型带给研发商的增益:减少服务、运维的人力成本企业案例五:内容科技独角兽-特赞企业案例五:内容科技独角兽-特赞成立
154、时间:成立时间:2015-04-22,上海融资轮次:融资轮次:D1轮,淡锡、红杉中国、软银中国、赫斯特、线性资本。行业定位:行业定位:AIGC应用层企业主营业务:主营业务:通过生成式人工智能技术助力企业实现更高效、更优质的内容管理、积累、生产、分析。服务对象:服务对象:已服务200多家大中型企业,包括阿里巴巴、联合利华、字节跳动、宝洁、保时捷等全球领先品牌,聚集5万+内容创作者,生产15万+内容资产,积累10亿+企业AIGC的数据集规模。合作伙伴:合作伙伴:微软云,接入 Azure OpenAI GPT-4。未来趋势未来趋势:AI会很快成为行业的基础能力,成本有望持续降低。AI产业发展的关键要
155、素:芯片、工程、数据、算法。产品赋能产品赋能 用AIGC提效200+类品牌Content内容的生产;AIGC Playground 提供100+开源模型,激发更多想象力;将AIGC引入企业完整的系统工作流,用品牌内容资产帮助品牌训练自己的GPT;MuseDAM示意DAM.GPT示意主要产品主要产品AIGC STUDIO(内容生成);MuseDAM(创作者工具);DAM.GPT(内容管理);特赞 AIGC PLAYGROUND特赞 AIGC PLAYGROUND行业预判:特赞观点 DAM(数字资产管理)是企业级的内容基建行业预判:特赞观点 DAM(数字资产管理)是企业级的内容基建AIGC工具对企
156、业营销工作的影响AIGC工具对企业营销工作的影响:AIGC工具降低了创作门槛。出于成本和反映敏捷度的考量,AIGC对于营销工作流的变革可能先会在小企业或创业团队中发生;传统广告公司、设计工作室可能走向新的AI公司、工作室。技术积累技术积累:特赞的技术积累具备连续性,在垂直场景建立了高密度有效的数据集。从而特赞可以在AI的时代把大语言模型技术应用在客户场景里,帮品牌做符合自己品牌调性、垂直场景的中模型或小模型,从而使品牌获得更好的生成式能力、或提升协作管理效率。模型调优模型调优:针对不同场景有不同的调优方式。主要取决于客户场景、客户在这此场景下的数据量和精准度。品牌方对AIGC的认知品牌方对AI
157、GC的认知:品牌方可能希望更了解:1.行业技术成熟度;2.自己哪个产品适合用AI解决、市面上哪家公司做得好、如何比较和采买。成立时间:成立时间:2003融资轮次:融资轮次:A股上市公司行业定位:行业定位:全球领先的新生代数字创意赋能者主营业务:主营业务:视频创意软件、AIGC应用、绘图创意软件、文档创意软件服务对象:服务对象:服务全球用户超15亿;服务超过百万家政府与企业客户,如中国联通、中船重工、一汽丰田、南方电网等。产品功能产品功能输入文案,一键生成“真人”营销视频产品优势产品优势上百套专业级模板,覆盖不同场景视频需求;80+免版权多国籍数字人,满足各类跨境营销视频需要;输入关键词,AI快
158、速生成脚本;移动端、桌面端多端使用;支持数字人形象定制、声音复刻和视频模板定制。产品功能产品功能文生图、图生图、AI简笔画产品优势产品优势只需输入自然的语言文字,即可生成精美艺术作品;一键上传图像,将原片变次元佳作。企业案例六:创意软件A股上市公司-万兴科技(300624.SZ)企业案例六:创意软件A股上市公司-万兴科技(300624.SZ)AIGC“真人”短视频出海营销应用:万兴播爆AIGC“真人”短视频出海营销应用:万兴播爆AI生成艺术创意灵感平台:万兴爱画AI生成艺术创意灵感平台:万兴爱画行业预判:万兴科技观点 未来的AIGC软件生态=若干大模型+海量小应用;交互界面的革新让所有软件都需
159、要再做一遍;AI赋能,创意软件将迎来前所未有的大机遇行业预判:万兴科技观点 未来的AIGC软件生态=若干大模型+海量小应用;交互界面的革新让所有软件都需要再做一遍;AI赋能,创意软件将迎来前所未有的大机遇有关AIGC应用价值:有关AIGC应用价值:1.降低创作门槛,并为创作提效,推进内容创作进入AIGC时代;2.交互方式变得更直接、更自然,会越来越智能化、API 化、云端化、模块化;3、大模型相当于一个“大脑”,它会指挥各种应用来实现用户需求。有关AIGC技术发展阶段:有关AIGC技术发展阶段:目前处于从信息范式,向模型范式转变的早期阶段,类似互联网发展早期。有关大模型评测:有关大模型评测:怎
160、么论证大模型,还属于探索阶段,目前业界各家的方式都不太一样,一般依据设定的场景、问题,以人工+机器的方式进行评测。另外,目前大模型迭代快,评测具有一定的时效性。有关政策监管:有关政策监管:国务院早在2017年发布了新一代人工智能发展规划。近期,国家网信办还发布了 生成式人工智能服务管理办法(征求意见稿),明确对生成式人工智能进行专项监管。总体来看,全球各地政府对生成式AI的监管会越来越快,而国内在完善人工智能法律体系上走在国际前列。72致谢致谢本报告历时9周完成,在编写过程中得到了机构和企业内相关投资人,技术专家的鼎力支持。在此,感谢Fabarta创始人兼 CEO高雪峰、云知声创始人董事长兼C
161、TO梁家恩、特赞联合创始人及首席技术官王喆、达观数据CEO陈运文、万兴科技战略发展负责人唐芳鑫(按照访谈时间排序)在百忙之中接受项目组的访谈和调研。几位老师对AIGC技术、产业、趋势等方面的论述,对报告编写方向起到了指导性作用。未来,创业邦研究中心将持续密切关注AIGC领域,进行更深入的探讨,持续输出更多研究成果,以帮助企业可持续健康发展,推动产业升级。欢迎大家与创业邦联系交流,提出宝贵意见。创业邦创业邦创业邦是领先的国际创新生态服务平台,为高成长企业、金融机构、产业大公司、政府园区提供全方位的媒体资讯、数字会展、数据研究、创新咨询、教育培训、资本对接等服务。关于我们关于我们睿兽分析是创业邦旗下横跨一二级市场的综合性创新数据平台,致力于通过即时、有效、可触达的行业一手数据,为大企业、地方政府、金融机构、投资机构等经济主体,提供强有力的创新驱动与投资决策依据。睿兽分析睿兽分析立即扫码关注立即扫码关注