上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

传媒行业AIGC算力时代系列报告:未来已来AI如何赋能传媒行业-230311(67页).pdf

编号:118073 PDF 67页 10.77MB 下载积分:VIP专享
下载报告请您先登录!

传媒行业AIGC算力时代系列报告:未来已来AI如何赋能传媒行业-230311(67页).pdf

1、分析师姚天航邮箱电话证书编号S012023年3月11日未来已来,AI如何赋能传媒行业AIGC算力时代系列报告行业评级:看好证券研究报告添加标题95%21、ChatGPT火爆的背后:算法革新+算力支持+数据共振ChatGPT引起全球热烈反响,上线仅五天用户突破百万,ChatGPT在文本交互和语言理解方面能力的显著进步或为通用人工智能的实现带来曙光。究其先进性根本,ChatGPT在以往基础上推进算法革新优化,辅以强大算力支持,并以大规模数据共振,协同助推这一划时代产品诞生。OpenAI以B端提供API接口流量+C端订阅收费模式,探索ChatGPT商业化路

2、径。展望未来AI将横纵向并行,结合技术深化与能力边界拓展,进一步铺开应用面。2、数字内容生产新方式AIGCAIGC的兴起推动人类叩响强人工智能之门,可应用于文本、音频、图片、视频、跨模态、策略生成等,有望开启新一轮内容生产力革命。随着Transformer、Diffusion Model等算力模型的迭代,推动AIGC在设计、内容创作、游戏智能、机器交互等领域实现降本增效。3、新时代生产力工具,AIGC赋能内容生产基于AI生成内容技术,AIGC已在游戏、广告营销、影视、媒体、互联网、娱乐等领域初显成效,并展现出较大的潜力。AIGC将推动游戏生产范式升级,并丰富游戏资产生成,高效辅助游戏测试,使制

3、作成本显著降低,全流程赋能游戏买量;AIGC贯穿广告营销全流程,将优化案头工作环节,提供更专业的个性化营销方案,并充实广告素材,实现广告自动化生成;AIGC提升影视行业全管线效率。影视剧本创作已初见成效,多AI技术将助力电影中期拍摄,后期制作将更快完成;AIGC带给媒体行业人机协作方案。新闻写作编排效率提升,传媒向智媒转向开启新篇章;AIGC提供互联网行业丰富内容,和更便捷的服务。ChatGPT赋能智慧搜索,互为供给加速发展内容平台发展,虚拟结合激发电商沉浸式体验;AIGC为娱乐行业提供了更多样的体验。人际交互娱乐迈入新台阶,AIGC或成元宇宙之匙。报告摘要31、AI核心技术和AIGC技术发展

4、不及预期风险。AIGC相关产业技术发展仍不成熟,技术壁垒较高,核心技术难以突破。2、版权相关风险。AIGC生成的内容依赖现有版权素材,不当使用或模型自身问题可能导致不良后果;3、人权道德风险。AI可能会生产违反道德、常规、法律等内容;4、行业竞争加剧风险。若相关企业加快技术迭代和应用布局,整体行业竞争程度加剧,将会对目前行业内企业的增长产生威胁;5、宏观经济波动的风险。若宏观经济景气度下行,将影响消费者消费意愿和产业链生产意愿,AIGC技术应用落地将会受限;6、政策监管风险;7、用户需求不及预期;8、技术垄断风险。风险提示目录C O N T E N T SChatGPT火爆的背后:算法革新+算

5、力支持+数据共振0103新时代生产力工具,AIGC赋能内容生产02数字内容生产新方式AIGC404风险提示015ChatGPT火爆的背后算法革新+算力支持+数据共振ChatGPT火爆全球,成为现象级互联网产品1.1数据来源:OpenAI官网、Statista、机器之心Pro、浙商证券研究所6ChatGPT是一个由OpenAI开发的大型语言模型,它使用自然语言处理和深度学习技术,可以理解语言内容和语境,能够承认错误、挑战不正确的前提、拒绝不适当的请求,通过生成自然语言文本的形式与用户交互,从而能够应用于各种语言任务和应用。2015年,Elon Musk、Sam Altman、Peter Thie

6、l等投资10亿美元,创立OpenAI2017年,谷歌大脑推出生成式预训练Transformer模型2018-2020年,OpenAI依次推出GPT-1/GPT-2/GPT-3等自然语言处理模型2022年11月30日,OpenAI推出在GPT-3.5模型基础上微调后得到的ChatGPT模型2023年2月7日,微软推出由ChatGPT支持的AI搜索引擎Bing和Edge浏览器ChatGPT上线仅5天后,用户数突破百万相较于其他互联网APP及服务,ChatGPT用户规模爆发式增长,迅速出圈并在全球各地引起热烈讨论。p ChatGPT仅5天就达成百万用户,为历史上最快突破百万用户的应用。p ChatG

7、PT上线2个月后,月活用户达1亿,为历史上用户增长最快的消费应用。3.5年2.5年2年10个月7个月5个月2.5个月5天NetflixAirbnbTwitterFacebookDropboxSpotifyInstagramChatGPT各项服务突破百万用户时间从AlphaGo到ChatGPT,AI技术发展叩响AGI之门1.2数据来源:DeepMind、CSDN、浙商证券研究所7围棋高手AlphaGo引发AI狂潮p AlphaGo唤起AGI畅想。AlphaGo的成功使市场对AI技术产生空前期待,预想AI将由专用人工智能(ANI)走向通用人工智能(AGI),实现人类同等能力的任务执行。p AGI遇

8、技术难关,发展相对停滞。随后几年间面向AGI的应用和底层技术的发展不尽如人意,遇数据、能耗、语义理解、可解释性等瓶颈,技术未出现明显突破。p ChatGPT文本交互能力更上一个台阶。ChatGPT在文字创作与语言交互等方面的能力令人惊喜,一定程度上实现了人类同等能力,提升读写效率,逐渐向AIGC靠近。p 或为AGI实现带来曙光。虽然在大量用户体验下ChatGPT仍暴露出部分反馈偏差问题,但验证了基于大型语言模型(LLM)实现AGI具有可能性,重塑AI发展前景。语言智能ChatGPT备受市场瞩目解密ChatGPT(1/2):算法优化,助力GPT模型革新1.3数据来源:CSDN、OpenAI官网、

9、浙商证券研究所82017年Transformer架构提出2022年ChatGPT推出2018年OpenAI推出GPT模型二十世纪初RNN、CNN等算法迅速发展Transformer架构1956年机器学习概念提出基于RLHF的算法应用基于人类反馈强化学习模式三步法训练模型从数据集中随机抽取问题,由工程师对预期的输出结果进行标注,以此在GPT-3.5基础上对模型进行微调。从微调后的模型中随机抽取问题并生成几个输出结果,由工程师对结果按质量从高到低排序,将排序后的结果用于奖励模型训练。通过奖励模型产生最优的输出结果后,将该结果对模型参数进行迭代与优化,并不断循环反复这一过程,最终得到高质量的Chat

10、GPT模型。奖励模型近端策略优化PPO强化学习训练监督策略模型推理能力的引入在基于大量代码训练构建的Codex模型上引入了推理能力综合来看,Transformer不论是在执行任务能力还是运行速度上,均是更好的选择Transformer架构的优势RNNCNNRNN采用从前往后收集信息的线性序列结构,导致在大规模并行下的计算能力不足;Transformer架构不存在序列依赖,使其在大规模并行计算下的能力明显优于RNN。传统模型CNN模型通过卷积层捕获远距离特征,受卷积核限制;Transformer应用位置函数进行编码,从而在集成信息过程中自然地建立单词间的联系,长距离特征捕获能力更强。Transf

11、ormer架构由谷歌于2017年提出,架构核心为Self-Attention自注意力机制解密ChatGPT(2/2):算力支撑+数据共振,实现交互革命1.3数据来源:CSDN、浙商证券研究所数据集的优化单一大模型下的模型训练效率与成本效益更强Azure算力支持在OpenAI不断更新GPT模型最终产出ChatGPT的过程中,强大的算力支持功不可没p 2019年,微软与OpenAI达成合作,由Azure为OpenAI提供训练及使用所需的算力。p 研究显示,模型表现会随着规模的扩大而增长,且存在涌现能力(emergent abilities)。基于模型效果需求等因素,OpenAI在对GPT模型的升级

12、过程中,涉及参数量和预训练数据量均爆发式增长,Azure的算力支持是GPT模型不断完善的重要支撑之一。发布时间参数量预训练数据量GPT-12018年6月1.17亿5GBGPT-22019年2月15亿40GBGPT-32020年5月1750亿45TBp 训练ChatGPT模型的数据集更新至2021年,主要来自于维基百科、书籍、期刊、Reddit链接、Common Crawl等渠道,预计数据量总规模达到45TB,大规模训练数据集使模型能力得到显著提升。p 根据ChatGPT的训练原理,模型训练数据集绝大多数来自非标注数据,并由工程师辅以少部分微调的形式开展,较传统标注数据为主的训练模式的通用性更强

13、,对工程师介入标注的要求更低,使模型训练的效率更强。ChatGPT先进性9具备上下文理解能力,交互更流畅能够承认错误、挑战不正确的前提可以拒绝用户的不适当请求模型训练效率提高回答更人性化、贴近人类价值观反馈准确性提升训练模式更具通用性,经济效益增强OpenAI商业化探索,B端流量收费与C端订阅收费并行1.4数据来源:OpenAI官网、浙商证券研究所10p B端:提供API接口实施流量收费OpenAI向用户提供语言、图像、音频等不同类型模型的API接口,通过用户使用模型的流量收费。其中ChatGPT对应API由其背后的AI模型gpt-3.5-turbo提供支持。此外,OpenAI还向用户提供嵌入

14、模型和微调模型,支持用户根据自定义需求进行模型定制。p C端:提供产品订阅服务收取费用OpenAI于2023年2月新推出ChatGPT Plus版本,对该版本的使用者收取20美元/月的订阅费用。ChatGPT Plus版本较免费公开使用的ChatGPT模型具有更快的响应速度,在应用高峰期能更顺畅的使用模型,且订阅者能够优先使用新功能,以向ChatGPT模型的深度用户提供更快捷的服务。功能应用模型API模型价格(美元)功能API模型价格(美元)语言模型ChatGPTgpt-3.5-turbo0.002/千字符图像模型102410240.02/图InstructGPTAda0.0004/千字符51

15、25120.018/图Babbage0.0005/千字符2562560.016/图Curie0.002/千字符音频模型Whisper0.006/分钟Davinci0.02/千字符嵌入模型Ada0.0004/千字符功能API模型训练价格(美元)使用价格(美元)微调模型Ada0.0004/千字符0.0016/千字符Babbage0.0006/千字符0.0024/千字符Curie0.003/千字符0.012/千字符Davinci0.03/千字符0.12/千字符发展展望:纵向加深AI能力,横向拓展能力边界1.5数据来源:CSDN、量子位、浙商证券研究所11算力ChatGPT依托微软Azure AI超算

16、基础设施,凭借参数量的提升带来了模型性能的明显增长。随着算力设施建设规模的扩大和算力承载量的增长,或将进一步提升模型质量。横向:推动AIGC多模态技术场景发展文本生成音频生成图像生成视频生成图像、视频、文本跨模态生成策略生成GameAI虚拟人生成p ChatGPT为AIGC在文本模态下的产物,证明了AIGC应用落地的可行性与先进性,或将催生更多的应用需求。p ChatGPT热烈的市场反应以及商业收益或将成为AI行业公司大力发展其他模态的重要激励与契机。纵向:促进ChatGPT及其原模型的深化发展数据ChatGPT的训练数据集信息更新截止2021年,随着信息的不断产生以及大量用户的使用,模型可应

17、用的数据集规模进一步扩张,或将促使ChatGPT的反馈更贴近实际。算法ChatGPT模型基于RLHF的预训练机制,但仍存在输出不良或虚假信息的现象,且其提供的信息也存在一定的滞后性。随着算法的优化改进,或将进一步提升模型反馈的准确性和时效性,或是简化模型的训练过程从而提升模型效率。0212数字内容生产新方式AIGCAIGC叩响认知智能之门,向强人工智能时代迈进一步213计算智能感知智能认知智能特点机器具备超强的存储能力和超快的计算能力,可以基于海量数据进行深度学习,利用历史经验指导当前环境。人工智能发展脉络使机器具备视觉、听觉、触觉等感知能力,可以将非结构化的数据结构化,并用人类的沟通方式与用

18、户互动。机器具有主动思考和理解的能力,不用人类事先编程就可以实现自我学习,有目的推理并与人类自然交互。2016年Google旗下Deepmind公司的AlphaGo机器人(基于深度学习)大胜世界围棋冠军李世石。电商平台基于对用户购买习惯的深度学习,进行个性化商品推荐。无人驾驶是基于道路检测、交通标志识别、车辆跟踪、行为分析和场景理解的感知智能应用。波士顿机器狗Big Dog是深度利用DNN技术的感知智能机器人。AIGC意味着AI开始在现实内容中承担新角色,叩开“认知智能”之门以ChatGPT为代表,利用Transformer模型进行大规模预训练与无监督学习,提升与人类互动水准。数据来源:知萌咨

19、询、浙商证券研究所弱人工智能强人工智能AIGC典型事件AIGC由技术驱动的数字内容生产新方式内容生产总量内容消费体验2nPGC:Professionally-Generated Contentn内容生产总量较低n单人/多人专业体验n举例:长视频专家生成内容用户生成内容nUGC:User-GeneratedContentn内容生产总量变多n小规模多人交互n举例:小红书、微博AI辅助生成内容AI生成内容nAIUGC:AI-assistedGenerated Contentn内容生产总量大n大规模沉浸交互n举例:语音转文字协助纪要生成、百家号TTV协助新闻图文生成视频nAIGC:AI-Generat

20、edContentn内容生产总量巨大n元宇宙式体验n举例:ChatGPT、AI绘画、AI生成视频等人工智能技术驱动下,数字内容生产方式向更高效迈进数据来源:浙商证券研究所14AIGC:产业链逐步形成,玩家百花齐放,商业模式持续探索以ChatGPT为代表的AIGC行业,上游主要包括数据供给方、算法/模型机构、创作者生态以及底层配合工具等,中游主要包括文字、图像、音频、视频等数字内容的处理加工方,下游主要是各类数字内容分发平台、消费方及相关服务机构等。上游中游下游数据供给方(业务数据联通、素材数据收集等,如第三方营销公司、版权图库方等)数据分析及标注创作者生态生物资产及内容素材底层配合工具渲染引擎

21、、混音设备等相关算法/模型研究机构相关开源算法嵌入/结合能力的业务平台/业务生态个性化市场营销广告植入、品牌虚拟形象打造、营销内容生成等自动实时交互数据梳理内外部数据分析及更新、数据分析及算法训练运营增效智能客服、简单决策等周边售卖NFT、个性化产品等内容制作工具音频/视频编辑工具、新闻采编、游戏制作等内容设计视觉设计、文案设计、结构设计等各内容创作及分发平台基于AICG激发PGC及UGC活力第三方分发渠道内容终端生产厂商新闻媒体机构、金融机构等消费品厂商AIGC内容检测第三方内容服务机构MCN公司、公关公司等2数据来源:量子位、浙商证券研究所15按技术场景,AIGC内容可分为文本、音频、图像

22、、视频等2按技术场景划分AIGC内容分为文本生成图像生成音频生成视频生成跨模态生成策略生成Game AI虚拟人生成数据来源:量子位、浙商证券研究所16文本生成:NLP重要任务标之一,神经网络生成法为主流趋势2.1p 文本生成(Text Generation)是自然语言处理(NLP)的重要任务之一,从非语言的表示生成人类可以理解的文本,文本文本、数据文本都是文本生成任务关注的。17传统文本生成方法数据来源:CSDN、浙商证券研究所神经网络文本生成方法p 基于规则p 基于统计Data AnalysisData InterpretationDocument PlanningMicroplanning

23、Realisationp 基于卷积神经网络CNN的语言生成模型p 基于递归神经网络RNN的语言生成模型p 基于Transformer的语言生成模型p 基于生成神经对抗网络GAN的语言生成模型p 基于图卷积神经网络GCN的语言生成模型InputOutputHidden2.1p RNN架构局限在于无法并行运算。RNN计算是有时序依赖的,需要用到前一个时间步或者后一个时间步的信息,这导致它难以并行计算,只能串行计算。GPU的并行化能够大大加速计算过程,如果模型不能够并行计算,会导致运算速度很低。p Transformer架构引入Self-attention自注意力机制可取代RNN。18文本生成:Tr

24、ansformer架构实现并行处理,提升模型训练效率2017年,Google发布Attention is All You NeedTransformer模型通过采用Self-Attention自注意力机制,完全抛弃了传统RNN在水平方向的传播,只在垂直方向上传播,只需要不断叠加Self-Attention层即可。这样,每一层的计算都可以并行进行,可以使用GPU进行加速。Seif-Attention自注意力机制结构Transformer整体结构数据来源:CSDN、arXiv、浙商证券研究所Encoder编码器Decoder解码器2.119数据来源:量子位、浙商证券研究所文本生成类型特色落地场景发

25、展现状未来展望代表性公司结构化文本生成基于结构化数据或规范格式,在特定情景类型下的文本生成,生成内容有较强规律。新闻写作、公司财报撰写、客服类问答等领域为文本生成最早的产生分类,应用广泛且技术趋于成熟。可代替部分较机械化的人工写作AutomatedInsights、Narrative Science、textengine.io、Yseop、Arria、Retresco、澜舟科技等非结构化文本生成具有更高的文本开放度和自由度,需要一定的创意和个性化,生成内容创意性更强。营销文本和剧情创作等领域底层原理明确,发展技术有待提升。长篇文字在内部逻辑上仍然有较明显问题,且生成内容稳定性不足。未来4-5年

26、,会出现较优的长文本内容Anyword、Phrasee、Persado、Copy.ai、Friday.ai、Retresco、Conversion.ai、Jasper AI、Snazzy AI、彩云小梦等交互性文本生成拥有社交属性,对NLP处理要求更高,生成内容需有上下文逻辑对应。虚拟伴侣、NPC互动等领域处于发展初期,缺乏人伦道德感,感知力不足。以ChatGPT为革命点,1-2年会有较大发展突破小冰公司、聆心智能、Latitude.io、Open AI等文本生成:或为AIGC率先应用模态,发展阶段成熟于其他音频生成:TTS应用发展成熟,AI乐曲创作未来可期2.2p 音频生成主要应用于流行歌曲

27、、乐曲、有声书的内容创作,以及视频、游戏、影视等领域的配乐创作,目前在众多场景已获初步发展,在部分场景已广泛应用、趋于成熟。常见音频生成中,TTS文字转语音是最普遍使用的落地应用,而创意性音频生成有助于激发创作者灵感,促进乐曲二创、辅助编曲。常见AI音频生成ASR语音转文字VPR声纹识别TTS文字转语音技术原理通过一个模型把文字转为语音的特征向量,比如MFCC,或者基频、频谱包络、能量等特征组合的形式,然后再使用声码器(Vocoder)把语音特征转换为音频信号。智能客服、有声读物制作、语音播报、自媒体配音、导航播报等进步空间p 通过富文本信息更好表现语调的抑扬顿挫p 基于用户较少的个性化数据得

28、到整体的复制能力创意AI音频生成乐曲/歌曲生成AI作曲AI编曲人声录制技术原理AI作曲:以语言模型为中介,对音乐数据进行双向转化AI编曲:基于主旋律和创作者个人偏好,生成不同乐器对应和弦,完成整体编配人声录制:通过端到端的声学模型和神经声码器完成进步空间p 旋律走向过于随机,部分和弦略有突兀p 音乐创作基于前人数据分析而得,难以生成全新曲风p 音乐数据标注困难数据来源:CSDN、量子位、浙商证券研究所文字转语音应用基本成熟,关键突破在于如何使语调更有情绪以乐曲二创、辅助编曲为代表,AI乐曲创作将在音频生产领域快速发展20图像生成:从GAN到Diffusion,技术持续迭代,能力更进一竿2.3p

29、 生成式对抗网络(GAN)的提出标志着AIGC图像生成可实现,进入快速发展阶段。GAN由生成器和判别器两部分组成,生成器将抓取数据、产生新的生成数据,并将其混入原始数据中送交判别器区分。这一过程将反复进行,直到判别器无法以超50%的准确度分辨出真实样本。21数据来源:CSDN、arXiv、量子位、浙商证券研究所图像生成传统主流模型GAN生成式对抗网络图像生成新一代主流模型Diffusion扩散模型GAN的训练是个动态的过程,是生成器G与判别器D两者之间的相互博弈过程。GG(z)DZX生成器G随机噪声Z通过随机噪声生成的图片G(z)判别器D真实数据XTureFake2014原始GAN2015CG

30、AN2016VAEGAN2017ACGAN2018StyleGAN相较于2014年初现期,现有的GAN在神经网络架构、损失函数设计、模型训练稳定性、模型崩溃问题上取得了相应突破,提升了最终图像的特定细节、内在逻辑、生成速度等。GAN进步空间n解决训练不稳定问题n缓解GAN的模式坍塌model collapse,即生成样本大量重复相似nGAN的结构改善nGAN可模仿“知识蒸馏”模型进行需求压缩基于GAN的图像翻译(左图为input,右图为output)图像生成:从GAN到Diffusion,技术持续迭代,能力更进一竿2.3p 扩散模型(Diffusion Model)成为图像生成领域的重要发现,

31、有望超越GAN,成为新一代图像生成主流模型。Diffusion Model在2015年被提出,于2020年在Denoising Diffusion Probabilistic Models研究中名声大噪,目前Google的Imagine与OpenAI的DALLE 2等热门图像生成软件都基于此模型。p Diffusion Model简化模型训练过程中数据处理的难度,解决了GAN稳定性问题,提高生成图片的质量。Diffusion模型的工作原理是通过逐渐添加高斯噪声来破坏训练数据。通过一张神经网络“生成器”来进行逆转破坏过程(去噪),从纯噪声中合成数据,直到产生干净的样本。GAN模型在训练过程中需要

32、两张神经网络“生成器”与“判别器”,稳定性很难平衡,而Diffusion Model只有一张神经网络,解决了稳定性问题,同时简化了数据处理过程,且更加灵活。22数据来源:CSDN、量子位、浙商证券研究所图像生成传统主流模型GAN生成式对抗网络图像生成新一代主流模型Diffusion扩散模型图:DALLE 2生成图片图:Imagine生成图片相较其余三类模型,扩散模型亮点在由于正向与逆向过程组成扩散模型的正向过程(扩散)和反向过程(逆扩散)扩散:从X0输入的真实图像,经过Diffusion模型后被渐近变换为纯高斯噪声的图片XT逆扩散:学习逆转后的分布,逐步地恢复样本数据图像生成:图像属性编辑普遍

33、应用,创意图像生成应用落地较少2.323数据来源:量子位、浙商证券研究所p 图像生成可简要划分为图像属性编辑、图像局部生成及更改、以及端到端的图像生成。其中,前两者的落地场景为图像编辑工具,而端到端的图像生成则对应创意图像及功能性图像生成两大落地场景。图像属性编辑大量应用落地,图像局部生成及更高目前有部分应用落地,端到端图像生成底层原理明确,未来有望规模化应用。p 由于图像的生成复杂度远高于文字,在整体生成上,目前仍然难以达到稳定可靠的生成高质量图像。但随着GAN、Diffusion Model等模型的不断迭代,图像生成发展将非常快速。图像属性编辑图像局部生成及更改端到端图像生成可理解成经AI

34、简化的Photoshop;图片去水印、自动调整光影、设置滤镜、修改颜色纹理、复刻/修改图像风格、提升分辨率等已广泛应用。代表公司美图秀秀(美图AI开放平放台)、Radius5、Photokit、Imglarger、Hotpot、Remove.bg、Skylum(Mask AI)、Photodiva具体内容更改图像某部分构成(如英伟达CycleGAN支持将图内的斑马和马进行更改)、修改面部某一特征等。Adobe(InsetGAN)、英伟达(EditGAN)、Metaphysics AI、Deepfake具体内容基于草图生成完整图像、有机组合多张图像生成新图像、根据指定属性生成目标图像等,可用于L

35、ogo、海报、模特图制作。阿里鹿班、Deepdream Generator、Rosebud AI、AI Gahaku artbre eder、Nightcafe、Starry ai、Wombo、Deepart、Obvious、Datagrid、诗云科技、道子智能绘画系统等具体内容代表公司代表公司2.424视频生成:分帧生成图像连接成视频,视频属性编辑已普遍应用p 视频生成强调将视频切割成帧,再对每一帧的图像进行处理,与图像生成原理类似。视频生成难度远高于图像生成,生成视频的质量与流畅度取决于很多因素,包括数据集规模、训练模型复杂度、特征提取准确性以及合成视频算法有效性;由于模型训练量要求过大,

36、目前模型只能实现几秒钟的短视频生成,未来有望随着模型的迭代实现中视频和长视频的生成。p 视频生成应用场景主要包括视频属性编辑、视频自动剪辑、视频部分编辑,前者已大量应用,后两者还处于技术尝试阶段。特征提取数据准备帧间预测合成视频准备用于训练模型的数据集。通常包括视频、音频、图像和文本等多种形式的数据利用卷积神经网络CNN或循环神经网络RNN等深度学习模型对视频中的每一帧进行特征提取。根据前面提取到的特征,预测视频中下一帧内容。可以通过生成模型实现,如VAE、GAN等。将生成的序列合成为视频。通常使用视频编解码器将视频压缩,并将其存储为可播放的格式。数据来源:CSDN、量子位、浙商证券研究所视频

37、生成基本流程应用场景内容发展情况代表公司视频属性编辑视频画质修复、删除画面中特定主体、自动跟踪主题剪辑、生成视频特效、自动添加特定内容、视频自动美颜等。目前大量应用Runway ML、Wisecut、Adobe Sensei、Kaleido、帝视科技、不咕剪辑等视频自动剪辑基于视频中的画面、声音等多模态信息的特征融合进行学习,按照氛围、情绪等高级语义限定,对满足条件片段进行检测并合成。技术尝试阶段影谱科技、Adobe(AI视频剪辑系统)、IBM Watson、Sony CSL(FlowMachine)等视频部分编辑基于目标图像或视频对源视频进行编辑及调试,通过基于语音等要素逐帧复刻,能够完成人

38、脸替换、人脸再现、人脸合成甚至全身合成、虚拟环境合成等功能。技术尝试阶段腾讯云(优图实验室天天P图联合打造的AI变脸玩法)等视频生成流程图示2.525跨模态生成:目前未大规模落地,文字生成图像取得突破p 跨模态生成是指将一种模态转换成另一种模态,同时保持模态间语义一致性。主要集中在文字生成图片、文字生成视频及图片/视频生成文字。p 文字生成图片:2022年被称为“AI绘画“之年,多款模型软件证明基于文字提示得到效果良好的图画的可行性,Diffusion Model受到广泛关注。p 文字生成视频:普遍以Token为中介,关联文本和图像生成,逐帧生成所需图片,最后逐帧生成完整视频。但由于视频生成会

39、面临不同帧之间连续性的问题,对生成图像间的长序列建模问题要求更高,以确保视频整体连贯流程。按技术生成难度和生成内容,可区分为拼凑式生成和完全从头生成。p 图片/视频生成文字:具体应用包括视觉问答系统、配字幕、标题生成等,这一技术还将有助于文本图像之间的跨模态搜索。代表模型包括METER、ALIGN等。跨模态生成类型代表性公司/产品目前存在缺点发展展望文字生成图片OpenAI(CLIP、DALL-E、DALL-E2)、Google(Imagen、AI绘画大师Parti)、Stability Al(Stable diffusion)、盗梦师AI、意间AI、Tiamat等。生成的图像可能会显得有些机

40、械和刻板缺乏人类艺术家的创造力和灵感基于Diffusion Model的兴起,AI绘画和AI生成视频有望在将来迎来较为广泛的规模应用文字生成视频Adobe(Project Morpheus)、Meta(Make-A-Video)、Google(Imagine Video、Phenaki)、Stability AI(研发中)由于模型限制,目前生成视频时间较短(Make-A-Video只可生成5s视频)帧与帧连接存可能存在动作不连贯、不协调等问题数据来源:CSDN、量子位、Meta AI、浙商证券研究所2.626策略生成:主要应用展望在游戏行业,其余场景发展较缓p 策略生成是指生成一个可以在给定环

41、境下执行任务的算法。普遍采用深度强化学习技术(早期曾采用决策树及监督学习),其本质原理是让AI感知环境、自身状态并基于特定目标决定当下需要执行的动作,然后基于下一个状态给到系统的反馈进行奖励或惩罚,最终使系统在不断的“强化”过程中优化“策略”。p 策略生成可应用于游戏智能(Game AI)、虚拟人交互、机器人控制、智慧交通等领域。p 游戏智能是决策生成目前应用最为广泛和明确的场景。由于游戏本身存在于计算机虚拟环境,并产生大量数据,因此游戏本身为AI提供了极佳的研发场景;而在其他业务场景中,还需先搭建能够充分还原现实因素的虚拟环境,并合理设置Reward等关键因素,目前距离现实应用较远。国内多家

42、AI企业已在尝试这一方向,但如何精准完成环境学习仍然具有关键意义。策略生成可应用方向数据来源:量子位、浙商证券研究所游戏智能策略生成可以用于训练游戏智能体,使其具有在各种游戏中获胜的能力。机器人控制策略生成可以用于设计机器人的控制策略,使其能够执行各种任务。自然语言处理策略生成可以用于训练自然语言处理模型,使其具有更好的语言理解和生成能力。智慧交通策略生成可以用于优化交通信号灯的控制策略,以最大程度地减少交通拥堵和延迟。图:AlphaGo战胜人类世界冠军图:智能扫地机器人策略生成专利2.727Game AI:AI可全面赋能游戏实现降本增效,行业积极布局中p AI融入游戏全生命周期,全方位赋能行

43、业。可在游戏前期制作环节、游戏过程运作、游戏周边、游戏营销等领域降本增效。可将其提炼出三个核心:游戏资产生成、游戏操作策略生成、游戏NPC及逻辑生成。p Game AI后续的行业发展关键在于游戏行业能否接受,并从底层架构开始支持提供包括客户数据在内的相关接口。目前来看,国内相关游戏厂商合作意愿良好,普遍存在内部开发或外部测试需求。数据来源:启元世界官网、量子位、浙商证券研究所游戏资产生成游戏人物外观生成游戏人物动画生成游戏人物动作生成地图关卡设计生成游戏场景生成游戏操作策略生成前期平衡性测试游戏跑图/功能测试对局陪伴特定对战风格模拟基于玩法教学的新型人机互动图:启元世界AI策略生成解决方案游戏

44、NPC及逻辑生成个性化生成能够带来画面、剧情及具体交互的个性化全新游戏体验;而实时剧情生成则有助于在特定框架内生成全新的可能性,增加游戏整体的叙事可能性图:黑客帝国:觉醒车辆行人等将独立于玩家操控变动图:利用Scenario AI生成的游戏NPC、道具虚拟人生成:多技术综合培育下的数字化应用2.8数据来源:央视网、中国人工智能产业发展联盟、量子位、浙商证券研究所28p 虚拟人是应用计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等多种计算机技术,并具多重人类特征的综合产物。真人驱动型:基于真人行动计算驱动型:基于深度学习模型建模:依据形象要求绘制模型原画及3D建模绑定关键点:将选定的关键点

45、映射至模型中并进行绑定渲染:对图像进行渲染以提升逼真度,生成虚拟人动捕:应用动捕设备对真人的行动、表情等进行采集建模:扫描模特并采集表情、姿态等数据,建模、绑定关键点训练模型:利用深度学习,学习模特语言、表情等参数间的潜在映射关系,形成驱动模型内容制作:基于语音输入或TTS技术,结合训练后的模型推理得到每帧虚拟人图片,并与语音对应渲染:对图像进行渲染以提升逼真度,生成虚拟人p 虚拟化:通过电子设备、VR设备或全息设备等形式呈现,非物理形式存在p 数字化:是多项数字技术的综合产物,相关技术的逐渐成熟是虚拟人发展的重要支撑p 拟人化:从外表、行动、交互等方面均高度拟人化,提升拟人化是未来虚拟人技术

46、的核心方向20世纪80年代:萌芽阶段p 技术以手绘为主1982年首位虚拟歌姬林明美出现21世纪初:探索阶段p 计算机技术开始应用2007年虚拟偶像初音未来诞生近5年:初级阶段p 深度学习获得突破2018年新华社发布首个仿真AI主持人现在:成长阶段p 向智能化、精细化发展虚拟人应用场景逐渐扩张虚拟人核心技术:拟人化为技术发展目标数据来源:量子位、CSDN、金融界资讯、浙商证券研究所29建模&渲染深度学习模型交互技术建模是合成虚拟人的首要步骤,目前应用较多的建模方式为仪器采集模型,或根据不同虚拟人形象,通过3D美术、改变顶点数据“捏脸”等技术构造虚拟人基础形象。渲染作为决定呈现效果的核心环境,可分

47、为传统渲染和神经渲染两类:p 传统渲染通过包括光线、材质等在内的电脑计算,以物理世界为基础,利用虚拟相机模拟感知的方式显示模型效果。p 神经渲染则是基于统计学习方法,通过深度神经网络,让计算机学习并理解物体的三维空间形态,实现图像合成。深度学习模型应用在计算驱动型虚拟人合成中,该模型的应用旨在通过计算机的自动学习匹配人类在说话时人脸骨骼和肌肉的变化,使虚拟人在动态情况下的表情形态更逼真。深度学习模型输出效果主要受到数据量、计算框架、关键特征点等因素影响。交互技术主要体现在实时互动虚拟人应用中,例如虚拟人主播、虚拟人客服等。虚拟人的交互能力以对话能力为核心,着重应用NLP技术,此外还会受到语音识

48、别能力、知识图谱、预先设置知识库等技术的影响。2021年新推出的虚拟数字人Charlie and Deck由GPT-3提供交互技术支撑,该类自然语言生成模型的应用和发展或将显著提升虚拟人的交互水平。2.8图:MetaHuman捏脸技术成熟渲染图:渲染提升虚拟人形象拟人度图:虚拟人主播已出现在各直播平台中03新时代生产力工具,AIGC赋能内容生产303数据来源:量子位、浙商证券研究所畅想AIGC:应用广泛,核心价值是优化内容生产的效率与创意01游戏02广告营销03影视04媒体05互联网06娱乐ChatGPTAIGC=提升内容生产效率让创作者拥有一个更加高效的智能创作工具,优化内容创作,大幅提升效

49、率并降低成本;提升创作效率的同时,同样提升了反馈生成效率,有助于实现实时交互内容。其他07降低内容生产成本捕捉激发创作灵感联动实现数据优化AIGC能够代替人工完成声音录制、图像渲染、视频创作等工作,从而降低内容生产的成本与门槛,使更多用户能够参与到高价值的内容创作流程中。帮助有经验的创作者捕捉灵感,在设计初期生成大量草图,更好的理解创作需求并寻找创作灵感。海量数据提高创造性和开放性,激发创意认知、提升生产多样性。在与其他特定的数据库(例如实时更新数据、特定主体数据等)或AI系统进行联动后,AIGC能够实现更精准的未来预测或更个性化预测基础上调整生成内容。31我们认为,1)AIGC的应用速度取决

50、于届时引领市场的游戏企业/项目组对AIGC所带来的效益与风险之间关系的认知与决策;2)独立游戏工作室、小规模游戏企业对AIGC的应用持有更加灵活的观点,更有可能率先较高程度应用AIGC技术;3)以下图示是我们综合分析了AIGC技术发展、游戏生产实践等,做出的较为乐观的判断。3.1数据来源:浙商证券研究所AIGC+游戏(1/7):推动游戏生产范式升级,行业新篇章IP小说影视动漫游戏开发探索阶段市场分析产品核心成本、周期预估竞争分析方案策划技术确定美术、音乐原型程序代码编写测试BUG修复原型阶段开发阶段美术设计音效制作测试阶段上线阶段游戏发行市场运营宣发物料广告买量数值迭代游戏版本控制游戏分销硬件

51、应用商店第三方游戏分销商垂直游戏平台玩家渠道对接活动策划用户运营紧急情况处理数据监控短期内较高程度辅助3-5年内较高程度辅助5-10年内较高程度辅助目前来看较难应用323.1数据来源:GitHub Copilot官网、MidJourney、Twitter、OpenAI、GameLook、浙商证券研究所AIGC+游戏(2/7):协助各类游戏资产生成,降低游戏开发成本游戏开发程序代码编写游戏地图设计音频音效制作美术原画设计游戏人物生成3D模型构建CG动画生成游戏方案策划包括自主生成基础简单代码、协助编写复杂代码、提供代码编写建议,不同代码语言切换等。通过AI分析游戏用户需求,协助产品定位及策划方案

52、产出。协助游戏地图设计与生成,包括地图设计及对应的代码编辑。包括生成游戏背景音、游戏音效及游戏人物语音等。协助美术原画设计及游戏产品画风定位,批量快速生产游戏美术素材,替代重复性美术生产工作。包括协助玩家人物制作,以及NPC的生成包括3D环境的搭建、游戏内各类3D素材模型的创造等。包括游戏内CG动画的生成。图:AI编程工具GitHub Copilot可辅助代码编写图:MidJourney生成最终幻想17概念原画图:OpenAI Point-E技术文字生成3D模型游戏资产生成333.1【案例】Scenario:首个商用的AI生成游戏资产平台选择并上传游戏厂商的训练数据:角色、道具、车辆、武器、皮

53、肤、建筑、概念图、像素图、草图等。步骤1选择一组视觉效果只需点击几下,即可创建游戏厂商自己的生成式AI引擎。100%在线;无需技术技能。步骤2训练定制的AI模型只需几句话,即可将游戏厂商的想法变为现实。资产创建从未如此简单。步骤3产生优秀资产p 首个AI生成游戏资产平台:Scenario通过对文本到图像生成模型Stable Diffusion的微调,使得用户可通过输入的文字和参考图片创造出达到当前游戏生产标准的游戏资产。p 生成特定美术风格的2D游戏素材:Scenario将对以2D美术资源为主流的独立游戏具有重大意义。同时其AI还在不断地更新和优化,以适应不同的游戏类型和风格。p 免费可商用:

54、目前Scenario工具可免费使用,而生成的游戏素材也可以直接使用于商业游戏制作中。图:Scenario生成的美术素材34数据来源:Scenario官网、GameLook、浙商证券研究所3.1数据来源:逆水寒官网、浙商证券研究所AIGC+游戏(3/7):优化玩家交互体验,提高游戏可玩性NPC对话及交互通过AI技术生成交互式文本、语音等,增强在游戏中与NPC沟通交流的对话现实感;利用AI技术来让NPC具有更高的智能和适应性,根据玩家的行为和环境的变化来调整策略和行动。加持故事剧情AI通过学习可无限开展游戏故事的剧情互动,实现千人千面的个性化体验。反作弊及AI托管AI可以通过分析玩家的行为数据和游

55、戏数据,检测并预防游戏中的作弊行为,保护游戏的公平性和玩家的利益,提高玩家游戏体验。同时,AI可以接管掉线玩家角色,优化玩家体验。语言翻译通过自然语言处理技术,AI可以实现游戏语言的翻译和本地化,为全球玩家提供更好的游戏体验。图:手游逆水寒实装游戏GPT图:游戏逆水寒实现游戏GPT游戏开发游戏体验优化353.1【案例】逆水寒智能NPC系统横空出世,交互体验图:玩家输入对话即可与NPC互动垂直于武侠背景游戏领域与ChatGPT不同的是,该智能NPC系统更垂直应用于逆水寒中:p 侧重点不同:ChatGPT侧重点在于归纳整理,给出结论;而逆水寒GPT的重点在于通过理解语义指导NPC的下一步行动。p

56、学习范围不同:ChatGPT学习范围更广,更像搜索引擎;而逆水寒GPT学习范围相对小,学习的是武侠小说、历史书等内容,它被刻意约束为“一个大宋江湖里的人”。自由度高的开放式体验通过智能NPC系统,玩家和NPC的交流交互不再是设定好的、流程式的。而是自由度极高、完全开放的新奇体验。例如,在两个女NPC正在讨论与夫君相隔千里的话题时,玩家输入“异地恋是没有未来的”,触发NPC放弃异地恋的相关对话。网易潜心打造游戏GPT逆水寒手游中运用了智能NPC系统,其使用了ChatGPT同源的底层AI技术。而早在2021年10月浙江省科学技术厅发布的“尖兵”“领雁”高新科技研发攻关计划中,由雷火掌舵人叶弄舟师兄

57、挂帅的“超大规模预训练模型云平台”项目就已经入选其中。图:玩家对话改变了NPC行为数据来源:逆水寒公众号、浙商证券研究所363.1数据来源:新浪游戏、量子位、浙商证券研究所AIGC+游戏(4/7):高效辅助游戏测试,保证质量并降低成本图:需要通过大量测试人员长时间体验以实现游戏测试图:育碧和Mozilla合作开发的Clever-Commit具备发现并标记Bug的能力游戏开发辅助游戏测试p 游戏测试通常是游戏开发周期中的一大关键环节,其目的是保证游戏质量,减少发布后的风险,并为玩家提供更好的游戏体验。在游戏测试中,测试人员将会对不同的测试目标使用不同的测试技术,就游戏玩法、游戏流程内容、游戏系统

58、、机型适配等进行测试,记录游戏中发现的问题,并通过管理工具报告Bug,向开发人员反馈问题。p 伴随游戏生产量的增长以及游戏复杂度的提高,游戏测试的需求爆发,而AI可以在游戏测试中执行一些自动化任务,如执行基本的功能测试、性能测试、兼容性测试等,以实现更高效地测试。但AI目前还无法像人类测试人员那样进行用户体验、情感反馈等测试。373.1数据来源:程序员大本营、浙商证券研究所【案例】日本卡牌游戏Shadowverse利用AI测试卡牌组合Cygames Research用神经网络技术解决测试大量卡牌组合的问题p Shadowverse是一款由日本Cygames发行的卡牌游戏,每三个月会加入新的卡牌

59、包,以保持玩家的新鲜感。p 但是,如何测试新卡牌对游戏系统的影响是一个难题。即一张新卡牌被设计出来之后,它能融入旧卡牌构成的系统,和其他卡牌配合时没有Bug、不会破坏数值系统的平衡。传统的QA测试方法耗时耗力,严重影响游戏开发。p 为了解决这个问题,Cygames Research提出了一种用神经网络技术测试卡牌组合的方法。他们通过收集游戏日志并将其转化为可以用于训练神经网络的数据的方法,训练出一个可以玩游戏的AI,从而可以自动化地进行游戏对局,以发现任何可能存在的Bug和平衡问题。这种方法大大提高了效率,节省了测试开发成本。游戏用户游戏记录AI模拟游戏测试测试报告模仿学习383.1数据来源:

60、浙商证券研究所AIGC+游戏(5/7):分析游戏数值,并协助版本迭代游戏运营数值分析及版本迭代p 根据当前版本游戏产生的用户数据及运营目标,AI能够通过模型分析游戏数值并调试、检验、筛选,协助提高运营人员的分析结果与游戏产品的迭代效率。p 版本管理方面,AI可以协助运营人员就版本内容、人力、开发进度实时规划并调整排期,敏捷提示风险,为版本运营提供准确、可信的信息参照。游戏用户记录AI现有游戏版本模仿学习日常运营提交游戏强化学习AIAIAI产生报告修改数值优化数值后的新版本游戏用户记录393.1数据来源:Ponzu官网、浙商证券研究所AIGC+游戏(6/7):协助举办游戏赛事,拓宽产品影响力游戏

61、运营游戏赛事协办赛事分析AICG广泛用于赛前阵容分析、赛后数据分析和赛事回放,并以最快的速度获得最优解,减少赛训压力。除了基础的数据以外,包括AI预测的一系列游戏观察工具已经逐渐进入赛事直播过程中,更有利于观众沉浸观赛。电竞解说集锦自动生产AICG通过对游戏内对局情况的各种数据的收集与处理,实时运算游戏事件,生成多个解说文案,进行内容决策,并选取最优文案进行实时解说,帮助观众了解比赛,降低成本,大大降低办赛门槛。AIGC分析赛场事件建立起相应的数据模型,通过算法实现在比赛结束后的最短时间内筛选、剪辑出视频素材,剪辑速度快、节省人力。图AI电竞赛事分析图AI电竞解说图AI集锦自动生产403.1数

62、据来源:手游那点事、浙商证券研究所AIGC+游戏(7/7):全流程赋能游戏买量,实现降本增效游戏发行游戏营销买量买量素材制作一方面,近年来游戏行业买量素材投放生命周期变短,素材创意消耗加速,对买量素材的需求增长;另一方面,买量素材需要经过创意构思、内容制作、反馈优化等流程,人工制作相较AI需要较长的周期。AIGC的应用可以优化创意产出、内容制作环节,从而成倍地赋能广告买量。投放效果分析买量投放执行AI具备快速跟踪并分析投放效果的能力,能够整合投放端及内部转化数据,分析各素材投放效果,进一步优化投放素材及投放策略,提升投放效率及ROI。此外,基于海外买量经验在国内行业并不普及的现状,我们认为AI

63、在对海外市场的买量投放中有更大的效率提升空间。AI能够快速提升广告投放的速度和效率,实现投放业务“7*24小时”批量化与自动化操作。图:三七互娱AI投放系统使用哪些素材使用什么样的人群包使用哪些账号投放竞价方式如何何时创建计划什么条件下关停计划何时调整计划海量数据计划智能化创建优选和维护机器学习产生模型循环反馈无需人工,更优的选择图:游戏买量素材413.2AIGC+广告营销(1/4):AIGC有望贯穿营销全流程资料收集整理编排广告效果分析文案写作素材选择与制作市场调研客户需求分析广告素材迭代广告投放数据来源:浙商证券研究所投放与管理内容生产前期准备短期内较高程度辅助3-5年内较高程度辅助目前来

64、看较难应用423.2AIGC+广告营销(2/4):加快案头工作效率,提供广告营销思路数据来源:蓝色光标公众号、浙商证券研究所p AI技术支持能快速缩短耗时,较大提升前期准备效率前期准备过程中时间占比70%的资料收集整理等案头工作可通过ChatGPT等模型抓取大数据缩短耗时;占比20%的调研访谈、头脑风暴产生灵感等创意工作可以通过AI运算快速实现。案头工作(时间占比70%)灵感刺激(时间占比20%)赋予意义(时间占比10%)大数据抓取AI提供方向思考AI运算生成传统BIG IDEA输出流程CREATECH输出创意实现案头工作的快速完成433.2AIGC+广告营销(3/4):专业化营销助力广告内容

65、生产AIGC出现前AI生成专业营销文案p 广告文案写作门槛较高:文案写作目的之一是提高转化效率,非专业人士难以完成。p 广告文案人工生成效率较低:广告主和广告商匹配及生成效率低。p 广告主可借用Jasper.AI等平台生成符合营销理论的专业文案,降低营销写作门槛,提高匹配效率,降低成本。合格广告素材批量生成p 广告素材相对不足:广告素材一般来源于公司产品、无版权网络素材、代言人等,可用材料有限。p 广告素材成本高:采购广告素材,如版权素材,代言人素材需要支出一定成本。p AI可根据广告主需求,目标人群,进行素材分析、抠图、配色等项目,制作多种类型的广告素材,并一定程度上节省广告素材成本。拼接编

66、排自动化,专业化p 广告素材拼接混乱,重点不清:广告商难以根据市场热点、目标人群喜好、产品核心卖点等进行最优化编排处理。p AI可基于算法推荐,对广告文案及广告素材进行拼接编排,生成广告海报、广告视频、广告软文等营销产品。AIGC出现后数据来源:浙商证券研究所44p 营销垂类优势显著:相较于ChatGPT,Jasper具有专业营销人员训练的小模型,对营销理解更出色,其基于营销理论形成了五十多个模板,集成了日常生活内容的方方面面,可对文本实现多种功能,如扩写,续写,撰写。p 产品交互体验上乘:Jasper产品逻辑以效率为核心,同时对用户使用场景的理解较好,在界面及UI等上做到简洁,易于上手。p

67、配套体系完善:Jasper有一套完整的培训课程,用于教授用户如何用AI做营销;并开放社区,方便用户进行讨论如何使用AI进行营销。p 为AI文本生成专家。Jasper成立于2021年,是AI领域的独角兽内容平台,基于GPT-3模型,用户可以在Jasper中生成具有丰富关键词、搜索引擎优化的原创文本。通过文字描述让Jasper帮助完成文章的创作、创建广告话术。用户也可以在其中寻找创作思路、突破语言壁垒。p 商业成绩斐然。Jasper目前拥有7万多名客户,包括Airbnb、IBM等企业。2021年一年便创造了4000万美元的收入,2022年预估收入为9000万美元,Jasper在最新一轮的融资里获得

68、了1.25亿美元资金,目前估值为15亿美元。3.2【案例】独角兽Jasper.AI,革新广告文案写作数据来源:Jasper官网、TechCrunch+、浙商证券研究所文本生成独角兽抬头深耕营销领域,垂直龙头可期图:Jasper界面简单易懂,交互体验良好453.2【案例】Meta自动生成广告系统Advantage+,加速广告迭代数据来源:金融时报、智东西、浙商证券研究所苹果新政影响传统大数据营销新型广告系统拯救Meta供给增长加速广告实时迭代p 苹果隐私新政:苹果在iOS14.5版本中新增了广告追踪权限功能,使得互联网企业无法直接获取用户信息。p 广告商受打击:这对很大幅度依靠大数据算法进行精准

69、营销的广告商,尤其打击了2022全年广告收入占比99.02%的Meta。在苹果版本更新后的九个月内,Meta损失了近100亿美元的收入。p AI广告开辟精准营销新路径:Meta推出了一项名为Advantage+的自动生成广告系统,利用AI并根据营销人员的具体目的自动生成多个广告,算法可以对潜在的众多广告进行测试,并根据用户喜好及转化率,选择最为有效的广告。p 广告实时迭代未来可期:随着技术更加进步,Advantage+只需要通过收集用户在使用行为中的反应迅速调整广告活动中的图文,以使得广告匹配效率得到全面提高。463.2数据来源:浙商证券研究所AIGC+广告营销(4/4):24小时虚拟客服,专

70、业可靠智能03千人千面,个性化营销推荐ChatGPT可结合数据及客户的诉求,进行个性化推荐系统的应用给出用户的营销线索,实现更标准、更贴心的用户服务。01全天候24小时在线ChatGPT可作为AI驱动的虚拟客服,在广告营销领域为客户提供24小时全天候的客服服务,同时亦能减轻商家人工客服的营销成本。02稳定可靠,快速解答ChatGPT作为虚拟客服相比人工客服更加稳定可靠,能够快速解答客户问题、传递标准化营销话术等,并提升问题解答的准确程度。473.3数据来源:Edward Jay Epstein、浙商证券研究所AIGC+影视(1/4):AI融合影视生产,全管线加速提效创意提出剧本创作制片厂审核项

71、目团队建立后期制作中期拍摄宣发发行剧本初创剧本打磨美术设计分镜制作特效制作演员拍摄音效制作市场调研预算方案拍摄方案剪辑宣传物料制作营销推广院线上映流媒体发行版权授权作画/CG48短期内较高程度辅助3-5年内较高程度辅助5-10年内较高程度辅助目前来看较难应用3.3AIGC+影视(2/4):高效剧本创作,激发人类创意影视剧本文稿归纳提炼一句话梗概标题情节特征细节1细节2细节3情景1情节元素位置冲突情景2情节元素位置冲突情景N情节元素位置冲突位置细节1细节2细节3对话案例:DramatronAI可以对海量剧本数据进行分析归纳,并按照预设风格快速生产剧本,激发创作者的灵感,再由创作者进行筛选和二次加

72、工,缩短创作周期。49数据来源:Dramatron、浙商证券研究所p Dramatron是DeepMind推出的联合写作工具,只需要一句话梗概以描述中心戏剧冲突,就能自动写出标题、角色、场景描述和对话。p Dramatron擅长电影脚本输出。其功能与ChatGPT相近,但它的输出更容易被改写成电影脚本。p 应用效果已受到验证,TheatreSports 公司已经改编了Dramatron参与创作的剧本并将其搬上了舞台。使用Dramatron的剧作家们表示其有助于他们产生更具创意的想法。3.3数据来源:机器之能公众号、Netflix、中关村科技会展公众号、浙商证券研究所AIGC+影视(3/4):助

73、力中期电影拍摄,场景绘制较为成熟数字人技术应用本世纪初,指环王:护戒使者使用Massive“虚拟环境群体模拟系统”制作数十万个数字人之间真实的互动对抗,让不同的个体在特征与动作上产生变化。随着建模、绑定,动捕,渲染、图像识别等技术开始应用于影视角色,数字人表现更为出色AI人脸替换与声音替换AI人脸合成、声音合成实现数字复活已故演员、替换“劣迹艺人”、更换演员角色形象、高难度动作合成等,减少演员自身局限对影视作品的影响【案例】流浪地球2大量采取AI技术进行拍摄:使用AI换脸技术,将吴孟达“复活”。通过AI特效,使吴京和刘德华变“年轻”;利用AI声音技术,修复李雪健的声音。场景及分镜制作通过AI绘

74、制场景将极大减少动画电影的开发周期和成本,同时可以优化真人电影中的分镜设计环节。【案例】犬与少年采用了rinna开发的AI辅助背景进行制作,极大地简化了从导演分镜表到Layout“设计图”的工序环节将手工着色的“设计图”提交至AI生成细化并优化背景,再对AI生成的背景图进行修正,进而通过人工智能技术绘制完整动画场景。数字人替代群演,节省成本,优化效果新技术持续赋能,虚拟角色愈发鲜活图:指环王数字人群演技术图:流浪地球2AI让刘德华变“年轻”图:犬与少年AI背景设计503.3数据来源:英伟达、Runway官网、浙商证券研究所AIGC+影视(4/4):后期剪辑加速,视频处理门槛降低摩根预告片快速生

75、成:类似剪辑,预告片往往都是在影片中选取部分精彩片段,又不能过分剧透。美国IBM旗下的AI系统Watson在学习了上百部惊悚预告片的视听手法后,从90分钟的摩根电影中挑选出符合惊悚预告片特点的电影镜头,并制作出一段6分钟的预告片。成功的将预告片的制作周期从以往的一个月左右压缩到一天。AI检索:预告片生成基于音频解析和画面识别进行视频分成不同片段,可以完成自动添加字幕、自动拼接视频等工作。AI剪辑:自动分段、拼接3D MoMa:英伟达推出了一种名为3D MoMa的AI,可以将静态2D照片转换为可轻松编辑的3D模型。据英伟达介绍,3D MoMa可供建筑师、设计师、艺术家和游戏开发者将图像转换的3D

76、模型快速导入图形引擎,使用过程中还可以修改比例、更改材料或尝试不同的照明效果。AI建模:2D到3D机器学习图像识别片段检索图:摩根预告片图:使用Arctime AI工具切分句子图:“一帧秒创”通过文案生成视频图:英伟达2D图片转3D建模Runway:Runway是国外一家在线视频剪辑制作网站,致力于降低视频创作的门槛。公司目前已经开发了30多个AI魔法工具,比如我们熟悉的根据文本生成图像、根据图像生成风格化变体、图像延展外绘、根据文本生成3D贴图纹理、视频局部无损放大等技术,在Runway内都可以实现。AI特效:视频处理图:AI视频特效513.4数据来源:中国信息通信研究院、浙商证券研究所AI

77、GC+媒体:推进人机协作共生,媒体效率提升新闻采编环节提高内容制作效率新闻传播环节播报高效智能化新闻主体影响智媒影响产业及生活实现采访录音语音转写借助语音识别技术将录音语音转写成文字,有效压缩重复工作,保障新闻时效性。实现智能新闻写作提升新闻资讯的时效。基于算法自动编写新闻,将工作自动化,更快、更准、更智能化地生产内容。实现智能视频剪辑提升视频内容的价值。通过使用视频字幕生成、视频锦集、视频拆条、视频超分等视频智能化剪辑工具,节省成本,最大化版权内容价值。对传媒机构产生深刻营销AIGC大幅提高生产效率,带来新的视觉化、互动化体验,推动传媒向智媒转变。对传媒从业者产生深刻影响AIGC助力生产更具

78、人文关怀、社会意义和经济价值的新闻作品,并将部分劳动性的采编播工作自动化。对传媒受众产生深刻影响AIGC使其在更短时间内获得以更丰富多元的形态呈现的新闻内容,也降低了传媒行业的技术门槛,极大增强其参与感。应用范围不断拓展目前新华社、中央广播电视总台、人民日报社、湖南卫视等积极布局,推出“新小微”、“小C”等虚拟新闻主持。人。应用场景不断升级除了常规的新闻播报,AI合成主播开始陆续支持多语种播报和手语播报,不断升级应用场景。应用形态日趋完善在形象方面,逐步向3D拓展;在驱动范围上,向面部表情、肢体、手指、背景内容素材延伸;在内容构建上,向智能化生产探索。523.5数据来源:机器之心、Bing、浙

79、商证券研究所AIGC+互联网(1/3):重构搜索引擎,更便捷高效多元改进用户搜索体验,在一些简单的事情如体育比分、股票价格和天气等,新必应会提供更相关结果,同时显示更全面的答案。更好的搜索体验审查从网络上搜索到的结果找到并总结答案。例如问题如何用鸡蛋代替蛋糕中的另一种成分,新版必应能够给出详细说明。更完整的答案全新的交互式聊天体验使用户能够通过询问更多细节、清晰度和想法来优化搜索,直到获得正在寻找的完整答案,并提供可用链接。全新的聊天体验可帮助用户获得灵感,例如可以帮助用户编写电子邮件、规划旅游行程、准备工作面试等;还引用了信息所有来源,用户可详细查看链接。激发创造性火花图:微软旗下搜索引擎集

80、成ChatGPT533.5数据来源:量子技术、知乎、Newbeing、浙商证券研究所AIGC+互联网(2/3):AIGC激活内容平台,互为供给加速发展模型训练的底层数据p 互联网内容平台将作为重要数据来源。图文内容社区的内容库可以作为大语言模型的语料库,提高模型自主学习和深度挖掘能力。这样,无论是知乎用户10年前的回答,还是小红书用户的冷门笔记,抑或是豆瓣上的海量书评、影评,都可以被AI有效地检索、利用和生成,展现出新的价值。内容供给的组成部分p AIGC将成为平台重要的内容形式。AI技术将显著降低内容制作门槛,提高内容制作效率,增加内容供给,如今已有不少内容创作者利用AI辅助生成图文,视频及

81、音频内容,同时也有AI直接生成的内容,未来AIGC有望成为内容平台供给的重要形式图:知乎回答可作为Newbeing语料库图:知乎答主使用ChatGPT生成回答543.5数据来源:中国信息通信研究院、新浪财经、电商报、Roblox官网、浙商证券研究所AIGC+互联网(3/3):电商购物虚实结合,沉浸式体验图:Gucci 推出“增强现实”虚拟试鞋服务图:快手虚拟主播与真人主播场景互动图:潮牌Vans在游戏Roblox的店铺展览基于不同角度的商品图像,借助视觉生成算法自动化生成商品的3D几何模型和纹理,辅以线上虚拟“看、试、穿、戴”,提供接近实物的差异化网购体验,助力高效提升用户转化。1)为观众提供

82、24小时不间断的货品推荐介绍,增加商品商铺曝光度;2)推进店铺品牌年轻化科技化进程;3)虚拟主播稳定性强,行为言谈可根据品牌方要求个性化定制,失误率低。通过二维图像的三维重建,实现虚拟货场快速、低成本、大批量的构建,有效降低商家搭建3D购物空间的门槛及成本,为消费者提供新消费体验。生成商品3D模型用于商品展示和虚拟试用01打造虚拟主播提升直播带货效率02线上线下商城加速演变打造全新购物场景03553.6数据来源:ChatGPT、百度指数、浙商证券研究所AIGC+娱乐(1/2):人机交互新台阶,有趣有料高热度ChatGPT火爆全网高热度,2个月活跃用户破亿ChatGPT有趣有料,人机交互娱乐迈入

83、新台阶图:ChatGPT百度搜索指数趋势图(2022/02/02-2023/02/09)图:ChatGPT百度资讯指数趋势图(2022/02/02-2023/02/09)563.6数据来源:中国信息通信研究院、腾讯研究院、浙商证券研究所元宇宙的生产力工具p AIGC在元宇宙内容生产方面发挥了重要作用:元宇宙旨在构建用户的第二空间,为了让用户获得沉浸式的体验,内容生产者需要提供各种类型的虚拟内容。与第一空间不同的是,元宇宙内的内容是原生的,能够刺激用户的全感官。在这样的背景下,仅靠PGC和UGC产生的内容数量远远不足以支撑一个完整的第二空间。因此,AI协助内容生产成为必然趋势。大量个性化、多元化

84、的数字内容将显著提升用户体验。开发C端用户数字化身p 数字人是元宇宙的关键要素:数字人是元宇宙中最早落地的应用场景之一,也是连接用户情感与VR、AR等硬件设备的交互中介。如果AR/VR看作是元宇宙的入口,在元宇宙中占据核心位置,那么数字人可被看作是元宇宙的关键要素。智能NPC提升沉浸感pAIGC是元宇宙中用户交互界面的重要组成部分:在元宇宙中,智能NPC可以由AIGC生成并驱动,而ChatGPT则可以作为语言模型集成到智能体中,使它们成为元宇宙中逼真的虚拟助手或伙伴,能够执行“智能”动作和复杂任务。AIGC+娱乐(2/2):开启元宇宙之匙,基础设施拔地而起57图:AI绘画赋予制作元宇宙场景想象

85、空间图:扎克伯格已在元宇宙中拥有数字化身3.7数据来源:中国信息通信研究院、浙商证券研究所AIGC+其他:加快数实融合,产业升级提速教育+AIGC赋予教育材料新活力,为教育工作者提供了新的工具,使原本抽象、平面的课本具体化、立体化。医疗+AIGC赋能诊疗全过程。1)辅助诊断,可用于改善医学图像质量、录入电子病历等;2)康复治疗,为失声者合成语言音频,为残疾者合成肢体投影等。金融+AIGC助力实现降本增效。1)实现金融资讯、产品介绍视频内容的自动化生产,提升效率;2)塑造视听双通道的虚拟数字人客服。工业+AIGC提升产业效率和价值。1)融入计算机辅助设计CAD,极大缩短工程设计周期;支持生成衍生

86、设计,实现动态模拟;2)加速数字孪生系统的构建,高效创建数字孪生系统。ChatGPTAIGC58点击此处添加标题添加标题点击此处添加标题点击此处添加标题点击此处添加标题点击此处添加标题点击此处添加标题添加标题点击此处添加标题点击此处添加标题添加标题点击此处添加标题添加标题95%1、知识产权挑战1)AI著作权侵权。AIGC作品既存在被他人侵权的风险,也存在侵犯他人权利的可能性。AI变得更加智能的过程中一个必要的环节就是深度学习,这需要一个庞大的人类作品数据库,让算法学会创作风格、内容题材等创作的要领。如果未经许可,复制或者通过网络爬虫爬取他人享有著作权的在线内容,在我国现行著作权法没有明确将数据

87、挖掘等智能化的分析行为规定为合理使用的情况下,此类行为可能构成著作权侵权。2)AI视频合成、剪辑领域侵权。如果没有获得原始视频的著作权人的许可,可能因为侵犯原著作权人所享有的修改权、保护作品完整权或者演绎权而构成版权侵权行为。挑战图:国外艺术作品平台抵制AIGC生成图像的活动593.8数据来源:腾讯研究院、浙商证券研究所点击此处添加标题添加标题点击此处添加标题点击此处添加标题点击此处添加标题点击此处添加标题点击此处添加标题添加标题点击此处添加标题点击此处添加标题添加标题点击此处添加标题添加标题95%2、安全挑战1)内容本身。互联网信息空间面临着虚假信息和信息内容安全的挑战,随着AIGC内容的持

88、续增长,虚假信息和信息内容安全的挑战也会增加。2)深度合成诈骗、诽谤、假冒身份等新型违法犯罪行为。不法分子利用开源的AIGC模型或工具,以更低的门槛、更高的效率来制作出音视频、图片和文字等种类丰富的、真伪辨别难度大的虚假信息,同时也更容易地盗用用户身份,以此幵展新型诈骗等非法活动。3)用户隐私和身份安全。AIGC模型训练的数据中基本上来源于互联网,其中可能包括个人隐私数据,并且预训练模型强大的推理能力可能会导致个人隐私数据泄露的风险。4)模型内生安全问题。如遭受后门攻击、数据中毒等。此外,用户数据通常以明文形式提交给模型服务提供商,如何利用现有的加密技术保护用户数据隐私也是一个重要的安全挑战。

89、603.8数据来源:腾讯研究院、浙商证券研究所挑战3、伦理挑战1)算法歧视问题。算法歧视问题一直是人工智能创新和应用中始终难以避免的伦理问题,并未因预训练模型而消除。基于预训练模型的AIGC依然存在较为严重的歧视问题。AIGC图像生成也存在将为显著的歧视现象。2)社会伦理问题。AIGC越来越多地被用来制作数字人、生成逝者的音容相貌、数字化复活已故演员、创造与逝者交谈的可能等。这也引发了社会对于相关伦理问题的讨论。3)AI自我意识问题。社会也有很多关于AIGC模型是否具有自我意识问题的争议和讨论。图:DALLE 2输入提示词后生成的图像613.8数据来源:腾讯研究院、浙商证券研究所挑战点击此处添

90、加标题添加标题点击此处添加标题点击此处添加标题点击此处添加标题点击此处添加标题点击此处添加标题添加标题点击此处添加标题点击此处添加标题添加标题点击此处添加标题添加标题95%4、环境挑战AI模型训练消耗大量算力,碳排放量惊人。随着近年来AI的大规模应用,人们已经开始意识到AI的碳排放问题。1)大量算力需求和碳排放造成AIGC应用的高昂成本。虽然很多AIGC工具深受用户喜爱,但是其原始成本非常昂贵。2)碳排放和算力问题制约AIGC预训练模型的幵源。目前,有很多头部机构的预训练模型无法开源的一个重要原因是,小型开发者无法承受算力成本。因此,有一部分开发者将超大模型的各种能力拆分到参数相对更小的模型上

91、,以解决算力和能耗问题。还有一部分通过加快大模型推理速度、降低算力成本、减少能耗,以此来突破预训练模型的发展制约。图:单一机器学习模型训练所产生的碳排放与普通汽车对比623.8数据来源:腾讯研究院、浙商证券研究所挑战04风险提示63641、AI核心技术和AIGC技术发展不及预期风险。AIGC相关产业技术发展仍不成熟,技术壁垒较高,核心技术难以突破。2、版权相关风险。AIGC生成的内容依赖现有版权素材,不当使用或模型自身问题可能导致不良后果;3、人权道德风险。AI可能会生产违反道德、常规、法律等内容;4、行业竞争加剧风险。若相关企业加快技术迭代和应用布局,整体行业竞争程度加剧,将会对目前行业内企

92、业的增长产生威胁;5、宏观经济波动的风险。若宏观经济景气度下行,将影响消费者消费意愿和产业链生产意愿,AIGC技术应用落地将会受限;6、政策监管风险;7、用户需求不及预期;8、技术垄断风险。风险提示点击此处添加标题添加标题点击此处添加标题点击此处添加标题点击此处添加标题点击此处添加标题点击此处添加标题添加标题点击此处添加标题点击此处添加标题添加标题点击此处添加标题添加标题95%65行业的投资评级以报告日后的6个月内,行业指数相对于沪深300指数的涨跌幅为标准,定义如下:1、看好:行业指数相对于沪深300指数表现10%以上;2、中性:行业指数相对于沪深300指数表现10%10%以上;3、看淡:行

93、业指数相对于沪深300指数表现10%以下。我们在此提醒您,不同证券研究机构采用不同的评级术语及评级标准。我们采用的是相对评级体系,表示投资的相对比重。建议:投资者买入或者卖出证券的决定取决于个人的实际情况,比如当前的持仓结构以及其他需要考虑的因素。投资者不应仅仅依靠投资评级来推断结论行业评级与免责声明66法律声明及风险提示本报告由浙商证券股份有限公司(已具备中国证监会批复的证券投资咨询业务资格,经营许可证编号为:Z39833000)制作。本报告中的信息均来源于我们认为可靠的已公开资料,但浙商证券股份有限公司及其关联机构(以下统称“本公司”)对这些信息的真实性、准确性及完整性不作任何保证,也不保

94、证所包含的信息和建议不发生任何变更。本公司没有将变更的信息和建议向报告所有接收者进行更新的义务。本报告仅供本公司的客户作参考之用。本公司不会因接收人收到本报告而视其为本公司的当然客户。本报告仅反映报告作者的出具日的观点和判断,在任何情况下,本报告中的信息或所表述的意见均不构成对任何人的投资建议,投资者应当对本报告中的信息和意见进行独立评估,并应同时考量各自的投资目的、财务状况和特定需求。对依据或者使用本报告所造成的一切后果,本公司及/或其关联人员均不承担任何法律责任。本公司的交易人员以及其他专业人士可能会依据不同假设和标准、采用不同的分析方法而口头或书面发表与本报告意见及建议不一致的市场评论和

95、/或交易观点。本公司没有将此意见及建议向报告所有接收者进行更新的义务。本公司的资产管理公司、自营部门以及其他投资业务部门可能独立做出与本报告中的意见或建议不一致的投资决策。本报告版权均归本公司所有,未经本公司事先书面授权,任何机构或个人不得以任何形式复制、发布、传播本报告的全部或部分内容。经授权刊载、转发本报告或者摘要的,应当注明本报告发布人和发布日期,并提示使用本报告的风险。未经授权或未按要求刊载、转发本报告的,应当承担相应的法律责任。本公司将保留向其追究法律责任的权利。行业评级与免责声明67联系方式浙商证券研究所上海总部地址:杨高南路729号陆家嘴世纪金融广场1号楼25层北京地址:北京市东城区朝阳门北大街8号富华大厦E座4层深圳地址:广东省深圳市福田区广电金融中心33层邮政编码:200127 电话:(8621)80108518 传真:(8621)80106010 浙商证券研究所:http:/

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(传媒行业AIGC算力时代系列报告:未来已来AI如何赋能传媒行业-230311(67页).pdf)为本站 (柒柒) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部