《2023传媒行业AIGC最新应用领域及场景研究报告.pdf》由会员分享,可在线阅读,更多相关《2023传媒行业AIGC最新应用领域及场景研究报告.pdf(86页珍藏版)》请在三个皮匠报告上搜索。
1、2 0 2 3 年深度行业分析研究报告目录目录01020403AIGCAIGC发展过程发展过程AIGCAIGC软件应用软件应用AIGCAIGC应用场景应用场景AIGCAIGC模型展望模型展望u AIGC(Artificial Intelligence Generated Content)指的是人工智能系统生成的内容人工智能系统生成的内容,、像、音频或视频。这类内容可以通过自然语言处理,机器学习和计算机视觉等技术生成,即生成式生成式AIAI。AIAI最初设立的目的是让机器像人类一样思考解决问题最初设立的目的是让机器像人类一样思考解决问题。目前AI的总体目的是通过各种算法解决问题提高生产通过各种算
2、法解决问题提高生产效率效率。u AIGC AIGC 多样化的内容生成能力使其覆盖各类内容形式,各类应用场景正随技术进步逐渐落地多样化的内容生成能力使其覆盖各类内容形式,各类应用场景正随技术进步逐渐落地。AIGC不仅可覆盖文本、音频、图像、视频等基本内容模态,还可综合图像、视频、文本进行跨模态生成,并应用于各类细分行业成为具体的生产力要素,例如游戏行业中的AI、NPC、虚拟人的视频制作与生成等。AIGCAIGC发展过程:发展过程:AIAI自行生成内容自行生成内容初期发展:技术所限,小范围实验。1957年由计算机创作的第一支音乐积累阶段:AIGC实用性增强,商业化探索。2007年第一部人工智能小说
3、1 The Road但可读性不强快速发展:深度学习算法不断迭代,内容呈现多样性。2017年微软人工智能少女“小冰”创造首部AI创作诗集爆发阶段:2022年AIGC产品密集发布,ChatGPT爆火。2022年12月5日OpenAI推出出AI聊天机器人ChatGPTAIGC发展历史沿革1950年-1990年1990年-2010年2010年-2021年2022年-至今u ChatGPTChatGPT的发展带动了的发展带动了文字类文字类AIAI生成,或将在生成,或将在20232023年进入黄金时期年进入黄金时期,图片类AI生成黄金时期将在2025年,3D频类 AI生成在2023年可能正处于草稿阶段,进
4、入黄金时期或许在2030年。u AIGC产业应用,如在制造业、建筑业等巨型垂直实体领域中,AIGC的C/Content内容将不仅停留在图片和文字的领域,而是进入信息更为丰富的领域。AIGCAIGC发展过程:发展过程:GPTGPT助力,进入黄金期助力,进入黄金期文字领域代码图像视频/3D/游戏单行代码补足垃圾邮件识别翻译基础问答基础文案撰写初稿撰写多行代码生成文本更长实现二稿撰写代码更长表达更精确艺术Logo摄影首次尝试3D文件视频模型支持更多编程语言服务更多垂直领域模仿(产品设计、建筑等)视频和3D文件的基础版/初稿制作终稿撰写,高于人类平均水平深度文字撰写提升(论文等)终稿制作(产品设计、建
5、筑等)二稿制作终稿撰写,高于专业写手水平根据文本生成终版应用程序,高于全职开发者终稿制作,高于专业艺术家设计师水平AI版Roblox私人定制游戏与电影初步尝试接近成熟完全成熟AIGC相关产品成熟度垂直领域的文案撰写实现可精调(论文等)生成广告图像增加用户体验u ChatGPTChatGPT是一种聊天机器人软件是一种聊天机器人软件:全名为Chat Generative Pre-Trained Transformer,2022年11月,OpenAI于 GPT-3.5的新型 AI聊天机器人ChatGPT免费预览版软件。用户只需向ChatGPT提出需求,即可实现文章创作、代码创作、回答问题等功能。u
6、如今更新至GPT-4.0比以往更具创造性和协作性更具创造性和协作性。基于客户需求可完成生成、编辑和迭代创意和技术写作任务,如创作歌曲、编写剧本或学习用户的写作风格。同时可以接受图片作为输入并生成标题、分类和分析同时可以接受图片作为输入并生成标题、分类和分析。GPT-4.0GPT-4.0能够处理超过能够处理超过25,00025,000字的文本字的文本,允许使用案例,如长形式的内容创作、扩展的对话以及文件搜索和分析。GPT-4.5预计今年9月推出。AIGCAIGC发展过程:发展过程:ChatGPTChatGPT的发展历程的发展历程ChatGPT与GPT-4回复对比u OpenAIOpenAI邀请第
7、三方公司进行插件测试并计划逐步扩大访问权限邀请第三方公司进行插件测试并计划逐步扩大访问权限(对于插件开发人员、ChatGPT用户以及alpha之后希望将插件集成到其产品中的API用户)建立一个社区,来塑造人类与人工智能交互范式的未来。u 受邀请进入等待名单的插件开发人员可以使用文档为可以使用文档为ChatGPTChatGPT构建插件构建插件,将启用的插件列在显示给语言模型的提示中,并提供说明文档以指导模型如何使用每个插件。第一批插件由Expedia、FiscalNote、Instacart、KAYAK、Klarna、Milo、OpenTable、Shopify、Slack、Speak、Wolf
8、ram和Zapier创建。AIGCAIGC发展过程:发展过程:ChatGPTChatGPT插件拓宽应用场景插件拓宽应用场景第一批受邀公司名单把你的旅行计划变成现实-到那里去,住在那里,找到要看的东西,做的事情。为法律、政治和监管数据和信息提供并实现对选定的市场领先的实时数据集的访问。从你喜欢的当地杂货店订购。搜索航班、住宿和租车。在你的预算范围内获得所有你能去的地方的推荐。搜索和比较数以千计的在线商店的价格。赋予父母超能力,每天20分钟将忙碌变为魔术。问:“嘿,Milo,今天有什么魔术?”提供餐厅推荐,并直接附上链接预订搜索来自世界上最伟大的品牌的数百万种产品。通过Speak,你的人工智能语言
9、导师,学习如何用另一种语言说任何话。通过Wolfram Alpha和Wolfram语言访问计算、数学、策划的知识和实时数据。与5,000多个应用程序互动,如Google Sheets、Trello、Gmail、HubSpot、Salesforce等。u Open AIOpen AI本身具备开发插件本身具备开发插件:OpenAIOpenAI自主开源了两个插件分别是网络浏览器和代码解释器。自主开源了两个插件分别是网络浏览器和代码解释器。u 网络浏览器:网络浏览器:帮助帮助OpenOpenAIAI接入了互联网,成功弥补了接入了互联网,成功弥补了之前数据之前数据存在时效性的问题存在时效性的问题。将Ch
10、atGPT插件接入网络后,原有的计算机软件生态和数据库相互结合,赋予其使用工具、联网和运行计算的功能。u 代码解释器:代码解释器则能够执行数学问题、数据分析、可视化和文件格式转换等任务代码解释器:代码解释器则能够执行数学问题、数据分析、可视化和文件格式转换等任务,使ChatGPT能够使用Python并在沙盒环境中处理上传和下载任务。此外,代码解释器可以使初级程序员工作流程变得更加高效。AIGCAIGC发展过程:发展过程:GPTGPT插件拓宽应用场景插件拓宽应用场景代码解释器应用网络浏览器AIGCAIGC发展过程:发展过程:GPT-4GPT-4与公司、政府合作与公司、政府合作u GPT-4GPT
11、-4的准确率与回应率明显提升的准确率与回应率明显提升。6个月的时间使GPT-4更安全、更统一。内部评估中,与GPT-3.5相比GPT-4对不允许的内容请求的回应率降低了82%,对事实的回应率提高了40%。u GPT-4GPT-4与公司、政府合作。与公司、政府合作。主要应用在语言学习公司的多邻国(Duolingo)、线上教育公司可汗学院(Khan Academy)、盲人和弱视辅助公司Be My Eyes、线上支付平台Stripe、Morgan Stanley财富管理部门整理数据库、以及与冰岛政府合作保护其语言。u 5月19日ChatGPT官方应用在IOS平台上线。发布时间不久已经成为发布时间不久
12、已经成为AppApp StoreStore免费应用热搜榜第二名,目前只在美国地区免费应用热搜榜第二名,目前只在美国地区进行推广。进行推广。安卓版本将在未来推出。u 自身特点:软件下载应用免费,同时可以同步网页端的聊天记录。并完成语音输入,反应速度较快。目前没有广告植入,可以通过AppStore直接订阅。u 目前IOS版本只有GPT-3.5和GPT-4两种模式,但对于但对于GPT-4GPT-4的使用次数仍有限制的使用次数仍有限制。同时没有使用联网插件,预训练数据集预训练数据集停留在停留在20212021年年9 9月。月。AIGCAIGC发展过程:发展过程:ChatGPTChatGPT 已接入终端
13、已接入终端ChatGPT使用提问展示免费应用排行榜OpenAI官网展示目录目录01020403AIGCAIGC发展过程发展过程AIGCAIGC软件应用软件应用AIGCAIGC应用场景应用场景AIGCAIGC模型展望模型展望应用方向应用方向具体表现具体表现代表产品代表产品文字类文字类直接生成应用型文本,已发展较成熟,以客服类的聊天问答、新闻撰写为核心场景直接生成创作型文本,适用于剧情续写、营销文本等细分场景生成交互型文本,典型场景为智能客服/聊天机器人/虚拟伴侣/游戏中的NPC个性化交互等文本辅助生成,是目前国内工具落地最为广泛的场景Notion AI:智能写作助手 Jasper:通过其文字生成
14、功能,用户可以轻松生成 Instagram 标题,编写 TikTok 视频脚本、广告营销文本ChatGPT:聊天机器人软件。只需向ChatGPT提出需求,即可实现文章创作、代码创作、回答问题等图片类图片类潜力巨大(据绘画生成网站6pen,未来5年全球10%-30%的图像有望由AI生成或辅助生成。)根据简单描述、关键词自动生成图像 Midjourney:可根据文本生成图像,使用者可通过Discord的机器人指令进行操作,可以创作出很多的图像作品6pen:国内AI图像生成公司音频类音频类已经相当成熟的TTS(语音合成)场景和音乐创作 该业务可提高歌曲乐曲、有声书、配音等内容的创作效率,实现有声内容
15、的规模化生产Amper Music:基于云算法的平台,帮助简化电影和视频游戏的音轨制作过程视频类视频类视频自动剪辑、属性编辑、视频到视频的自动生成等Runaway:基于文本和图 片生成视频Designs.AI:AI人工智 能图片视频创作网站跨模态生成跨模态生成文字生成图像(也分功能性和创意性)、文字生成视频(有更高的长序列建模要求,比文生图发展得要滞后两年左右)、图像/视频到文本(跨模态搜索、视觉问答系统、配字幕、标题生成)Copilot:智能办公Adobe:生成式AI营销工具Sensei和图片视频生成工具FireflyAIGCAIGC软件应用:软件应用:AIAI技术提升效率技术提升效率基于内
16、容产生形式进行应用分类AIGCAIGC软件应用:文字类软件应用:文字类-Notion AI-Notion AI介绍介绍u简短介绍:2022年11月,Notion公司推出Notion AI,它是一款集成了笔记、知识库、数据表格、看板、日历等多种能集成了笔记、知识库、数据表格、看板、日历等多种能力于一体的应用力于一体的应用,支持个人用户单独使用,也可以与他人进行跨平台协作。目前,部分公司及个人使用Notion来撰写笔记。u 功能描述:强大的可视化功能强大的可视化功能,更好地展示和解释数据。灵活的搜索功能灵活的搜索功能,更快地找到所需的信息。可以将多个 Notion 页面链接在一起,形成一个超级页面
17、。支持嵌入多种媒体类型和第三方应用程序支持嵌入多种媒体类型和第三方应用程序,如视频、音频、网页等。具有强大的移动应用程序支持。无论是在手机、平板电脑还是电脑上使用 Notion AI,都可以方便地查看、编辑和共享信息。Notion AI的视频介绍AIGCAIGC软件应用:文字类软件应用:文字类-Notion AI-Notion AI使用场景使用场景u 撰写学习笔记u 规划出行流程u 记录会议纪要Notion AI使用场景展示AIGCAIGC软件应用:图像类软件应用:图像类-MidjourneyMidjourney介绍介绍u 背景介绍:背景介绍:Midjourney是一款2022年3月面世的AI
18、绘画工具,它是由Midjourney研究实验室开发的人工智能程序,可根据文本生成图像,使用者可通过Discord的机器人指令进行操作,指令进行操作,可以创作出的图像作品。5月15日推出了中文版官方内测已经开放中文版官方内测已经开放,新用户可通过腾讯QQ频道免费试用。u 功能介绍:功能介绍:在创作过程中可以自动识别和纠正绘画中自动识别和纠正绘画中的错误的错误,生成更加真实自然的图像。应用领域非常广泛应用领域非常广泛,包括美术设计、游戏开发、虚拟人物创作等。通过APIAPI接口集成到各种应用接口集成到各种应用中,为用户提供更加便捷的服务。功能功能详细描述详细描述人物卡通化将人物照片转换成有趣的卡通
19、形象。轮廓生成根据输入的文字描述生成对应的图像轮廓。色彩生成利用GAN模型生成具有艺术感和创意的彩色图像。视频换脸实现对视频中人物的面部进行换脸操作。人脸合成将不同人物的面部特征进行合成,生成新的面孔。视觉问答通过图像识别和自然语言处理技术,实现对话。Midjourney功能详解AIGCAIGC软件应用:图像类软件应用:图像类-MidjourneyMidjourney作品作品展示社区中优秀作品AIGCAIGC软件应用:音频类软件应用:音频类-Amper MusicAmper Music介绍介绍u简短介绍:Amper Music Amper Music是一个基于云算法的平台,是一个基于云算法的平
20、台,帮助简化电影和视频游戏的音轨制作过程。在这个过程中,它会生成AI生成的算法,帮助用户创作各种音乐流派的音乐。它允许用户为其内容创建和自定义原创音乐,是全球首家人工智能编曲、表演和制作公司,使用户能够即时创作和定制原创音乐。u 目前Amper Muisc已经加入Shutterstock。在Shutterstock可以直接使用由Amper Muisc预生成的歌曲。u 功能介绍:最容易使用的最容易使用的 AI AI 音乐生成器之一音乐生成器之一,AI 音乐生成器列表中名列前茅,目的打造成为音乐人心中最好的AI生成音乐产品。从预先录制的样本中制作音乐从预先录制的样本中制作音乐。这些随后被转换成实际
21、的音频,可以改变音乐键、速度、特定乐器和其他因素。例如,可以调整全部乐器以适应想要创造的音可以调整全部乐器以适应想要创造的音调或感觉。因此,无需透彻了解音乐理调或感觉。因此,无需透彻了解音乐理论或作曲即可使用它。论或作曲即可使用它。Amper Music曲库使用界面AIGCAIGC软件应用:音频类软件应用:音频类-Amper MusicAmper Music优势优势u AIAI参与音乐创作的部分逐步增加,直到完全包揽作词、参与音乐创作的部分逐步增加,直到完全包揽作词、作曲、编曲、演唱所有部分,即从作曲、编曲、演唱所有部分,即从AIAI辅助音乐创作到辅助音乐创作到AIAI独立完成音乐创作:独立完
22、成音乐创作:2016年,索尼公司使用一种名为“Flow Machines”的软件,创作了一首披头士(Beatles)风格的旋律,作曲家Benoit Carre进而将其制作成一首完整的流行歌曲Daddys Car。2017年,美国歌手Taryn Southern与AI作曲公司Amper Music开发的工具共同创作出Break Free 2020年底,网易发布了AI生成歌曲醒来。这这是一首作词、作曲、编曲、演唱全部由是一首作词、作曲、编曲、演唱全部由AIAI完成的完成的歌曲。歌曲。uAmper Music功能特点:广泛应用领域(播客、电影和视频游戏)快速创广泛应用领域(播客、电影和视频游戏)快速
23、创建音乐建音乐:只需提供音乐的风格、情绪、长度、关键词即可快速创作音乐。数百万的样品和多种工具:数百万的样品和多种工具:有效改进音乐制作的水准。音乐项目初期创建界面改进音乐的制作流程AIGCAIGC软件应用:代码类软件应用:代码类-Github CopilotGithub Copilot介绍介绍u 简短介绍:GitHub Copilot,是是 GitHub GitHub 和和 OpenAI OpenAI 合合作开发的一个人工智能工具作开发的一个人工智能工具,用户在使用 Visual Studio Code、Microsoft Visual Studio、Vim 或JetBrains集成开发环境
24、时可以通过 GitHub Copilot 自动补全代码。u 功能描述:Copilot可以支持十几种语言,与Python、JavaScript、TypeScript、Ruby和Go等主流语言配合效果更佳。GitHub Copilot还可以将注释转换为代码。只需要描述需求逻辑,只需要描述需求逻辑,GitHub GitHub Copilot Copilot 能自动能自动“理解理解”并写出相应功能的代并写出相应功能的代码,也能自动填充重复代码。码,也能自动填充重复代码。GitHub 官方表示,Copilot 的功能能够帮助程序员减省阅读软件文档的时间,快速浏览不熟悉的编码框架和语言。GitHub Co
25、pilot与VS Code工作流程图AIGCAIGC软件应用:代码类软件应用:代码类-Github CopiloGithub Copilo应用场景应用场景u 注释或命令写代码:可生成任意语言,如:java、python、go等u 智能纠错、代码补全:可根据上下文纠正错误代码AIGCAIGC软件应用:视频类软件应用:视频类-D-ID-D-ID介绍介绍u D-ID推出了其新的视频化照片产品。该产品可以使用其新的技术创造创造一个能够表达各种情感的多语言电、电、持互动创建虚拟聊天机器虚拟聊天机器人角色、开发用于专业发展的培训课程、培训课程、并创建交互式对话视频广告交互式对话视频广告。u 基本原理:D-
26、ID的原理在于人脸识别,不仅是改变脸部和动画生成,同时可以根据少量信息生成逼真的人物视频或从单个静止图像生成动态人物。脸识别技术分为脸识别技术分为4 4步:步:人脸检测、人脸对齐、人脸编码、人脸匹配。人脸检测、人脸对齐、人脸编码、人脸匹配。u Chat D-ID为首个使用首个使用ChatGPTChatGPT实现人与虚拟实现人与虚拟人面对面对话的应用程序,整合了ChatGPT与D-ID生成式技术。它使用实时人脸动画和先进的文本到语音来营造一种身临其境的感觉。面部标志点检测Chat D-ID展示AIGCAIGC软件应用:视频类软件应用:视频类-D-ID-D-ID成果展示成果展示由图像生成的视频成果
27、AIGCAIGC软件应用:视频类软件应用:视频类-Runway介绍介绍u 背景介绍:Runway 公司推出了一个新的人工智能模型Gen-1,该模型通过应用文本 prompt(提示词)或参考图像指定的任何风格,可将现有视频转化为新视频。u Gen-1 支持几种编辑模式:风格化风格化:将任何图像或 prompt 的风格转移到视频的每一帧。故事板故事板:将模型变成完全风格化和动画的渲染。遮罩遮罩:分离视频中的主题并使用简单的文本 prompt 对其进行修改。渲染渲染:通过应用输入图像或 prompt,将无纹理渲染变成逼真的输出。定制化定制化:通过自定义模型以获得更高保真度的结果,释放 Gen-1 的
28、全部功能。u 官网:https:/Runway官网AIGCAIGC软件应用:视频类软件应用:视频类-Runway介绍介绍u 文本生成内容:Runway发布Gen2系统,该系统可以根据用户提示生成短视频。使用该系统,用户可以输入简短的视频描述,例如用户可以输入简短的视频描述,例如“一只行走在雨中的猫一只行走在雨中的猫”,GenGen2 2根据语义生成大约根据语义生成大约3 3秒钟秒钟的视频。的视频。u 改变视频风格:Runway的GenGen1 1系统可以根据用户需求改变视频风格或在视系统可以根据用户需求改变视频风格或在视频上添加更多细节。频上添加更多细节。乡下雪地上的汽车外星人探索在山中徒步旅
29、行漫步星空的太空熊视频风格变化视频展示u AdobeAdobe与英伟达联合推出与英伟达联合推出Firefly(萤火虫)。Firefly在3月推出的早期版本与Midjourney功能近似,但较弱。原因:原因:1、提示语已经在MidJourney中进行了大量优化,Firefly仍有提升空间。2、FirelyFirely宣城它仅在宣城它仅在AdobeAdobe StockStock和完全许可的图像上接受过训练。和完全许可的图像上接受过训练。u 新版的 Firefly 可以让任何人轻松地编辑视频,通过几个字让AI自动进行颜色分级,添加背景音乐和声音效果,创建带自动进行颜色分级,添加背景音乐和声音效果,
30、创建带有动画的字体、图形和徽标有动画的字体、图形和徽标。Firefly 承诺会自动将导演脚本转换为故事板和预可视化动画直接从草图生成动画。AIGCAIGC软件应用:视频类软件应用:视频类-Adobe-Adobe FireflyFirefly调色功能展示一键调色:输入转为暖调,以及提亮面部,即可完成校色。一键配乐:输入与画面有关的关键词(如明亮、冒险、欢快的音乐),能自动搜索匹配需要的音乐。配乐功能展示AIGCAIGC软件应用:视频类软件应用:视频类-Adobe-Adobe FireflyFirefly展示展示 一键剪辑:通过分析视频中的文本,萤火虫可以自动选择萤火虫可以自动选择视频中相匹配的其
31、他画面,自动选择适当的时间轴位置,视频中相匹配的其他画面,自动选择适当的时间轴位置,完成剪辑。完成剪辑。一键分析剧本:生成分镜。:生成分镜。只要输入剧本可以自动添加特效字幕。甚至可制作分镜画。编辑功能展示分镜画展示添加字幕展示AIGCAIGC软件应用:软件应用:跨模态生成跨模态生成-AI-AI搜索引擎搜索引擎NewBing介绍介绍u背景介绍 2023年2月7日,微软正式发布新版必应(New Bing)搜索引擎,该引擎整合了ChatGPT系统背后的技术。其与ChatGPT的区别是,它不仅可以生成内容,还可以搜索网上的信息,并且给出相关的链接和引用,也可以根据用户的语言偏好进行切换,比如英文、中文
32、、日文等。New Bing更像是一个搜索引擎,而不是一个聊天机器人。New Bing界面展示搜索内容困惑解读信息整合,如旅游路线规划AIGCAIGC软件应用:软件应用:跨模态生成跨模态生成-New BingNew Bing与与ChatGPTChatGPT对比对比uNew Bing回答简要直接,而ChatGPT回答详细全面。u用户可以与ChatGPT进行深度互动,获取丰富的信息和建议,而New Bing智能性和灵活性欠佳。ChatGPT(左)与New Bing(右)对比AIGCAIGC软件应用:软件应用:跨模态生成跨模态生成-New BingNew Bing与与ChatGPTChatGPT对比对
33、比uNew Bing准确率高,信息更及时,而ChatGPT信息准确性有待考量。uChatGPT的答案是基于国外,而New Bing更本土化,而且它很爱引用知乎的回答。ChatGPT(左)与New Bing(右)对比目录目录01020403AIGCAIGC发展过程发展过程AIGCAIGC软件应用软件应用AIGCAIGC应用场景应用场景AIGCAIGC模型展望模型展望工业革命历程:人工智能引发第四次科技变革工业革命历程:人工智能引发第四次科技变革u 每一次工业革命的到来,背后都有一个通用目的技术,例如第一次工业革命背后有蒸汽机,第二次工业革背后有电,后面有了计算机、互联网。而每一个通用技术都会赋能
34、千行百业,创造很多的商业机会,推动产业的变革发展每一个通用技术都会赋能千行百业,创造很多的商业机会,推动产业的变革发展。u 人类历史上已经发生了三次科学革命、技术革命和工(产)业革命,第四次科学革命、技术革命和工业革命即将到来,并第四次科学革命、技术革命和工业革命即将到来,并有希望在本世纪内完成有希望在本世纪内完成。工业革命历程u 第四次工业革命将对全球经济产生深远的影响第四次工业革命将对全球经济产生深远的影响,GDPGDP、投资、消费、就业、贸易、通货膨胀等宏观变量几乎都会受其影响。、投资、消费、就业、贸易、通货膨胀等宏观变量几乎都会受其影响。生产效率方面:当前世界技术和创新正处于拐点,第四
35、次工业革命将很快推动生产效率的大幅上升,加速经济增长第四次工业革命将很快推动生产效率的大幅上升,加速经济增长。对就业的影响:一方面,技术对就业是有破坏效应的技术对就业是有破坏效应的,因为技术带来的颠覆和自动化会让资本取代人工,从而导致工导致工人失业人失业,或者把他们的技能用到其他地方;另一方面,这样的破坏效应也伴随着资本化效应:对新商品和新服务需求的增加,会催生全新职业、业务,甚至是全新行业。会催生全新职业、业务,甚至是全新行业。AIGCAIGC应用场景:内容创作行业边际成本趋于零应用场景:内容创作行业边际成本趋于零u 内容创作行业主要指以内容创作生产为主业,包括新闻信息、出版、影视、演艺、数
36、字内容、创意设计、的文化企业。u 内容生产范式的变革:PGC:PGC:内容供应不求,产能受限严重内容供应不求,产能受限严重,基于Web1.0,创作门槛高。如:新闻网页。UGC:UGC:用户生产内容用户生产内容(“人人都是自媒体”)基于Web2.0,内容丰富,但参差不齐。如:博客、微博、微信(公众号)。AIGCAIGC:人工智能生成内容:人工智能生成内容(引发互联网交互模式变革),基于Web3.0,优质高效。如:ChatGPT、Midjourney等。内容生产范式变革u AIGCAIGC将重塑互联网内容生产和用户交互方式,成为将重塑互联网内容生产和用户交互方式,成为WEB3.0WEB3.0发展中
37、的重要里程碑。发展中的重要里程碑。加速进化,让创作者不再过多焦虑创作难度,做到充分发挥自己的想象力和创意创作者不再过多焦虑创作难度,做到充分发挥自己的想象力和创意。自动提取和整理视频素材自动提取和整理视频素材,进行视频内容的归纳总结视频内容的归纳总结,让用户可以在社区内更高效便捷地互动,减少重复劳动和生产减少重复劳动和生产时间时间。内容个性化推荐也能够提高用户的社区黏性等。这些机遇将为知识型社区或平台带来更好的商业发展和社会影响。通过AI技术的应用,视频创作者可以大大降低生产门槛视频创作者可以大大降低生产门槛,减少工序性的人工消耗,减小工具和技术层面的差异,从而减少工序性的人工消耗,减小工具和
38、技术层面的差异,从而获得更多的创作权力和自由。获得更多的创作权力和自由。内容质量好、专业程度高、优质创作者聚集的内容平台或社区,显然有望成为内容质量好、专业程度高、优质创作者聚集的内容平台或社区,显然有望成为AIGCAIGC时代的重要受益者时代的重要受益者。中国AIGC产业全景报告报告中,预计预计20302030年,我国年,我国AIGCAIGC市场规模达到万亿级别市场规模达到万亿级别;2025年和2027年预计成为两次规模爆发点,年复合增长率有质变提升。AIGCAIGC应用场景:办公应用应用场景:办公应用-Office-Office系列全面升级系列全面升级u 2023年3月16日,微软宣布将推
39、出名为Copilot的人工智能服务,并将其嵌入Word、PowerPoint、Excel等Office办公软件中,能够根据不同软件的功能与需要,处理不同类型的任务。u 微软董事长兼首席执行官萨蒂亚纳德拉(Satya Nadella)称,“这是我们在计算交互方面迈出的重要一步,这将从根本上改变我们的工作方式,并开启新的生产力增长浪潮。”u 除了加入 Office 应用之外,Copilot 也搭载于 Viva Sales、Dynamics 365、以及微软的低代码应用 Power Platform。u 目前,微软正在与一小部分客户一起测试 Copilot,以根据用户反馈改进模型。它将在未来几个月内
40、面向更多企业客户推出。项目项目详细功能详细功能 WordCopilot 可以帮助用户完成初稿的创作,提升写作效率。Copilot 可以向现有文档添加内容,总结文本,并重写部分或整个文档,使其更加简洁。Copilot还可以改进写作,建议加强论证的方法,或者消除不一致的地方,使用户的文章更加完善。Excel在Copilot 的支持下,用户可以随意制作复杂的电子表格。Copilot将揭示相关性,并根据用户的问题建议新的公式-生成基于用户的问题的模型,帮助用户探索数据。Copilot 可以从 Excel 数据中直接生成战略分析,直接作为新的一页让 AI 添加到 PPT 里。PPT只需要一个提示或根据现
41、有的书面文件,Copilot 就可以创建演示 PPT,并在几秒钟内创建可视化的数据。可以用文字命令 Copilot 帮你修改:简化内容、替换你不满意的图片(可以从 OneDrive 云盘直接加载图片、添加动画等)。Out-lookCopilot 可以总结冗长、复杂的电子邮件线程,了解每个人的不同观点和尚未回答的问题,以便更好地沟通;同时也可以使用简单提示回复现有电子邮件,或将快速笔记转化为清晰、专业的信息。Office全家桶介绍AIGCAIGC应用场景:办公应用应用场景:办公应用-Office-Office全系列展示全系列展示u GPT-Wordu GPT-Excelu GPT-PPTu GP
42、T-OutlookAIGCAIGC应用场景:办公应用应用场景:办公应用-Tome-Tome为为PPTPPT制作提升体验制作提升体验u TomeTome可以利用人工智能(可以利用人工智能(AIAI)来帮助用户创建各种类)来帮助用户创建各种类型的故事和项目展示型的故事和项目展示PPTPPT。用户想要制作一份产品设计评审,展示一项公司战略,或者想要培训客户,TomeTome都可以让用户以都可以让用户以PPTPPT的形式来呈现想法和内容的形式来呈现想法和内容。u 网址:https:/beta.tome.appu 功能介绍功能介绍 AI AI 辅助生成辅助生成 PPT PPT 内容内容。Tome 核心功
43、能,目前中英文描述均支持中英文描述均支持。其中,Tome 内嵌 Dall-E 等模块,可根据用户描述生成特定主题的配图或者插画。主题与模版主题与模版。Tome 内置了一些主题和模版,根据使用场景进行分类,方便引导用户上手产品。模块化的模块化的 PPT PPT 内容内容。类似 Notion 的块编辑器体验,支持内容块的快速组合与排版,允许嵌入允许嵌入文本、图片、视频、书签、网页片段等多种内容文本、图片、视频、书签、网页片段等多种内容块块,集成 Twitter、Figma 等网站内容。协同功能协同功能。每页 PPT 内容支持添加视频解说,提供了异步视频协同沟通。Tome官网界面AIGCAIGC应用
44、场景:办公应用应用场景:办公应用-Tome-Tome为为PPTPPT制作提升体验制作提升体验u 提示栏(提示栏(Prompt BarPrompt Bar):可以输入想法或问题,由可以输入想法或问题,由AIAI生成完整的故事或者特定的页面生成完整的故事或者特定的页面。例如,输入“一动汽车”,AI会生成一份包含文本和图片的故事。也可以输入“添加一个关于市场分析的页面”,AI会生成一个包含相关数据和图表的页面。u DALL-E 2 DALL-E 2 标题(标题(DALL-E 2 TileDALL-E 2 Tile):可以利用):可以利用AIAI来创造出任何类型和风格的图片。来创造出任何类型和风格的图
45、片。只需输入一些文字或图标,AI就会生成一张图片,并且可以进行细节上的调整和编辑。例如,输入“一个穿着西装骑着独角兽的男人”,AI会生成一张符合这个描述的图片,并且可以让你改变男人或独角兽的颜色、大小、位置等。AIGCAIGC应用场景:办公应用应用场景:办公应用-Tome-Tome为为PPTPPT制作提升体验制作提升体验u 内容类型(内容类型(Content TypesContent Types):可以添加各种类型的内容到故事中。选择文本、图片、视频、音频、可以添加各种类型的内容到故事中。选择文本、图片、视频、音频、3D3D、多种内容类型,来展示想法和数据。多种内容类型,来展示想法和数据。通过
46、拖放的方式来调整内容的位置和大小,也可以通过一键主题来选择合适的配色一键主题来选择合适的配色和字体和字体。支持多种格式的导入和导出,如PDF、PPT、Word等,方便与其他工具兼容。添加文本、图片等多种内容类型一键设置主题u 4月18日,金山办公正式发布具备大语言模型能力的生成式人工智能应用,暂定代号“WPS AI”,这也道首个类ChatGPT式应用。WPS AI最初搭载在金山办公新一代在线内容协作编辑工具轻文档(airPage,)5 5月月1616日,推出了文字、表格、日,推出了文字、表格、PPTPPT、PDFPDF组件搭载的组件搭载的AIAI大模型能力,支持大模型能力,支持PCPC及移动设
47、备,整体呈现与微软及移动设备,整体呈现与微软CopiltCopilt近似。近似。u WPS AI未来发展将锚定三个战略方向:1.1.AIGCAIGC,主要是辅助编辑、改写、润色,帮助用户生产更优质的文章。2.2.阅读理解和问答阅读理解和问答,基于已储备的语料做问答式的交互,辅助阅读和知识检索。3.3.人机交互人机交互,基于大语言模型技术去做下一代基于自然语言的人机交互,用自然人类语言给软件下命令、提要求。AIGCAIGC应用场景:办公应用应用场景:办公应用-WPS-WPS AIAI对标微软对标微软CopilotCopilotWPS AI 战略方向WPS AI自动生成PPT演示文稿u 4月18日
48、,钉钉总裁叶军宣布,钉钉正式接入阿里巴巴“通义千问”大模型,钉钉将全面启动智能化战,同办公平台、智能应用开发平台。u 叶军和钉钉团队发布现场演示了斜杠“/”功能的四个高频应用场景:群聊、文档、视频会议和低代码应用开发。群聊、文档、视频会议和低代码应用开发。无论是文档的内容生成能力,群聊、会议的摘要提取总结,还是对话或者拍照就能自动生成一个可直接使用的小程序,钉钉AI能力全被收进这一道斜杠“/”里。u 钉钉对未来展望:钉钉对未来展望:人和软件的交互将变得非常简单,产品会走向极简。以前大家用Word、Office,找菜单、有按钮、有一个函数,或者改一个表格。以后用户的习惯。可能就是通过一条斜杠来唤
49、起所有想要功能以后用户的习惯。可能就是通过一条斜杠来唤起所有想要功能。AIGCAIGC应用场景:协同办公应用场景:协同办公-钉钉深耕工作场景钉钉深耕工作场景会议纪要功能展示头脑风暴功能展示u 设计业务简单分为7 7个流程个流程:设计调研、设计脑暴&提案、拍摄素材、包装设计、工业造型设计、商品团设计、IP设计。从可行性和推广性的角度出发,详细介绍AIGC在商品、品牌、营销和体验等多个领域的应用与探索。提升了提案效率,辅助拍摄,提供了丰富素材AIGCAIGC应用场景应用场景:设计行业:设计行业-多环节辅助多环节辅助1.1.设计调研设计调研:调研设计师需要输入大量的分析资料输入大量的分析资料。Cha
50、tGPT主要提供辅助功能辅助功能2.2.设计脑暴设计脑暴&提案:提案:设计师可以使用使用AIAI快速模拟用于提案的概念创意方案快速模拟用于提案的概念创意方案,并根据需求目标迭代,快速响应业务需要。前期设计团队通过洞察需求,产品定义,以及如何可洞察需求,产品定义,以及如何可信信三个维度对ChatGPT进行提问。GPT辅助调研事项厕清共创项提案实例(包装方案人工完成)3.3.拍摄素材:拍摄素材:AI辅助拍摄和生产高清材质,提升内容所需拍摄的多样性素材并降低照片素材采购成本拍摄的多样性素材并降低照片素材采购成本。Midjourney生成所需图像。AIGCAIGC应用场景应用场景:设计行业:设计行业-
51、多环节辅助多环节辅助品牌调性图商品氛围图素材材质特写商业版权图服饰模特换装相关素材展示4.4.包装设计:包装设计:AIAI帮助设计师帮助设计师提供容器造型,平面设计和背景等方面的创意效果AIGCAIGC应用场景应用场景:设计行业:设计行业-多环节辅助多环节辅助5.5.工业造型设计:工业造型设计:AI帮助设计师快速验验证创意效果证创意效果快消品包装设计工学椅造型设计6.6.商品图案设计:商品图案设计:AI帮助设计师生成图案并应用到商品上,可以快速产出图案创意方向及场景图餐具图案设计人工/AI 对比7.7.IPIP设计:设计:格调性&内容作为相应的prompt描述,MidjourneyMidjou
52、rney中中生产大量的素材,提升效率生产大量的素材,提升效率。创意生成u 产品网页可通过语言描述快速生成。产品网页可通过语言描述快速生成。Relume Ipsum通过一段文字调整网页设计。选定设计模版,然后在文本框中输入描述,譬如希望生成的网站实现什么功能、呈现何种样式,点击生成 Generate,Relume Ipsum 就能根据描述,把内容填充到模版中。AIGCAIGC应用场景应用场景:设计行业:设计行业-网页制作提升效率网页制作提升效率输入描述场景生成网页软件特点基于模板和组件即时生成文案锁定保留的副本,AI 会写剩下的使用 Figma 内部的提示改进现有副本u 3月 28 日,一款面向
53、 UI 设计的生成式 AI 产品,能够让 AI 生成可编辑 UI 设计稿的即时 AI开放内,得了业内人群的关注。UI 中国发布的盘点报告,目前全球有三款产品可以实现AI 生成可编辑 UI的功能,分别是即时 AI、Galileo AI 以及 Uizard。其中国外的两款产品仍停留在小范围内测阶段。目前,即时目前,即时 AIAI是全球首款可以是全球首款可以大规模让用户体验到大规模让用户体验到AI AI 生成可编辑生成可编辑 UI UI 设计稿功能的产品。设计稿功能的产品。u 即时即时 AIAI基于在线协作设计平台即时设计基于在线协作设计平台即时设计,利用大语言模型,让人们在网页端就可以通过自然语言
54、描述,实现可编辑 UI 设计稿的快速生成。使用即时 AI,只用简单的一句话描述,AI 就可以自动帮你生成出一个 UI 界面样板。AIGCAIGC应用场景:应用场景:UIUI设计领域设计领域-特定优化特定优化AIAI工具出现工具出现市面UI设计产品对比UI界面样板展示AIGCAIGC应用场景:应用场景:UIUI设计领域设计领域-特定优化特定优化AIAI工具出现工具出现u 作为实用化的生产力工具,作为实用化的生产力工具,即时 AI 拥有组件识别能力,不仅可以识别单一图层,还能够识别页面上,如按钮、标题栏、底栏等。通过组件级别的识别能力,设计师可以通过该工具生成符合不同设计规范的设计稿。u 设计师只
55、需要输入文字指示只需要输入文字指示,能快速获得初步符合需求且可编辑,图层结构清晰的 UI 设计稿。在常规的 UI 设计流程中,一个页面平均需要花费设计师约约 30 30 分钟的时间分钟的时间,而使用即时 AI生成页面的时间只是写提示词(prompt)加上等待大模型作出反应的模型作出反应的 1 1 分钟分钟,且随着版本更新生成时间还会被再度压缩。u 没有智能化到能取代设计师的程度没有智能化到能取代设计师的程度,生成内容需要修改后才可使用。生成的范围也有限制在 AI生成式工具出现后,UI 设计的形态会发生转变:首先提出需求之后,设计者可以在短时间内向甲方提供多种设计方案以供选择,并快速对进一步的需
56、求进行反馈和调整。另一方面,若遇到相对简单、以往出现过的需求,可以在短时间内快速完成任务。根据描述语言设计界面AI生成的设计稿u 广告服务商蓝色光标,网传在4月12日华东区总部运营采购部下发邮件称,“为了遏制核心能力空心化,全面拥抱AIGC打下基础”,将无期限全面停止创意设计、文案撰写等相关外包支出。4 4月月1313日,蓝色光标大涨日,蓝色光标大涨9.77%9.77%,盘,盘中一度涨超中一度涨超18%18%。u 事件回顾:事件回顾:2月15日,蓝色光标旗下蓝色宇宙宣布,将成为百度文心一言首批生态合作伙伴,并把百度领先的智能对话技术成果应用在 AIGC 营销场景,后续蓝色光标也将全面体验并接入
57、文心一言的能力。4月11日,蓝色光标表示已与微软广告达成核心代理的战略合作,已获得微软云官方 AI 调用和训练许可:目前微软云上线的是OpenAI ChatGPT(GPT-3.5)的相关服务,待日后微软部署完成微软部署完成GPT-4GPT-4相关服务后,蓝色光标即可同步使用相关服务后,蓝色光标即可同步使用。AIGCAIGC应用场景应用场景:广告行业:广告行业-与与AIAI深度结合降本增效深度结合降本增效旗下蓝标传媒与微软广告达成合作外包类型详解类型类型具体内容具体内容创意设计包括但不限干平面设计类(海报、长图、KV)3D 建模、插画、动画、Kevnote/PPT 美化等,暂不包括视频拍摄和制作
58、类文案撰写即所有文档整理、撰写类的外包工作,包括但不限于:稿件撰写、创意文案撰写、创意脚本、活动相关文案撰写、报告整理、资料收集等方案撰写包括竞标方案、执行方案、活动策划等,既包括联合竞标产生的额外成本,也包括方案里的创意设计相关部分短期雇员不含实习生,主要是指计时付薪的个人外包u 产品赋能产品赋能:3月15日消息,可口可乐最新发布了一则创意广告,该广告运用Stable Diffusion技术完美还原了世界名画艺术展,并实现了多个世界名画的动态表现。可口可乐与全球咨询公司贝恩公司签署协议,将通过OpenAI公司探索提高营销创造力的新方法,并要在人工智能上争当先锋,全面提升运营能力。未来,可口可
59、乐将在其营销和客户体验中使用ChatGPT和DALL-E2平台制作个性化的广告文案、图像和消息。u 可口可乐需求变化可口可乐需求变化:从浅层品牌曝光目标到追求更深层次的品牌营销u AIGC 给内容营销生态带来的变化大幅降低内容生产制作成本从理解语义进化到了对语义的分析归纳。实现了从无到有生成内容。AIGCAIGC应用场景应用场景:广告行业:广告行业-营销生态新思路营销生态新思路可口可乐创意广告:世界名画动态表现u 微软已在New Bing尝试新的广告营销形式,3月29日,微软表示公司“正尝试在Bing聊天中插入广告”;420,英国金融时报,谷歌计划在未来几个月将生成式AI引入其广告业务,目前谷
60、歌已经在广告业务中使用AI创建简单提示(Prompts)鼓励用户购买产品。AIGCAIGC应用场景:广告行业应用场景:广告行业-New-New BingBing革新渠道革新渠道Bing聊天中的广告展示广告主要嵌入形式:回答内容中、内容后的链接、以及图片展示u AIAI模特已应用于品牌服装展示模特已应用于品牌服装展示。Levi Strauss&Co.是一家著名的牛仔服装品牌,近日宣布与数字时Lalaland.ai合作,利用其先进的人工智能技术,创建各种身材、年龄、尺码和肤色的AI生成的模特,以展示其服装系列。u Lalaland.ai是一家成立于2019年的阿姆斯特丹公司,通过通过AIAI技术让
61、时尚品牌和零售商能够创建超逼真的模特,满足不同的技术让时尚品牌和零售商能够创建超逼真的模特,满足不同的消费者需求消费者需求。该公司认为,通过这些包容性的虚拟形象,可以为时尚品牌、零售商和消费者提供更加个性化、包容性和可持续性的购物体验。AIGCAIGC应用场景应用场景:广告行业:广告行业-AI-AI模特模特真人模特(左)与AI模特对比(右)LALALAND AI模特收费套餐AIGCAIGC应用场景应用场景:广告行业:广告行业-AI-AI模特模特第一步:根据需要,选择从发型、到体型,和大小、肤色等一系列参数。甚至可以指定姿势、情感和其他选项。第二部:在LALALAND的软件页面中,根据AI模型进
62、行针对性服装设计,或将服装设计文件导入AI模型并进行修改,而无需进行任何实际物理样品的裁剪。第三部:当设计通过验证后,就可以生成3D服装的销售页面,开始进行销售。设计,销售和生产的关系不再遵循严格的时间关系,而是可以同步进行,缩短上市时间。LALALAND商业AI模特定制流程u 从3G时代到5G时代,互联网历经PC互联网、移动互联网,当前迈入AIGC新业态探索期,电商行业从电商行业从PCPC网页网页(以文字、图片静态内容为主以文字、图片静态内容为主)到传统货架电商再到直到传统货架电商再到直播电商播电商(以音视频流媒体动态内容为主以音视频流媒体动态内容为主),不断升级迭,不断升级迭代。代。u 市
63、面上的AI模特,主要由主要由Stable DiffusionStable Diffusion、Novel Novel AIAI、MidjourneyMidjourney三种应用生成三种应用生成,以Midjourney举例,想要生成一张AI模特图片,主要有以下三种方式:第一,文字描述的生成方式。第一,文字描述的生成方式。创作者将所需图片的主题内容、环境背景、构图镜头、参考方向、图像设定,以文字的形式描述出来,就可以得到一张AI图片。第二,文字描述加参考图片的方式,这也是第二,文字描述加参考图片的方式,这也是AIAI模模特生成的最多方式。特生成的最多方式。先在Midjourney上,上传一张服装图
64、片,再右键复制图片地址,然后输入关于AI模特的文字描述,就能让这件服装,成功穿到模特的身上。第三,参考图片加参考图片的方式,这种方式最第三,参考图片加参考图片的方式,这种方式最为简洁,但也最容易出错。为简洁,但也最容易出错。对此,操作者分别上传两张图片,一张是服装图片,要求背景最好是干净的,另一张是最终效果图片,然后将两张照片进行合成,最终呈现服装上身的效果。AIGCAIGC应用场景应用场景:电商平台:电商平台-全面赋能全面赋能国内平台AI模特展示AIGCAIGC应用场景应用场景:电商平台:电商平台-全面赋能全面赋能u AIGCAIGC使用户搜素定位效率提升使用户搜素定位效率提升:AIGC支持
65、用户通过语音/文字/图片/视频等多种方式输入信息,基于AIGC强大的算法能力,精确定位用户的购物需精确定位用户的购物需求求。将ChatGPT插件功能与电商平台结合将更有利于沉淀用户标签,使用户有效使用户有效“种草种草”并成功并成功“拔草拔草”,从而提升电商平台经营实力和盈利能力。u AIGCAIGC使电商平台营销能力升级:使电商平台营销能力升级:AIGCAIGC可以自动生成商品描述、推荐文案、商品介绍短视频等内容可以自动生成商品描述、推荐文案、商品介绍短视频等内容,帮助电商平台提高营销能力。ChatGPT生成营销文案D-ID生成商品介绍短视频-点开播放AIGCAIGC应用场景:应用场景:电商平
66、台电商平台-虚拟主播、数字人客服虚拟主播、数字人客服u AIGCAIGC虚拟数字人扮演直播、客服等角色,促进电商平台降本增效:虚拟数字人扮演直播、客服等角色,促进电商平台降本增效:对虚拟主播来说,“24“24小时全天候、不间断直播小时全天候、不间断直播”这一点可以轻松完成。微软天猫官方旗舰店曾推出“24小时全智能虚拟IP”带货,通过对后台知识库的不断学习,虚拟主播可以在直播期间自动介绍商品信息,并自主回答用户问题,与用户互动。市场调查显示,人们每周平均要花10到20分钟在电话上等待客服。如果按照正常人70岁的寿命计算,把这些时间都加起来,足足占去了一个人43天的时间。虚拟客服可以虚拟客服可以2
67、424*7 7全天候快速识别并回答大部分常见的客户查询,并全天候快速识别并回答大部分常见的客户查询,并快速、高效地给出准确的答复,极大的节省了用户的时间,可以给用户带来更加良好的体验。快速、高效地给出准确的答复,极大的节省了用户的时间,可以给用户带来更加良好的体验。中国联通虚拟主播AI客服-小微智能机器人u Shopify主营业务为SaaS订阅解决方案和商家解决方案旗下产品旗下产品ShopShop成为第一批受邀公司成为第一批受邀公司,其CEO表示Shop应用程序,将ChatGPT集成在内,买家可以向ChatGPT提出问题,就像个人助理一样。”当买家搜索产品时,当买家搜索产品时,AIAI就会根据
68、就会根据买家的要求进行个性化的推荐,通过扫描数百万种产品来简化买家的购物流程,帮助用户快速找到自己想要的东西。买家的要求进行个性化的推荐,通过扫描数百万种产品来简化买家的购物流程,帮助用户快速找到自己想要的东西。u 同时Shoify自身提供提供平台商品评论数据分析、标题及关键词优化、营销文案撰写、网站智能化开发编程平台商品评论数据分析、标题及关键词优化、营销文案撰写、网站智能化开发编程等多项功能,有效改善卖家运营效率及消费者体验。AIGCAIGC应用场景:电商独立站应用场景:电商独立站-平台建立平台建立Shop智能导购展示Shopify独立站创建界面u 剪刀、石头、布动画时长有7分21秒,而该
69、动画的制作团队仅有三人。幕后视频揭晓后,该动画引注,短时间内其幕后视频和动画本身均超过百万播放量。u AIAI制作简易动画,可代替部分制作流程制作简易动画,可代替部分制作流程。第一部分是用AI创建并生成动漫人物,建立它与演员之间的关联;第二部分是创作动漫场景;第三部分是合成并调整最终动漫效果。难点难点:直接用AI生成动画会出现帧与帧之间的差异不大,衔接起来并不完全连贯,会导致画面疯狂闪烁。第一部分:用用AIAI改画人物动漫改画人物动漫。这部分是用Stable DiffusionStable Diffusion完成的,同时采用了谷歌推出的DreamBoothDreamBooth扩散模型进行微调。
70、同时为了确保人物的动漫画风达到预期效果,作者们收集了经典动漫吸血鬼猎人吸血鬼猎人D D中的大量人物多角度截图,为AI进行预训练。并提前演员拍摄不同光照、多个角度、各类动作下的大量照片。AI在视频中的捕捉演员后,以吸血鬼猎人D为作画风格基础,画出演员长相的动漫风格人物来。AIGCAIGC应用场景应用场景:动画行业:动画行业-提升制作效率提升制作效率吸血鬼猎人D素材(左)与演员部分多角度素材(右)AI生成动画逐帧差异 第二部分第二部分:生成场景。这部分作者们直接用了虚幻引擎和里面自带的一些3D模型,来制作动漫背景。背景将大量场景照片合成起来,快速滚动形成。AIGCAIGC应用场景应用场景:动画行业
71、:动画行业-提升制作效率提升制作效率 第三部分第三部分:合成润色。此部分由,加3D模型在增加人物沉浸感的同时增加复古视觉特效使画面更加精良。背景照片(上图)与合成效果(下图)最终合成效果u 网易互娱AI Lab结合专业美术反馈迭代优化、开发AIxPose视频动捕软件。该软件已经处理了超过数十,并应用于游戏剧情动画、热门舞蹈动画等资源的制作流程。u 1 分钟的舞蹈动画,美术手工制作或需20多天,用AIxPose辅助制作仅需3天,整个流程缩短了整个流程缩短了80%80%以上以上。u 操作过程:1、动画师提供一段视频,AI动捕软件自动输出动作。2、虚拟人的动画可以完成手部精准捕捉。该软件支持单视角、
72、多个视角的视频,相比其他只支持单目识别的动捕软件,该软件能提供更高的动捕质量。AIGCAIGC应用场景应用场景:动画行业:动画行业-提升制作效率提升制作效率AIxPose角色捕捉AIxPose多个视角展示u 吸血鬼猎人D是由日本动画制作公司Madhouse于2001年发行的动画电影,仅针对我国国内情况而言,第11条的规定,Madhouse公司应对该电影享有著作权;同时根据第23条的规定,对该电影的著作权保护期限应为50年。u 2023年1月底,图库老大哥盖蒂图片社(Getty Images)以侵犯版权和商标保护权的名义,在伦敦高等法院起诉了Stability AI。u 2023 年4月11日,
73、国家网信办公布生成式人工智能服务管理办法(征求意见稿)生成式人工智能服务管理办法(征求意见稿)征求意见稿明确规定,利用生成式人工智能提供服务的主体对训练数据的合法性承担责任,不得含有侵犯知识产权的内容,以及服务前需要申报安全评估,不得利用AI生成内容损害他人形象名誉等内容。AIGCAIGC应用场景应用场景:动画行业:动画行业-侵权风险侵权风险盖蒂照片(左)Stable Difussion生成图像,上面有盖蒂标志(右)国外多位专业版权律师在Twitter上发声AIGCAIGC应用场景:游戏行业应用场景:游戏行业-触发形态升级和产业变革触发形态升级和产业变革u 游戏行业作为涵盖文本、图像、声音、视
74、频、3D内容及交互性的最复杂娱乐形式,自身具有较高的创作准入门槛及制作成本。随着AI技术的“爆发式”发展,AIGCAIGC在游戏领域的应在游戏领域的应 用有望全面带动游戏行业生产革命,其与游戏产业的用有望全面带动游戏行业生产革命,其与游戏产业的深度结合也受到了前所未有的关注。就如微软深度结合也受到了前所未有的关注。就如微软CEOCEO纳德拉所言,纳德拉所言,“AIGC“AIGC 堪比工业革命堪比工业革命”。u 长久以来,在传统游戏开发领域,成本、质量和效率三者组成了一个只能三选其二的“不可能三角”。如今,借由如今,借由AIGCAIGC强大的功能,游戏开发者可以打破传统游戏研发的束缚,降低开发门
75、槛和成本,显著提升游戏开发效率。强大的功能,游戏开发者可以打破传统游戏研发的束缚,降低开发门槛和成本,显著提升游戏开发效率。AIGC可通过机器学习、深度学习和自然语言处理等技术为游戏开发、剧情策划、人物交互、上线运营等提供精准强大的赋能。u 投资公司 a16z 不久前发表过一篇研究文章AIGC 在游戏中的革命,认为在所有娱乐类目中,游戏会是游戏会是生成式生成式 AI AI 影响最大的领域。影响最大的领域。u 主要因素:主要因素:1.游戏产业的吸金能力天然强大。2.游戏是最为复杂的艺术创造形式,也是体验最为丰富的艺术形式。3.AIGC 在游戏环境中的行动空间更大,世俗约束相对较少。AI对各领域的
76、影响程度(游戏最大)AIGCAIGC应用场景:游戏行业应用场景:游戏行业-业内广泛应用业内广泛应用u 在2022年末才正式崛起的AIGCAIGC技术,已在游戏行业蛰技术,已在游戏行业蛰伏多年伏多年。在游戏厂商探索工业化开发管线的进程中,相关的AIGC技术亦在如影随形发展。以美国游戏厂商美国游戏厂商RockstarRockstar(以下简称(以下简称“R“R星星”)为例,在旗下游戏)为例,在旗下游戏侠盗猎车手侠盗猎车手5 5和荒野大镖客和荒野大镖客2 2中的中的NPCNPC交互、交互、人物建模、环境渲染等方面均用到了人物建模、环境渲染等方面均用到了AIGCAIGC技术进行辅技术进行辅助开发。助开
77、发。u 在国内,近年来已有越来越多的游戏厂商走上了工业在国内,近年来已有越来越多的游戏厂商走上了工业化之路,并已将化之路,并已将AIGCAIGC技术接入了工作流。技术接入了工作流。腾讯腾讯AI LabAI Lab便将便将AIGCAIGC技术应用于技术应用于MOBAMOBA、FPSFPS、棋、棋牌等游戏品类中,牌等游戏品类中,相关技术目前在旗下王者荣耀和平精英使命召唤手游等游戏中已有实际应用,在智能NPC、智能游戏角色动作等方面实现了AI化。网易伏羲实验室则在其官网中指出,已将网易伏羲实验室则在其官网中指出,已将AIAI技术技术应用于游戏资源生产,应用于游戏资源生产,既包括在逆水寒天谕等MMOR
78、PG端游中的表情、语音、动作合成,也包括学习用户行为特征生成游戏内的社交关系、消费方向以及对战策略推荐。上海上海“游戏四小龙游戏四小龙”中的米哈游和莉莉丝在中的米哈游和莉莉丝在AIGCAIGC浪潮中虽然低调,但并未隐身。浪潮中虽然低调,但并未隐身。AIGC在游戏行业的应用AIGCAIGC应用场景:游戏行业应用场景:游戏行业-降低降低开发成本,替代重复性工作开发成本,替代重复性工作u AIGCAIGC在美术图标、角色对话、剧情策划、游戏互在美术图标、角色对话、剧情策划、游戏互动等方面进行技术辅助,从而实现降本增效,动等方面进行技术辅助,从而实现降本增效,将进一步降低制作门槛,推动游戏创新活跃等。
79、理想情况是提升现有流程效率10%-20%。美术方面:利用美术方面:利用AIAI生成基础美术素材等,生成基础美术素材等,能够高效地完成模型贴图、素材拼接等工作。程序方面,基于游戏引擎优化代码编写流程程序方面,基于游戏引擎优化代码编写流程中的重复性工作,中的重复性工作,只需AI提供修改思路即可对代码进行简单的批量修改。“AIGC“AIGC的引入的引入可以在游戏开发成本、质量、效率之间实现可以在游戏开发成本、质量、效率之间实现一种难得的平衡。一种难得的平衡。”对于以广告为主要变现模式的休闲游戏而言,AIGCAIGC在降低制作门槛与成本的同时,在降低制作门槛与成本的同时,还有助于优化流量投放效果,提升
80、游戏的用户留存,并通过快速迭代生产扩大产品矩阵,触达广告变现天花板。在游戏内容方面,在游戏内容方面,AIAI生成图片、音乐等有望生成图片、音乐等有望丰富游戏内容丰富游戏内容,提升玩家交互体验。可根据玩家需求个性化定制外观、服装、场景等美术资源,自由改变游戏背景音乐的风格等。Notion AI生成的游戏文档大纲AI绘画-Midjourney生成美术素材AIGCAIGC应用场景:游戏行业应用场景:游戏行业-Unity-Unity插件构造游戏世界插件构造游戏世界u 英特尔、英特尔、Procedural WorldsProcedural Worlds和和UnityUnity联手创建了采用联手创建了采用
81、Gaia MLGaia ML的的Intel Game Dev AI ToolkitIntel Game Dev AI Toolkit(适用于(适用于。费的工具包将硅优化的人工智能功能与复杂的游戏世界构建结合到一个无缝集成的Unity插件中,确保为游戏提供最有效确保为游戏提供最有效的人工智能驱动功能的人工智能驱动功能。工具包架构通过使用英特尔OpenVINO和Unity Barracuda神经网络推理库的推理层与Unity集成。因此,设计师可以立即将不同的风格应用到自身的游戏中,无需昂贵的重新开发。因此,设计师可以立即将不同的风格应用到自身的游戏中,无需昂贵的重新开发。u 工具包特点:工具包特点
82、:在未来将进一步增强在未来将进一步增强3D3D对象重建、高分辨率对象重建、高分辨率3D3D人体数字化、自动声音生成和面部动画等功能。人体数字化、自动声音生成和面部动画等功能。提供对游戏内对象检测的能力。提供对游戏内对象检测的能力。工作室可以通过此功能提供人工智能辅助目标识别或创建mod以改进游戏,从而实现根据玩家的偏好智能地提升玩家的游戏体验并为玩家构造自己的游戏世界。人工智能驱动系统-样式传输和Uinty渲染Intel Game Dev AI Toolkit工具包AIGCAIGC应用场景:游戏行业应用场景:游戏行业-虚拟虚拟NPCNPC提升用户游戏体验感提升用户游戏体验感u AIAI虚拟虚拟
83、NPCNPC与用户实时交互,提升用户游戏体验与用户实时交互,提升用户游戏体验感感:高级 NPC 行为和对话的开发平台Inworld AI调查了美国1,000多名16-50岁的游戏玩家发现,这些受访者中的大多数人认为,人工智能的最新进展可能会改变游戏的面人工智能的最新进展可能会改变游戏的面貌,并开创一个沉浸式体验和与具有个性貌,并开创一个沉浸式体验和与具有个性的的 NPC NPC 互动的新时代互动的新时代,并且能够在类似 ChatGPT 的语言模型的帮助下进行无脚本的语音到语音对话以及多模态行为和感知系统。u 报告称:81%81%的人愿意为具有改进的人愿意为具有改进 AI AI 的的 NPC N
84、PC 的游戏支付更多费用的游戏支付更多费用;84%;84%的游戏玩家同意当前的游戏玩家同意当前的的 NPC NPC 对游戏玩法产生了积极的影响对游戏玩法产生了积极的影响;超过一半(52%)不喜欢重复的 NPC 对话;76%的人希望看到具有更好态势感知能力的 NPC;78%的人会花更多时间与高级AI NPC一起玩游戏。国内首款为NPC配备人工智能引擎的手游-网易逆水寒AIGCAIGC应用场景:游戏行业应用场景:游戏行业-ChatGPTChatGPT生成代码优化开发流程生成代码优化开发流程u AI AI 爱好者爱好者 AmmaarAmmaar Reshi Reshi使用使用GPT-4GPT-4生成
85、了贪吃蛇的生成了贪吃蛇的代码,并明确要求它给出支持游戏运行的代码,并明确要求它给出支持游戏运行的 HTML HTML、CSS CSS 和和 JavaScriptJavaScript配置。配置。生成完毕后,将代码运行在用于构建和运行软件的工程项目中。Reshi表示游戏起初未能顺利运行,通过通过ChatGPTChatGPT对代码进行微调对代码进行微调,并并同步同步提供了提供了代码代码改动的相应解释改动的相应解释。u 该模型生成该模型生成了了1993 1993 年的太空飞车(年的太空飞车(SkyRoadsSkyRoads)游戏游戏代码。代码。AI迷 Javi Lopez使用GPT-4打造了可基础运行
86、的毁灭战士代码。u AIGCAIGC可以可以通过代码通过代码实现实现内容的事实生成内容的事实生成,使得游戏内容使得游戏内容上的创新。上的创新。微软的模拟飞行为例,模拟飞行基于真实世界和仿真的飞机,让玩家体验纯粹的核心循环驾驶飞机,飞行各个地区。整个游戏世界依赖Bing Map(必应卫星地图)构建真实地表,通过Azure AI人工智能技术创建事物细节,运用Project xCloud云服务保证数据交互。模拟飞行与普通的飞行模拟游戏相比的最大差异是模拟飞行与普通的飞行模拟游戏相比的最大差异是基于基于AIAI技术技术实时生成内容,包括地图、景物、气象等实时生成内容,包括地图、景物、气象等。Ammaa
87、r Reshi利用GPT-4生成的太空飞车微软模拟飞行游戏AIGCAIGC应用场景:游戏行业应用场景:游戏行业-辅助游戏测试,减少发布风险辅助游戏测试,减少发布风险u 游戏测试游戏测试为为游戏开发周期中游戏开发周期中的的关键环节,其目的是关键环节,其目的是保证游戏质量,减少发布后的风险,并为玩家提供保证游戏质量,减少发布后的风险,并为玩家提供更好的游戏体验。更好的游戏体验。在游戏测试中,测试人员将会对不同的测试目标使用不同的测试技术,依据游戏玩法、游戏流程内容、游戏系统、机型适配等进行测试,记录游戏中发现的问题,并通过管理工具报告Bug,向开发人员反馈问题。u 伴随游戏生产量的增长以及游戏复杂
88、度的提高,游戏测试的需求爆发,而AIAI可以在游戏测试中执行一可以在游戏测试中执行一些自动化任务,如执行基本的功能测试、性能测试、些自动化任务,如执行基本的功能测试、性能测试、兼容性测试等,以实现更高效地测试。兼容性测试等,以实现更高效地测试。u 在具体的游戏测试应用中,例如日本卡牌游Shadowverse利用AI测试卡牌组合,利用数据利用数据训练出可以玩游戏的训练出可以玩游戏的AIAI,从而可以自动化的进行游,从而可以自动化的进行游戏对局,用来发现可能存在的戏对局,用来发现可能存在的bugbug和平衡问题和平衡问题,大大提高了效率,降低了测试成本。天天跑酷手游利用AI自动化测试游戏中的各种动
89、作和游戏中障碍物安排的合理性。日本卡牌游戏Shadowverse测试原理u 虚拟导师将成为虚拟导师将成为GPTGPT在教育行业的主要表现形式之一。在教育行业的主要表现形式之一。在第一批受邀与OpenAI合作的公司中包含多邻国Duolingo汗学院(Academy)两家教育类公司。u 多邻国Duolingo 拥有简单的用户界面和有趣但竞争激烈的排行榜,支持 40 种语言的 100 多门课程。学习者通过在手机上点击和滑动,从简单的词汇练习到复杂的句子结构。如果学习者想要超越基本的熟练程度,理解语法规则会很有帮助。但真正精通一门语言需要交谈,最好是与母语人士交谈,但并非每个人都能接触到。u 多邻国与
90、OpenAI合作基于GPT-4,在Duolingo Max中添加推出两个新功能:角色扮演(AI对话伙伴)添加了回答反馈功能AIGCAIGC应用场景:教育行业应用场景:教育行业-虚拟导师虚拟导师多邻国界面展示Duolingo Max界面回答反馈角色扮演u 可汗学院是一个在线教育平台可汗学院是一个在线教育平台,它发布了使用GPT-4来创建和优化课程内容,提供个性化的学习建议和,KhanmigoKhanmigo一个由可汗学院(一个由可汗学院(Khan AcademyKhan Academy)开发的)开发的AIAI在线教育工具在线教育工具,它使用了OpenAI的最新语言模型GPT-4。u Khanmi
91、goKhanmigo可以作为学生的虚拟导师,也可以作为教师的课堂助手。可以作为学生的虚拟导师,也可以作为教师的课堂助手。作为教师的课堂助手,帮助教师管理和评估学生的学习情况,提供更多的支持和资源。从学生学习角度,可以增加学生的参与度和学习动力,通过与Khanmigo进行有趣和有意义的对话,激发他们的好奇心和创造力。同时为学生提供更个性化和适应性的学习体验,根据每个学生的能力和进度给予合适的指导和反馈,扩大学生的视野和知识面。AIGCAIGC应用场景:教育行业应用场景:教育行业-虚拟导师虚拟导师Khanmigo界面及内容展示引导学生解决问题老师交流教学内容引导学生兴趣爱好u 在场景应用上 AI
92、技术与 AI 应用核心应用场景可归纳为智能营销、智能风控与合规、客服与渠道、安认、智能营销、智能风控与合规、客服与渠道、安认、智能运营以及保险与投研投顾等六大应用智能运营以及保险与投研投顾等六大应用领域基本涵盖金融机构前中后台中的市场营销、产品设计、风控与合规、客户服务、运营管理等。主要由数据智能、自然语言处理、计算机视觉、知识图谱和智能语音等五大技术支撑实现,互相之间的支撑关系。AIGCAIGC应用场景:金融行业应用场景:金融行业-涵盖金融机构前中后台涵盖金融机构前中后台AI覆盖金融场景u StripeStripe专注于网络支付,为中小型企业和个人提供在线支付服专注于网络支付,为中小型企业和
93、个人提供在线支付服务,通过收取费率和手续费方式盈利。务,通过收取费率和手续费方式盈利。与OpenAI合作,为其提供订阅服务支付方式的同时与GPT-4相结合。Stripe 应用机器学习团队的产品负责人 Eugene Mann表示:“我们的任务是确定 Stripe 中可以通过大型语言模型加速的产品和工作流程,并真正了解 LLM 在当今哪些方面运作良好,哪些方面仍然存在困难,但只要能够访问 GPT-4,我们就会意识到,所有这些问题都可以用 GPT 解决得非常好。”u 从三个方面升级体验:从三个方面升级体验:更好地了解用户的业务更好地了解用户的业务:为了更好地服务用户并提供正确类型的支持,准确了解每个
94、企业如何使用该平台并相应地定制支持。回答有关文档的支持问题回答有关文档的支持问题:支持开发人员。通过广泛的技术文档和强大的开发人员支持团队来回答技术问题或解决问题。社区平台上的欺诈检测社区平台上的欺诈检测:Stripe在Discord等论坛上保持着一个强大的社区。互联网中恶意行为者进入这些论坛,试图通过社区成员获得关键信。GPT4仅仅通过分析Discord中帖子的语法,可以标记,Stripe的反欺诈团队跟进的账户,并确定欺诈者行为。GPT-4可以帮助扫描入站通信,识别恶意行为者的协调活动。AIGCAIGC应用场景:金融行业应用场景:金融行业-线上支付平台线上支付平台Stripe界面展示及提问过
95、程u 对出版行业的影响:对出版行业的影响:依靠ChatGPT,非专业作家在非专业作家在几个小时内完成一本30页的儿童插图电子书,并于今1月亚马逊的Kindle自助出版部门出售。截至今年2月中旬,亚马逊Kindle商店中,已经出现了超过200本且数量仍在增长,将ChatGPT列为作者或合著者的电子书,包括如何使用ChatGPT写作和创作内容、家庭作业的力量和诗集宇宙的回声等。u 全球知名科幻杂志Clarkesworld(克拉克世界)最近关闭了投稿通道,起因是在2月收到了700篇由人类撰写的投稿和500篇由AI生成的故事。投稿数量有着异常激增,但很多在质量上却几近雷同。投稿数量有着异常激增,但很多
96、在质量上却几近雷同。该杂志负责人表示,许多故事几乎都是按照同一个语言模型生成,无论从文字风格还是剧情结构,都没有任何创意。AIGCAIGC应用场景应用场景:文学创作:文学创作-利与弊相博弈利与弊相博弈ClarkesWorld接收稿件数量(截止2023年2月20日)聪明的小松鼠:储蓄与投资的故事u ChatGPTChatGPT极大改变律师工作状态。极大改变律师工作状态。律师工作的大部分工作采用书面文字的形式电子邮件、备忘录、诉讼文书、回应请求、各种事务性文件等。现有的技术在某些方面使这些内容的生成更容易,例如允许使用模板和自动文件组装工具,这些工具以相对温和的方式改变了大多数律师的工作。Chat
97、GPTChatGPT等人工智能工具有望改变生成更广泛法律等人工智能工具有望改变生成更广泛法律文件和信息的方式。文件和信息的方式。u ChatGPTChatGPT生成的内容并不是完善的,存在一定的问题生成的内容并不是完善的,存在一定的问题。例如,法律文件不完整,对某些主题的讨论缺乏细微差别。此外,将人工智能工具用于法律相关服务会引发一系列监管和道德问题,例如与未经授权的法律执业有关的问题。人工智能引起人们广泛担忧的最主要原因在于,它在某种程度上可能会起到影响他人价值判断的作用会起到影响他人价值判断的作用,甚至某种程度上会形成一定的心理效应。AIGCAIGC应用场景:法律行业应用场景:法律行业-改
98、变工作状态改变工作状态ChatGPT可替代性ChatGPT赋能方式AIGCAIGC应用场景:应用场景:XRXR行业行业-有望迎来新一轮增长有望迎来新一轮增长u AIGCAIGC推动元宇宙发展。推动元宇宙发展。AIGCAIGC 为元宇宙内为元宇宙内容生成提供解决方案。容生成提供解决方案。基于生成式AI自身优势,更高效的生成3D场景,提高用户体验。u 元宇宙的发展使元宇宙的发展使AR/VRAR/VR等设备需求增多。等设备需求增多。AI技术一直是支持AR产业发展的基石,众多AR公司采用AR+AI的发展模式u AIGCAIGC的发展也降低了虚拟场景内容生成成的发展也降低了虚拟场景内容生成成本。制作成本
99、过高为本。制作成本过高为VRVR等虚拟电影制作主等虚拟电影制作主要问题,要问题,早前Oculus制作的一部5分钟的VR电影LOST,平均每分钟的成本就要100万美元,而一部普通电影的平均每分钟成本大约是10万美元,u IDC预测,2023年全球AR/VR设备出货量将同比增长31.5%。未来数年AR/VR设备将保持30%以上的增长,2026年出货量将达到3510万台。AR/VR/MR/XR介绍AIGCAIGC应用场景:医疗行业应用场景:医疗行业-在线问诊业务质量优化在线问诊业务质量优化u 医疗健康方面,医疗健康方面,AIGCAIGC技术可以通过对医疗数据的分析和技术可以通过对医疗数据的分析和处理
100、,实现疾病的早期预警和个性化诊疗,提高医疗服处理,实现疾病的早期预警和个性化诊疗,提高医疗服务的质量和效率:务的质量和效率:发表在科学公共图书馆数字健康杂志上的研究显示,人工智能系统人工智能系统ChatGPTChatGPT在美国执业医师资在美国执业医师资格考试中取得了合格或接近合格的成绩格考试中取得了合格或接近合格的成绩。研究作者们说:“在这项出了名难的专业考试中取得合格分数,并且在没有任何人类增援的情况下做到这一点,这是人工智能在临床领域走向成熟的一个显著里程碑。”u 医疗诊断方面,医疗诊断方面,AIGCAIGC技术可以通过对病例和医学影像等技术可以通过对病例和医学影像等数据的分析和处理,实
101、现疾病的早期诊断和预测。数据的分析和处理,实现疾病的早期诊断和预测。u 疾病治疗方面,疾病治疗方面,AIGCAIGC技术可以通过对患者数据的分析和技术可以通过对患者数据的分析和处理,实现个性化治疗和用药推荐,提高治疗效果和患处理,实现个性化治疗和用药推荐,提高治疗效果和患者满意度:者满意度:AIGC可实现高效在线问诊、为患者提供个性化治疗建议和用药推荐。ChatGPT等聊天机器人可充当心理医生,为咨询者提供心理疏导及建议。ChatGPT提供心理疏导AIGCAIGC应用场景:医疗行业应用场景:医疗行业-ChatGPTChatGPT回答癌症问题媲美专家回答癌症问题媲美专家u 2023年3月16日,
102、美国犹他大学医学院的研究人员在Journal of The National Cancer Institute Cancer Spectrum期刊发表了题为:Using Chat GPT to evaluate cancer myths and misconceptions:artificial intelligence and cancer information (使用使用ChatGPTChatGPT评估常见评估常见癌症谣言和误解癌症谣言和误解)的文章。u 这项研究结果显示,当被问及关于癌症的问题时,ChatGPT给出的答案的准确性和可靠性非常之高,与美国国家癌症研究所(NCI)提供的标准
103、答案相比,ChatGPT给出的答案正确率高达96.9%,负责评价答案的专家甚至难以分辨答案究竟是来自NCI还是ChatGPT,总体来说,总体来说,ChatChatGPTGPT的答案可读性更高,的答案可读性更高,也就是说更加通俗易懂。也就是说更加通俗易懂。ChatGPT对比美国国家癌症研究所AIGCAIGC应用场景:医疗行业应用场景:医疗行业-国内国内打造打造AI数字分身数字分身u 讲解眼健康知识、分享“天下无盲”的心愿、甚至饶有兴致与真人比拼绕口令,知名眼科医生陶勇的知名眼科医生陶勇的AIAI数字分数字分身,凭借身,凭借“以假乱真以假乱真”的声音、形象、表情等,成为跨的声音、形象、表情等,成为
104、跨界人工智能、医学健康、自媒体、科普多个领域的里程界人工智能、医学健康、自媒体、科普多个领域的里程碑式数字碑式数字IPIP。致力于聚焦AIGC神经渲染引擎的科创企业倒映有声(杭州倒映有声科技有限公司),是陶勇医生倒映有声(杭州倒映有声科技有限公司),是陶勇医生AIAI数字分身的技术打造团队数字分身的技术打造团队。u 倒映有声打造的陶勇AI数字分身,完全复刻陶勇真人形象与声音;在人物形象上,延续了陶勇医生在现实世界中的“眼科专家、科普传播大V、眼健康公益人”等专业标签。u AIAI数字分身相当于真人医生的无数个数字分身相当于真人医生的无数个“分身分身”。真人医生投入在问诊、查房、手术等专业工作环
105、节中时,AI数字分身可以在社交媒体上实现专业科普内容输出,将专业医生和医学专家所掌握的疾病防范、日常康养等知识进行普及,帮助用户在鱼龙混杂的社交媒体平台上,避开“伪科普”“假养生”等有害内容;另一方面,医学医学专家们也可以把握住新媒体机遇,将自己的专业水准能专家们也可以把握住新媒体机遇,将自己的专业水准能够在更多平台上得以展现,快速打造个人品牌影响力够在更多平台上得以展现,快速打造个人品牌影响力。陶勇医生AI数字分身联合腾讯视频,打造眼健陶勇医生AI数字分身科普视频在【学习强国】APP上海品茶推荐目录目录01020403AIGCAIGC发展过程发展过程AIGCAIGC软件应用软件应用AIGCAIG
106、C应用场景应用场景AIGCAIGC模型展望模型展望u 预训练基础模型(PFM)是大数据时代人工智能的重要组成部分。PFM 基于预训练技术,其目的是利用大量的数据和任务来训练一个通用模型,该模型可以在不同的下游应用中很容易地进行微调。u ChatGPT 是 PFM 应用的典型案例。它是从生成性预训练 transformer 模型 GPT-3.5 中微调得出,该模型利用了大量本文和代码进行训练。此外,ChatGPT 应用了来自人类反馈的强化学习(RLHF),这已经成为让大型 LM 与人类意图保持一致的一种有希望的方式。u PFM 有以下两大优势:要想提高在下游任务中的性能,模型只需要进行很小的微调
107、。其次,PFM 已经在质量方面得到了审查。将 PFM 应用于任务相关的数据集,而不是从头开始构建模型来解决类似的问题。u 广阔前景激发了大量的相关工作来关注模型的效率、关注模型的效率、安全性和压缩等问题。安全性和压缩等问题。AIGCAIGC模型展望模型展望:预训练基础模型为发展基石:预训练基础模型为发展基石PFM 在 NLP、CV 和 GL 领域的历史和演变PFM 在 NLP、CV 和 GL 领域的历史和演变u 开发新颖的应用程序开发新颖的应用程序:技术最先进的团队面临着广阔的前景。有很多创新可以做,特别是在信息检索,混信息检索,混合模态和训练合模态和训练/推理效率推理效率方面。可以推动科学的
108、界限,创建以前不可能的应用程序。u 寻找差异化寻找差异化:具有出色想法但仅有早期技术能力的团队现在可以访问工具,使得可以使用更丰富的记忆/上下文,更丰富的外部数据源和API,以及评估和缝合多个模型的能力来构建更丰富的应用程序。提供了更广泛的途径构建新颖且易防御的产品,即使用了广泛可用的技术。u 开发工具开发工具:喜欢基础设施的团队现在有一个高效率的机会,可以在编排编排OrchestractionOrchestraction(开发人员框架,(开发人员框架,数据源和动作,评估)数据源和动作,评估)和基础模型操作(部署,训练基础模型操作(部署,训练和推理的基础设施和优化工具)和推理的基础设施和优化工
109、具)方面构建工具。更加强大和灵活的工具将加强现有开发者的能力,并让更多的新开发者使用。u 基础模型相关的创新仍然会源源不断,基础模型相关的创新仍然会源源不断,但是其速度和质量将会受到很多限制。AIGCAIGC模型展望:模型发展方向模型展望:模型发展方向国外发展现状时间时间公司公司/模型名称模型名称后续发展后续发展2018/01Google/BERT2021年发布4810亿参数新版本;2023年2月发布Bard对标ChatGPT2018/02OpenAl/GPT基于GPT3.5发布了ChatGPT;2023年3月更新至 GPT42019/03百度/ERNIE2021年升级至3.0;2023年3月
110、推出文心一言2020/02微软/Turing NLG2023年推出基于GPT4的New Bing2021/04华为/盘古后续发布了NLP、CV多模态等多个大模型;2023年4月发布盘古大模型2021/06阿里/M6、Plug2022年9月,AliceMind-Plug(Plug后续版)和 M6-OFA(M6 后续版)合并为通义大模型2021/11商汤/书生2023年3月发布书生2.5;2023年4月发布日日新(SenseNova)2022/04腾讯/混元混元更新至2.0版本微信团队;2022年10月推出 WeML;2023年4月发布HCC2022/5FaceBook/OPT-175B2023年
111、2月发布LLaMA-13BAIGCAIGC模型展望:现阶段大模型梳理模型展望:现阶段大模型梳理u 阿里和百度都已在建设大模型生态,即以云平台输出模型能力,支撑更多应用生长。阿里在去年的云栖大上出出了了MaaSMaaS(模型即服务,(模型即服务,ModelsasaServiceModelsasaService),李彦宏在半个月前也提及了这一概念。阿里去年11月初推出模型社区“魔搭”,上线时汇集了达摩院的300多个开源模型。百度在其深度学习框架飞桨平台中设置了供开发者调用的“模型库”。u AIAI大模型的出现是一个划时代的里程碑,人类将进入到一个全新的智能化时代大模型的出现是一个划时代的里程碑,人
112、类将进入到一个全新的智能化时代,就像工业革命一样,大模型将会被各行各业广泛应用,带来生产力的巨大提升,并深刻改变我们的生活方式。u 训练超大规模的语言模型围绕算法、算力、数据三方面算法、算力、数据三方面。以ChatGPT为例:微软为OpenAI斥资数十亿美元,使用3万多个英伟达A100打造超算。数据方面,目前仅依靠少样本数据来训练模型,但数据可用性仍是一大难题。训练出真正优秀的大语言模型,不仅需要耗费资本耗费资本,还需要足够多的时间足够多的时间。2022年,GPT-4模型训练完成后,仍需6个月的时间,进行了微调和测试。u 亚马逊亚马逊BedrockBedrock为垂类模型技术,主要形式为个性化
113、型为垂类模型技术,主要形式为个性化型定制定制+数据隐私,数据隐私,让生成式AI技术变得普惠。根据Grand View Research的估计,到2030年,生成式AI市场价值可能接近1100亿美元。开发者自行定制模型,并构建属于自己的生成式AI应用程序。在训练时,Bedrok会为开发者创建一个基础模型的副本,并对此私有副本进行训练。其中,所有的数据都经过加密的,并不会用于训练底层模型。开发者通过在Amazon S3中提供一些标注示例来为特定任务微调模型,无需大量个人数据无需大量个人数据就能产生比较满意的结果。Bedrock与平台上其他的工具和功能配合使用,开发者无需管理任何额外的基础设施。AI
114、GCAIGC模型展望模型展望:亚马逊亚马逊BedrockBedrock平台模型新方向平台模型新方向 自研模型Titan与第三方AI21 Labs、Anthropic、ta i ity 模型详解种类种类介绍介绍 Amazon Titan由 AWS 开发的一系列基础模型,用于各种与文本相关的任务,例如文本摘要、生成、分类、开放式问答、信息提取、嵌入和搜索。Jurassic-2一个多语言LLM用于生成文本、翻译语言、回答问题。Claude一个文本处理和对话工具的AI机器人。Stable Diffusion文本到图像工具,用于生成独特、逼真、高质量的图像、艺术、徽标和设计。u AWS Bedrock
115、AWS Bedrock 和和 OpenAIOpenAI对比:对比:Bedrock 和 GPT 都是基于大量数据进行预训练的基础模型,但 Bedrock 源的各种模型,而 GPT 是来自 OpenAI 的特定模型。Bedrock 提供无服务器体验,无需管理基础设施即可集成和部署模型。Bedrock可确保使用客户数据实现更加无缝和安全的定制流程,旨在帮助企业使用自身的数据来微调特定用例的基础模型。u 应用举例应用举例:营销经为新品开发广告创意,只需向Bedrock提供标注过的最佳广告,以及新品描述,Bedrock就能自动生成媒体推文、展示广告和产品网页。同样的,所有数据都进行了加密,任何客户数据都
116、不会被用于训练底层模型。目前,目前,Coda AICoda AI、DeloitteDeloitte、埃森哲、埃森哲、InfosysInfosys等合作伙伴等合作伙伴已经使用已经使用BedrockBedrock。AIGCAIGC模型展望模型展望:垂类模型:垂类模型-亚马逊亚马逊BedrockBedrock平台平台 AWS使用生成式 AI进行构建 Bedrock功能展示u 彭博社重磅发布为金融界打造的大型语言模型(LLM)BloombergGPT。模型依托彭博社的大量金融,有500亿参数的语言模型支持金融行业内的各类任务。该模型在金融任务上的表现远超过现有模型。该模型在金融任务上的表现远超过现有模
117、型。u 彭博社主要是一家金融数据公司,数据分析师在公司成立的四十年的时间里收集了大量的金融文件,拥有广泛的金融数据档案,涵盖了一系列的主题。将这些数据添加到公共数据集中,以创建一个拥有超过7000亿个标签的大型训练语料库。u 优势:特定领域模型仍有其不可替代性且彭博数据来源可靠,数据不同于传统的网络爬取数据,网络上的数据有重复和特定领域模型仍有其不可替代性且彭博数据来源可靠,数据不同于传统的网络爬取数据,网络上的数据有重复和错误,保证数据来源可靠错误,保证数据来源可靠。AIGCAIGC模型展望模型展望:垂类模型:垂类模型-BloombergGPTBloombergGPTBloombergGPT
118、五项测试结果展示测试项目测试项目内容内容ConvFinQA针对金融领域的问答数据集,包括从新闻文章中提取出的问题和答案,旨在测试模型对金融领域相关问题的理解和推理能力。FiQA SA情感分析任务,测试英语金融新闻和社交媒体标题中的情感走向。Headline标题,数据集包括关于黄金商品领域的英文新闻标题,标注了不同的子集。任务是判断新闻标题是否包含特定信息,例如价格上涨或价格下跌等。FPB金融短语库数据集包括来自金融新闻的句子情绪分类任务。NER命名实体识别任务,针对从提交给SEC的金融协议中收集金融数据,进行信用风险评估。测试结果测试结果AIGCAIGC模型展望模型展望:垂类模型:垂类模型-M
119、arketingGPTu 品牌数字化营销运营服务商Whale 帷幄发布了国内首个MarketingGPTAliviaAlivia,这是一个专为Marketing打造的类ChatGPT产品。从前期内容生产、管从前期内容生产、管理到审核、发布,及后期数据分析到运营优化,它都能理到审核、发布,及后期数据分析到运营优化,它都能独立完成整个营销运营工作的一整套闭环。独立完成整个营销运营工作的一整套闭环。u Alivia只需通过 人机对话 的协作方式,就可以:轻松设计轻松设计CampaignCampaign 自动生成个性化图片和视频自动生成个性化图片和视频 根据个性化标签,精准一键投放根据个性化标签,精准
120、一键投放 随时总结和分析数据随时总结和分析数据u 根据锐观咨询预测,到到20232023年,我国直播电商市场市场年,我国直播电商市场市场规模将达到规模将达到37749.537749.5亿元。亿元。这也意味着专注于数字营销的Alivia将大有作为。帷幄创始人叶生晅认为:AGI(通用人工智能)不会替代人类,而是极大地扩展了人类的能力边界。u 任何可以用语言表达自己想法的人,无论专业知识如何,都可以使用Alivia来完成日常工作,并且随着每个人的随着每个人的使用频率增加,使用频率增加,AliviaAlivia将会越来越理解用户意图,成将会越来越理解用户意图,成为为tata的专属助理。的专属助理。而这
121、种人机协作模式背后,是未来工作方式的彻底重塑。Alivia展示2017-2023年中国直播电商市场规模预测-锐观咨询u GPT虽然强大,但并非在所有场景下都是最佳选择。对于特定的任务,中等大小的模型反而可以更有效地捕捉领域相关的信息。在写小红书文案时,在写小红书文案时,AliviaAlivia就更加专注于时尚、美容、生活方式就更加专注于时尚、美容、生活方式等主题,因而它生成的内容也就更符合用户预期。等主题,因而它生成的内容也就更符合用户预期。u 主要功能:文案编辑 海报调整 与AI单次对话,连续对话,随意切换,选定内容深度编辑 提供商品主图,即可得到模特上身效果,可以随意变换长相。任意品牌都可
122、以通过任意品牌都可以通过AliviaAlivia模型,生产出万级、十万级的内模型,生产出万级、十万级的内容容 ,符合新范式,符合新范式Model as a ServiceModel as a Service的定义的定义 直播带货脚本生成直播带货脚本生成:撰写任意商品的直播带货脚本,提升直播带货效率。催单话术撰写催单话术撰写:利用Alivia撰写催单话术,可极大提升客户留存率,帮助主播更好带货。对异常数据实时可视化监测,从而提高成交密度,确保转化率回到上升状态。对直播数据及时复盘,一键生成可视化看板,赋能直播数据化流程。AIGCAIGC模型展望模型展望:垂类模型:垂类模型-MarketingGP
123、TAI带货详解带货详解直播数据复盘AIGCAIGC模型展望:模型展望:垂类模型垂类模型-Personalization模块个性化体验模块个性化体验u 大语言模型具有强大的文字理解和处理能力。文档、数据、对话,均可以进行分析和整理。不过,但得到与用户预期一致的答案仍需不断但得到与用户预期一致的答案仍需不断调整。具体解决方案:调整。具体解决方案:1、需要反复通过调整prompt去引导模型;2、模型不具有存储功能,退出当前聊天后,不能进行数据保存。u 为解决以上问题问题,帷幄提出Personalization模块:记录记录用户用户兴趣兴趣,以及当LLM没有给出满意的回答时,用户是如何进行调整。用户在
124、每次对话时,大模型都能通过Personalization,提前提前预知用户预知用户喜好喜好。Personalization模块还会基于对基于对用户用户过往过往习惯的理解,给出一些习惯的理解,给出一些PromptPrompt建议建议,让使使用体验更加个性化用体验更加个性化。u AGI-lization营销时代,对话Alivia将改变营销人员工作方式与企业商业增长模式,重塑MarTech新范式。Personalization模块工作原理u 捷成股份子公司世优科技在4月20日发布AI数字人产品“世优BOTA”,世优BOTA是数字人+AI技术的关键一步,将大幅提升数字人智慧化服务垂直产业能力,降低企业
125、AI模型训练难度和成本。u 解决三个痛点:1.AI指令式沟通,维护成本高 2.传统页面长链路,购买效率低 3.人机交互难拟真,情感链接弱u 根据世优科技官方介绍,其主要特点包括:专属定制专属定制,垂直领域;灵活部署灵活部署,确保数据安全;反馈及时反馈及时,保证精准输出;永不掉线永不掉线,自动化服务;持续进化持续进化,越用越聪明;形象焕新,形象焕新,让服务更有温度。AIGCAIGC模型展望:模型展望:垂类模型垂类模型-世优科技世优科技AI生成数字人流程世优BOTA线上终端应用场景产业环节应用领域相关标的上游云计算/芯片/IDC/光模块/服务器液冷/数据供给方浪潮信息(000977.SZ)、百度(
126、9888.HK)/英伟达(NVDA.O)、中芯国际(688981.SH)/中国曙光(603019.SH)、奥飞数据(300738.SZ)/新易盛(300502.SZ),光讯科技(220081.SZ)/海天瑞声(688787.SH)中游多模态 百度(9888.HK)、阿里巴巴(9988.HK)、腾讯控股(0700.HK)、京东集团(9618.HK)、宣亚国际(300612.SZ)、昆仑万维(300418.SZ)、风语筑(603466.SH)、云从科技(688327.SH)、商汤(0020.HK)NLP 阿里巴巴(9988.HK)、科大讯飞(002230.SZ)、百度(9888.HK)、金山办公(
127、688111.SH)、奥飞娱乐(002292.SZ)虚拟人 拓尔思(300229.SZ)、二六三(002467.SZ)、虹软科技(688088.SH)、汉王科技(002362.SZ)、顺网科技(300113.SZ)代码生成 微软(MSFT.O)视频生成 当虹科技(688039.SH)、商汤(0020.HK)下游电商 值得买(300785.SZ)内容生产 汉仪股份(301270.SZ)、中文在线(300364.SZ)、视觉中国(000681.SZ)、因赛集团(300781.SZ)、万兴科技(300624.SZ)、恒信东方(300081.SZ)营销 蓝色光标(300058.SZ)、浙文互联(600986.SH)、果麦文化(301052.SZ)、吉宏股份(002803.SZ)、易点天下(301171.SZ)虚拟人 捷成股份(300182.SZ)、天娱数科(002354.SZ)游戏 完美世界(002624.SZ)、腾讯控股(0700.HK)、汤姆猫(300459.SZ)、姚记科技(002605.SZ)政务 数字政通(300075.SZ)、金财互联(002530.SZ)C端应用 微软(MSFT.O)、谷歌(GOOGL.O)AIGC产业链图谱产业链图谱