上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

工业4.0俱乐部:ChatGPT认知白皮书(151页).pdf

编号:118891 PDF  DOCX  151页 13.80MB 下载积分:VIP专享
下载报告请您先登录!

工业4.0俱乐部:ChatGPT认知白皮书(151页).pdf

1、IChatGPT 认 知 白 皮 书(讨论稿)(2023 年 2 月)作者:杜玉河工业 4.0 俱乐部 工业人工智能创新中心 开源工业联盟重要提示:本报告仅供内部研究使用,不做投资参考,未经允许,不得复制与转发。I前前言言虽然我们已经可以开始用 ChatGPT 进行聊天,写出一些让人想不到的东西。但如果想了解开源人工智能,想了解 ChatGPT 完整的内容时。我们还需要看各方面的报告,将信息进行拼图。从这一角度看,人工智能要走的路还很多。我从各种渠道采集了各种的报告,希望能从一个较客观我的角度来写一份报告。让系统了解这一技术进步,以及这处技术给技术发展、产品发展、人工智能的解决方案及各种应用场

2、景带来哪些好处。对于普通的公司与普通人有什么样的影响呢?结合这些年的工作,以及从 2020 年开始展开的认知对抗的经历,给大家尽可能呈现出一个客观我的场景。客观来讲,ChatGPT 这一次热潮本身就是由 AIGC 技术本身操纵出来的。他在与大家聊天的同时,也在生成着大家关注的文章,带着节奏。过去人工智能技术是由人帮人工智能技术去宣传与推广。而这一次是人工智能自己为自己炒作。当结合从去年底开始硅谷的裁员潮,可以看出传统领先的企业已开始采用新技术为自己提升生产力。但这并没有止步于高科技公司。带来的影响将是社会级的变化。对于传统的人类来讲,是一次机会,同时也是一次挑战。杜玉河2023 年 2 月 2

3、1 日龙抬头I报告导读报告导读ChatGPT 是 0penAl 开发的智能聊天机器人程序。不仅能像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务。ChatGPT 自发布以来爆火全球,月活破亿用时仅 2 个多月,被称为史上用户增长最快的消费者应用。凭借其功能多样,ChatGPT未来的市场规模想象空间巨大,不同领域和形式的商业化尝试也在逐步推进中,但当下ChatGPT 仍然只能起到辅助作用,技术之外的社会负面问题也值得我们关注。随着各大巨头的纷纷涌入,ChatGPT 概念成为市场追逐的热点,我们梳理出了部分包括百度、阿里等港股市场的关键公司。I一、一、前世今生前世今生1.

4、1 基本概念基本概念Chat GPT 是美国人工智能研究实验室 Open AI 新推出的一种人工智能技术驱动的自然语言处理工具,使用了 Transformer 神经网络架构,也是 GPT-3.5 架构。这是一种用于处理序列数据的模型,拥有语言理解和文本生成能力,尤其是它会通过连接大量的语料库来训练模型,这些语料库包含了真实世界中的对话,使得 Chat GPT 具备上知天文下知地理,还能根据聊天的上下文进行互动的能力,做到与真正人类几乎无异的聊天场景进行交流。Chat GPT 不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。ChatGPT 自 2022 年 11 月 30

5、日发布以来爆火全球,5 天注册用户超 100 万,月活破亿用时仅 2 个多月,被称为“史上用户增长最快的消费者应用”。I1.2 ChatGPT 为何如此火爆?为何如此火爆?首先,最本质的出圈原因就是大家对于其功能之强大和应用范围之广泛的惊叹,小到简单的文字对话交流,大到小说文案论文写作都不在话下,甚至可以实现代码编写。并且ChatGPT 在经过了大量数据训练之后,可以生成更自然、更多样化的响应,让人难以辨别其内容是 Al 生成还是真人撰写。强大的功能使其在学生之间快速传播,甚至导致其在教育领域遭到“封杀”。据海外媒体报道,美国某大学教授为学生作业评分时,读到了一篇没有错别字和语法错误的“最佳论

6、文,最后发现是学生用 ChatGPT 完成的。据调查显示,美国 89%的大学生在用 ChatGPT 做作业,因此为了避免其危害,教育部开始限制学生对于 ChatGPT 的使用。这也侧面反应了ChatGPT 的强大功能和火爆程度。过去 Al 技术已有诸多成功的商业化应用,例如基于人工智能算法的个性化推荐,但人们的感知并不强烈;而过去面向 C 端的产品,体验并不完善,并未在社会面引起巨大反响并传播开来。因此 ChatGPT 的面世与出圈,堪称是迄今为止最成功的的 C 端人工智能应用,意味着 Al 技术对于普罗大众正式从幕后走向台前,这对于 Al 技术未来的发展和商业化运用都有着里程碑式的意义。目前

7、,Chat GPT 已经在美国通过了律师从业资格证,并且打赢了很多起法律诉讼案件!美国普林斯顿大学,还用 Chat GPT 拿来做医疗诊断,目前的准确率、可靠性已经远远超过资深的医生!Chat GPT 还通过了谷歌程序员考核,可以拿到 18 万元的年薪!Ch 来来来 at GPT 还可以帮高校毕业生书写论文,而且不重复,并高分通过审核!Chat GPT 画出来的画的质量也已经超过顶级画家的水准!上面仅仅是举几个例子。可以说,Chat GPT 目前颠覆了太多行业,现在各行各业的从业者也是十分的焦虑。例如,Chat GPT 怎样颠覆房地产行业?以前开发商拿地是盲目的预估,Chat GPT 将会给开

8、发商更加合理的拿地价格。拿地后怎么开发,开发什么户型,怎么进行营销,Chat GPT 都会给出更加合理的方案。就是说,人工智能能够通过大数据整合、信息整合并通过合理的计算方式,自行学习后给出合理的方案。业界有以下看法:也许也许,这是一个可以控制整个元宇宙的技术,这是一个可以控制整个元宇宙的技术实现实现平台平台;一场意识形态的核战争就要来了一场意识形态的核战争就要来了;比经济危机更严重的危机来了。比经济危机更严重的危机来了。I1.3 OpenAI 公司深度分析公司深度分析1OpenAI(开放人工智能4)是美国一个人工智能研究实验室,由营利组织 OpenAI LP 与母公司非营利组织 OpenAI

9、 Inc 所组成,目的是促进和发展友好的人工智能,使人类整体受益。OpenAI 成立于 2015 年底,总部位于加利福尼亚州旧金山,组织目标是通过与其他机构和研究者的“自由合作”,向公众开放专利和研究成果。创始人山姆柯曼以及伊隆马斯克的动机是出于对强人工智慧潜在风险的担忧。至 2018 年,OpenAI 的总部坐落于旧金山的米慎区,与伊隆马斯克的另一座公司 Neuralink 在同一办公室大楼。1.3.1 组织架构组织架构OpenAI 于 2019 年转型为营利性人工智能研究实验室组织。公司由两个实体组织组成:OpenAI,Inc.,由非营利组织 OpenAI 和营利性组织 OpenAI LP

10、 控制。OpenAI LP 由 OpenAI,Inc(基金会)的董事会管理,作为普通合伙人。同时,有限合伙人包括 LP 的员工、部分董事会成员以及 Reid Hoffman 的慈善基金会、Khosla Ventures 和 微软,LP 的主要投资者。1https:/zh.wikipedia.org/zh-hans/OpenAII1.3.2 创始创始团队团队山姆柯曼、伊尔亚苏茨克维、格雷格布洛克曼、沃伊切赫扎伦巴、伊隆马斯克、约翰舒曼、安德烈卡帕西。I1.3.3 运作结构运作结构OpenAI 细分为:OpenAI Inc.,这是一家单一成员特拉华州有限责任公司,OpenAI 和OpenAI LP

11、 控制。微软是有限合伙人,它还有一项商业协议作为 2019 年投资的 10 亿美元的一部分,内容包含 Microsoft/OpenAI Azure AI 超级计算技术。OpenAI 产品通过在微软 Azure上进行训练,而微软将是 OpenAI 人工智能新技术商业化的首选合作伙伴。山姆山姆柯曼柯曼I伊尔亚伊尔亚苏茨克维苏茨克维FRS(英语:Ilya Sutskever,1985/1986 年)是一名加拿大计算机科学家,从事机器学习的研究。他是 OpenAI 的联合创始人及首席科学家。苏茨克维对深度学习领域做出多项重大贡献。他与亚历克斯克里泽夫斯基和杰弗里辛顿是卷积神经网络 AlexNet 的共

12、同发明人。他也是 AlphaGo 论文的众多作者之一。21985 年出生,出生地是俄罗斯诺夫哥罗德,这座城市位于俄罗斯西北部。3虽然是俄罗斯出生,但伊尔亚主要是在以色列长大,像很多计算机达人一样,他从小就展现出对计算机的浓厚兴趣,并且学习优异,甚至在大学期间,也曾连跳两级。借由人类大脑神经元的启发,上个世纪 80 年代,杰弗里辛顿将反向传播算法应用到了计算机深度学习,将联结主义人工智能带到了新的高度。2015 年,OpenAI 成立,伊尔亚成为这家公司的首席科学家,年薪 190 万,而后续 chatGPT的理论概念,诞生于伊尔亚与其他学者共同在 2017 年发布的一篇论文,次年,OpenAI

13、推出了 GPT 的第一个版本,如今,GPT 迭代到了 GPT-3,参数量达到了 1750 亿,而最近爆火的chatGPT 正是基于 GPT-3.5 开发,上线仅仅五天,就有了 100 万用户,就在前不久,ChatGPT实现了月活破亿。2012 年,由于辛顿的 AlexNet 神经网络大获成功,因其彻底打开全球深度学习的热潮,AlexNet 又被看作是 AI 深度学习革命的开始。2002 年,伊尔亚全家移民至加拿大多伦多,正是在此期间,伊尔亚遇到了世界 AI 领域的顶级大神、多伦多大学教授杰弗里辛顿(Geoffrey Hinton),他是美国计算机协会认可的“深度学习三巨头”之一,被业界称为深度

14、学习教父!2000 年至 2002 年期间,苏茨克维在就读于以色列开放大学6。2002 年,他与家人移居加拿大,并转入多伦多大学,随后在杰弗里辛顿的指导下获得数学学士学位(2005 年)6738、计算机科学硕士学位(2007 年)79和博士学位(2012 年)810。2012 年毕业后,苏茨克维在史丹佛大学的吴恩达那里做了两个月的博士后。之后他回到多伦多大学,加入辛顿的新研究公司 DNNResearch,这是辛顿研究小组的一个衍生产品。四个月后,在 2013 年 3 月,Google 收购了 DNNResearch,并聘请苏茨克维为 Google 大脑的研究科学家。在 Google 大脑,苏茨

15、克维与奥里奥尔维尼亚尔斯和 Quoc Viet Le 合作创建了 Seq2Seq学习算法。2015 年,苏茨克维被评为麻省理工科技评论35 位 35 岁以下的创新者12。2https:/zh.wikipedia.org/zh-hans/%E4%BC%8A%E7%88%BE%E4%BA%9E%C2%B7%E8%98%87%E8%8C%A8%E5%85%8B%E7%B6%AD3https:/ 年底,他离开 Google,成为新成立的 OpenAI 的主管13。2018 年,苏茨克维是 NVIDIA NTECH 和人工智慧前沿会议的主旨发言人。他于 2022 年当选为英国皇家学会院士14。2015

16、年底,OpenAI 成立,总部位于加利福尼亚州旧金山,组织目标是通过与其他机构和研究者的“自由合作”,向公众开放专利和研究成果。2016 年,OpenAI 宣称将制造“通用”机器人,希望能够预防人工智能的灾难性影响,推动人工智能发挥积极作用。2019 年 3 月 1 日成立 OpenAI LP 子公司,目的为营利所用。2019 年 7 月 22 日微软投资 OpenAI 10 亿美元,双方将携手合作替 Azure 云端平台服务开发人工智慧技术。2020 年 6 月 11 日宣布了 GPT-3 语言模型,微软于 2020 年 9 月 22 日取得独家授权。2022 年 11 月 30 日,Ope

17、nAI 发布了一个名为 ChatGPT 的自然语言生成式模型,它以对话方式进行交互。在研究预览期间,用户注册并登陆后可免费使用 ChatGPT。但是该项目对一些包括中国大陆、香港在内的地区暂不可用。伊隆伊隆马斯克马斯克2015 年,马斯克和 OpenAI 现任 CEO Sam Altman 等人共同创办了非营利组织 OpenAI,对外宣称要避免人工智能灭世。2018 年,OpenAI 突然把马斯克踢出了董事会,据媒体称是因为特斯拉深入研究自动驾驶的 AI 技术,与 OpenAI 出现了利益冲突。除此以外,马斯克对于 OpenAI 的不满在一定程度上还要归咎于 ChatGPT 近期种种表现确实让

18、人大跌眼镜,比如 ChatGPT 版必应搜索引擎对用户胡说八道,向用户示爱,突然发脾气,遭到质疑时还会 PUA 用户。结合亲自试用的经验,马斯卡在推特上对 ChatGPT 开启了冷嘲热讽模式:I此外,对于 ChatGPT 把马斯克列入具有争议性且应该得到“特殊对待”的名单,马斯克在一篇相关推文下面回了两个略显无奈的感叹号。I1.3.4 商业模式商业模式OpenAI 的商业模式即 API 接口收费:客户可以通过 OpenAI 的强大 AI 模型构建应用程序,例如访问执行各种自然语言任务的 GPT-3、将自然语言翻译成代码的 Codex 以及创建和编辑原始图像的 DALLE。公司按照不同项目的 A

19、I 模式和不同需求进行收费,对于 AI 图像系统I按不同的图片分辨率定价;对于 AI 语言文字系统按字符单价收费,对于调整模型和嵌入模型按照文字单价收费,并根据不同的调用模型区别定价。目前 DALLE 方面,已有超过 300 万人在使用,每天生成超过 400 万张图像。其 API 具备快速、灵活、可拓展等性质。1.3.4 产品矩阵产品矩阵OpenAI 不仅仅是不仅仅是 ChatGPT:Open AI 的业务不仅仅局限于 ChatGPT 领域,还包括 DallE2、Whisper 等项目。DALLE2 可根据自然语言的描述创作逼真的绘画作品,Whisper 是一种语言识别系统,其鲁棒性和准确性极

20、高,支持多种语言的转录并翻译成英文。1.3.4.1 核心产品核心产品DALL E 2一个可以根据自然语言的描述创建逼真的图像和艺术的人工智能系统。对现有图像进行逼真的编辑。拍摄图像并创建受原件启发的不同变体。2021 年 1 月,OpenAI 推出 DALLE 1,并于一年后推出最新系统 DALLE 2,能够生成更逼真、更准确的图像,分辨率提高 4 倍。DALLE 2 优于 DALLE 1 的标题匹配和照片级真实感,字幕匹配度优于一代 71.7%,照片级写实程度优于 DALLE 1 的 88.8%。DALL-E 2 使用了一种改进的 GLIDE 模型,这种模型以两种方式使用投影的 CLIP 文

21、本嵌入,DALL-E 2 先验子模型和图像生成子模型都是基于扩散模型的,体现了其在深度学习中的能力。I1.4.3.2 核心产品核心产品Whisper核心产品Whisper,一个自动语音识别(ASR)系统,对从网络收集的 68 万小时的多语言和多任务监督数据进行训练。使用这样一个庞大而多样的数据集可以提高对口音、背景噪声和技术语言的鲁棒性。支持多种语言的转录,以及将这些语言翻译成英语。Whisper 架构:是一种简单的端到端方法,作为编码器-解码器 Transformer 实现。输入音频被分成 30 秒的块,转换为 log-Mel 频谱图,然后传递到编码器中。训练解码器来预测相应的文本标题,并与

22、指示单个模型执行语言识别、短语级时间戳、多语言语音听录和英语语音翻译等任务的特殊标记混合在一起。1.4.3.3ChatGPT Plus 订阅服务订阅服务2023 年 2 月 10 日,OpenAI 在美国推出了 ChatGPT Plus 订阅服务,每月收费 20 美元,支持以下功能:高峰时段也能正常访问 ChatGPT、更快的响应时间、优先使用新功能和改进。根据路透社,OpenAI 预计 2023 年收入 2 亿美元,2024 年收入 10 亿美元。据华尔街日报,截至 2023 年 1 月,OpenAI 正在就收购要约进行谈判,这将使公司估值达到 290 亿美元,是公司 2021 年市值的两倍

23、。2023 年 1 月 23 日,微软宣布了一项新的对 OpenAI的多年期、数十亿美元的投资计划。红杉资本预测:ChatGPT 这类生成式 AI 工具,让机器开始大规模涉足知识类和创造性工作,未来预计能够产生数万亿美元的经济价值。1.3.5 技术路线技术路线1.3.5.1 基于基于 GPT-3.5,GPT-4 预计提升更明显预计提升更明显ChatGPT 是基于 GPT-3.5 的主力模型,ChatGPT 在互联网开源数据集上进行训练,引入人工数据标注和强化学习两项功能,实现“从人类反馈中强化学习”(Reinforcement Learning fromHuman Feedback,RLHF)

24、。因此,相比于之前的模型,ChatGPT 可以用更接近人类思I考的方式,根据上下文和情景,模拟人类的情绪和语气回答用户提出的问题。OpenAI 首席执行官称,GPT-4 有望成为多模态的人工智能,根据 openAI 创始人 Altman消息,GPT-4 参数预计更大,计算模型优化有望实现更优化,且 GPT-4 将是纯文本模型(不是多模态),我们认为 GPT-4 的推出潜在商业价值巨大,模型更具备“拟人化”的功能,文本生成和内容创作有望更加丰富,并有望进入文字工作的相关领域,例如新闻、金融等相关行业。1.3.5.2GPT、Bert 均源自均源自 Transformer 模型模型NLP 模型首选T

25、ransformers。2017 年由 Google Brain 团队推出深度学习模型Transformer,采用自注意力机制,对输入数据的每一部分的重要性进行差异加权,主要用于自然语言处理(NLP)和计算机视觉(CV)领域。IBERT(Bidirectional Encoder Representations from Transformers)为谷歌于 2018 年推出的一种基于神经网络的 NLP 预训练技术,BERT 在情绪分析和回答问题等分类任务中表现良好,在命名实体识别和下一句预测方面也表现出色。ChatGPT 同样是根据语言/语料概率来自动生成回答的每一个字(词语),即利用已经说过

26、的语句作为输入条件,预测下一个时刻语句出现的概率分布。I1.3.5.3 领先的领先的 NLP 模型模型ChatGPT 是一个出色的 NLP(Natural language processing-自然语言识别)新模型。NLP 随算力增长突破:在过去的十年里,通过使用简单的人工神经网络计算,基于以 GPU、TPU 为代表的强大算力资源,并在巨量的数据上进行训练,自然语言处理(NLP)取得了令世人瞩目的成就和突破。侧重文本分析能力:NLP 技术是人工智能(AI)和机器学习(ML)的子集,专注于让计算机处理和理解人类语言。虽然语音是语言处理的一部分,但自然语言处理最重要的进步在于它对书面文本的分析能

27、力。NLP/NLU 领域已知局限包括对重复文本、对高度专业的主题的误解,以及对上下文短语的误解。I1.3.5.4RLHF 与与 TAMER 是重要架构支撑是重要架构支撑RLHF:InstructGPT/GPT3.5(ChatGPT 的前身)与 GPT-3 的主要区别在于,新加入了被称为 RLHF(Reinforcement Learningfrom Human Feedback,人类反馈强化学习)。循环:训练范式增强了人类对模型输出结果的调节,整个训练过程是人类、代理对目标的理解和 RL 训练之间的 3 步反馈循环。在 InstructGPT 中,以下是“goodness of sentenc

28、es”的评价标准。真实性:是虚假信息还是误导性信息?无害性:它是否对人或环境造成身体或精神上的伤害?有用性:它是否解决了用户的任务?TAMER(Training an Agent Manually via Evaluative Reinforcement,评估式强化人工训练代理)框架将人类标记者引入到 Agents 的学习循环中,可以通过人类向 Agents 提供奖励反馈(即指导 Agents 进行训练),从而快速达到训练任务目标。通过 TAMER+RL(强化学习),借助人类标记者的反馈,能够增强从马尔可夫决策过程(MDP)奖励进行强化学习(RL)的过程I1.3.6 产业价值产业价值1.3.6

29、.1 带来搜索产业变革带来搜索产业变革Bing&Edge+AI:2023 年 2 月 8 日,微软公司发布了新版必应 AI 搜索引擎和 Edge 浏览器,采用了 ChatGPT 开发商 OpenAI 的最新技术 AI 模型 GPT 3.5 的升级版,率先提供更具对话性的网络搜索和创建内容的替代方式,集搜索、浏览、聊天于一体,带来前所未有的全新体验。微软企业副总裁兼消费领域首席营销官 Yusuf Mehdi 公布的最新推文称,在新版 Bing上线 48 小时内,已经有超过 100 万人申请加入。I1.3.6.2 即将赋能即将赋能“千行百业千行百业”以 ChatGPT 为代表的的 AIGC 作为当

30、前新型的内容生产方式,已经率先在传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大创新发展,市场潜力逐渐显现。数字媒体公司 BuzzFeed 表示公司将使用 OpenAI 开放的应用编程接口(API),该公司将依靠 ChatGPT 的创建者 OpenAI 来加强部分内容创作,并为观众个性化一些内容,打算2023 年让人工智能在公司的编辑和业务运营中发挥更大的作用。未来,ChatGPT 亦可应用在数字营销的多个领域,譬如内容创建、个性化广告文案、电子邮件营销等等,助力增强行业的生产力。I1.4 AIGC:Chat 所应用的技术经所应用的技术经历历了哪几个阶段?了哪几个阶段?AIGC

31、 发展可分为三阶段,早期萌芽阶段(上世纪 50 年代至 90 年代中期),沉淀累积阶段(上世纪 90 年代至本世纪 10 年代中期),快速发展阶段(本世纪 10 年代中期至今)。1.4.1、早期萌芽阶段、早期萌芽阶段(1950s-1990s)由于技术限制 AIGC 仅限于小范围实验与应用,1957 年出现首支电脑创作的音乐作品,弦乐四重奏依利亚克组曲(Illiac Suite),80 年代末至 90 年代中由于高成本及难以商业化,因此资本投入有限导致 AIGC 无较多较大成绩。1.4.2、沉淀累积阶段、沉淀累积阶段(1990s-2010s)AIGC 从实验性转向实用性,2006 年深度学习算法

32、取得进展,同时 GPU,CPU 等算力设备日益精进,互联网快速发展,为各类人工智能算法提供海量数据进行训练。2007 年首部人工I智能装置完成的小说 I The Road(在路上)问世,2012 年微软展示全自动同声传译系统,主要基于“深度神经网络”(Deep Neural Network,DNN)自动将英文讲话内容通过语音识别等技术生成中文。1.4.3、快速发展阶段、快速发展阶段(2010S 至今至今)2014 年深度学习算法“生成式对抗网络”(Generative Adversarial Network,GAN)推出并迭代更新,助力 AIGC 新发展。2017 年微软人工智能少年“小冰”推

33、出世界首部由人工智能写作的诗集阳光失了玻璃窗,2018 年 NVIDIA(英伟达)发布 StyleGAN 模型可自动生成图片,2019 年 DeepMind 发布DVD-GAN 模型可生成连续视频。2021 年 Open AI 推出 DALL-E 并更新迭代版本 DALL-E-2,主要用于文本、图像的交互生成内容。我国 AIGC 市场在 2022 年底引起较大关注,2023 年开年企业端跃跃欲试。虽然行业仍处于起步阶段,距离大规模证明和体系化发展仍有距离,但从资 本的加码到应用场景的探索,距离的缝隙有望逐步填补,同时,“模块分拆+个性化推荐”的“泛 AIGC”形式有望持续发展。1.5 Char

34、t GPT 的发展的发展ChatGPT 是由 OpenAl 团队研发创造,OpenAl 是由创业家埃隆-马斯克、美国创业孵化器Y Combinator 总裁阿尔特曼、全球在线支付平台 PayPal 联合创始人彼得-蒂尔等人于 2015 年在旧金山创立的一家非盈利的 AI 研究公司,拥有多位硅谷重量级人物的资金支持,启动资金高达 10 亿美金;OpenAl 的创立目标是与其它机构合作进行 Al 的相关研究,并开放研究成果以促进 Al 技术的发展。1.5.1 OpenAl 的的 ChatGPT 是一种什么样的技术?是一种什么样的技术?它是生成式人工智能技术(AIGC)浪潮的一部分。与其并齐的还有其

35、他几个技术。I1.5.2ChatGPT 技术演进经历了哪几个过程?技术演进经历了哪几个过程?ChatGPT 是在 GPT 基础上进一步开发的自然语言处理模型。GPT 模型是一种自然语言处理(NLP)模型,使用多层变换器(Transformer)来预测下一个单词的概率分布,通过训练在大型文本语料库上学习到的语言模式来生成自然语言文本。从 GPT-1 到 GPT-3 智能化程度不断提升,ChatGPT 的到来也是 GPT-4 正式推出之前的序章1.5.3ChatGPT 发布后市场影响力如何?发布后市场影响力如何?根据 UBS 发布的研究报告显示,ChatGPT 在 1 月份的月活跃用户数已达 1

36、亿,成为史上用户数增长最快的消费者应用。相比之下,TikTok 花了九个月的时间月活跃用户数才破亿,而 Instagram 则花费了两年半的时间,同时,根据 Similar Web 的披露信息,Spotify 在四年半后仅积累了 1 亿月活跃用户。根据 Similar Web 的数据,1 月份平均每天有超过 1300 万名独立访问者使用 ChatGPT,是去年 12 月份的两倍多。I1.5.4.ChatGPT 都能做什么事情?都能做什么事情?由于 ChatGPT 包含了更多主题的数据,能够处理更多小众主题。ChatGPT 能力范围可以覆盖回答问题、撰写文章、文本摘要、语言翻译和生成计算机代码等

37、任务。1.5.5.ChatGPT 具备哪些先进性的特征?具备哪些先进性的特征?ChatGPT 嵌入了人类反馈强化学习以及人工监督微调,因而具备了理解上下文、连贯性等诸多先进特征,解锁了海量应用场景。当前,ChatGPT 所利用的数据集只截止到 2021 年。在对话中,ChatGPT 会主动记忆先前的对话内容信息(上下文理解),用来辅助假设性的问题的回复,因而 ChatGPT 也可实现连续对话,提升了交互模式下的用户体验。同时,ChatGPT 也会屏蔽敏感信息,对于不能回答的内容也能给予相关建议。II二、二、市场现状市场现状2022 年 9 月的 AI 绘画作品太空歌剧院获得美国科罗拉多州 博览

38、会的艺术比赛的第一名,当时有人预测若未来五年有 10%-30%的图片在 AI 的帮助下诞生,那么 AI 绘画则将创造超过 600 亿元的市 场空间,若考虑到下一代互联网对内容需求的迅速提升,则可能创造更 大的市场规模。随后 OpenAI 的 ChatGPT 一问世就多次刷新之前 APP 注册用户数量突破的纪录,业内预测带动的市场规模将破万亿。1.ChatGPT 是否已触发新一轮的是否已触发新一轮的 AI 发展浪潮?发展浪潮?2023 年初,微软和谷歌均宣布裁员计划,但都加大了在 Al 行业的投入。2、国内外主要有哪些玩家?国内外主要有哪些玩家?国内外科技巨头积极布局深成是 AI,部分公司已有成

39、型产品。I2.1 谷歌谷歌面对 ChatGPT 构成的威胁,注資 3 亿美元投资竞品 Anthropic.2.2 微软微软OpenAI 的最大投资方,开始利用 ChatGPTj 是局产品竞争力。I2.3 亚马逊亚马逊ChatGPT 受到重点关注,已广泛运用在各种工作职能中。2.4Buzzfoed 美国新媒体巨头美国新媒体巨头2.5 Stability AlStable Diffusion 大热,Open Al 在图片生成 Al 大有可为。I2.6 Jasper采用同类底层技术,进一步证明 ChatGPT 的巨大商业潜力。2.6 百度百度百度:1 月 10 日,百度宣布将升级百度捜素的生成式捜索

40、能力,智能解答用户的捜素提问;2 月 7 日,百度宣布将在 3 月份 完成其 ChatGPT 产品的内测,面向公众开放,该项目名字为文心一言(ERNIE Bot),百度指出,生成式 AI 和搜索引擎是互补关系而不是替代;据路透社报道,百度计划于 3 月将类似 ChatGPT 的 AI 对话服务作为独立血用推岀,之后再逐步将其合并到捜索引擎中。I2.7 腾讯腾讯2 月 3 日,腾讯公布一项人机对话专利,能够实现机器与用户之间自然且顺畅的沟通。专利摘要显示,该方法包括:当人机对话被激活时,在预设文本库中获取用于进行人机对话的参考文本;根据所参考文本,确定出对话过程中用于生成应答信息的背景信息;接收

41、人机对话的对话信息;根据对话信息和背景信息,确定出对应的应答信息。通过该申请,能够实现机器与用户之间自然且顺畅的沟通,提高用户的使用体验度。4该项专利与这段时间爆火的人工智能聊天机器人 ChatGPT 的原理十分相似,ChatGPT是由初创公司 OpenAI 开发,并于 2022 年 11 月 30 日上线的对话式 AI 模型,是 AIGC(人工智能生成式内容)的一种应用和产品,能实现撰写代码、回答问题、书写论文、诗歌、剧本等指令。3、与与 ChatGPT 相比还有哪些技术公司?相比还有哪些技术公司?AIGC 创业公司大比拼,国外 ChatGPT 的优势遥遥领先并有望延续。4http:/ AI

42、GC 产业如何发展,人工智能的分析、创作、决策能力都 依赖海量数据。因此决定不同机器间能力差异的就是数据的数量与质量。I2.1.1、数据查询与处理、数据查询与处理通常来说数据库有两种模型,一种像湖泊,汇聚来自各地的水源 而不作区分;另一种像仓库,分门别类的存储数据。近几年在科技的 推动下,现代数据库一般都是两种模型的结合,兼具二者的易用性、规范性等特征,还为用户带来降本增效、省时省力等特点。根据对其 中数据的查询与处理等时效性,涉及其中业务的公司可分为异步处理 型公司和实时处理型公司。2.1.2、数据转换与编排、数据转换与编排数据的处理主要涉及提取,加载和转换。根据海外市场研究企业 Grand

43、 View Research的数据,2021 年全球数据集成工具市场的规 模约 105 亿美元,在未来十年将以年复合增长率约 12%的速度增长。根据处理方式的区别,这种公司可以分为本地部署型公司和云端原生 型公司。2.1.3、数据标注与管理、数据标注与管理不论哪种机器学习模型,都可以简化为“老师教学生知识”,其 中对知识点等数据就需要标注与管理,从而进行监督,最终形成各种 不同的算法模型。根据 Grand View Research 的数据,2021 年全 球数据标注市场规模约为 16.7 亿美元,在未来十年将以年复合增长 率约 25%的速度增长。根据公司业务拓展程度的差异,这种公司可 以分为

44、基础型公司和扩张型公司。2.1.4、数据治理与合规、数据治理与合规在数字经济时代,数据是和土地、人力、资本一样举足轻重的生 产资料。因此就需要保证数据资产在管理时预先设置质量规范,在后 期的访问和调取时也要做到合法合规,因此这项服务也就成为各大企 业的必需品。根据海外市场研究企业 ReporterLinker 的数据,全球 数据治理市场规模约 18 亿美元,预计未来几年将以年复合增长率约 22%的速度增长.根据服务交付模式,这种公司可以分为工具型公司和定制型公司。2.2、产业中游:算法模型、产业中游:算法模型算法模型是 AIGC 最核心的环节,是机器学习的关键所在。它包含三类参与者:专门实验室

45、、企业研究院、开源社区。I2.2.1、AI 实验室实验室算法模型在 AI 系统中起决策作用,是它完成各种任务的基础,可 以视为 AI 系统的灵魂所在。很多企业为了更好地研究算法并推动商 业化落地,在内部都设立专门的实验室,因此这种实验室可以分为独 立型实验室和附属型实验室。2.2.2、企业研究院、企业研究院一些集团型公司或企业往往会设立专注于前沿科技领域的大型研 究院,下设不同领域的细分实验室,通过学术氛围更浓厚的管理方式 为公司的科研发展添砖加瓦。2.2.3、开源社区开源社区开源社区对 AIGC 非常重要,它提供了一个共享成果、代码的平 台,还可以与其他人相互合作,共同推动 AIGC 相关技

46、术的进步。根据覆盖领域的宽度和深度,这种社区可以分为综合型开源社区和垂直型开源社区。I2.3、产业下游:应用拓展、产业下游:应用拓展任何优秀的科研成果都需要最终落地部署才能产生实际意义和价 值,算法模型也不例外。在 AIGC 产业链的下游,可以将相关应用拓 展到四个主要场景:文本处理、音频处理、图像处理、视频处理。2.3.1.1、文本处理、文本处理目前,文本处理是 AIGC 相关技术距离普通消费者最近的场景,也是技术较为成熟的场景,许多应用公司都会从多个维度出发,辅助 业务拓展与商业化过程中。一般说来文本处理可以细分为营销型、销 售型、续写型、知识型、通用型、辅助型、交互型、代码型。I2.2.

47、3.2、音频处理、音频处理此处主要介绍由语音合成技术来生成的相关应用,与视频相关的 将放在视频部分说明。目前的音频处理主要分为三类:音乐型、讲话 型、定制型,很多公司都专注于此。AI 的应用将优化供给效率,改 善整体利润水平。2.2.3.3、图片处理、图片处理图片的创作门槛比文字高,传递信息也更直观,所以商业化的潜 力自然也更高。随着 AIGC 应用的日益广泛,图片处理也就从广告、设计、编辑等角度带来更大更多的机遇。图片处理可细分为生成型、广告型、设计型、编辑型。2.2.3.4、视频处理、视频处理随着时代的发展,人们在视频上的投入逐渐超出了在图片上的,视频也日益成为新时代最主流的内容消费形态。

48、因此将 AIGC 引入视频将是全新的赛道,也是技术难度最大的领域。视频处理可以细分为 生成型、编辑型、定制型、数字虚拟人视频。I四、四、生态全景图生态全景图I五、五、技术架构体系技术架构体系I六、六、基本原理与技术的演进基本原理与技术的演进1、AI 构建构建1.1、图灵测试与、图灵测试与 AI 的诞生的诞生1950 年,人工智能的先驱艾伦 图灵发表了一篇划时代的论文 计算机器与智能,文中提出了著名的图灵测试:“如果一台机器能够与人类展开对话(通过电信设备)而保证其机器身份不被识破,那么就可以认为这台机器具有智能。”此外文章还预言了在未来可能创造出具有真正智能的机器。图灵测试最初版本的示意图虽然

49、图灵测试从理论上验证了机器拥有智能的可能性,但 AI 正式发展成一门专业学科则是在 1956 年的达特茅斯会议,会议的组织者与参与者都是数一数二的科学家,包括约翰麦卡锡,马文闵斯基,纳撒尼尔罗切斯特,克劳德香农等。在这次会议上,“人工智能”的名称与概念正式确立,因此这次会议也被视为 AI 产业的起点。1.2、人工智能发展的三种流派、人工智能发展的三种流派1.2.1、符号主义、符号主义符号主义认为人类的一切活动(包括体力活动和智力活动)都是符合某种逻辑的,所有信息都可以用各种符号表示,人类的认知过程 就可以视为基于逻辑规则的,操作这些符号的过程。根据这种理论,如果电脑能自动执行和人脑一样的规则和

50、过程,那么就可以视为实现了人工智能。I1.2.2、联结主义、联结主义联结主义与符号主义几乎是同时提出的,人工智能的关键不在于让电脑等机器实现智力活动,而应该模仿人脑的结构。这派观点认为智能是人脑细胞与神经元彼此连接成网络共同处理信息的结果,如果 能在电脑中模拟这种结构再实现人工智能自然也更轻松。早在电脑发明前的 40 年代,就有持这种观点的科学家进行了数学建模,奠定了后来人工神经网络和专家系统的雏形。1.2.3、行为主义、行为主义与前两种流派不同的,行为主义于上世纪 80 年代提出,它倡导“感知+行动”。这种观点源于“控制论”,强调模拟人在控制过程 中的智能行为和动作。但是限于时代和科技发展,

51、行为主义直到上世 纪末,随着智能控制与机器人逐渐兴起才引起重视。截至目前的 AI 发展,几乎都是三种流派的结合运用。专家系统结构示意图2、AI 学习学习2.1、机器学习的概念、机器学习的概念在 1950 年,图灵的论文计算机器与智能中提出了“学习机器”的概念,现在已经发展成 AI 科学中的一个独立分支。机器学习主要是设计和分析一些让电脑可以“自动学习”的算法,是一类从数 据中自动分析和获得规律,并利用规律对未知数据进行预测的算法。从技术角度说,这一理论关注可以实现的,行之有效的学习算法(要防止错误累积)。I机器学习理论示意图2.2、机器学习算法的分类、机器学习算法的分类2.2.1、感知器算法、

52、感知器算法机器学习中最容易理解与实现的是监督学习与无监督学习,前者就是感知器算法的典型案例之一,它也是人工神经网络的基础。简要说来,监督学习是从给定的训练数据集中学习出一个函数,再接收到新数据时就可以根据这个函数预测结果。监督学习的训练集要求包括 输入和输出,也可以说是特征和目标,训练集中的各项目标都是人为 标注的。与之原理类似的,无监督学习就是目标没有人为标注,但还保有 训练集且同样要求输入和输出。不同形态的机器学习对比2.2.2、神经网络算法、神经网络算法这种算法可以视为多层感知器,除了输入输出层外,它还加入了若干隐藏层。隐藏层中的神经元节点可以与输入输出节点相连,每条链接上都有各自的权重

53、系数,最终形成一个网络结构。之所以要加入 隐藏层,是因为现实中很多情况都不是简单的二元对立,总有这样那样的变化需要考虑。I单层人工神经网络示意图2.2.3、强化学习算法、强化学习算法与监督和无监督学习更重视学习数据不同,强化学习是在给定的 数据环境下,让机器学习如何通过选择一系列行动来达成长期累计收 益最大化的目标。从本质上说,这种算法学习的是一套决策系统而非 数据,它在很多游戏中都有运用。著名的阿尔法狗(AlphaGo)就 结合了强化学习与专家系统,能连续击败多位人类围棋高手,名噪一时。强化学习构成元素及其关系通过前面的介绍可以发现,不论哪种机器学习算法,对特征的选 取和处理在模型训练中是很

54、重要的,但在很多情况下要直接提取合适 且有效的特征是很困难的,如提取海量图片和句子的特征。此时的机 器学习就不能只局限于图片或句子的某一特征,而是它们背后隐含的复杂关系。因此需要结合深度模型进行自动计算,而模型主要是深度。神经网络,这是一种更复杂的神经网络。深度学习算法就是采用类似的深层次结构进行机器学习的算法,目前大火的 ChatGPT 就运用了这种算法。I不同形态的机器学习关系示意图3、怎样理解、怎样理解 ChatGPT 技术先进性?技术先进性?3.1 ChatGPT 的技术是怎样进化来的?的技术是怎样进化来的?ChatGPT 所能实现的人类意图,来自于机器学习、神经网络以及 Transf

55、ormer 模型的多种技术模型积累。3.2 为什么说为什么说 ChatGPT 应用应用 Transformer 标志着基础模型时代标志着基础模型时代的开始?的开始?转移学习转移学习(Transfer Learning)使基础模型成为可能使基础模型成为可能。技术层面上,基础模型通过转移学习(Transfer Learning)(Thrun 1998)和规模(scale)得以实现。转移学习的思想是将从一项任务中学习到的“知识”(例如,图像中的对象识别)应用于另一项任务(例如,视频中的活动识别)。在深度学习中,预训练又是转移学习的主要方法在替代任务上训练模型(通常只是达到目的的一种手段),然后通过微

56、调来活应感兴趣的下游任务。转移学习(TransferLearning)使基础模型成为可能。大规模化(大规模化(scale)使基础模型更强大,因而)使基础模型更强大,因而 GPT 模型得以形成。模型得以形成。大规模需要三个要素:I(i)计算机硬件的改进例如,GPU 吞吐量和内存在过去四年中增加了 10 倍;(ii)Transformer 模型架构的开发(Vaswani et al.2017),该架构利用硬件的并行性来训练比以前更具表现力的模型;以及(iii)更多训练数据的可用性。基于 Transformer 的序列建模方法现在应用于文本、图像、语音、表格数据、蛋白质序列、有机分子和强化学习等,这

57、些例子的逐步形成使得使用一套统一的工具来开发各种模态的基础模型这种理念得以成熟。例如,GPT-3(Brown et al.2020)与 GPT-2 的 15 亿参数相比,GPT-3 具有 1750 亿个参数,允许上下文学习,在上下文学习中,只需向下游任务提供提示(任务的自然语言描述),语言模型就可以适应下游任务,这是产生的一种新兴属性。3.3Transformer 针对不同场景的技术原理有哪些?针对不同场景的技术原理有哪些?Transformer 实现的不同技术场景对应的不同技术原理。Transformer 架构可分为自回归系列(例如 GPT-3,偏好生成性任务)、双向 Transformer

58、+Mask 的自编码系列(例如 BERT 偏好自然语言理解)、Encoder-decoder 架构(例如 T5,使用双向/单向 attention,偏好条件文本生成)3.4 GPT-1 能做什么?进行无监督训练和有监督微调。能做什么?进行无监督训练和有监督微调。借助预训练,进行无监督训练和有监督微调。GPT-1 模型基于 Transformer 解除了顺序关联和依赖性的前提,采用生成式模型方式,重点考虑了从原始文本中有效学习的能力,这对于减轻自然语言处理(NLP)中对监督学习的依赖至关重要。GPT(Generative Pre-trainingTransformer)于 2018 年 6 月由

59、 OpenAl 首次提出。GPT 模型考虑到在自然语言理解中有大量不同的任务,尽管大量的未标记文本语料库非常丰富,但用于学习这些特定任务的标记数据却很少,这使得经过区分训练的模型很难充分执行。同时,大多数深度学习方法需要大量手动标记的数据,这限制了它们在许多缺少注释资源的领域的适用性;在考虑以上局限性的前提下,GPT 论文中证明,通过对未标记文本的不同语料库进行语言模型的生成性预训练,然后对每个特定任务进行区分性微调,可以实现这些任务上的巨大收益。和之前方法不同,GPTI在微调期间使用任务感知输入转换,以实现有效的传输同时对模型架构的更改最小。模型更简化模型更简化、计算加速计算加速,更适合自然

60、语言生成任务更适合自然语言生成任务(NLG)。GPT 相比于 Transformer 等模型进行了显著简化。相比于 Transformer,GPT 训练了一个 12 层仅 decoder 的解码器(原Transformer 模型中包含 Encoder 和 Decoder 两部分)。相比于 Google 的 BERT(BidirectionalEncoder Representations from Transformers,双向编码生成 Transformer),GPT 仅采用上文预测单词(BERT 采用了基于上下文双向的预测手段)。3.5 GPT-2 能做什么?能做什么?GPT-2:采用多任

61、务系统采用多任务系统,基于基于 GPT-1 进行优化进行优化。GPT-2 在 GPT-1 的基础上进行诸多改进,实现执行任务多样性,开始学习在不需要明确监督的情况下执行数量惊人的任务。在 GPT-2阶段,OpenAl 去掉了 GPT-1 阶段的有监督微调(fine-tuning),成为无监督模型。大模型 GPT-2是一个 1.5B 参数的 Transformer,在其相关论文中它在 8 个测试语言建模数据集中的 7 个数据集上实现了当时最先进的结果。模型中,Transfomer 堆叠至 48 层。GPT-2 的数据集增加到8 million 的网页、大小 40GB 的文本。GPT-2 仍未解决

62、应用中的诸多瓶颈仍未解决应用中的诸多瓶颈。GPT-2 聚焦在无监督、zero-shot(零次学习)上,然而 GPT-2 训练结果也有不达预期之处,所存在的问题也亟待优化。在 GPT-2 阶段,尽管体系结构是任务无关的,但仍然需要任务特定的数据集和任务特定的微调;要在所需任务上实现强大的性能,通常需要对特定于该任务的数干到数十万个示例的数据集进行微调。I3.6 GPT-3 有了哪些突破?有了哪些突破?GPT-3 取得突破性进展,任务结果难以与人类作品区分开来。GPT-3 对 GPT-2 追求无监督与零次学习的特征进行了改进 GPT-3 利用了过滤前 45TB 的压缩文本,在诸多 NLP 数据集中

63、实现了强大性能。GPT-3 是一个具有 1750 亿个参数的自回归语言模型,比之前的任何非稀疏语言模型多 10 倍。对于所有任务(在 few-shot 设置下测试其性能),GPT-3 都是在没有任何梯度更新或微调的情况下应用的,仅通过与模型的文本交互来指定任务和 few-shot 演示。GPT-3 在许多 NLP 数据集上都有很强的性能(包括翻译、问题解答和完形填空任务),以及一些需要动态推理或领域适应的任务(如解译单词、在句子中使用一个新单词或执行三位数算术)。GPT-3 可以生成新闻文章样本(已很难将其与人类撰写的文章区分开来)。InstructGPT 又是什么?与又是什么?与 GPT-3

64、 有什么区别?有什么区别?InstructGPT 模型在 GPT-3 基础上进一步强化。InstructGPT 使用来自人类反馈的强化学习方案 RLHF(reinforcement learning from human feedback),通过对大语言模型进行微调,从而能够在参数减少的情况下,实现优于 GPT-3 的功能InstructGPT 提出的背景:使语言模型更大并不意味着它们能够更好地遵循用户的意图,例如大型语言模型可以生成不真实、有毒或对用户毫无帮助的输出,即这些模型与其用户不一致。另外,GPT-3 虽然选择了少样本学习(few-shot)和继续坚持了 GPT-2 的无监督学习,但

65、基于few-shot 的效果,其稍逊于监督微调(fine-tuning)的方式。基于以上背景,OpenAl 在 GPT-3基础上根据人类反馈的强化学习方案 RHLF,训练出奖励模型(reward model)去训练学习模型(即:用 Al 训练 Al 的思路)。InstructGPT 的训练步骤为:对 GPT-3 监督微调训练奖励模型(reward model)增强学习优化 SFT(第二、第三步可以迭代循环多次)I3.7ChatGPT 核心优势是什么?核心优势是什么?ChatGPT 核心技术优势是提升了理解人类思维的准确性。核心技术优势是提升了理解人类思维的准确性。InstructGPT 与 C

66、hatGPT 属于相同代际的模型,ChatGPT 只是在 InstructGPT 的基础上增加了 Chat 属性,且开放了公众测试ChatGPT 提升了理解人类思维的准确性的原因在于利用了基于人类反馈数据的系统进行模型训练3.8ChatGPT 采用的什么样的范式?采用的什么样的范式?ChatGPT 得益于通用(基础)模型所构建 Al 系统的新范式。基础模型(Foundation Model)在广泛的应用中整合构建机器学习系统的方法,它为许多任务提供了强大的杠杆作用;基础模型是在深度神经网络和自我监督学习的基础上演化而来。基础模型基于广泛数据(通常使用大规模自我监督)训练的任何模型,可以适应(例

67、如微调)广泛的下游任务,目前例子包括 BERT(Devlin et al.)、GPT-3(Brown et al.2020)和 CLIP(Radford et al.2021);机器学习使学习算法同质化(例如,逻辑回归),深度学习使模型架构同质化(如卷积神经网络),而基础模型使模型本身同质化(比如 GPT-3)。3.9ChatGPT 会在哪些领域中进行应用?会在哪些领域中进行应用?ChatGPT 以基础模型为杠杆,可适用多类下游任务。ChatGPT 采用了 GPT3.5(InstructGPT)大规模预训练模型,在自然语言理解和作品生成上取得极大性能提升。鉴于传统鉴于传统 NLP 技术的局限问

68、题,基于大语言模型(技术的局限问题,基于大语言模型(LLM)有助于充分利。)有助于充分利。用海量无标注I文本预训练,从而文本大模型在较小的数据集和零数据集场景下可以有较好的理解和生成能力。基于大模型的无标准文本书收集,ChatGPT 得以在情感分析、信息钻取、理解阅读等文本场景中优势突出。随着训练模型数据量的增加随着训练模型数据量的增加,数据种类逐步丰富数据种类逐步丰富,模型规模以及参数量的增加模型规模以及参数量的增加,会进一步促进模型语义理解能力以及抽象学习能力的极大提升,实现 ChatGPT 的数据飞轮效应(用更多数据可以训练出更好的模型,吸引更多用户,从而产生更多用户数据用于训练,形成良

69、性循环)。研究发现,每增加参数都带来了文本合成和/或下游 NLP 任务的改进有证据表明,日志丢失与许多下游任务密切相关,随着规模的增长,日志丢失呈现平稳的改善趋势。3.10 大模型架构产生的根本原因是什么?大模型架构产生的根本原因是什么?ChatGPT 大模型架构也是 ML 发展到第三阶段的必然产物。ML 中的计算历史分为三个时代:前深度学习时代、深度学习时代和大规模时代。在大规模时代,训练高级 ML 系统的需求快速增长 计算、数据和算法的进步是指导现代机器学习(ML)进步的三个基本因素。在 2010年之前,训练计算的增长符合摩尔定律,大约每 20 个月翻一番,自 2010 年代早期深度学习(

70、Deep Learning)问世以来,训练计算的规模已经加快,大约每 6 个月翻一番。2015 年末,随着公司开发大规模 ML 模型,训练计算需求增加 10 至 100 倍,出现了一种新趋势训练高级 ML 系统的需求快速增长。2015-2016年左右,出现了大规模模型的新趋势。这一新趋势始于2015年末的AlphaGo,并持续至今(GPT-3 于 2020 年出现)。I七、七、产业全景图产业全景图1、AIGC:人工智能生成内容,:人工智能生成内容,Web3 时代的生产工具。时代的生产工具。AIGC(AI Generated Content),即通过人工智能自动生成内容,具体指基于大型语言模型

71、LLM、生成对抗网络 GAN 等深度学习技术,输入数据后由人工智能生成相关内容。目前AIGC 已进入成长期,AI 生成图像、文字、代码、音乐等领域均已有相关应用落地,我们认为随着 B、C 两端的快速普及,AI 创作生产 内容将成为下一阶段的重要内容生产方式。2、当下为何关注当下为何关注 AIGC:落地前的技术积累已经基本完成:落地前的技术积累已经基本完成。I3、当下为何关注当下为何关注 AIGC:ChatGPT 诞生,催化诞生,催化 AIGC 商业商业化价值化价值。ChatGPT 实现了从技术提升到技术突破的转变。此前残差网络及 Transformer 的出现使得模型的深度和参数量指数级增加,

72、大模型成为可能,AIGC 应用飞速发展;太语言模型出现后,大模型的使用方式从预训练的单一任务模型迭代到多模态模型,微调时所需的标注数据量显著减少,从而降低了业务的使用成本。在此基础上、2022 年 11 月,ObenAI 上线了机器人对话模型 ChutGPT(GPT-3.5),新模型参数量为 1750 亿(人脑神经元数量为 120-140 亿),远超此前模型的参数量。Cha(GPT 引入了 RL/HF(基于人类反馈的强化学习),能够在大部分领域与人类进行持续的语言交互,实现了历史性的突破。ChatGPT 标志着 AIGC 规模化、商业化应用的开始,人类的内容生产习惯将被改变。尽管此前 Stab

73、le Diffusion、Midjoumey 等 AI 绘画应用已经落地,但注册及使用门槛仍相对较高。ChutGPT 的对话机器人属性及免费试用窗口期使其能够广泛触达用户,瑞银数据显示上线两月用户数已突破一亿,系目前用户增长最快的消费应用,2023 年 1 月推出付费订阅版,每月价格20美元。我们认为,ChatGPT之于OpenAI,可以对标AlphaGo和AlphaFold之于DeepMind,开启了 AIGC 认知普及的一大步,是 AIGC 内容批量规模化生产的起点。4、行业将会以什么样的进程向前发展呢?、行业将会以什么样的进程向前发展呢?AIGC 多模态交互功奠定多场景商用基能持续演化。

74、5、II八、八、ChatGPT 应用场景应用场景1、ChatGPT 试点订阅计划试点订阅计划-ChatGPTPlus 发布发布,商业化序商业化序幕已经拉开幕已经拉开2023 年 2 月 2 日,OpenAl 发布 ChatGPT 试点订阅计划ChatGPT Plus,每月 20 美元。ChatGPT Plus 订阅者可获得比免费版本更稳定、更快的服务,及尝试新功能和优化的优先权。2、ChatGPT+传媒传媒:实现智能新闻写作实现智能新闻写作,提升新闻的时效性提升新闻的时效性ChatGPT 可以帮助新闻媒体工作者智能生成报道,将部分劳动性的采编工作自动化,更快、更准、更智能地生成内容。I3、Ch

75、atGPT+影视:拓宽创作素材,提升作品质量影视:拓宽创作素材,提升作品质量ChatGPT 可以根据大众的兴趣身定制影视内容,从而更有可能吸引大众的注意力,获得更好的收视率、票房和口碑;ChatGPT 可以为剧本创作提供新思路,创作者可根据 ChatGPT的生成内容再进行筛选和二次加工,从而激发创作者的灵感,开拓创作思路,缩短创作周期。ChatGPT 有着降本增效的优势,可以有效帮助影视制作团队降低在内容创作上的成本,提高内容创作的效率,在更短的时间内制作出更高质量的影视内容。5、ChatGPT+营销:打造虚拟客服,赋能产品销售营销:打造虚拟客服,赋能产品销售ChatGPT 可以打造虚拟客服,

76、助力产品营销。6、ChatGPT+娱乐:人机互动加强,激发用户参与热情娱乐:人机互动加强,激发用户参与热情ChatGPT 可以成为线上的实时聊天对象,增加互动的趣味性和娱乐性。I7、ChatGPT+其他:促进数实共生,助力产业升级其他:促进数实共生,助力产业升级ChatGPT+教育:赋予教育教材新活力,让教育方式更个性化、更智能ChatGPT+金融:帮助金融机构降本增效,让金融服务更有温度ChatGPT+医疗:赋能医疗机构诊疗全过程I九、九、行业的发展趋势行业的发展趋势1、AIGC:利用人工智能产生内容,提升生产力曲线:利用人工智能产生内容,提升生产力曲线AlGC:Artificial Int

77、elligence Generated Context,即可以利用人工智能技术自动产生内容,常见如代码生成,文本问答等。2、ChatGPT 已成为已成为 AIGC 功能矩阵中的重要板块功能矩阵中的重要板块ChatGPT 是 AIGC“数字内容智能编辑”功能中的重要组成部分,ChatGPT 模型的出现对于文字/语音模态的 AlGC 应用具有重要意义。随着深度学习技术的快速突破以及数字内容的海量增长,AIGC 领域相关技术打破了预定义规则的局限性,使得快速便捷且智慧地输出多模态的数字内容成为可能。在技术创新以及多模态模型的持续突破下,AIGC 根据功能和对象的不同,按顺序可包括三种主要实用功能:数

78、字内容孪生、数字内容的智能编辑、数字内容的智能创作。这三种功能相互嵌套与结合,可以让 AIGC 产品具备超越人类的创作潜力。而 ChatGPT 正是 AlGC 的数字内容智能编辑这一大功能领域中的重要组成部分。I3、AIGC 相关技术包含了三大前沿能力相关技术包含了三大前沿能力数字内容李生能力构建现实世界-虚拟世界映射。孪生能力包括智能增强与转译技术,其中增强技术弥补内容数字化过程中的信息损失,转译技术在理解基础上对内容进行多种形式呈现;数字编辑能力打通现实世界虚拟世界交互通道。编辑能力包括智能语义理解与属性控制、语义理解除助实现数字内容各属性的分离解耦,属性控制则在理解基础上对属性进行精确修

79、改、编辑与二次生成,最终反馈于现实世界,形成孪生-反馈闭环;数字创作能力从数据理解走向数据创作。创作能力可分为基于模仿的创作与基于概念的创作,前者基于对某一类作品数据分布进行创作,而后者从海量数据中学习抽象概念,并基于概念创作出现实世界不存在的内容。4、AIGC 行业发展经历了三个主要时期行业发展经历了三个主要时期AIGC 发展经历了早期萌芽、沉淀积累和 2014 年之后的快速发展阶段。I5、从分析式从分析式 Al 到生成式到生成式 Al 逐步演化逐步演化,生成式生成式 Al 赋予赋予 AlGC创新力创新力生成式 Al 起源于分析式 Al,分析式 AI 发展过程中的技术积累为生成式 AI 的产

80、生奠定基础。分析式 AI 其学习的知识局限于数据本身;生成式 AI 在总结归纳数据知识的基础上可生成数据中不存在的样本;最新生成式 AI 技术如 GAN,Diffusion 等,催生多款 AlGC 产品如:OpenAl 系列、DALL-E2(Diffusion),Starry A.I.(基于 GAN)等6、AIGC:学习范式更新奠定基础,模型结构升级助力腾飞:学习范式更新奠定基础,模型结构升级助力腾飞人工智能技术推动 AIGC 行业不断发展,其中学习范式的更新赋予 AI 模型主动学习能力,模型结构升级提升 AI 模型学习、归纳与创新能力。I7、AIGC 产业链涵盖了从硬件到多类终端应用的广泛领

81、域产业链涵盖了从硬件到多类终端应用的广泛领域AlGC 关联产业可分为应用层、模型层、云计算平台与计算硬件层。计算硬件层结合云计算平台为 AIGC 提供机器学习训练与推理算力,其中 GPU 与 TPU 为硬件核心,主要参与厂商包括英伟达(GPU)与谷歌(TPU);云平台参与厂商则包含 AWS,GCP,Azure 以及 Coreweave;计算硬件层中云计算平台厂商分布稳定,竞争出现于模型层面与应用层面。模型层面,闭源基础模型提供商如 OpenAl 通过 API 向用户提供服务,而开源基础模型则通过在托管平台如 Hugging Face、Replica 公开模型权重。模型训练其高计算力需求推动了模

82、型层厂商与云计算厂商建立合作关系(如 OpenAl+Azure,GCP+DeepMind。模型层面闭源模型较为普遍,各厂商依靠模型建立技术壁垒在应用层面,MidJourney,Runway 等自主研发、持有模型;而 Jasper,Github Copilot 则通过调用闭源模型商提供的 APl 或采用托管平台共享的模型。I8、AIGC 产业链上下游玩家百花齐放产业链上下游玩家百花齐放AlGC 上游主要包括数据供给方、算法机构、创作者生态以及底层配合工具等,中游主要是文字、图像、音频和视频处理厂商,其中玩家众多;下游主要是各类内容创作及分发平台以及内容服务机构等。I9、AIGC 厂商之间的竞争在

83、于模型层面竞争厂商之间的竞争在于模型层面竞争追根溯源,AlGC 依赖于底层机器学习模型产生内容,因此模型为 AIGC 行业厂商真正竞争力所在。文本生成产品多依赖 GPT 系列模型,自己训练的模型在图像/视频模态产品中较为普遍(图像/视频模态产品通常拥有自己训练的模型,而不是如文本模态调用 OpenAl 提供的模型服务);比较而言,OpenAl 依靠模型建立先发竞争优势,技术到产品转化相对亮眼。10、AIGC 取长补短,有望成为主流内容生产模式取长补短,有望成为主流内容生产模式AlGC 所属内容生产生态的发展经历了专家生产内容(PGC)、用户生成内容(UGC)、Al 辅助生产内容、Al 生产内容

84、(AIGC)四个阶段,目前处于一、二阶段为主,第三阶段为辅的境况。AlGC 克服 PGC 与 UGC 存在的质量、产量无法兼具的缺点,其有望成为未来主流的内容生产模式。11、AIGC 生成技术可按模态进行分类生成技术可按模态进行分类AIGC 根据其内容模态不同可分为文本、视频、图像,音频与跨模态生成。I12、AIGC 不同模态对应着各种生成技术及应用场景不同模态对应着各种生成技术及应用场景AIGC 不同模态对应的技术应用场景也有着各自的细分品类。13、AIGC 文本生成技术场景可分为交互式和非交互式文本生成技术场景可分为交互式和非交互式AlGC 非交互式文本生成技术中,结构化写作其形式相对固定

85、,生成难度较小,商业化应用较为广泛;而创作型写作开放性较大,在长文本生成中难度较大,仍需技术进一步发展。随着通信互联网技术发展,线上社交需求快速增长,如闲聊机器人等交互式文本产品将迎来快速发展I14、AIGC 文本生成技术商业化落地有望优势先发文本生成技术商业化落地有望优势先发文本领域预训练大模型技术成熟,文本领域细分垂类较多,产品数量居首位,模型数量发展超过其他模态技术。数字内容中,文字模态数据远大于图片/视频/音频等,发展前景相对较大基于 GPT-3 的文字生成功能已嵌入如 Writesonic、Conversion.ai、Copysmith 等软件中,商业化前景相对清晰。15、AIGC

86、图像生成技术随着模型结构的优化而明显提升图像生成技术随着模型结构的优化而明显提升模型结构不断进化提高了 AlGC 生产图像的多样性,但要求较高的功能实现还有待于技术的进一步提升。“图像缩辑”难度低于“图像生成”与“2D”转换,目前已存在多款产品支持“图像编辑”,而对于“图像生成”任务,由于图片相较包含更多元素,其生成效果仍存在不稳定性,对于要求较高的功能类图像生成仍需要技术上的提升。I16、AIGC 音频生成技术正朝更富情感等人类特征演化音频生成技术正朝更富情感等人类特征演化文本到语音任务已比较成熟,语音质量已达到自然的标准,未来将朝更富情感、富韵律的语音合成以及小样本语音学习方向发展。音乐生

87、成任务中仍需解决音乐数据难以标注的问题,数据标注其颗粒度大小影响音乐生成任务的可控性。若可控性得以解决,则可指定风格情绪等因素的音乐生成任务有希望在影视、游戏等场景下的到大量应用。17、视频生成为、视频生成为 AIGC 应用生态中的高潜力场景应用生态中的高潜力场景视频生成本质上与图片生成类似,通过对视频进行帧数级别的切割,实现对每一帧的处理。视频生成过程包括三个阶段数据的提取、训练和转换,当前技术正在着重提升视频修改精准度和实时性两个维度。鉴于视频本身的文本、图像和音频的综合属性,视频生成也是跨模态生成领域的重要应用场景。18、跨模态生成技术是真正实现认知和决策智能的转折点、跨模态生成技术是真

88、正实现认知和决策智能的转折点现实世界的信息是文本、音频、视觉、传感器以及人类各种触觉的综合体系,要更为精准地模拟现实世界,就需要将各种模态能力之间打通,例如文字-图像、文字-视频等跨模态生成能力。大型预训练模型的发展使得跨模态逐步成熟,“文本图像”生成正在快速落地,“文字视频”的实验效果也已较为理想(视频时长、清晰程度、逻辑等还有较大提升空间)。I19、AIGC 改变数字内容生产模式改变数字内容生产模式AlGC 作为新的内容生产模式,其具有内容多样,可控性强与生产效率高的优点,符合传媒,电商,影视,娱乐等行业对内容数字化程度高、内容多样以及内容更新快的要求,AIGC在以上行业逐渐替代传统内容生

89、产模式的趋势十分显著。20、AIGC 渗透传媒领域各个环节渗透传媒领域各个环节AlGC 技术逐渐渗透传媒领域包括采集、编辑、传播等环节,有助于加快内容生产效率,提高内容质量,扩宽内容影响力。I21、AIGC 化化 2D 为为 3D,拓展电商展示维度,拓展电商展示维度AIGC 2D图像生成3D模型技术为传统电商提供多维度的展示空间虚拟合成主播为客户提供更及时、可靠、亲和的服务体验。22、AIGC 打破传统娱乐体验边界打破传统娱乐体验边界AIGC 技术打破物理边界,使粉丝可与偶像亲密互动,并形成新的发展点 AIGC 为用户打开虚拟世界入口,通过趣味方式体验虚拟世界。23、AlGC 拓宽影视行业创意

90、边际拓宽影视行业创意边际AlGC 技术以其内容多样性为作品内容带来更多灵感,AlGC 技术帮助拍摄突破物理限制,还原剧本效果,提高作品质量。I24、AIGC 促进各行业转型升级促进各行业转型升级AIGC 技术在各行业数字内容相关领域均有发挥空间。I十、十、AIGC 的应用场景的应用场景1、AIGC+资讯行业资讯行业在信息化时代,社会中充斥着各种资讯,同时这些资讯也有高标准、需求大、时效强等特点。自 2014 年起,AIGC 已开始用于新闻资讯领域,因此资讯行业是 AIGC 商业化相对成熟的赛道。新华社写稿机器人“快笔小新”1.1、AIGC 辅助信息收集辅助信息收集,打造坚实基础,打造坚实基础优

91、质的新闻产出必定需要全面、高效、准确的信息收集与整理的 基础上。按照传统的I作业模式,工作人员需要亲临现场,通过各种手 段才能获得足够且扎实的信息。现在的 AI 已经能对该环节高效赋能,例如科大讯飞的 AI 转写工具可以帮助记者实时生成文稿,自动撰写 提纲、精简语句等,进而提高工作效率,保证最终产出的时效性。除帮助获取一手信息外,AI 也可以帮助精确检索二手信息,收集 素材。在高性能的AIGC 工具如 ChatGPT 出现后,就可以像常人对 话一样直接提问并获得答案。虽然难免还是会有这样那样的问题,但 作为工具而言,AIGC 的意义已经非常明显了。1.2、AIGC 支持资讯生成支持资讯生成,实

92、现高效产出,实现高效产出在资讯写作等生成环节,基于自然语言生成和自然语言处理技术,AIGC 已经逐步得到从业者和消费者的认可,因此有不少企业积极参 与其中。以产出数量为例,与美联社、雅虎等外媒合作的 Automated Insights,其撰稿工具 Wordsmith 能在一分钟内生成两千条新闻,且单条质量可比拟人类半小时的作品质量。除了速度惊人,AI 在准确度方面同样优势明显,能够很好的避免 人类的粗心或计算等错误,在保证质量的同时减轻人类工作压力。这 方面国内企业颇多,如新华社自研的写稿AI“快笔小新”、腾讯公 司开发的 Dream Writer、百度公司和人民网合作开发的“人民网-百度文

93、心”大模型都是其中的佼佼者。1.3、AIGC 助力内容分发助力内容分发,缓解人类压力,缓解人类压力在内容分发环节,AI 除了常见的个性化内容推荐外,也在逐步开 拓全新应用场景,如虚拟人主播,以视频或直播的形式发放内容,打 造沉浸式体验。如新华社数字记者“小诤”、央视网虚拟主播“小 C”、阿里巴巴数字人“冬冬”、百度智能云 AI 手语主播等等,在未来,AI 虚拟主播可能发展成媒体行业的标配。2、AIGC+电商行业电商行业自网络电商出现以来,社会的很多方面都被改变了,电商企业既 是网络时代的受益者,也在推动社会发展进程中扮演关键角色。自十年前网络直播出现,带动带货模式变革以来,各大企业都在或多或少

94、 的面临转型问题。在数字世界和物理世界快速融合的当下,AIGC走在时代前沿,可以赋能电商行业的多个领域,可能带来新一轮的行业变革。每平每屋云渲染效果图I2.1、AIGC 助力商品建模助力商品建模,改善购物体验,改善购物体验对比传统的购物模式,网购的一个典型问题在于只能通过图片了 解商品,难以观察到全貌,也让以次充好的不法商家有机可乘。而AIGC 技术可以通过视觉算法生成商品的三维模型,提供多方位视觉 体验,节省沟通成本,改善用户体验,促成用户成交与转化。除了三维建模,AIGC 还有更高级的应用方式,如阿里巴巴的每平 每屋业务就利用 AIGC 技术,实现线上“商品放家中”的模拟展示效 果。这种业

95、务是将 AIGC 功能植入手机淘宝和每平每屋 APP 端,用 户用手机扫描家居环境让 AI 生成商品模型,在手机即可预览实物效果,进而改善电商家居的购物体验。2.2、AIGC 赋能服饰电商赋能服饰电商,助力降本增效,助力降本增效AIGC 可以为商家提供大量创意素材,电商广告正是对创意营销素 材需求量很大的领域,阿里巴巴的 AI 设计师“鲁班”就是应用于此。除了通用型广告,AIGC 在电商服饰领域用途更多。一般说来,服饰领域都采用“小单快返”的模式,即先小批量生产多种样式的服饰产品投入市场,快速获取市场反馈,对优质产品加大投入,在试出爆款的同时减小库存压力。但这种方式对产品图片的需求量很大,如果

96、有上千种服饰产品分别找模特再牌照修图,无疑会耗费极大的时间和成本。成立于 2020 年的 ZMO 公司就运用 AIGC 解决这个问题,商家只需在 ZMO 平台上传产品图和模特图就可以得到展示图。借助 AIGC,更多服饰相关的市场策略都可以低成本的实现。即使没有专业模特,虚拟人模特及广告也可以发挥作用,甚至还可以调整虚拟人的相貌来 适配不同风格的服饰。2.3、AIGC 打造虚拟主播打造虚拟主播,提升直播效率,提升直播效率随着概念的传播,虚拟主播正日益成为许多商家的选择。与真人主播不同,虚拟主播可以全天无间断的直播,突破时间和空间的限制。2022 年 2 月 28 日,经典美妆超级品类日活动开启时

97、,京东美妆虚拟主播“小美”就出现在兰蔻、欧莱雅、OLAY 等超过二十个美妆大牌直播间,开启直播首秀。虚拟人不仅五官形象由 AI 合成,嘴型也可以利用 AI 精确匹配台词,动作灵活且流畅,营造出极佳的真实感,为用户带来与真人无异的体验。不过目前的虚拟主播更多的是与真人主播形成互补,或者为没有直播能力的的商家提供服务,还不能完全替代真人。虚拟主播要获得更强的交互能力,更好的与观众互动,做出实时反馈,还需要 AIGC 相关技术的后续发展。3、AIGC+影视行业影视行业随着虚拟技术的逐步到来,对影视内容的需求也在爆发式增长。为了满足观众日益刁钻的口味和挑剔的眼光,影视行业正全力提高产 量,迭代技术,导

98、致整个行业的工业化程度逐渐提高,同时变得精细 且复杂,同时人的局限性也逐渐凸显。AI 的应用无疑可以降本增效,让行业回归本真。I海马轻帆官网“剧本智能评估”页面3.1、AIGC 协助剧本创作协助剧本创作,释放创意潜力,释放创意潜力通过对海量优质剧本的学习,AI 能根据特定需求快速生成不同风格或架构的剧本,在极大提高工作者工作效率的同时,AI 也在激发创意,帮助产出更优质的作品。事实上,将 AI 引入剧本创作的做法早已有之。2016 年,纽约大学研发的 AI 在学习了几十部经典科幻电影剧本后成功编写了剧本阳春以及一段配乐歌词。经过修改、调整后的成品只有区区八分钟,内容也平平无奇,但阳春在各大视

99、频网站最终收获的百万级播放量依然证明外界对 AI 创作的兴趣很大。2020 年,GPT-3 被用于创作一个短剧,再次引发广泛关注。通过这些早期试验可以看出 AI 在剧本创作方面的潜力,但要真正 将其转化为生产力,还要 AI 更贴合具体的应用场景,做针对性训练,并结合实际业务需求开发或定制功能。海外一些影视公司如 FinalWrite 和 Logline 等都偏向垂直式工具,国内的海马轻帆公司深耕中文剧本、小说、IP 等领域,也已经收获百万级用户。3.2、AIGC 推动创意落地推动创意落地,突破表达瓶颈,突破表达瓶颈虽然 AI 能帮助人类更好的释放创意,但从剧本到荧幕仍是一段漫 长的距离。从创意

100、到表达的跨越,AI 可以保驾护航,帮助人类化不 可能为可能。举例来说,当前劳动密集型的影视生产方式难以满足观 众对质量日益提高的要求。2009 年上映的阿凡达令全球观众首 次了解 3D 电影的魅力,此后沉浸式观影体验成了影视产业链上共同 的追求。为了满足这种追求,影视特技与应用呈现井喷式发展,但后 期制作与渲染,复杂程度也都水涨船高,传统的作业方式已经难以为 继,而 AI 技术就有推动变革的潜力。从技术角度来说,影视特技行业的作业流程是极为繁琐的,比如场景中的建模就需要从一草一木、一人一物开始,逐渐打造世界的雏形,再通过骨骼绑定和动作设计让模型活起来,之后的定分镜、调灯 光、铺轨道、取镜头等等

101、无不费时费力,后期的解算和渲染等工作同 样如此。可以说在影视工作的每个环节都有大量重复性工作或等待时间,无形中拖慢了工作节奏。因此现在就有企业致力于解封流程生产 力,比如优酷的“妙叹”工具箱,在动漫中实时渲染,帮助工作者实 时把握效果或做出修改,节省了大量成本,减轻人员负担,目前已被多家国漫企业采用。I4、AIGC+教育行业教育行业技术的飞速发展也将为教育行业带来颠覆,但是相比其他行业的 快速发展,AI 在教育中的落地部署似乎也慢了半拍。这其实是由教 育行业本身的性质导致的,它的参与者众多,时间跨度很大,个体的 差异性也很大,这让解决边界清晰、定义明确的 AI 难以适应。另外 教育更注重人与人

102、的互动和联结,也没有统一的理论模型,这都为相 关 AI 的开发训练和落地部署增加了难度。但 AI 在教育行业绝非毫无用处,以技术手段推动行业进步也并非痴人说梦。“小花狮”中文写作智能辅导系统3.1、AIGC 助力学习者助力学习者,走向无限,走向无限生活经验告诉我们,从降生起人类就开始通过各种手段建立对世 界的认识。识字前的手摸嘴咬、拳打脚踢,识字后的课本习题、书籍 影视、实地体验等等无不如此。但是不论怎样,每个人的学习过程总会遇到这样那样的阻碍,而 AI 对学习者的意义就在于尽量摆脱种种 束缚,最终从有限的自身走向无限的世界。互联网时代的教育,是将部分内容转化为数字化形式并公开分发,助力资源流

103、转。现在由 AI 辅助甚至主导的制作,整理学习资料,降 本增效是显而易见的,资源的丰富度和易用性都将提升到新的高度。AIGC 也可以在一些特定领域,如儿童绘本等,加速知识的生产效率 并接入网络,最终提供给用户。通过补充有限的学习资源将促进教育 公平,AI 也助力教育资源的生产与分发。微软在这一领域就布局颇多,如微软亚洲研究院与华东师范大学合作研发的中文写作智能辅导 系统“小花狮”,借助自然语言处理技术,实时为学生作文评分并分 析原因,从而帮助学生进步。3.2、AIGC 赋能教育者,减负提效赋能教育者,减负提效老话说“师傅领进门,修行在个人”,教育者作为领路人的重要 性不言而喻,对他们而言,AI

104、 就如同手上的火把,更好的帮助学习 者引燃心中的学习火种。从目前的社会发展现状来看,教育者数量不 足将会是长期现象,一位老师带几十位学生的“大班制”还将长期存 在,在各种琐碎的答疑解惑,书山题海中奔波,AIGC 就可以解决此 类问题。现在作业/试卷自动批阅技术已经获得了广泛应用,AI 不但 可以判断对错,还可以生成针对性的评语,教师的作业批改用时大幅 节约,可以更关注学生的个性化发展。除了助力解决重复性I问题,AI 还可以延伸感知。如基于电脑视觉技术,AI 可以实时分析学生当 前的情绪和状态等,帮助教师更好的了解情况。通过对教育者的赋能,AIGC 最终可以帮助实现教育的终极理想:因材施教,推广

105、个性化教育。尽管 AI 还有可能加剧信息茧房的风险,以及对传统理念的挑战,甚至将人机器化,但就目前来看,未来还是值得期待的,以人为本的教育还是可能实现的。5、AIGC+医疗行业医疗行业对医患双方而言,AIGC 的应用与推广都是福音,比如 AI 预问诊 的应用。虽然病人与病情千变万化,但总是有重复的地方,因此在预 问诊阶段,AI 就可以先了解患者的既往情况,让医生的诊断更有针 对性,既缓解了医生的工作压力,也更好的服务了患者,医院内病人 扎堆排队的现象也得以分流,可以说是一举三得。2021 年,复旦大 学附属眼耳鼻喉科医院与腾讯医疗健康签署合作协议,全面打造数字 化医院新标杆、新范式,深入推进医

106、院数字化转型,在预问诊等业务上快速落地部署。对于传统医学的难点:心理疾病领域,AI 同样可以参与其中。相 较于过去的与人对话,AIGC 聊天机器人只是个软件程序,用户不必 担心隐私被泄露,况且还可以预置海量数据或知识模型,可以在更新 迭代中保持冷静与中立。成立于 2021 年的聆心智能就是这方面的代 表,基于生成式大模型开发的情绪疗愈机器人 Emohaa,可以构建以生成对话为核心的交互式数字诊疗方案,通过对话与患者共情,及时提供情绪支持与心理疏导,促进患者心理健康。受疫情困扰的用户与 Emohaa 对话6、AIGC+金融行业金融行业金融业天然与数据和信息密切相关,各类公司都要从繁复的市场 上搜

107、集信息,并加以利用,创造价值。基于这样的现状,金融行业的 信息化一直走在其他行业之前,具备数据质量好、维度全、场景多等 特点,因此也成为了 AI 最早落地的商业化场景之一。一般说来,AI 在金融行业最常见的应用是通过机器视觉和学习的 方式捕捉市场的实时变化,并利用实时数据进行分析,以此提高金融 公司的财务分析效率与能力。类似的,AIGC在金融行业的应用则是 以智能客服和智能顾问两种,基于自然语言处理技术与客户互动,此 外还可以快速高效地完成一些人工难以完成的任务,改善服务体验。2017 年 4 月,富国银行开始试点一款基于 Facebook Messenger 平台的智能客服,美国银行很快也推

108、出了类似的智能助手 Erica。国内金融行业的相关产业应用也较为成熟,多家公司或商业银行都推I出 过自己的 AI 业务,如 2022 年工商银行的“工小智”,邮储银行的半年报显示数字化转型成绩斐然,这些都表明 AIGC 应用于金融行业的巨大潜力。百信银行数字虚拟人员工艾雅(AIYA)I十一、十一、进入的壁垒进入的壁垒AIGC 的进入壁垒:开源降低行业技术门槛,但大模型对数据及算力需求极高。AIGC 本身的技术门槛并不高。大模型的涌现和指数级的能力迭代,开源社区的繁荣、API 接口的大量开发和开放(ChatGPT 即为开放平台),使 AIGC 应用对新进入者较为友好。此外大模型的泛化能力和通用性

109、极强,无需对场景和模型重复训练(即 Zeroshot),由此而来的低成本准入门槛、数据飞轮效应和广泛的场景适应能力,都一定程度降低了行业的技术壁垒。但大模型对数据量及算力的海量需求,使得头部大厂的规模优势更加突出。模型是当下主流 AIGC 应用的核心基础,训练和运行模型都需要庞大的数据量和算力成本(资金)。1)数据需求:模型性能与数据量、数据质量紧密相关,文献显示即使是拥有 130 亿参数的模型(仅次于拥有 1750 亿的 GPT-3 完整版模型)处理二位数加减法的准确率也只有 50%左右,处理其他运算的准确率还不到 10%。2)算力花费:GPT3.5 的训练使用了微软专门建设的 AI计算系统

110、,由 1 万个 V100 GPU 组成的高性能网络集群,总算力消耗约 3640 PF-days(即假如每秒计算一千万亿次,需要计算 3640 天)。I十二、十二、商业模式商业模式1、变现方式、变现方式ChatGPT 作为工具属性的产品,最简单直接的商业模式主要包括按需一次性收费的商品模式和周期性使用的订阅模式。商品模式例如一定金额购买固定次数的文案生成/社媒生成/广告语生成;订阅模式则类似于 SaaS 周期性收费的方式,例如通过每月支付月费来使用服务。当下 ChatGPT 已经开启了变现的尝试,推出了订阅服务 ChatGPT Pro,价格为 42 美金/月。相较免费版,付费版的 ChatGPT

111、 Pro 主要有三大功能:1)免费版限流,在流量高峰期可能会导致无法使用,付费版在流量高峰期没有限制,提升了使用体验;2)ChatGPT Pro 生成文本的速度更快,用时小于免费版的一半,可以提升工作效率;3)可以抢先体验新功能。除了直接的 C 端服务收费,B 端赋能收费同样也是值得期待的商业化方向,例如通过 API接口提供技术服务。B 端客户可以通过在自己的系统中集成 ChatGPT 模型,通过 API 调用从而实现自身服务和功能的拓展优化,例如近日微软宣布将 ChatGPT 功能集成至旗下的搜索引擎 Bing 和浏览器 Edge。2、商业化空间、商业化空间商业化落地方向的丰富多样,是市场对

112、于 ChatGPT 庞大发展空间预期的基础。区别于以往 Al 模型功能的单一性,例如 AlphaGo 只会下围棋,ChatGPT 基于的“大型语言模型(LLMs,也称为大模型)通过把尽可能大量的数据通过 Transformer 架构做机器学习,就能从数据中学到很多能力,多到超出设计者的想象。ChatGPT 的爆火出圈,本质就是大家惊叹于其能够完成的任务之多样,且完成度远超人们预期。这也打开了 ChatGPT 在各式各样商业场景中应用的想象空间。我们从 ChatGPT 的功能来分类,例举一些想象得到的未来应用场景:文本创作/修改:从通用的文案创作、邮件写作、公文信函、简历修改,再到进一步细分到专

113、业领域,例如金融、法律、教育等等;代码生成/纠错:当前 ChatGPT 在这方面的能力仍不足以替代程序员,但未来在辅助编写上大有可为,例如快速的检索、简单代码的快速写作、自动纠错等辅助功能。聊天机器人:最典型的例如客服机器人,当下市面上的客服机器人仍在使用老一代的系统,新一代语言模型技术的出现有望带动这个细分行业的更新。语音助手:ChatGPT 的问答智能程度明显好于当前市面上市占率较高的小爱同学和 Siri,ChatGPT 的技术有望提升语音助手的智能程度。其他方面:ChatGPT 因其智能化程度高,知识信息含量之广,使其在各个领域都能起到不小的作用,未来想象空间巨大。I3、行业已经具备大规

114、模商业化条件行业已经具备大规模商业化条件:供给多点开花供给多点开花,顺应行顺应行业需求业需求4、行业已经具备大规模商业化条件行业已经具备大规模商业化条件:厂商实现盈利厂商实现盈利,验证商验证商业模式可行性业模式可行性目前海外已有实现稳定盈利的厂商、持续验证商业模式的可行性。公开业绩数据显示2020 年 Depmind 已实现千万美元量级的利润.营业额为 8.26 亿英镑。根据此前分析的下游应用场景,判断 ToB、ToC 两端的商业化条件已完备,并给出如下展望:1)B 端(出售 API 接口)移植模型):瞄准进行高频、大规模内容生产的细分场景,为平台提供定制化模型服务,游戏、数字人领域受益短期内

115、即能看到。2)C 端(大众应用):大厂将定制化模型嵌入搜索、办公等成熟应用,利用庞大用户流量挖掘附加价值;此外随着订阅费用的调整个人创作者直接订阅 AIGC 应用将更为普遍。I3.1、B 端的商业模式端的商业模式B 端变现展望:LLM+X,瞄准有高频、大规模内容生产需求的细分场景。3.1.1、细分行业定制、细分行业定制 LLM(大语言模型)(大语言模型)B 端变现的方式可展望为细分行业定制 LLM(大语言模型),即厂商的模型底座+用户数据源,构建“LLM+X”。厂商通过改变训练用数据的分布,来提升模型在某一细分领域的表现。从具体领域来看,定制化模型能够逐步深度融入到文字、音乐、图片、视频、3D

116、 多种媒介形态的生产中,可以担任新闻、论文、小说写手,音乐作曲和编曲者,多样化风格的画手,长短视频的剪辑者和后期处理工程师,3D 建模师等多样化的助手角色,在人类的指导下完成指定主题内容的创作、编辑和风格迁移。3.1.2 传媒互联网是最直接受益于传媒互联网是最直接受益于 AIGC 落地的场景。落地的场景。中文互联网首先为大模型的建立提供丰富的中文语料库,从源头哺育 AIGC;传媒细分子赛道均具备高内容需求、高交互、高创意浓度等属性,与 AIGC 天然契合。I3.1.3 重点关注两个能够显著受益的行业:重点关注两个能够显著受益的行业:游戏行业具备高交互性、内容创意密集的特点,将显著受益于 AIG

117、C 带来的成本、效益改善、玩法创新,商业模式有望发生变革。以 3A 游戏为例,一款成熟的 3A 游戏开发时间周期长、资金人力耗费巨大。R 星 2018 年发售的游戏荒野大镖客 2,其虚拟场景约有约 60 平方公里,耗费六百余名美术 8 年时间完成。AIGC 技术的引入,能够在设计、调试、NPC 行为、优化、3D 场景制作等多领域提升效率,降低游戏行业对人力的重度依赖,有效实现成本控制。广告营销:内容生产及个性化需求大,看好 AI 数字虚拟人产品降本增效.3.2、C 端的商业模式端的商业模式缺乏实时性是类 ChatGPT 产品的最大掣肘。作为语言模型,对话式机器人没有搜索引擎的爬虫能力,只能回答

118、已知信息。2023 年 2 月起,大厂陆续将对话是机器人与搜索引擎结合,I进一步提升搜索业务效率。3.2.1 SaaS 应用将是最快落地、最早触达应用将是最快落地、最早触达 C 端用户并带来附加收入端用户并带来附加收入的场景。的场景。一方面,AIGC 在办公领域的应用前景已经相当显性,文本转图像、快速文案撰写、快速数据分析等技术能够集成至日常工作流程中。相关大厂已经开始实际布局,微软计划 OFFICE全家桶、云计算模型 Azure 中悉数加入 AI 大模型,线上会议软件 Teams 已经推出了 AI 撰写会议纪要和邮件的付费服务。另一方面,工作中的应用需求更为刚性、用户基础已经较为庞大,心智培

119、育成本低、付费意愿更强,通过嵌入增值服务收取费用商业模式更加成熟。享有C 端流量分发话语权的厂商受益更加显著。头部厂商的产品本身已经有着用户基数、心智壁垒,变现路径相对明晰,获客成本远低于新进入者。3.2.2 C 端变现展望:心智提升、费用下降,直接订阅制将更加普遍端变现展望:心智提升、费用下降,直接订阅制将更加普遍直接 ToC 的按月订阅制产品受众范围较窄。当前 AIGC 应用的订阅价格约在 10-30 美元区间内,我们判断付费制较高的成本将按月订阅的消费者范围限定在了有硬性需求的独立创作者中。从 AI 绘画领域付费情况来看,根据 6pen 数据,中国 60%的用户并没有在使用 AI 绘图产

120、品上有过付费行为,剩下 40%的付费用户中,16%付费在 10 元以内,14%在 100 元以内,付费超过 100 元的不到 10%。随着 AIGC 能力的大幅度提升,AIGC 订阅费用有望逐步调降,购买决策成本降低伴随用户认知建立,我们认为 C 端应用消费需求的扩大已是必然。IDC 预计中国 AI 市场规模将以24.4%的 CAGR 增长,有望在 2025 年超过 184.3 亿美元(约 1263 亿元人民币)。咨询机构AcumenResearch and Consulting 预测,2030 年 AIGC 全球市场规模将达到 1100 亿美元;量子位智库预计 2030 年 AIGC 市场规

121、模将超过万亿人民币。I十三、十三、政策与法规政策与法规AIGC 目前存在版权、伦理、数据安全等风险点。AI 模型通常是通过预先存储的大量数据训练得到的,因此其中可能存在错误、偏见或不准确的信息。1)版权:AI 模型可能侵犯到他人的版权,如通过复制或抄袭别人的作品创建文本。2)伦理:AI 模型可能存在伦理风险,例如造成误导、歧视或侵犯个人隐私。3)数据安全:当存储或处理敏感信息时,存在数据泄露、被窃取等安全风险。数据及算法领域此前已经经历过一轮密集规范,相关细则已经相对完善,叠加 2021 年以来数字经济相关政策利好陆续释放,我们判断产业初创期相关的政策态度趋于包容,目前审核责任更多集中于平台对

122、语料库的自查。I十四、十四、投资机会与风险投资机会与风险1、投资观点一、投资观点一5AIGC 多模态跨模态应用逐渐成熟,市场空间广阔。多模态跨模态应用逐渐成熟,市场空间广阔。广义的 AlGC 指具备生成创造能力的Al 技术,即生成式 Al。可以基于训练数据和生成算法模型,自主生成创造新的文本、图像、音乐、视频等内容。2022 年被称为 AIGC 元年,未来兼具大模型和多模态模型的 AIGC 模型有望成为新的技术平台。据中国 Al 数字商业产业展望 2021-2025报告,预测 Al 数字商业内容的市场规模将从 2020 年的 40 亿元,增加到 2025 年的 495 亿元。ChatGPT 产

123、品历经多代技术演进产品历经多代技术演进,产品与商业模式逐渐成熟产品与商业模式逐渐成熟6。ChatGPT 是文本生成式 Al,过去的传统 Al 偏向于分析能力,主要基于已有内容;现在文本生成式 AI 基于底层 Transformer模型,不断训练数据和迭代生成算法模型,历经 GPT-1、GPT-2、GPT-3,模型不断升级,到ChatGPT 的 GPT3.5 模型,已可以自主生成各种形式的内容。近期收费版 ChatGPT Plus 版本发布,Al 商业化序幕逐渐拉开。Al 商业化落地在即商业化落地在即,行业算法侧和算力侧投资机会有望超预期行业算法侧和算力侧投资机会有望超预期。7根据数据显示,Ch

124、atGPT总算力消耗约为 3640PF-Days,按国内的数据中心算力测算,需要 7-8 个数据中心才能支持其运行。各模态 Al 数据训练到应用均需要算法和算力的加持,未来要想大规模应用,算法训练和算力部署均需先行。投资建议:投资建议:ChatGPT 商业落地在即,建议关注算力侧投资机会;国内外类 ChatGPT 相关产品即将迎来爆发,看好相关厂商投资机会.风险提示:风险提示:ChatGPT 应用不及预期;Al 技术发展不及预期;ChatGPT 带来的社会问题大于预期;各国监管力度大于预期。2、投资观点一、投资观点一8ChatGPT 凭借其强大且多样的功能火遍全球凭借其强大且多样的功能火遍全球

125、。ChatGPT 是公司 OpenAl 开发并推出的智能聊天机器人工具,以其多样的功能和出色的效果,自发布以来爆火全球,月活破亿用时仅 2个多月,被称为史上增长最快的消费者应用。这也是首次 C 端 Al 产品如此爆火,使得 Al技术正式从幕后走向台前,对于 Al 技术的发展和商业化都有着里程碑式的意义。ChatGPT 商业化的想象空间巨大。商业化的想象空间巨大。区别于以往 Al 模型功能的单一性,ChatGPT 基于的大模型通过把尽可能大量的数据通过 Transformer 架构做机器学习,就能从数据中学到很多能力,多到超出设计者的想象。变现方式除了最简单直接的按需一次性收费和周期性订阅的模式

126、,还有 B 端赋能收费同样也是值得期待的商业化方向,例如近日微软宣布将 ChatGPT功能集成至旗下的搜索引擎 Bing 和浏览器 Edge。ChatGPT 仍只能起到辅助作用,带来的负面社会影响需警惕。仍只能起到辅助作用,带来的负面社会影响需警惕。ChatGPT 还存在着诸多局5引自AIGC&ChatGPT 发展报告6同上7同上8引自浙商国际I限性,目前只能作为有效的辅助工具,但未来效果会随着使用量和训练量的增多不断加强。仅仅当下阶段的智能程度,ChatGPT 的滥用就引起了教育界和学术界的诸多负面问题。未来随着 ChatGPT 能力的进化完善,像数据安全、网络安全、知识产权、法律风险等社会

127、问题对于各个国家的监管部门都将是不小的挑战。3、港股投资机会、港股投资机会9百度集团百度集团-SW(9888.HK):百度在人工智能、大数据和语言模型等方面处于行业领先地位,公司在 2 月 7 日宣布其类 ChatGPT 产品文心一言即将推出,三月份完成内测,面向公众开放,目前正在做上线前的冲刺。百度的文心大模型和 ChatGPT 类似,在 2019 年就已经推出,经过多次迭代,已经形成了较强的技术能力。此前文心大模型已面相大众推出了 Al作画平台“文心一格”和产业级搜索系统“文心百中”。阿里巴巴-SM(9988.HK):阿里在 Al 领域同样能力不俗,根据 IDC 的数据,截至 2022 上

128、半年,阿里 Al 在语音语义领域连续三年多保持引领地位,市场份额达到 31.98%,其中阿里语音 Al、语言 Al、对话式 Al 市占率均为第一。2 月 8 日,阿里宣布由阿里达摩院研发的类 ChatGPT 对话机器人已经进入内测阶段,未来将和阿里 Al 大模型、钉钉开放平台结合。商汤商汤-W(0020.HK):):“大模型”需要构建在大的算力中心上,0penAl 的 ChatGPT 就是构建在微软的算力中心上。因此,大模型数据参数大,大算力投入成本大,“大模型”配合“大算力”成为了头部 Al 公司的重要护城河。商汤作为国内头部的 Al 公司,不光在大模型方面同样有着较深的技术积累,在大算力上

129、同样投入巨大,在临港投资近 50 亿元的算力中心已经建成。网易网易-S(9999.HK):网易有道 Al 技术团队已投入到 ChatGPT 同源技术 AIGC 在教育场景的落地研发中,目前该团队正在 Al 口语老师、中文作文批改等细分学习场景中尝试探索,将尽快推出相关的 demo 版产品。近年来,团队在神经网络翻译、计算机视觉、智能语音 Al 技术、高性能计算等关键技术方面均取得重要突破。4、国内企业投资机会、国内企业投资机会-网络与平台网络与平台梳理我们此前的分析,国产替代机会更多存在于兼具中文数据资源、算力及流量分发话语权的企业中。如果说算力及资金成本、数据资源是显性壁垒,那么下游流量的充

130、沛程度是C 端的隐藏壁垒,考虑到手握 C 端流量的大厂技术布局已经相当完备,行业格局被颠覆的可能性并不高。行业内头部企业兼具数据、算力及资金优势,且在 C 端话语权更强,将率先从生产力革命中获益。我们重点关注同时布局 AIGC 生产及消费领域的互联网平台,料长期主义布局下公司将结构性受益,推荐 1)百度:国内 AIGC 领域发力最早,投入最多,研发成果最丰富的企业,据新民晚报,三月其类 ChatGPT 项目“文心一言”将完成内测并对公众开放。2)腾讯:掌握下游分发话语权,自研“混元”AI 大模型已被广泛应用到广告创作、广告检索、广告推荐等腾讯业务场景中,内容、广告及云业务将直接受益;3)网易:

131、AIGC 已被引入游戏研发流程,重磅储备逆水寒手游上线在即。我们同时关注已在视频、营销、阅读等相关细分领域抢跑的重点标的,预计先发优势下应用端的推进将更快反映至业绩。1)数码视讯:多年布局视频视觉 AI 技术,有望受益于 AIGC 生态兴起;2)捷成股份:参股公司世优科技数字人已接入 ChatGPT;3)风语筑:深耕数字展示,已有 AIGC 场景应用落地;4)浙文互联:旗下米塔数字艺术社区已开启 AIGC 模式。9引自浙商国际I4.1 百度:超前布局优势尽显,三月将推出中国版百度:超前布局优势尽显,三月将推出中国版 ChatGPT并嵌入搜索并嵌入搜索百度是国内 AlGC 领域发力最早,投入最多

132、,研发成果最丰富的企业,拥有产业级知识增强文心大模型 ERNE,具备跨模态、跨语言的深度语义理解与生成能力。从具体产品上看,2022年以来,AIGC 陆续落地搜索、内容创作和数字人领域。对话式搜索对话式搜索:百度将在 2023 年 3 月推出中国版本的 ChatGPT,最初版本将嵌入其搜索服务中,让用户获得对话式的搜索结果。多年技术积累使得公司具备布局生成式搜索的能力,ERNIE3.0Titan 预训练语言模型具有 2600 亿个参数,超过 ChatCPT 的技术根基(GPT-3.5 模型)1750 亿的参数数量,我们认为在数据数量及人工标注成本上,公司具备相对优势。内容创作内容创作:公司通过

133、文心大模型、文心一格、图文转视频等技术,为创作者提供“AI 文案助理”、“AI 指画助理”、“AI 视频制作助理”。从变现上看,文心一格付费版本采用积分制,用户可以通过消耗积分生成不同品质的图片,也开放合理范围内的商业使用。数字人将数字人技术与 AlGC 图文转视频、TIS 语音合成技术结合,为媒体及创作者定制真人孪生数字人。创作者输入文本即可生成有数字主持人口播的视频,不仅保证信息播报准确性,还具备多国语言口播、情绪识别等人格化功能,实现 AI 驱动 24 小时不停播。AIGC 天然契合智能搜索、智能推荐、智能营销等业务高度个性化的特点,有望加快公司业务连接效率的提升,进一步提振主业绩。22

134、Q3 百度核心非营销收入 65 亿元,同比+25%,受云服务及其他 Al 业务推动显著。2022年,公司提出技术能用尽用、能出尽出,未来 AIGC 将在其移动生态大规模落地。4.2 腾讯:掌握下游分发话语权,内容、广告及云业务将直腾讯:掌握下游分发话语权,内容、广告及云业务将直接受益接受益公司坐拥海量用户及社交数据资源,具备独立开发类 ChatGPT 应用的能力,相关技术已经应用于广告业务。公司广告多媒体 AI 团队独立研发的“混元”AI 大模型覆盖计算机视觉、自然语言处理、多模态内容理解、文案生成、文生视频等多个方向,可将视频和文本等跨模态数据分别做拆解,通过相似度分析,综合考量并提取视频和

135、文本之间层次化的语义关联。目前,“混元”AI 大模型已被广泛应用到广告创作、广告检索、广告推荐等腾讯业务场景中。公司将直接受益于 AI 内容生产降本增效能力。公司内容业务覆盖游戏、视频、音频、资讯等领域,结合体外投资,基本实现内容赛道上下游全布局。1)文娱内容:随着 2022 年以来降本增效策略持续推行,PCG 内容部门成为成本优化的第一线,我们判断“混元”AI 大模型的广泛应用能够与公司的运营策略共振,进一步为内容业务去肥增瘦;2)游戏:Gcloud团队的自动蒙皮、自动 2UV、一站式全流程工具管线 Superman 等 AI 相关游戏服务已落地。公司 FBS 业务线拥有多个 SaaS 服务

136、软件,我们判断腾讯会议、腾讯文档、企业微信等可对标微软 Teams 及 Office,具备嵌入 AI 机器人等附加服务的条件,SaaS 业务变现有望进一步加快。I4.3 网易:网易:AIGC 已被引入游戏研发流程,重磅储备上线在即已被引入游戏研发流程,重磅储备上线在即公司已经将 AIGC 技术深度融入业务。从具体技术布局来看,1)网易互娱已在语音驱动嘴型、风格化头部模型生成、贴图变化、资源超分等具体技术领域有了成熟产品。2)网易伏羲已经发表了 70 多篇游戏和 AI 顶会论文,申请了 100 多篇游戏和 AI 相关的技术专利。相关研落地服务了 100 多个游戏客户,AI 服务每日调用量超过 1

137、 亿次,在 AI 捏脸、语音生成 NPC、动画生成等均有布局。3)网易有道 AI 技术团队已投入到 ChatGPT 同源技术(AIGC)在教育场景的落地研发中,目前该团队已在 AI 口语老师、中文作文批改等细分学习场景中尝试应用,有望成为 AIGC 技术在国内互联网教育场景的首次落地应用。重磅储备逆水寒已经取得版号,看好业绩修复空间。公司已连续三批取得版号,其中逆水寒手游预约数超百万,有望成为国产开放世界手游领军作,有力增厚业绩;此外超凡先锋巅峰极速亦取得版号,代理产品幻想生活突袭:暗影传说均为海外流水表现优异的佳作。与暴雪解约的影响甚微,关注 3A 领域长期布局。公司实际已经通过投资及自设方

138、式扩大海外布局,吸纳大量 3A 游戏制作人,且 2022 以来节奏更加密集,近期来看,公司于英国成立工作室 Spliced,致力于打造原创 IP 的“世界级在线游戏”体验,目前已有 R 星、动视等3A 大厂员工加盟;于日本成立工作室 GPTRACK50,专注于制作高质量端游;同时投资瑞典Liquid Swords、美国 Something WickedGames、加拿大 SkyBox Labs 等工作室,长期主义导向突出。4.4 数码视讯数码视讯:多年布局视频视觉多年布局视频视觉 AI 技术技术,有望受益于有望受益于 AIGC生态兴起生态兴起公司于视觉 AI 方向已具备充分的技术研发储备,并在

139、多个领域进行市场化验证,实现落地应用。公司拥有自主研发的 AVS2/AVS3 系列超高清视频算法库,具备 4K/8K 采集、核心传输交换、存储等全产业链解决方案,积极参与总台、北京电视台 2022 年北京冬奥会、冬残奥会直播报道,助力总台实现奥运会历史上转播技术方面的全球领先,为人民日报新媒体提供了包括 5G+4K 便携式直播背包等超高清视频产品及技术支持。公司在元宇宙领域已展开技术布局。公司利用 5G 等技术储备,探索构建元宇宙场景基础。I子公司快视听旗下洞壹元典平台联合国内大型机构,发行多款公益数字藏品及宝庆竹刻非遗文化敦煌境飞天赐福等多个商业项目,实现了极大社会关注和传播宣导。2021

140、年报显示,未来公司将结合安全系统框架、低延时传输、超高清编码、5G 视频应用、区块链应用及智能合约等技术储备,为相关应用从底层构建一个符合元宇宙身份认知、沉浸感、低延迟、经济系统等核心要素的元宇宙场景基础。4.5 捷成股份:参股公司世优科技数字人已接入捷成股份:参股公司世优科技数字人已接入 ChatGPT公司参股公司世优科技已经完成 AI 赛道布局,数字人领域商业化应用成熟。作为国内较早专注于实时虚拟技术研发与应用的科技公司,世优科技基于十余年的项目经验,将数字人工厂升级至 3.0 版本,形成了“实时数字人+虚拟演播室+SAAS+MAS”的下一代全栈式虚拟技术服务平台,目前已涵盖入门级/消费级

141、/专业级/AI 级多层次数字人赋能产品体系,产品应用范围覆盖大 B 端、中小 B 端、C 端。世优科技数字人已经接入 ChatGPT,有望快速进入内容生成、智能客服等领域。接入ChatGPT 超强 AI 大脑的世优科技数字人除具备通用能力外,还将具备个性化独有的人设背景表达能力,已形成产品化解决方案,商业价值处于上升周期。4.6 风语筑:深耕数字展示,已有风语筑:深耕数字展示,已有 AI 场景应用落地场景应用落地公司多年深耕数字展示,相关产品技术基础成熟。公司通过全息影像、裸眼 3D、CGI 特效等技术手段,AR/VR/MR、4K/8K 超高清视频等媒介形式,为客户和消费者提供商业展览、数字艺

142、术消费品及各类数字视觉服务,3D 数字设计和视觉渲染领域已经完成了相对成熟的布局,在 VR/AR/XR、裸眼 3D、全息等数字技术应用领域亦拥有丰富的项目应用案例和经验。目前公司已结合 AIGC 技术在文生文、文生图、文生音视频等领域进行场景应用。此前公司在虚拟展厅、虚拟数字人、虚拟场景以及数字艺术创作领域均有结合 AI 人工智能技术的探索与应用,有效提升了数字创意、三维设计与 3D 内容创作的效率和独特性。随着 AIGC 技术从“通用模型”向“行业垂直”方向加速迭代,看好公司在 3D 建模和虚拟空间生成等领域的定向训练和模型优化。I4.7 浙文互联:旗下米塔数字艺术社区已开启浙文互联:旗下米

143、塔数字艺术社区已开启 AIGC 模式模式据公司在投资者互动平台的介绍,公司在 2021 年就已进军元宇宙领域,持续探索营销领域的科技赋能:汽车元宇宙:汽车元宇宙:加速元宇宙汽车公园等基础设施建设。在吉利 ICON 的“巧克力城”元宇宙项目中,用户可以通过虚拟驾驶吉利 ICON 巧克力 SUV 行驶在铺满巧克力汁的高空路面上,实现了在虚拟世界中为现实世界品牌的高效赋能。数字藏品:数字藏品:公司旗下 数字藏品平台“米塔数字艺术平台”与浙江文化艺术品交易所股份有限公司签署战略合作,目前在该领域的布局发展迅速有序。虚拟数字人:虚拟数字人:自有虚拟数字人-国风虚拟 IP“君若锦”、Z 世代虚拟 IP“兰

144、 LAN”在 2022 年迎来持续升级,在更多场景中得以应用。公司还为东风风光 MINIEV 打造了风光轻生活主理人“可甜”,为长安汽车打造数字体验工程师“宫橙诗”等。公司旗下米塔数字艺术作为元宇宙艺术创作社区,已开启 AIGC 模式。米塔 APP 现支持 AI绘画和手动绘画两种模式,打开 AI 绘画即可使用 AI 进行绘制。5、国内企业投资机会、国内企业投资机会-算力算力5.1、AI 超算中心:超算中心:ChatGPT 的核心基础设施的核心基础设施算力(ComputationalPower 简称 CP)指对数据的处理能力,被视为数字经济时代的新生产力,是推动数字经济发展的核心力量。算力基本计

145、量单位为 FLOPS,通常一台服务器的计量单位为 TFLLOPS(1012FLOPS)。在 2022 超算大会上,超级计算机 Frontier 排名第一算力达到 1.102EFLOPS(1018FLOPS)。中国的神威太湖之光排名第六,算力为 93.01PFLOPS(1015FLOPS)。II微软投资微软投资 10 亿美金打造亿美金打造 OpenAI 超算平台超算平台。2020 年 5 月,微软投资 10 亿美金与 OpenAI独家合作打造了 Azure AI 超算平台亮相,性能位居全球前五,拥有超过 28.5 万个 CPU 核心、1 万个 GPU、每 GPU 拥有 400Gbps 网络带宽的

146、超级计算机,主要用于大规模分布式 AI 模型训练。根据澎拜新闻数据,微软表示,AI 超算平台可比肩世界 TOP 超级计算机 Top 5,则意味着它在中国国家超级计算机中心的天河 2A 后面,在德克萨斯高级计算机中心的 Frontera 之前,其算力峰值每秒可以执行 23.5 到 61.4 个万亿浮点运算。大模型需要的算力极其夸张大模型需要的算力极其夸张。基于 Transformer 体系结构的大型语言模型(Large LanguageModels)涉及高达数万亿从文本中学习的参数。开发它们是一个昂贵、耗时的过程,需要深入研究技术专长、分布式数据中心规模的基础设施和完整的堆栈加速计算方法。据 O

147、penAI报告,训练一次 1746 亿参数的 GPT-3 模型需要的算力约为 3640 PFlop/s-day。即假如每秒计算一千万亿次,也需要计算 3640 天。ChatGPT 产品运营需要更大的算力产品运营需要更大的算力:据 SimilarWeb 数据,2023 年 1 月 ChatGPT 官网总访问量为 6.16 亿次。据 Fortune 杂志,每次用户与 ChatGPT 互动,产生的算力云服务成本约 0.01美元。根据科技云报道如果使用总投资 30.2 亿元、算力 500P 的数据中心来支撑 ChatGPT 的运行,至少需要 7-8 个这样的数据中心,基础设施的投入都是以百亿计的。I海

148、外巨头积极投入大模型。参数量(Params)形容模型的大小程度,类似于算法中的空间复杂度,往往参数量越大(复杂程度越高)的神经网络模型对算力的需求程度更高,从右图得知复杂的神经网络模型的算法参数量约千亿级别甚至万亿级别,与已知应用级别的呈现指数级别的差异。GPT-3 的参数量相较于此前大幅度增长。I5.2、AI 服务器服务器:新一代数据中心的关键硬件新一代数据中心的关键硬件数据中心产业链最上游为 IT 硬件和基础设施。IT 硬件:分为计算设备(IT)和通信设备(CT),IT 设备主要为服务器,CT 设备包括交换机、路由器等网络设备和光模块,这些构成了算力与网络传输的基础。基础设施:分为电力设备

149、、监控设备、空调设备和发电机组,主要为 IT 硬件提供稳定电力供应和适宜的温度环境。服务器是数据中心的核心硬件。根据中国电子信息产业发展研究院数据显示,中国数据中心硬件设备投资规模中,服务器占主要比重,其中以 X86 服务器为主,其次为数据中心存储设备。I我国智能算力规模持续增长。经中国信息通信研究院测算,2021 年我国计算设备算力总规模达到 202 Eflops,全球占比约 33%,保持 50%以上高速增长,其中智能算力规模达到104Eflpos,增速 85%,成为我国算力增长的主要驱动力。(智能服务器按我国近 6 年 AI 服务器算力总量测算)。I根据 IDC 数据,2021 年全球人工

150、智能服务器规模达 156.3 亿美元。同比增速达 39.1%。其中,浪潮信息、戴尔、HPE 分别以 20.9%、13.0%、9.2%的市占比率为例前三,三家厂商占总时长份额的 43.1%。根据 IDC 数据,预计 2021 年人工智能加速服务器市场规模将达到 56.9 亿美元,同比增长 61.6%,到 2025 年,中国人工智能加速服务器市场将达到 108.6 亿美元,其五年复合增长率为 25.3%,2021 H1,中国加速服务器厂商浪潮、宁畅、华为市场规模位列前三,占据了中国 70%的市场份额。I5.3、GPU:AI 算力的算力的“心脏心脏”,行业景气向上,行业景气向上AI 芯片是 AI 算

151、力的“心脏”。伴随数据海量增长,算法模型趋向复杂,处理对象异构,计算性能要求高,AI 芯片在人工智能的算法和应用上做针对性设计,可高效处理人工智能应用中日渐多样繁杂的计算任务。在人工智能不断扩大渗透的数字时代,芯片多元化展现出广阔的应用前景,通过不断演进的架构,为下一代计算提供源源不断的动力。AI 芯片主要包括图形处理器(GPU)、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、神经拟态芯片(NPU)等。人工智能深度学习需要异常强大的并行处理能力,芯片厂商正在通过不断研发和升级新的芯片产品来应对挑战。GPU 比 CPU 更擅长并行计算:CPU 是以低延迟为导向的计算单元,而 GPU 是

152、以吞吐量为导向的计算单元,转为执行多任务并行。由于微架构的不同导致 CPU 绝大部分晶体管用于构建控制电路和缓存,只有小部分晶体管用来完成运算工作,GPU 则是流处理器和显存控制用于绝大部分晶体管,从而拥有更强大的并行计算能力和浮点计算能力。AI 服务器作为超算芯片载体彰显其重要性:与通用服务器采用串行架构、以 CPU 为算力提供者不同的是,AI 服务器采取异构架构,如 CPU+GPU、CPU+TPU、CPU+其他的加速卡等不同的组合方式,目前广泛使用的是 CPU+GPU。与通用服务器相比,AI 服务器拥有更出色的高性能计算能力,未来,随着算力的持续增长,自然语言处理和图像、视频等 AI 模型

153、的深入发展,AI 服务器将被更广泛使用。人工智能一直是行业内大力发展的核心技术之一,越来越多的公司将人工智能应用于其终端产品中以提升产品性能或拓展应用领域,这一趋势带动了人工智能芯片行业的快速增长。I根据 Frost&Sullivan 数据显示,2021 年全球人工智能芯片市场规模为 255 亿美元。预计2021-2026 年,全球人工智能芯片市场规模将以 29.3%的复合增长率增长,2023 年将达到 490亿美元。根据中商情报网数据,2021 年,我国 AI 芯片达到 427 亿元,同比增长 124%。在政策、市场、技术等合力作用下,中国人工智能芯片行业将快速发展,预计 2023 年我国

154、AI 芯片市场规模将达 1206 亿元。我国加速服务器主要应用于互联网行业,英伟达是主要加速卡供货商。根据 IDC 披露 2021年我国加速服务器行业数据:1)加速服务器下游行业:互联网依然是最大的采购行业,占整体加速服务器市场近 60%的份额,同比增长 70%以上,此外金融、服务、制造、公共事业和能源行业均有超过 50%的上涨。2)加速卡供应商:2021 年,中国加速卡数量出货超过 80 万片,其中 Nvidia 占据超过80%市场份额。此外还包括 AMD、百度、寒武纪、燧原科技、新华三、华为、Intel 和赛灵思等。5.4、AI 服务器和服务器和 GPU 的主要玩家的主要玩家5.4.1、浪

155、潮:中国服务器、浪潮:中国服务器/AI 服务器市占率稳居榜首服务器市占率稳居榜首浪潮信息是全球领先的新型 IT 基础架构产品、方案及服务提供商。公司是全球领先的 AI基础设施供应商,拥有业内最全的人工智能计算全堆栈解决方案,涉及训练、推理、边缘等全栈 AI 场景,构建起领先的 AI 算法模型、AI 框架优化、AI 开发管理和应用优化等全栈 AI能力,为智慧时代提供坚实的基础设施支撑。生产算力方面,公司拥有业内最强最全的 AI 计算产品阵列,业界性能最好的 Transformer训练服务器 NF5488、全球首个 AI 开放加速计算系统 MX1、自研 AI 大模型计算框架 LMS。聚合算力层面,

156、公司针对高并发训练推理集群进行架构优化,构建了高性能的 NVMe 存储池,深度优化了软件栈,性能提升 3.5 倍以上。调度算力层面,浪潮信息 AIstation 计算资源平台可支持 AI 训练和推理,是业界功能最全的 AI 管理平台;同时,浪潮信息还有自动机器学习平台 AutoML Suite,可实现自动建模,加速产业化应用。I5.4.2、戴尔:全球服务器龙头,提供完整、戴尔:全球服务器龙头,提供完整 AI 架构与方案架构与方案戴尔以生产、设计、销售家用以及办公室电脑而闻名,生产与销售服务器、数据储存设备、网络设备等。2016 年 9 月,EMC Corporation 和戴尔公司合并,新公司

157、将被命名为戴尔科技(Dell Technologies)。新公司营业重点将转向云服务,并推进服务器及存储领域整合。戴尔科技集团可以提供完整的 AI 基础架构、AI 平台就绪解决方案和 AI 行业应用。AI 基础架构包括高性能 AI 训练服务器、AI 推理服务器、AI 边缘计算、高性能 AI 存储系统 PowerScale、DPS 数据保护解决方案和数据中心网络。AI 平台就绪解决方案则包括基于 CPU、IPU、GPU 的AI 就绪解决方案,GPU 分布式训练自动化实现,Graphcore IPU AI 专用芯片,NVAIE,GPU 虚拟化,AIaaS 平台和 OMNIA 开源社区。5.4.3、

158、中科曙光:我国高性能计算、智能计算领军企业、中科曙光:我国高性能计算、智能计算领军企业中科曙光作为我国核心信息基础设施领军企业,在高端计算、存储、安全、数据中心等领域拥有深厚的技术积淀和领先的市场份额,并充分发挥高端计算优势,布局智能计算、云计算、大数据等领域的技术研发,打造计算产业生态,为科研探索创新、行业信息化建设、产业转型升级、数字经济发展提供了坚实可信的支撑。依托先进计算领域的先发优势和技术细节,中科曙光全面布局智能计算,完成了包括 AI核心组件、人工智能服务器、人工智能管理平台、软件等多项创新,构建了完整的 AI 计算服务体系。并积极响应时代需求,在智能计算中心建设浪潮下,形成了 5

159、A 级智能计算中心整体方案。目前,曙光 5A 智能计算中心已在广东、安徽、浙江等地建成,江苏、湖北、湖南等地已进入建设阶段,其他地区也在紧张筹备和规划中。I5.4.4、英伟达:、英伟达:全球全球 GPU 领军企业领军企业英伟达公司是一家以设计智核芯片组为主的无晶圆英伟达公司是一家以设计智核芯片组为主的无晶圆 IC 半导体公司半导体公司。早在 1999 年,英伟达发明了 GPU,重新定义了现代计算机图形技术,彻底改变了并行计算。在独立 GPU 领域,英伟达 2022 年占据 81%的市场份额,处于绝对的领先地位。英伟达有消费者(游戏)业务Gaming、数据中心业务 Data Center、汽车业

160、务 Auto、专业解决方案业务 ProfessionalVisualization 以及 OEM 和其他业务 OEM&Others,英伟达主要为这些领域提供 GPU 芯片及相应的软件工具链。英伟达成为云计算和 AI 行业的芯片及服务器等“种子”工具GPU 的主要供应商,搭载英伟达 GPU 硬件的工作站(Workstation)、服务器(Server)和云(Cloud)通过 CUDA 软件系统以及开发的 CUDA-X Al 库,为 Al 领域的机器学司(MachineLearning)、深度学习(DeepLearing)中的训练(Train)和推理(Inference)提供软件王具链,来服务众多

161、的框架、云服务。CUDA 成为连接 AI 的中心节点,CUDA+GPU 系統极大推动了 AI 倾城的发展,形成了CPU+GPU+DPU 产品矩阵。5.4.5、海光信息:支持全精度,、海光信息:支持全精度,GPU 实现规模量产实现规模量产海光信息主要从事高端处理器、加速器等计算芯片产品和系统的研究、开发,主要产品包括海光 CPU 和海光 DCU。2018 年 10 月,公司启动深算一号 DCU 产品设计,海光 8100 采用先进的 FinFET 工艺,典型应用场景下性能指标可以达到国际同类型高端产品的同期水平。2020 年 1 月,公司启动DCU 深算二号的产品研发。海光 DCU 性能强大。海光

162、 DCU 基于大规模并行计算微结构进行设计,不但具备强大的双精度浮点计算能力,同时在单精度、半精度、整型计算方面表现同样优异,是一款计算性能强大、能效比较高的通用协处理器。海光 DCU 集成片上高带宽内存芯片,可以在大规模数据计算过程中提供优异的数据处理能力。I5.4.6、华为海思:五大系列发挥产业集成优势、华为海思:五大系列发挥产业集成优势海思是全球领先的 Fabless 半导体与器件设计公司。前身为华为集成电路设计中心,1991年启动集成电路设计及研发业务,为汇聚行业人才、发挥产业集成优势,2004 年注册成立实体公司,提供海思芯片对外销售及服务。海思致力于为智慧城市、智慧家庭、智慧出行等

163、多场景智能终端打造性能领先、安全可靠的半导体基石,服务于千行百业客户及开发者。海思产品覆盖智慧视觉、智慧 IoT、智慧媒体、智慧出行、显示交互、手机终端、数据中心及光收发器等多个领域。海思半导体旗下的芯片共有五大系列,分别是用于智能设备的麒麟 Kirin 系列;用于数据中心的鲲鹏 Kunpeng 系列服务 CPU;用于人工智能的场景 AI 芯片组昇腾 Ascend 系列SoC;用于连接芯片(基站芯片 Tiangang、终端芯片巴龙 Balong);以及其他专用芯片(视频监控、机顶盒芯片、智能电视、运动相机、物联网等芯片)。5.4.7、寒武纪:少数全面掌握、寒武纪:少数全面掌握 AI 芯片技术的

164、企业之一芯片技术的企业之一寒武纪主营业务是应用于各类云服务器、边缘计算设备、终端设备中人工智能核心芯片的研发和销售。公司的主要产品包括终端智能处理器 IP、云端智能芯片及加速卡、边缘智能芯片及加速卡以及与上述产品配套的基础系统软件平台。寒武纪是目前国际上少数几家全面系统掌握了通用型智能芯片及其基础系统软件研发和产品化核心技术的企业之一,能提供云边端一体、软硬件协同、训练推理融合、具备统一生态的系列化智能芯片产品和平台化基础系统软件。2022 年 3 月,寒武纪正式发布了新款训练加速卡“MLU370-X8”,搭载双芯片四芯粒封装的思元 370,集成寒武纪 MLU-Link 多芯互联技术,主要面向

165、 AI 训练任务。I5.4.8、龙芯中科:、龙芯中科:2K2000 系列集成自主系列集成自主 GPU龙芯中科主营业务为处理器及配套芯片的研制、销售及服务,主要产品与服务包括处理器及配套芯片产品与基础软硬件解决方案业务。公司基于信息系统和工控系统两条主线开展产业生态建设,面向网络安全、办公与业务信息化、工控及物联网等领域与合作伙伴保持全面合作,产品在电子政务、能源、交通、金融、电信、教育等行业领域已获得广泛应用。2022 年 12 月,龙芯 2K2000 完成了初步功能调试及性能测试,达到其设计目标,2023年将推出试用。龙芯 2K2000 集成了两个 LA364 处理器核,典型工作频率为 1.

166、5GHz,共享 2MB的 L2 缓存,SPEC2006INT(base)单核定/浮点分值达到 13.5/14.9 分。龙芯 2K2000 芯片集成了龙芯自主研发的 GPU,并优化了图形算法和性能。5.4.9、景嘉微:新一代、景嘉微:新一代 JM9 系列有望打开商用市场系列有望打开商用市场景嘉微主要从事高可靠电子产品的研发、生产和销售,产品主要涉及图形显控领域、小型专用化雷达领域、芯片领域和其他。图形显控是公司现有核心业务,也是传统优势业务,小型专用化雷达和芯片是公司未来大力发展的业务方向。在图形处理芯片领域,公司历经十余年,成功研发 JM5400、JM7200、JM9 为代表的系列图形处理芯片

167、,并成功实现产业化。日前,公司 JM9 系列图形处理芯片已顺利发布,应用领域涵盖地理信息系统、媒体处理、CAD 辅助设计、游戏、虚拟化等高性能显示和人工智能计算领域。目前,信创市场为公司提供了新的业务增长点,JM9 系列图形处理芯片的成功发布将为公司未来进一步拓展通用市场提供强有力的产品支撑。I5.5、算力投资建议、算力投资建议ChatGPT 或将引发产业对于 AI 算力的新一轮“军备竞赛”。相关受益标的包括,1)AI 服务器:浪潮信息、中科曙光、紫光股份、联想集团;2)GPU:海光信息、寒武纪、龙芯中科、景嘉微;3)网络设备(通信覆盖):紫光股份、星网锐捷;4)光模块(通信覆盖):新易盛、光

168、迅科技等。5.6、风险提示、风险提示技术迭代创新不及预期技术迭代创新不及预期:AIGC 相关产业技术壁垒较高,公司核心技术难以突破,进程低于预期,影响整体进度。互联网等行业资本开支不及预期互联网等行业资本开支不及预期:预计互联网厂商将在未来AI算力投入中扮演重要角色,如果互联网 IT 资本开支下降,将影响 AI 算力的投入。市场竞争加剧市场竞争加剧:ChatGPT 的诞生将带来新的市场机遇,互联网、科技企业的入局或将加速行业的竞争,短期影响公司的盈利能力。中美贸易摩擦升级的风险中美贸易摩擦升级的风险:供应链存在部分海外提供商,容易受到美国”卡脖子”制裁,导致产品研发不及预期。I十五、十五、机遇

169、与挑战机遇与挑战1、AIGC 发展机遇发展机遇作为尖端科技,AIGC 正迎来全面商业化落地部署的今天,因此展望未来趋势自然有助于更好的建设明天。1.1、大模型的广泛应用、大模型的广泛应用AI 发展至今已走过多次寒冬与春天,每次交织都与 AI 的“通用化”与“专业化”分歧息息相关,可以说“通用化”代表着人类对未来的畅想,“专业化”则能带来更好的落地部署形式,但不论哪种都 经常遇见这样那样的瓶颈。21 世纪的前二十年,是“通用化”大模型提出并获得发展的时代,简单说来它是通过“预训练大模型+下游任务微调”的方式,先 让模型在大量标记与未标记的数据中学习知识,在将微调后的模型迁 移到其他场景中,进而极

170、大的扩展了模型通用能力。现在随着模型规 模的增长也让大模型的能力水涨船高,比如 GPT-3 就包含高达 1750 亿的参数量。大模型之“大”,除了参数规模庞大,数据量同样不能小视。过 去有人说“人工智能就是大量人工才能换来的智能”,这是因为当时 的机器学习依赖数据标注,一旦转换场景就需要重新标注。现在的机 器学习多采用监督与无监督学习相结合的方式,例如“无监督训练,监督微调”。此外也利用互联网上的 PGC,UGC 进行训练,以获得更 丰富的数据与更自然的表达。不论模型还是数据,大模型都为 AIGC 赋予了充分的想象空间,随着时代的发展,它也许在未来能获得更多应用场景。1.2、全新的仿人模式、全

171、新的仿人模式在 AI 产业刚起步时,一种非常简单的思路是让机器模仿人的学习方式,这种模式一直都是 AI 算法的重要思路来源,因此 AI 也经历 了从推理到知识再到学习的变化。从起初的微观,机械性模仿,到现在宏观的认知模式借鉴,技术哲学也在随着时代而发展。在 AI 发展早期阶段,三种流派中的“符号主义”占据主导地位,这派观点简而言之就是“人类的一切智能源于某种逻辑规则”。虽然 当时它的确取得了一定成绩但这种观点缺陷明显,最易于理解的莫过 于人类的很多智力行为都没有逻辑可言,因此这一流派很快被淘汰,由从更高的抽象层次定义 AI 的“联结主义”取而代之。这种观点在发展初期遇到了诸多障碍,现在的形式也

172、与当初的出发点相去甚远,但 AI 神经网络的蓬勃发展也在一定程度上验证了这种高度抽象化模 式的可行。从 AI 开拓到应用,从模仿人类的学习过程到模仿人类的认知方式,AI 的发展也逐渐变得宏观,随着未来科技的发展,AI 还会迎来飞跃式发展,为 AIGC 带来更多可能性。I1.3、技术伦理成为重点关注领域、技术伦理成为重点关注领域AI 的发展堪称具有革命性,但本质上来说,任何科技都有伦理 问题,并且逐渐受到关注。很多 AIGC 从学术研究转向产业研究的第一步就是探索如何从技术角度解决可能的技术伦理问题。比较典型的是 AI 生成内容的危险性,比如 2016 年微软发布的 Tay,它可以通过推特学习社

173、会信息并与他人互动。但是在仅仅一天后,Tay 就开始说出一些种族歧视之类的偏激言论,因此微软暂时关闭了 Tay 的账号。但这些言论明显是和网络上一些有偏激言论的人互动后,被刻意教导出来的,因为微软当时还没有让 Tay 了解哪些言论是不适当的。目前很多企业都在运用一些技术手段避免类似事件的发生,如改 善数据集,或者增加限制性条件,微调模型,让 AI 可以更少的接触 不良信息,但依然难以根绝有人刻意诱导 AI。比如最近大火的 ChatGPT 就曾写过步骤详细的毁灭人类计划书,后来发现是有一位工程师在故意为之。除了技术伦理问题的预防,在使用时的及时警告及紧急关停措施 同样重要且必要。AIGC应该自带

174、对生成内容的检测机制,确保不被 用于危害社会。一旦发现可疑举动 AI 可以迅速反应,暂停服务,并且给出警告甚至自动报警。这不仅依赖技术发展,相关的法律法规同 样必不可少,AIGC 技术伦理问题需要社会各界的共同努力。2、AIGC 发展挑战发展挑战目前 AIGC 相关的挑战主要集中在版权、欺诈、违禁内容三方面。2.1、AIGC 的版权问题的版权问题从本质上说,AIGC 是机器学习的应用。而在模型的学习阶段一定会使用大量数据,但目前对训练后的生成物版权归属问题尚无定论。对此问题,业内一般有两种观点。其一认为内容由学习数据集后生成,那版权就归数据集作者;另一种则认为 AIGC 的生产过程是完全随机的

175、,没有版权问题,生成的版权属于 AIGC 作者或平台,具体规则由平台制定。目前的实践中,各平台的版权条例也偏向后者。但无论哪种都会引起一些原创版权作者的不满,比较常见的说法是“吃作者的饭,砸作者的碗”。很多人的愤怒点在于,为什么 AI 基于自己创作的作品生成的新作品却与自己无关?而且现行法律都是针对人类的行为规范而设立的,AI 只是一种工具,不受法律约束与审判。即便证据充分,作者的维权之路通常也难言顺利。不过对于 AIGC 与作者的关系将会随着时代发展而逐渐清晰,界定也将更有条理性。2.2、AIGC 的欺诈问题的欺诈问题近几年高科技诈骗手段层出不穷,AI 经过训练后也可以创作出以假乱真的音视频

176、,同时制作门槛也在日益降低,既可用于修改作品,也可用于制作全新内容。比如现在很常见的“换脸”“变声”等功能,一旦滥用就可能导致正规渠道信息的公信力减弱,久而久之危害甚大。现在已有部分诈骗分子利用“换脸”技术实施诈骗,也有不法分子恶意伪造他人视频,再转手兜售到灰色市场,用于赌博、诈骗、非法集资等犯罪行为,极大的增加了执法机构的成本投入。I2.3、AIGC 的违禁内容的违禁内容从技术角度说,AIGC 完全取决于使用者的引导,在安全措施不到位的情况下,AI 对恶意诱导会不加分辨或判断,只会根据学习到的信息输出新内容,例如 Tay 的极端或暴力言论。一旦被人利用恶意造谣生事,或者编造花边新闻,除了对社

177、会人物名誉和形象的损害,更会导致许多不必要的麻烦。这类新闻此前就屡见不鲜,无疑是应该被打击严惩的。AIGC 作为内容生产的新范式,在推动数字经济快速发展的同时 也对国家相关法律法规机构及监管治理能力都提出了更高要求。很多国家在打击违法犯罪的同时也在不断完善法律法规,尽力避免潜在的社会漏洞。十六、十六、结论结论1、ChatGPT 市场反应热烈,国内外巨头纷纷入场市场反应热烈,国内外巨头纷纷入场;据统计 ChatGPT 日活跃用尸数的增速远超 Instagram,1 月份平均每天有超过 1300 万名独立访问者使用 ChatGPT,是去年 12 月份的两倍多;国内外科技巨头都非常重视 ChatGP

178、T 引发的科技浪潮,积极布局生成式国内厂商(百度,腾讯等)也高度关注 ChatGPT,积极探索前沿技术。相关深度应用也即格推出。2、ChartGPT 经历多类技术路线,演化逐步成熟与完善经历多类技术路线,演化逐步成熟与完善;ChatGPT 所能实现的人类意图来自于机器学习、神经网络以及意图与机器学习以及Transformer 模型的多种技术模型积累.Transformer 建模方法成熟以后,使用一套统一的工具来开发各种模态的基础模型这种理念得以成熱,随后 GPT-1、GPT-2、GPT-3 模型持续演化升级,最终孵 ChatGPT 文本对诂应用。3、AIGC 跨模态产业生态逐步成熟,商业落地落

179、地未来可跨模态产业生态逐步成熟,商业落地落地未来可期期;AIGC 产业生态当前在文本、音频、视频等多模态交互功能上持续演化升级,奠定了多场景的商用基础。跨模态生成技术也有望成为真正实现认知和决策智能的转折点。4、Chat GPT 趁东风,商业架构,日益清晰趁东风,商业架构,日益清晰随着 ChatGPT Pius 发布,商业化序幕已经拉开,ChatGPT 在传媒、彩视、营销、娱乐以及数实共生助力产业升级等领域均可产生极大助益,提升生产力曲线,多维度赋能虚拟经济和实体经济。I十七、十七、未来展望未来展望1、趋势判断趋势判断短期来看,ChatGPT 的快速推广阻力仍存。2、存在问题、存在问题技术仍未

180、成熟,仅能起到辅助作用。虽然 ChatGPT 看似功能特别强大,但当前还存在着诸多局限性,例如:1)上下文语境的理解能力仍有所欠缺、2)反馈信息片面不准确,导致产生有偏见或误导性的信息、3)训练信息有误会导致信息错误等等。尝试使用 ChatGPT 写一段金融领域相关的文案,我们发现 ChatGPT 给出的答案总体而言相当有逻辑性,但是实质内容仍有所欠缺,整体回答给人感觉废话过多。但对于遣词造句和逻辑梳理而言,ChatGPT的确是写作者不错的辅助工具。I3、社会影响、社会影响ChatGPT 除了技术本身之外,随着其进化得越来越智能,带来的社会问题也将是我们要考虑的重点,首当其冲且已经发生的问题就

181、集中在教育和学术界。正如上述中提到的 ChatGPT 在学生群体中传播极快,对学术和教育界产生了严重的负面影响。人工智能造成的剽窃作弊行为在当下的学术规则中很难得到证明,包括英国、法国、美国在内的诸多国家的教育部门均出台政策,禁止在学校使用 ChatGPT。学术界遇到的冲击更为严峻,科学期刊表示他们正在更新编辑规则,强调不能在作品中使用任何人工智能生成的内容,如有违反,将构成科学不端行为。但最近的一项研究中发现,有大量由 ChatGPT 创建的论文摘要被提交给学术审稿人,但被发现比例不超过 63%。未来 ChatGPT 带来的失业问题也难以避免。即使当前 ChatGPT 的智能程度还未到可以完

182、全取代人类的地步,但其优秀的辅助能力仍有望帮助公司大幅提升效率,从而对于人员的需求减少。近日有美版今日头条之称的美国数字媒体公司 BuzzFeed 宣布计划采用 ChatGPT 协助创作个性化内容,并宣布裁掉 12%的员工,其股价赢来暴涨。未来随着 ChatGPT 的进化和普及,带来的社会生产力变革,一定也会伴随着变革带来诸多社会问题,像数据安全问题、网络安全问题、知识产权问题、法律风险问题等等,这对于各个国家的监管部门都将是不小的挑战。I参考资料参考资料1.一文读懂 AIGC 的前世今生,亿欧智库。2.ChatGPT 平地惊雷,AI 热潮袭来,长城证券研究报告。3.ChatGPT 打响 AI

183、 算力“军备战”AIGC 行业深度报告(3)华西计算机团队。4.新生产工具落地,近期即可展望变现AIGC 应用、商业化及受益标的华西证券股份有限公司 华西传媒互联网团队,2023 年 2 月 10 日附件、概念索引附件、概念索引AIGCAIGC 是 AI Generated Content 的缩写,指利用人工智能技术生成的内容。它也被认为是继 PGC,UGC 之后的新型内容生产方式,AI 绘画、AI 写作等都属于 AIGC 的具体形式。2022年 AIGC 发展速度惊人,迭代速度更是呈现指数级发展,这其中深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,都在助力 AIGC 的快速发

184、展。去年人工智能绘画作品的夺冠、超级聊天机器人 ChatGPT 的出现,拉开了智能创作时代的序幕。AIGC 是利用人工智能技术自动生成内容的新型生产方式。按照模态区分,AIGC 又可分为音频生成、文本生成、图像生成、视频生成及图像、视频、文本间的跨模态生成,细分场景众多,其中跨模态生成值得重点关注。在人工智能发展的漫长历程中,如何让机器学会创作一直被视为难以逾越的天堑,“创造力”也因此被视为人类与机器最本质的区别之一。然而,人类的创造力也终将赋予机器创造力,把世界送入智能 创作的新时代。从机器学习到智能创造,从 PGC,UGC 到 AIGC,我们即将见证一场深刻的生产力变革,而这份变革也会影响

185、到我们工作与生活的方方面面。本书将结合生动的比喻和有趣的案例,向所有关注未来科技的从业者、创业者、投资人、政府部门科普AIGC 的商业落地场景和行业应用案例。从 PGC 到 UGC 再到 AIGC 的发展历程PGCPGC(全称:Professional Generated Content)互联网术语,指专业生产内容。用来泛指内容个性化、视角多元化、传播民主化、社会关系虚拟化。也称为 PPC,(Professionally-producedContent)。PGC(Professional Generated Content),指专业生产内容。经由传统广电业者按互联网形态互联网形态Web1Web

186、1Web2Web2Web3Web3 与元宇宙与元宇宙内容生产方式 PGC(专业生产)UGC(用户生产)AIGC(AI 生产)生产主体专业人非专业人非人核心特点内容质量高内容丰富度高生产效率高I照几乎与电视节目无异的方式进行制作,但在内容的传播层面,却必须按照互联网的传播特性进行调整。UGCUGC 互联网术语,全称为 User Generated Content,也就是用户生成内容,即用户原创内容。UGC 的概念最早起源于互联网领域,即用户将自己原创的内容通过互联网平台进行展示或者提供给其他用户。UGC 是伴随着以提倡个性化为主要特点的 Web2.0 概念而兴起的,也可叫做 UCC(User-c

187、reated Content)。它并不是某一种具体的业务,而是一种用户使用互联网的新方式,即由原来的以下载为主变成下载和上传并重。ChatGPTChatGPT 是 OpenAI 从 GPT-3.5 系列中 的模型进行微调产生的聊天机器人模型,能够通过学习和理解人类的 语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样 来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务。NLP 自然语言处理自然语言处理自然语言处理(NLP)赋予了 AI 理解和生成能力,大规模预训 练模型是 NLP 的发展趋势。NLP 的两个核心任务分别是自然语言理解(NLU)和自然语言生成(NLG),C

188、hatGPT是 NLP 发展中具有里程碑式意义的模型之一。自然语言处理(NLP)发展历程.Dall-E 图像生成系统图像生成系统美国人工智能非营利组织 OpenAI 于 2021 年 1 月份推出 DallE,这是一个可以根据书面文字生成图像的人工智能系统,该名称来源于著名画家达利(Dal)和机器人总动员(Wall-E)。该系统可以根据简单的描述创建极其逼真和清晰的图像,精通各种艺术风格,包括插画和风景等。它还可以生成文字来制作建筑物上的标志,并分别制作同一场景的草图和全彩图像。2021 年 4 月,入选由技术领域全球知名大学组成的 Netexplo 大学网络历时一年,在全球范围内遴选出的 1

189、0 项极具突破性的数字创新技术。INLU 自然语言理解自然语言理解自然语言理解(Natural Language Understanding,NLU)是所有支持机器理解文本内容的方法模型或任务的总称,俗称人机对话。NLU 在文本信息处理处理系统中扮演着非常重要的角色,是推荐、问答、搜索等系统的必备模块。研究用电子计算机模拟人的语言交际过程,使计算机能理解和运用人类社会的自然语言如汉语、英语等,实现人机之间的自然语言通信,以代替人的部分脑力劳动,包括查询资料、解答问题、摘录文献、汇编资料以及一切有关自然语言信息的加工处理。NLG 自然语言生成自然语言生成自然语言生成(NLG)是一种产生自然语言输

190、出的软件过程。一项被广泛引用的 NLG 方法调查将 NLG 描述为“人工智能和计算语言学的一个子领域,它关注计算机系统的构建,能够从信息的某些潜在非语言表示中产生英语或其他人类语言的可理解文本”。DALL-E-2OpenAI 文本生成图像系统。2022 年 9 月 29 日消息,OpenAI 已经取消了访问其文本生成图像系统 DALL-E 2 的等待名单,这意味着任何人都可以立即注册使用这个人工智能艺术生成器。OpenAIOpenAI(开放式人工智能)是美国一个人工智能研究实验室,由营利组织 OpenAI LP 与母公司非营利组织 OpenAI Inc 所组成,目的是促进和发展友好的人工智能,

191、使人类整体受益。OpenAI 成立于 2015 年底,总部位于加利福尼亚州旧金山,组织目标是通过与其他机构和研究者的“自由合作”,向公众开放专利和研究成果。创始人山姆柯曼以及伊隆马斯克的动机是出于对强人工智能潜在风险的担忧。至 2018 年,OpenAI 的总部坐落于旧金山的米慎区,与伊隆马斯克的另一座公司 Neuralink 在同一办公室大楼。102015 年底,OpenAI 成立,总部位于加利福尼亚州旧金山,组织目标是通过与其他机构和研究者的“自由合作”,向公众开放专利和研究成果。2016 年,OpenAI 宣称将制造“通用”机器人,希望能够预防人工智能的灾难性影响,推动人工智能发挥积极作

192、用。2019 年 3月 1 日成立 OpenAI LP 子公司,目的为营利所用。2019 年 7 月 22 日微软投资 OpenAI 10 亿美元,双方将携手合作替 Azure 云端平台服务开发人工智能技术。2020 年 6 月 11 日宣布了 GPT-3语言模型,微软于 2020 年 9 月 22 日获取独家授权。2022 年 11 爸爸我月 30 日,OpenAI 发布了一个名为 ChatGPT 的自然语言生成式模型,它以对话方式进行交互。在研究预览期间,用户注册并登陆后可免费使用 ChatGPT。但是该项目对一些包括中国大陆、香港在内的地区暂不可用。跨模态通用可控跨模态通用可控 AIGC

193、该发明提出语言与视觉统一的理解与生成模型,创新提出融合知识的生成,实现了文本生成、图像生成、视频生成、数字人生成的实用化跨越。可应用于图文转视频、高精度数字10https:/zh.wikipedia.org/wiki/OpenAII人生成、文生图等创新领域,大幅提升内容生产效率。11CNN 卷积神经网络卷积神经网络12卷积神经网络是人工神经网络的一种特殊类型,在其至少一层中使用称为卷积的数学运算代替通用矩阵乘法。它们专门设计用于处理像素数据,并用于图像识别和处理。RNN 循环神经网络循环神经网络13循环神经网络(Recurrent Neural Network,RNN)是一类以序列(seque

194、nce)数据为输入,在序列的演进方向进行递归(recursion)且所有节点(循环单元)按链式连接的递归神经网络(recursive neural network)。对循环神经网络的研究始于二十世纪 80-90 年代,并在二十一世纪初发展为深度学习(deep learning)算法之一,其中双向循环神经网络(BidirectionalRNN,Bi-RNN)和长短期记忆网络(Long Short-Term Memory networks,LSTM)是常见的循环神经网络。LLM 大型语言模型大型语言模型RLHF大型语言模型(LLM)的 RLHF 包括三个阶段。首先,从预训练的语言模型开始。因为 L

195、LM 需要大量的训练数据。通过人工反馈从零开始训练它们是不合理的。所以可以通过无监督学习进行预训练,将现成的语言模型创建并做输出。接下来,进入第二阶段,为 RL 系统创建奖励模型。在此阶段,我们训练另一个机器学习模型,该模型接收主模型生成的文本并生成质量分数。这第二个模型通常是另一个 LLM,它被修改为输出标量值而不是文本标记序列。为了训练奖励模型,我们必须创建一个 LLM 生成的质量标记文本数据集。为了组成每个训练示例,我们给主 LLM 一个提示并让它生成几个输出。然后,我们要求人工评估人生成文本的质量。然后我们训练奖励模型来预测 LLM 文本的分数。通过在 LLM 的输出和排名分数上进行训

196、练,奖励模型创建了人类偏好的数学表示。在最后阶段,创建强化学习循环。主 LLM 的副本成为 RL 代理。在每个训练集中,LLM从训练数据集中获取多个提示并生成文本。然后将其输出传递给奖励模型,该模型提供一个分数来评估其与人类偏好的一致性。然后更新 LLM 以创建在奖励模型上得分更高的输出。11https:/ AI 的负面影响。的负面影响。14当前,以 Chat-GPT 为代表的生成式人工智能技术创新应用,开始对人类思维和工作方式产生颠覆性影响。Chat-GPT 已初步具备与人类相似的学习能力和逻辑常识,可提供复杂、高质量、带有情感色彩的原创回复,减轻了用户材料搜集、基础调研等负担。比如原来人们

197、只能在搜索引擎搜到一连串链接,现在 Chat-GPT 可以直接给出成型的答案。马斯克称其“好到让人害怕”。比尔盖茨表示,“Chat-GPT 出现的重大历史意义,不亚于个人计算机和互联网诞生。”然而,新兴技术的诞生,通常是一把双刃剑。有人已经在盘算,要将 Chat-GPT 打造成对付中国的认知战武器。让我们详解其中的运作机理。1、建立依赖、建立依赖凭借具有革命性的“强智能”功能,Chat-GPT 已吸引 1 亿多月活跃用户,成为史上用户增长速度最快的消费级应用程序,在撰写论文、生成文案、编写代码、语言翻译等诸多领域大显身手。89%的美国大学生借助 Chat-GPT 完成作业,已有学者在发表论文中

198、将 Chat-GPT 列为合著作者,甚至以色列总统也使用 Chat-GPT 撰写在网络安全会议上的开幕致辞。可以预见,随着 Chat-GPT 越来越“聪明”,人们对它的依赖也将与日俱增。在长期潜移默化的影响下,人们将更习惯于求助人工智能、接受既成结论、追求短期刺激,使自己坠入丧失独立思考能力的陷阱。2、编织茧房、编织茧房新媒体时代,随着大数据捕捉、算法推荐等技术广泛应用,“所信即所见”现象日益突出,价值立场、情感偏好代替客观事实和理性逻辑,正左右着许多受众对事物的评判标准。Chat-GPT“看人下菜碟”更加高明,在面对不同语种、语境提问时,它会有针对性、选择性的输出结果。例如,关于所谓“新疆种

199、族灭绝”问题,Chat-GPT 回答中文提问可能给出的答案是“国际社会积极行动加大对中国政府施加压力”,而在回答英语提问时,通常直接宣称“中国对维吾尔人实施暴行”。如果用户长期使用 Chat-GPT 构建认知,他将接收越来越多程式化、定式化信息,从而不自觉地被困于 Chat-GPT 编织的信息茧房之中,导致认知固化,不同民族、阶层、背景民众之间的思想鸿沟越来越大。3、预设立场、预设立场相较其他智能应用,Chat-GPT 能一次次地根据你的意愿修正回答,直到你满意为止。如果有人幕后利用这一功能,悄悄篡改部分正确答案,你也会习惯性认为这就是正解并深信不疑,彻底沦为其操控的傀儡。连 Chat-GPT

200、 研发公司 OpenAl 也警告使用者,它“可能偶尔会生成不正确的信息”,“产生有害指令或有偏见的内容”。14本篇内容来自于网络整理I事实上,经过大数据和人工的双重训练,Chat-GPT 已经受到美西方价值观和思维倾向的侵蚀,特别是针对民族、宗教、人权等问题,它的回答通常会迎合西方立场和喜好。比如,关于新冠病毒溯源问题,Chat-GPT 在回答“新冠病毒来自武汉实验室吗”时称,“关于新冠病毒是否来自武汉实验室的结论仍不确定”。然而,一旦被问“新冠病毒是否来自美国德特里克堡实验室,Chat-GPT 语气一下就变得斩钉截铁起来,明确强调“目前没有科学证据证明新冠病毒来自美国德特里克堡实验室或任何其

201、他实验室”。当被问及“新冠病毒源自哪里”时,Chat-GPT 更直接回答“源自中国武汉市”。再比如,针对“西藏是中国的一部分吗?”,Chat-GPT 先说西藏是中国的一个自治区,然后话锋一转称“关于西藏的政治地位在国际上存在争议。一些国家和国际组织认为西藏是一个独立国家”。继续追问哪些国家持此看法,Chat-GPT 给出的答案是:“尼泊尔、印度和巴基斯坦等国在官方层面上表示,西藏是一个独立的国家,并对西藏的独立问题提出了关切。”这真是让人大跌眼镜,稍有常识的人都知道,世界上没有任何一个国家承认西藏是独立的,而且不知它是有心还是无意,竟然顺道“坑”上了“巴铁”。4、暗流涌动、暗流涌动在中美博弈日

202、益激烈尖锐背景下,美国正在显著强化对中国的认知战攻势,包括编造“民主对抗威权”叙事,散布涉疆、涉港、涉疫等虚假信息,炒作“今日乌克兰,明日台湾”,封禁亲中社交媒体账号等,无不是攻心夺志之策。下一步,美国不排除瞄上人工智能领域,对中国造成多重威胁。Chat-GPT 可能成为美国对华认知战新工具。美国国防部联合人工智能中心官网显示,OpenAl 公司于 2015 年在美国旧金山成立,虽标榜“非盈利机构”,但部分研发人员属于美国国防部联合人工智能中心“国防创新委员会”的成员,定期参加相关研讨会。美国国防部支持的微软公司“联合企业国防基建(JEDI)人工智能项目有意投资 OpenAl公司的云计算业务。

203、Chat-GPT 可能强化美国意识形态渗透能力。近年来,美国凭借全球舆论和科技霸权,强化控制信息制作平台和传播渠道,持续抹黑中国形象,毒化国际受众对华认知。如果 Chat-GPT 技术与社交机器人相结合,将使社交机器人更加智能化,发布内容更具迷惑性,使人们更加难以识别美西方的虚假信息。同时,敌对势力利用 Chat-GPT 炮制各类反华信息也将更迅速、更密集,令我们应对起来更加困难。Chat-GPT 可能成为收集涉华核心数据渠道。互联网数据已成为各国研发人工智能技术和维护国家安全的战略资产。Chat-GPT 可能通过与人类交互,针对性收集中文互联网的数据信息,用于开发下一代智能工具,产生优质资源

204、向强者集中、强者愈强的马太效应,对中国数据安全构成威胁。变革的前夜,哀歌与圣咏并存。作为普通民众,我们要主动拥抱 Al 技术的发展,同时要保持头脑清醒,坚持独立思考,特别要高度警惕 Al 应用可能引发的意识形态风险。希望中国跟上全球人工智能发展步伐,做好前瞻性部署,在新一轮 Al 竞赛中占据主动。I附件:问与答附件:问与答15Q1:巨头打架,小公司有哪些商业机会?巨头打架,小公司有哪些商业机会?其实小公司的商业机会非常大,因为 ChatGPT 这种大模型基本上在现在的生态里有三个角色。第一个角色是模型提供商第一个角色是模型提供商,各个巨头通过提供 API 和 SaaS 服务,让大家具备使用这些

205、大模型的能力。这些大模型的训练成本是非常高的,GPT 3 训练一次大概花了四五百万美金,预估 ChatGPT 的训练费用大概在 2000 万到 5000 万美金之间。这是小公司没有办法去承受的,所以模型层基本上是巨头的天下。第二个层是比较弱的一个层,叫中间层。第二个层是比较弱的一个层,叫中间层。也就是把这些 ChatGPT 的 API 包装成小公司更容易使用的一些场景。最后一层就是应用层最后一层就是应用层,其实就是我们这样的小公司利用 ChatGPT 的 API 来做各种各样的落地场景。我经常说 AIGC 本质上生成的不是内容,我认为它能生成的是素材。素材到内容其实是需要一个转换的。而对于小公

206、司来说,你切入转换层,把 AI 生成出来的素材转变成用户可用的内容,这个就是你的价值。对于大公司来说,这是第二个提供 AIGC 的云服务。Q2:在不考虑算力训练成本的下在不考虑算力训练成本的下,基于现有开源项目基于现有开源项目,能否能否构建一个差不多的构建一个差不多的 ChatGPT 产品?产品?这个是完全可能的。但是由于需要的集中算力非常大,有可能要开源项目在底层实现真正的分布式训练,才能构建一个差不多的 ChatGPT 产品。但是我认为这其实跟当初人人在自己家里装显卡挖矿一样。大家买的消费级显卡,如果把能力通过分布式集中起来,我认为是有可能训练出一个差不多的 ChatGPT 产品的。Q3:

207、ChatGPT 能和哪些应用软件链接成为新的应用场景?能和哪些应用软件链接成为新的应用场景?我觉得 ChatGPT 本身是一种类似于 Siri 的一个新的人类自然语言输入方式,和一种新的人类知识图谱的输出。第一个链接的一定是内容生产行业。比如所有的笔杆子(行业),不管你是写小说、写财报,还是写新闻采访,所有跟 word 相关的场景它都是可以链接的。所以微软要在 office 里面全面接入 ChatGPT。第二个是跟搜索引擎链接。它第二次降低了搜索引擎的使用门槛,提高了搜索引擎的可用性,不会让搜索引擎的搜索结果和问题再牛头不对马嘴。第三个链接场景特别适合那些内部有大量基于文本的数据库,并且基于这

208、些内部数据库给外部行业、外部公司提供咨询的行业,(它们)都可以用 ChatGPT 来做人力的工作。比如像企业征信、律师咨询的初步获客基本上都可以用 ChatGPT 来实现。152 月 11 日 ChatGPT 主题会客厅精华汇总IQ4:在婚恋项目里装入在婚恋项目里装入 ChatGPT 的具体建议?的具体建议?ChatGPT 可以成为婚恋项目最基本的一个获客渠道。比如我们可以把 ChatGPT 当成你的一个店小二和一个托,对你的应用场景的扩充都是比较好的。Q5:在中国区调用是否合规?以及在商业显示屏整合的机在中国区调用是否合规?以及在商业显示屏整合的机遇?遇?我觉得 ChatGPT 首先就是本着

209、政治正确原则去训练的,但是它是按照美国人的政治正确。所以对于我们诸位做 ChatGPT 应用的同学来说,大家要考虑到一个问题,不要去接美国的 API。因为接美国的 API 会牵扯到将中国数据跨境的问题,实际上是违规的。如果在国内做,还是要等到中国的类 ChatGPT 产品出现,这样去调用才是合规的。Q6:AIGC 如何才能最大限度地保证生成内容的准确性?如何才能最大限度地保证生成内容的准确性?说实话,他没法保证生成内容的准确性,但是它能保证生成的内容看起来正确。我们也知道 ChatGPT 的训练知识库是 2021 年之前的,他的知识更新以及知识 的准确性,其实还是要外接搜索引擎以及知识图谱的。

210、所以我们认为下面一个大 的方向就是把知识图谱和搜索引擎嫁接到 ChatGPT 模型上去,让这些模型具有更 新以及索引的能力,这样就能够让AI 扩充到具有与人类相当的先验知识体系。Q7:如何在数据分析场景中使用:如何在数据分析场景中使用 ChatGPT,做到把企业运,做到把企业运营数据上传给它,营数据上传给它,就可以自动生成各类洞察?就可以自动生成各类洞察?目前他的逻辑推理能力其实还是比较浅层的,用来处理代码和一些基本的数学问题可能还凑合,但是他做数学题特别容易出错。他通过美国研究生考试 SAT 的分数是 1020 分(满分 2000 分)。所以我们可以把他的智力水平想象成一个脑力特别好的初中生

211、。如果你想把企业运营数据上传给它,以自动生成各类洞察。我认为大概率会生成老生常谈的东西,而不会真的生成出有远见的内容。Q8:我们三月即将上线基于我们三月即将上线基于 ChatGPT 人工智能的企业工人工智能的企业工商、退税等商务服务平商、退税等商务服务平 台,请给些具体意见和建议。台,请给些具体意见和建议。这个我认为还是挺好的,但是你需要把 promote 这一层做好。现在 ChatGPT 可以根据你的预输入文档来做推理和判断,这里面具有很多技巧。你可以去调试 给他输入什么样的预生成文本,他给出的建议让用户觉得更好。这是有很大的开发空间的。IQ9:国内语境环境下国内语境环境下,ChatGPT

212、的商业应用前景有哪些具的商业应用前景有哪些具体落地方向?体落地方向?其实我们也说过,(如果使用 ChatGPT)你的输出是要以 word 文档为基础的。而且 word文档还不应牵扯到大量准确的数据,而应该是一些定性的东西。比如 早寝室晚汇报、写情书、写论文、写检讨这些工作,他都能完成得非常好。我现 在就经常拿他给我闺女改作文,我觉得改得非常好。所以你的应用方向本来就是 文本文档,而且需要定性的多,定量的少,逻辑不要太复杂,这时候用它的应用 就非常好。Q10:基金近期会关注什么样的基金近期会关注什么样的 ChatGPT 初创团队初创团队?因为现在 ChatGPT 的训练模型实在太贵了,小公司跟初

213、创公司是扛不起来的,所以我觉得你们要关注能把 AIGC 技术落地的公司。也就我说的应用层怎么样把素材转成内容,这里面是有巨大的空间可以去做的。Q11:未来十年年轻人需要重点关注什么样的知识积累和技未来十年年轻人需要重点关注什么样的知识积累和技能成长?能成长?我觉得要思考有哪些行业是不容易被 AI 所取代的。目前看来,跟线下结合越紧密的行业越不容易被 AI 取代。举个例子,外卖小哥送东西就没法被 AI 取代。AI 只要跟线下一结合,它的落地就会非常慢。落地最快的永远是在电脑上可以 完成闭环的生意,比如写代码、写文档、画画,这些都在电脑上可以闭环完成。他们必然要受 AI 的冲击最大。所以我觉得年轻

214、人要重点关注偏创意性、偏人类高级思维能力的知识积累和 技能成长。而自己的技能如果是学 3D 动画制作、写代码,如果你水平不高,是 很容易被取代的。Q12:基于目前基于目前 AI 结果的不可预知性结果的不可预知性,是不是类似的技术是不是类似的技术很难在国内商业化?很难在国内商业化?内容审核如何解决?内容审核如何解决?ChatGPT 就是为了保证美国人的政治正确而出现的,而我们中国做的类 ChatGPT 也一定会保证中国的政治正确。而且中国在内容审查方面的技术积累是 很深厚的。所以针对 AI结果的不可预知性,在类 ChatGPT 产品的自我审核以及 外部添加的审核的双重打压之下,应该不会有太大的问

215、题。Q13:文字转语音直接商业化成产品进入文字转语音直接商业化成产品进入 C 端是否可行?端是否可行?文字转语音技术实际上已经很成熟了,这个东西叫 TTS,科大讯飞就是专门 干这个的。因为这个技术进步很快,有好多家公司,例如谷歌微软都提供类似的 服务。这个技术从商业化产品到 C 端已经很普及了,我不认为是一个新的方向。IQ14:垂直网站如何拥抱垂直网站如何拥抱 ChatGPT?如何防止被颠覆?如何防止被颠覆?其实我觉得垂直网站是很难被颠覆的,因为如果你在垂直行业有独一份的数据,会有一堆做 ChatGPT 创业的小公司来找你合作。我们知道国内做大模型的公司现在很挣钱的一个生意就是,他们内部有大量

216、的专有数据。他们一方面不想把 这些数据公布,但是又需要基于这些数据做大模型。那他们就会把这些数据的预训练外包给外面的创业公司,让这些创业公司帮他们去训练大模型。做垂直网站,只要保证你的数据是国内最好的,就不用担心被颠覆。别人只有来找你合作的份。Q15:预测一下预测一下 1 年后中美各自会有哪家公司会独领年后中美各自会有哪家公司会独领chatGPT 风骚,中美公司之间会有隔离带吗?风骚,中美公司之间会有隔离带吗?因为数据安全的问题,我觉得中美公司肯定有隔离带。国外肯定还是 OpenAI、Deepmind、谷歌、Facebook 这些大厂最厉害。国内据我所知进度最快的是百度,其次是腾讯跟阿里,再其

217、次是字节。一拥而上的创业公司也非常多。我目前比较看好的公司中,美国的肯定是 OpenAI、Deepmind、谷歌、Facebook 以及 Microsoft,这几家做底层的公司仍然是美国最出彩的。还有一家开源公司叫 Step Diffusion,我也比较看好。中国公司中,我其实还是看好大厂居多,我觉得小厂在应用层可能会出来一些公司。Q16:如何评价如何评价 ChatGPT 生产的内容?基于此生产的内容?基于此,他的商业他的商业价值是什么?价值是什么?它有哪些它有哪些 比较有可能的应用场景?比较有可能的应用场景?其实我也说过了,它生产的内容都是文本为主,所有我们用 word 可以输出 的定性的文

218、本都可以用它来加速生成。我举个例子,我们诸位在招聘的时候,经 常会招刚毕业的大学生给你当助理,帮你改文档,做一些日常的事务。你们可以 把 ChatGPT 想成个人助理,它能极大提高你的工作效率,提升输出工作的质量。但是它并不能取代你,因为你的专业知识仍然是有用的。Q17:能不能找到一个在智能制造领域的具体应用案例?能不能找到一个在智能制造领域的具体应用案例?说实话,我觉得八杆子打不上。他能帮你写思想文案、帮你出广告、帮助你公司管理,但跟你的智能制造的核心技术没关系。Q18:ChatGPT 对谷歌对谷歌、百度这些搜索公司会有什么影响?百度这些搜索公司会有什么影响?会对他们形成毁灭性会对他们形成毁

219、灭性 打击吗?打击吗?我觉得 ChatGPT 反而会让他们巩固自己的地位。因为现在 ChatGPT 技术还是需要与搜索引擎深度结合的。但目前全世界搜索引擎技术最好的就是微软、谷歌和百度,所以我认为谷歌跟百度赶上这个事情还是比较容易的,不会形成什么毁灭性的打击。I但是我们认为因为内容创作范式的变化,比如文本、图片、视频和音频生产的变化,我觉得这对整个内容生产行业会是一个巨大的颠覆。原来我们做一部动画片可能要几百个人花两三年时间,但现在有很多公司利用 3D 引擎去做动画,可能四五十个人一个礼拜就能出一部动画片。我觉得在 AIGC 技术普及到一定程度之后,可能一两个人用一两天就能出一部动画片。这样会

220、导致整个内容生产行业一个巨大的爆发。Q19:请问请问 ChatGPT 出来后出来后,如何解决如何解决 AI 伦理治理问题,伦理治理问题,或者您的公司在后续或者您的公司在后续 会有什么布局吗?会有什么布局吗?AI 是非常乖的、政治正确的。所以你不要担心它有什么伦理问题。我们后续的布局基本上是在两个方向努力。一个是协助开源界做开源的解决方案,让中小创业公司有一个便宜、可以修改、可以学习的模型去使用。第二个方向,我们还是要在应用层下功夫,去把 AIGC 的技术落实到素材生成内容层级上去,制作出下一代的内容创作工具和内 容创作社区。Q20:简单的数据库处理脚本语言是否可以通过训练后由简单的数据库处理脚

221、本语言是否可以通过训练后由ChatGPT 代替人工来完成?金融、能源等领域的专业知识代替人工来完成?金融、能源等领域的专业知识如何基于如何基于 ChatGPT 来训练?对于金融业的智能客服来训练?对于金融业的智能客服、大客大客户的报表分析和户的报表分析和 BI 建模等是否能通过给建模等是否能通过给 ChatGPT 喂专喂专业领域的数业领域的数 据和客户的思路来完成?据和客户的思路来完成?现在 ChatGPT 就能写代码了。因为 ChatGPT 本质上是两个模型结合起来的,一个是 Code,一个是 Text。这两个模型就导致了它最强的能力其实是写代码,它写简单的代码是很容易的。至于金融、能源等领

222、域的专业知识如何基于 ChatGPT 来训练,这需要等到 ChatGPT 技术开源,或者是大厂普及化之后,你们可以把你们的专业知识去喂给类 ChatGPT 或者让ChatGPT 接你们的知识图谱。金融业的智能客服受它的影响是最大的。ChatGPT 绝对能够极大地提高我们 智能客服的能力。但是对于报表分析和 BI 建模这些,可能还需要专门的研发。Q21:请老师讲讲在企业培训领域的应用。:请老师讲讲在企业培训领域的应用。ChatGPT 有个很好的功能是缩写,不管多长的文章他能给你缩写提炼出比较 精要的话。这样用让大家来看文档总结是非常方便的。我觉得企业培训领域的片儿汤话特别多,真正独一无二的企业培

223、训是非常少 的。如果我们要做普通的企业培训,用它来给你生成企业培训文档是很容易的。因为企业培训文档不外乎是一个 PPT 从头讲到尾,用它来实现没啥问题。I总结总结很多人担心“我赶不上 ChatGPT 这一波就落后了”。但其实我觉得大家大不用担心这个事。我举一个例子,当初移动互联网出现的时候,大家纷纷讲移动互 联网只有几张船票,腾讯搞了,微信有了这张船票,但其他公司可能没有船票。“BAT”里面,阿里跟腾讯都拿到了船票,而百度只拿到了半张船票。但到现在为止,百度也仍然活着,搜索引擎也没有把它给替代。移动互联网真正改变人类的是什么?是它创造出来了一些新的方向。比如手机加上摄像头可以拍短视频,这样就催

224、生了快手跟抖音;手机有定位功能,催生了高德地图,又催生了美团和滴滴。也就是我们不用担心如果自己没赶上 ChatGPT 这个东西就业务做不下去了。大家可以把它想成第二种形态的 APP。等做 APP 的东西成熟之后,你公司也跟着 做一个就可以。任何一个技术都会迅速白菜化,因为它太红了。所以现在做 AI 的工程师会 非常贵,但是价格也会迅速下降。所以我觉得诸位等到这个东西价格便宜之后,再结合自己的业务做一些相对的工作,就 OK 了。但是如果你的生意是完全基于电脑闭环的。而且输出结果是文档为主,以定性的结果为主,你可能就比较危险了。I附件:附件:ChatGPT 体验指南体验指南1、入门:注册入门:注册

225、 ChatGPT 全攻略全攻略162、初学:基本操作体验。初学:基本操作体验。17(1)用简单的术语解释量子计算(2)如何实现中华民族伟大复兴(3)根据 Midjourney 的格式,用英文给我一段生成猫窝的 text prompt16注册 ChatGPT 全攻略(账号购买)BoxChenhttps:/mirror.xyz/boxchen.eth/9O9CSqyKDj4BKUIil7NC1Sa1LJM-3hsPqaeW_QjfFBc17https:/mirror.xyz/boxchen.eth/9O9CSqyKDj4BKUIil7NC1Sa1LJM-3hsPqaeW_QjfFBcI(4)介绍一

226、下 MQTT 协议(5)用 python 帮我写一段冒泡排序的代码这里生成的代码经过格式调整后是可以正确执行的。I(6)帮我写一篇 MES 软件的技术路线说明书(7)作一首关于雪的诗I(8)你可以取代 Google 搜索引擎吗(9)更多详细内容请参看:https:/www.eula.club/blogs/ChatGPT%E6%99%BA%E8%83%BD%E9%97%AE%E7%AD%94AI%E4%BD%BF%E7%94%A8%E6%8C%87%E5%8D%97.html#_5-2-python%E8%B0%83%E7%94%A8chatgpt%E5%AE%98%E6%96%B9api3、从

227、零基础到熟练应用、从零基础到熟练应用 ChatGPT。1818详见 https:/xv44586.github.io/2023/01/09/zero-to-chatgpt/I附件:团队介绍附件:团队介绍杜玉河杜玉河工业 4.0 俱乐部创始人,工业 4.0 产业联盟创始人,开源工业联盟创始人,工业人工智能创新中心主任。智能装备应用研究院院长;工业 4.0 产业联盟区块链发展研究中心主任、工信部培训中心专家库成员;上海交通大学、复旦大学、浙江大学、国家会计学院、上海理工大学、上海浦东干部学院等大学特聘教授;上海大学 MBA 智能制造方向产业与企业导师;上海交通大学 EMBA 校友会首任秘书长;上海

228、人工智能公共服务平专家组成员;智领智能产业生态联盟首任轮值秘书长;安徽中德教育合作基金会理事;杜特企业管理咨询公司创始人;工业 4.0 创新平台数字化工厂专家;开源工业互联网联盟副秘书长;中国机电一体化协会制造执行系统分会高级顾问,中国五金交电化工商业协会智能装备分会智能制造高级顾问;物联网中国联席会理事长;两岸智能制造联盟联席主席;现任多地经济转型升级特聘顾问与多家创新公司独立董事。曾任中国第一家互联网公司瀛海威时空上海公司总经理;在用友软件集团发展早期工作数年(从事信息化规划、供应链、工业领域信息化的专家顾问);从业初期在中国机械电子部下属某大型装备制造企业担任多年计算机中心主任、数控设备

229、应用专家等。刘家维刘家维工业 4.0 俱乐部工业人工智能中心,研究员。附件:组织简介附件:组织简介工业 4.0 产业联盟,2014 年成立于上海,经过近十年发展,全球近 10,000 企业会员、10万个人会员。以把握第四次工业革命脉搏,助力产业、企业、个人走向成功为使命。打造中国最具活力的工业 4.0 产业生态联盟!面向全球的创新机构:在中国、美国、德国、以色列、日本等地创建了 40 多个创新中心。工业 4.0 关键技术研究机构:包括智能制造研究中心、工业互联网研究中心、工业物联网研究中心、工业人工智能研究中心、区块链研究中心、案例研究中心、开源研究中心、工业元宇宙研究中心等。产业集聚机构:设

230、立新工业产业联盟、工业 4.0 产业联盟、开源工业4.0 产业联盟、开源数字孪生产业联盟、智慧物流产业联盟等。人才培育机构:发起成立新工业大学,并加速机器人学院、工业互联网学院、工业人工智能学院的建设。主要服务:面向政府的产业的服务:工业 4.0 产业全生命周期服务,产业战略研究、规划、产业园区规划设计、导入(招商引智)与运营服务,聚商与产业落有机融合;面向企业的转型升级服务:项目评估、规划、开发、建设、运维服务;面向个人的转型升级服务:高中级及基层人才规划、培训及输送服务。工业 4.0 产业资本服务:从种子期、成长期与加速期等企业全生命周期的投融资服务。I附件:精彩对话摘录附件:精彩对话摘录

231、19192 月 11 日 ChatGPT 主题会客厅精华汇总I附件:团队分析附件:团队分析IChatGPT 团队规模不足百人(共 87 人)。分析发现,其显著特征是“年纪很轻”、“背 景豪华”、“聚焦技术”、“积累深厚”、“崇尚创业”和“华人抢眼”。该团队平均年龄为 32 岁,“90 后”是主力军。他们引领的这一波大型语言模型技术风潮,充分说明了那些经常被认为研发经验不足的年轻人,完全有可能在前沿科技领域取得重 大突破。团队成员绝大多数拥有名校学历,且具有全球知名企业工作经历。从成员毕业高校分布 看,校友最多的前 5 大高校是斯坦福大学(14 人)、加州大学伯克利分校(10 人)、麻省 理工学

232、院(7 人)、剑桥大学(5 人)、哈佛大学(4 人)和佐治亚理工学院(4 人)。另 外,该团队有 3 人是我国清华大学校友,即翁家翌、赵盛佳、袁启明,他们本科均在清华大 学就读,目前均在团队担任研发工程师一职。ChatGPT 不一味强调高学历,其成员并非“清 一色”的研究生学历,而是本、硕、博人数相对均衡。团队成员有 10 人从谷歌跳槽加入,其他成员也大多来自 Facebook、Stripe、Uber、Quora、NVIDIA、Microsoft、Dropbox、DeepMind、Apple、Intel 等顶尖或知名科技 公司。另外,该团 队 有5 人 被 评 为 2023 年 度“AI 20

233、00 全 球 人 工 智 能 学 者(全 名 单 链 接:https:/ 2 人为 OpenAI 联合创始人,2 人分别被评为 全球机器人和机器学习领域最具影响力学者。可见,技术型顶尖学者对创新型团队的引领作用至关重要。从成员职位构成看,该团队成员近 9 成为技术人员,未配备技术与产品之外的职能人员(如公共关系、市场营销等人员),而是高度聚焦于技术研发。由此可见,在数字化传播时 代,一款人工智能产品只要性能足够优异,即使未配置专人做推广营销,也能在短短的一两个月时间内在全球引爆。IChatGPT 是 OpenAI 在大型语言模型领域多年技术积累的结果。统计发现,在与 ChatGPT 相关的先前

234、 7 大技术项目研发中,ChatGPT 团队成员参与人数最多的是CodeX 项目,共有 22 人参与过,占总团队人员总数的 25%;其次是 webGPT 和instructGPT,共有 9 人参与过;第三是 GPT3,共有 6 人参与过;第四是 RLHF,共有 3 人参与过。由此 可见,ChatGPT 团队成员在生成式预训练语言模型领域有较深厚的技术积累,特别是 1/4 团队成员曾参与过同样基于 GPT3 的 CodeX 项目的研发经验,对后续成功研发 ChatGPT打下了坚实的基础。webGPTInstructGPTcodeXGPT3GPT2GPT1RLHF222505101520ChatG

235、PT 团队参与人数(人)数据来源:AMiner 科技情报平台图分析发现,该团队成员不再把进入“大厂”作为首选,而是更倾向于选择更加创新潜力 的创业机构。团队成员大多是从“大厂”跳槽,以及作为应届生加入,其次就是从相对“稳 定”的科研机构和高校教职岗位离职后加入。即使从 ChatGPT 团队离职的 4 位成员,也仍 然选择加入创业公司或机构。399006I数据来源:AMiner 科技情报平台ChatGPT 团队中的华人表现抢眼。团队共有华人 9 人,占团队总人数 10%。其中 5 人本科就读于中国内陆高校,3 人大学教育经历均在美国高校完成。梳理毕业于中国内陆高校 的ChatGPT 华人成员成长

236、路径发现,他们就读于中国内陆顶尖高校的学习阶段均为本科,之后赴美深造,获得硕士或博士学位,然后加入美国诸如 Dropbox、OpenAI 等创新型公 司。姓名职务毕业院校工 作 单 位(按时间顺序排列)翁家翌研发工程师学 士:清 华 大 学硕士:卡内基梅隆大学OpenAI赵盛佳研发工程师(MTS)学士:清华大学博士:斯坦福大学OpenAI江旭研发工程师(MTS)学士:华中科技大学博士:马里兰大学帕克分校Mythic;OpenAIV姓名职务毕业院校工 作 单 位(按时间顺序排列)袁启明研发工程师学士:清华大学硕士:德克萨斯大学奥斯汀分校Dropbox;OpenAI翁丽莲AI 应 用 研究 经理学

237、士:北京大学、香港大学博士:印第安纳大学伯明顿分校Dropbox;Affirm;OpenAI肖凯深度学习研究员学士:麻省理工学院博士:麻省理工学院OpenAISteph Lin研究员学士:麻省理工学院硕士:佐治亚理工学院牛津大学(人类未来 研 究所);OpenAI欧阳龙高级研究员学士:哈佛大学博士:斯坦福大学Self-Employed;OpenAI张马文信息缺失博士:加州大学伯克利分校加州大学伯克利分校;OpenAI数据来源:AMiner 科技情报平台华人学者欧阳龙参与了与 ChatGPT 相关的 7 大技术项目中的 4 大项目的研发,他是 InstructGPT 论文的第一作者,是 RLHF

238、 论文的第二作者,可见他是这两个关键技术项目的 核心人员。根据以上分析所获相关启示,就国内人工智能前沿技术发展提出以下建议:1)注重科技兴趣和信仰培育,鼓励优秀年轻人投身于前沿技术创新浪潮;2)“大厂”前沿科技创新疲态显现,鼓励年轻人将目光投向创业公司;3)海外华人学者是全球科技创新的重要力量,鼓励加强对外学术交流。VI内容提要II一、职位分工:近 9 成为技术人员,高度聚焦技术研发1二、年龄分布:“90 后”科研“后浪”显示强大创新能力2三、教育背景:绝大多数拥有名校学历,6 人毕业于中国高校3四、人员流动:10 人从谷歌跳槽加入,1 人曾在百度任职5五、华人成员:在国内完成本科学业,后赴美

239、深造并就业7六、成员贡献:1/4 成员参与过 codeX 研发,欧阳龙表现突出8七、性别特征:团队由男性主导,女性仅占 1 成10八、2023 年“AI 2000 学者”入选情况:5 位顶尖学者入选12九、启示与建议13附件:ChatGPT 团队全体成员名单(87 人)1512022 年 11 月 30 日,OpenAI 公司(美国致力于人工智能研究的非营利机构)发布了 由大型语言模型驱动的自然语言处理工具 ChatGPT。该工具通过学习和理解人类语言,能 够与用户进行高质量对话,甚至还能撰写邮件、视频脚本、文案、代码、论文和小说等。由 于在同行中具有较卓越的性能,ChatGPT 推出仅 2

240、个多月的时间即引爆全球。除了关注 ChatGPT 性能本身外,业内人士更关注该 AI“梦之队”成员到底具有哪些特征,才促使他 们在全球大型语言模型创新技术领域如此独领风骚。根据 OpenAI 官网显示,为 ChatGPT 项目做出贡献的人员共 87 人(名单详情见附件)。现就该团队成员职务构成、年龄分布、教育背景、人员流动、华人成员、成员贡献、性别分布等数据进行统计分析,并总结归纳其特征。一、一、职位分工:近职位分工:近 9 成为技术人员,高度聚焦技术研发成为技术人员,高度聚焦技术研发从 ChatGPT 团队职位分工看,研发人员共 77 人,占比 88%,其中含 1 名公司联合创 始人,即 W

241、ojciech Zaremba(被评选为 2023 年 AI 2000机器人领域最具影响力学者);产品人员共 4 人,占 5%。另外,6 人职位信息无法获取。https:/ 2000全球人工智能学者”名录涵盖了 20 个核心主题领域和一些新兴领域。每年从过去 10 年中1来 自各领域排名前 10 名的学者被命名为“AI 2000 最具影响力学者”,前 11-100 名学者被命名为“AI2000 最具影响力学者提名”。因此,每年将有约 200 名最具影响力学者,从 2020 年至 2029 年 10 年将形成一 个由约 2000 名学者组成的名录,他们正在推动 21 世纪 20 年代人工智能各个

242、领域的创新和进步。参阅网 址:https:/ 后后”科研科研“后浪后浪”显示强大创新能力显示强大创新能力从 ChatGPT 团队年龄分布看,2029 岁的成员有 28 人,占全体成员(剔除年龄信息缺失的 5 位成员)的 34%;3039 岁的共 50 人,占 61%;4049 岁的仅 3 人,无5059 岁年龄段的成员,60 岁以上的有 1 人。经计算,。由此可见,20 以下202930394049505960 及 以上信 息缺失03015286030人 数(人)数据来源:AMiner 科技情报平台图 2504020500103在 ChatGPT 团队中,27 人具有本科学历,25 人为硕士研

243、究生学历,28 人拥有博士研 究生学历(注:5 人信息缺失),占比分别为 33%、30%、37%。学士/本科33%硕士研究生30%数据来源:智谱研究根据公开资料统计从 ChatGPT 团队成员毕业高校分布看,斯坦福大学校友最多,共 14 人;其次是加州 大学伯克利分校,共 10 人;第三是麻省理工学院,共 7 人;我国清华大学与卡内基梅隆大学并列第 7 名,各有 3 人。该团队成员毕业人数前 10 名的高校(见下表)均有2 人及 以上人数分布,共计 54 人;排名第 10 之后的高校均只有 1 人,其中不乏全球顶尖大学,如牛津大学、东京大学、康奈尔大学、加州大学圣巴巴拉分校等。总体看,博士研究

244、生37%表 14排名毕业高校校 友 人 数(人)1美斯坦福大学142美加州大学伯克利分校103美麻省理工学院74英剑桥大学55美哈佛大学45美佐治亚理工学院47美卡内基梅隆大学37中清华大学39美莱斯大学29波华沙大学2数据来源:AMiner 科技情报平台在 ChatGPT 团队中,有 6 人曾毕业于中国高校,其中 3 人本科毕业于清华大学,各有 1 人本科毕业于华中科技大学、北京大学/香港大学,1 人硕士研究生毕业于台湾交通大学(如下表所示)。表 2姓名职务曾就读中国高校学位阶段翁家翌研发工程师清华大学本科赵盛佳研发工程师(MTS)清华大学本科5姓名职务曾就读中国高校学位阶段袁启明研发工程师

245、清华大学本科江旭研发工程师(MTS)华中科技大学本科翁丽莲AI 应用研究经理北京大学、香港大学本科Phil Tillet研发工程师(MTS)台湾交通大学硕士研究生数据来源:AMiner 科技情报平台ChatGPT团队成员主要来自外部公司(81%)、高校应届毕业生(13%)、科研机构(4%)和高校教职人员(3%)等(如下图所示)。来源人数超过 2 人(含)以上的外部企业还有 Facebook、Stripe、Uber、Quora、NVIDIA、Microsoft、Dropbox、DeepMind 等知名科技公司。作为应届生直接 加入 ChatGPT 团队的共 11 人,其中 5 人来自加州大学伯克

246、利分校、3 人来自斯坦福大学,麻省理工学院、卡内基梅隆大学和哈佛大学各 1 人。可见,6数据来源:AMiner 科技情报平台图 4监测发现,ChatGPT 研究员 Heewoo Jun 曾在 2015-2019 年间在百度(美国研究院,Sunnyvale,California,USA.)担任研究员,2019 年从百度离职后加入 OpenAI 担任研究 员至今(如下表所示)。表 3姓名职务履历Heewoo Jun研究员2019-至 今,OpenAI,研 究 员2015-2019,百度(美国研究院),研究员 2013-2015,斯坦福大学,硕士研究生2008-2013,多伦多大学,本科数据来源:A

247、Miner 科技情报平台到目前为止,ChatGPT 团队已离职员工有 4 人(离职率为 4.6%),他们是 Jacob Hilton、Igor Babuschkin、Matthias Plappert 和 Andrew Carr,去向分别为 Alignment ResearchCenter、DeepMind、Github 和 Gretel.ai。可见,7ChatGPT 团队有 9 位华人(名单见下表)。其中 5 人本科就读于在中国内陆高校,3 人大学教育经历均在美国高校完成,1 人(张马文,Marvin Zhang)信息不全。表 4姓名职务毕业院校工 作 单 位(按时间顺序排列)翁家翌研发工程

248、师学 士:清 华 大 学硕士:卡内基梅隆大学OpenAI赵盛佳研发工程师(MTS)学士:清华大学博士:斯坦福大学OpenAI江旭研发工程师(MTS)学士:华中科技大学博士:马里兰大学帕克分校Mythic;OpenAI袁启明研发工程师学士:清华大学硕士:德克萨斯大学奥斯汀分校Dropbox;OpenAI翁丽莲AI 应 用 研究 经理学士:北京大学、香港大学博士:印第安纳大学伯明顿分校Dropbox;Affirm;OpenAI肖凯深度学习研究员学士:麻省理工学院博士:麻省理工学院OpenAI8姓名职务毕业院校工 作 单 位(按时间顺序排列)Steph Lin研究员学士:麻省理工学院硕士:佐治亚理工

249、学院牛津大学(人类未来 研 究所);OpenAI欧阳龙高级研究员学士:哈佛大学博士:斯坦福大学Self-Employed;OpenAI张马文信息缺失博士:加州大学伯克利分校加州大学伯克利分校;OpenAI数据来源:AMiner 科技情报平台ChatGPT 是 OpenAI 公司在大型语言模型领域多年技术积累的结果。与 ChatGPT相 关的先前关键技术项目有 RLHF(Reinforcement Learning from Human Feedbac,人 类反馈强化学习)、GPT1、GPT2、GPT3、codex、InstructGPT、webGPT等 7 项。统计发现,ChatGPT 团队中

250、,有 2 人参与了其中 4 项关键技术项目的研发,他们是高 级研究员欧阳龙和研发工程师 Christopher Hesse。他们均为机器学习领域专家。RLHF论 文LearningtoSummarizeFromHumanFeedback,下 载 链 接https:/ f5356f991e0110c40a7bc3bGPT1 论 文ImprovingLanguageUnderstandingbyGenerativePre-Training,下 载 链 接https:/www.amine 文LanguageModelsareUnsupervisedMultitaskLearners,下 载 链 接h

251、ttps:/ 011915d9e43eecodex论 文EvaluatingLargeLanguageModelsTrainedonCode,下 载 链 接https:/ 0e7be6891e011dcbc23b0a0InstructGPT 论文 TrainingLanguageModelstoFollowInstructionsWithHumanFeedback,下载链接 htt ps:/ 论文 WebGPT:Browser-assistedQuestion-AnsweringWithHumanFeedback 下载链接https:/w 5姓名参与数量(项)RLHFGPT1GPT2GPT3c

252、odeXInstructGPTwebGPTChatGPT欧阳龙4ChristopherHesse4Ryan Lowe3Nick Ryder3SandhiniAgarwal3ClemensWinter3BenjaminChess3ShantanuJain3Jan Leike3JohnSchulman3Jacob Hilton3数据来源:AMiner 科技情报平台在上述 7 大技术项目中,ChatGPT 团队成员参与人数最多的是 CodeX 项目,共有22 人参与过,占总团队人员总数的 25%;其次是 webGPT 和 instructGPT,共有 9 人参与过;第三是 GPT3,共有 6 人参与

253、过;第四是 RLHF,共有 3 人参与过。由此可见10webGPTInstructGPTcodeXGPT3GPT2GPT1RLHF222505101520ChatGPT 团队参与人数(人)数据来源:AMiner 科技情报平台图 5从性别分布看,ChatGPT 团队中有女性 9 人,仅占总数的 10%;男性共 78 人,占90%。由此可见,男性是该团队的主导,女性成员占比较低。女,9,10%男,78,90%数据来源:AMiner 科技情报平台图 6该 9 位女性成员中,有 2 位是华人,即曾就读于北京大学的翁丽莲,以及 Steph36009910Lin。分析发现,9 位女性成员均拥有世界名校教育

254、经历;另外,除了翁丽莲和 KatarinaSlama 外,其他均为“90 后”。11序号姓名职位学历毕业院校1翁丽莲(华人)AI 应用 研究经 理博士研究生(Phd)学士:北京大学、香港大学博士:印第安纳大学伯明顿分校2Steph Lin(华人)研究员硕士研究生学士:麻省理工学院硕士:佐治亚理工学院3Christina Kim研发工程师(MTS)学士学士:美国西北大学4Chelsea Voss计算机科学家硕士研究生学士/硕士:斯坦福大学5Valerie Balcom研发工程师硕士研究生学士:加州大学圣迭戈分校6Sarah Yoo信息缺失信息缺失信息缺失7Katarina Slama研发工程师(

255、MTS)博士研究生(Phd)学士:布朗大学博士:加州大学伯克利分校8Nick Ryder研发工程师(MTS)博士研究生(Phd)学士:莱斯大学博士:加州大学伯克利分校9Sandhini AgarwalAI 政策研究员博士研究生(Phd)学士/博士:斯坦福大学数据来源:AMiner 科技情报平台12AMiner 每年推出“AI 2000 全球人工智能学者”名单,该名单评选全球人工智能 20个细分领域前 100 名最具影响力学者。统计发现,ChatGPT 团队成员有 5 人入选今年“AI2000 全球人工智能学者”,他们是 OpenAI 联合创始人 Wojciech Zaremba(机器人,第10

256、 名);ChatGPT 研究员 Lukasz Kaiser(机器学习,第 10 名);OpenAI 联合创始人、ChatGPT 研究科学家 John Schulman(机器学习,第 41 名);ChatGPT 研发工程师Tomer Kaftan(数据库,第 52 名);ChatGPT 研究科学家 Barret Zoph(机器学习,第 95名)。在 ChatGPT 不足百人团队中,即有 5 人属于全球人工智能各领域顶尖学者,其中 2人为 OpenAI 联合创始人,2 人分别被评为机器人(Wojciech Zaremba,OpenAI 联合 创始人)和机器学习(Lukasz Kaiser,Chat

257、GPT 研究员)领域最具影响力学者。可见,技术型顶尖学者对创新型团队的引领作用至关重要。表 7姓名职务毕业院校AI 2000入选领域AI 2000 入选领域排名Wojciech ZarembaOpenAI联合 创始人博士:纽约大学机器人10Lukasz Kaiser研究员硕士:波兰弗罗茨瓦夫大学博士:亚琛工业大学机器学习1012John Schulman联合创始人、研究科学家硕士:加州理工学院博士:加州大学伯克利分校机器学习41Tomer Kaftan研发工程师(MTS)学士:加州大学伯克利分校数据库5214姓名职务毕业院校AI 2000入选领域AI 2000 入选领域排名博士:美国华盛顿大学

258、Barret Zoph研究科学家学士:南加州大学机器学习95数据来源:AMiner 科技情报平台根据以上分析所获相关启示,就国内人工智能前沿技术发展提出以下建议:OpenAI 是一家非营利的人工智能研究机构,其 ChatGPT 团队的显著特征是“年轻”和“优质”。一个平均年龄仅 32 岁的 87 人团队,就能够引爆全球新一轮人工智能技术浪潮,其背后是团队成员对人工智能技术的兴趣和信仰,以及对技术创新和研发的全心投入。国内不缺乏如 OpenAI 一样的年轻优秀人才,若能更加注重对其科技兴趣和信仰培育,鼓励其心无旁骛地投身于前沿技术创新,我们就能在全球科技竞争中处于不败之地。本次 OpenAI 不

259、足百人的团队推出的大型语言模型 ChatGPT,让谷歌、Meta 包括国 内的阿里、百度等“大厂”感到压力巨大,它们只好纷纷跟风上马类似项目。“大厂”因其创新机制、组织文化等相对固定,因而在本次大语音模型创新浪潮中疲态尽显。今后,正如 ChatGPT 一样,更多的突破性创新技术会来自创业公司。因此,鼓励国内有志投身前沿科 技创业的年轻人,把目光投向更具创新潜力的创业公司。14在全球人工智能前沿领域,华人学者是一支重要的科技创新力量。海外华人学者是中外学术交流的重要桥梁。本轮以 ChatGPT 为代表的基于大型语言模型的 AIGC 技术发展速度,令国内某些业界人士感到“惊讶”。对外学术交流的重要

260、性在于,能够比较实时、准确感知 和把握全球前沿技术发展的脉搏和趋势。在全球疫情走向尾声之际,鼓励国外顶尖学者走进 来,国内学者走出去,对促进国内前沿科技创新发展具有重要意义。15NumberFull NameTitle1John Schulmanresearch scientist and cofounder2Barret ZophEx Research Scientist3Christina KimMember of Technical Staff4Jacob Hiltonresearcher5Jacob MenickMember of Technical Staff6Jiayi WengR

261、esearch Engineer7Juan Felipe Ceron UribeResearch Engineer8Liam FedusSenior Research Scientist9Luke MetzResearch Scientist10Michael PokornyResident(reinforcement learning)11Rapha Gontijo LopesResearch Scientist12Shengjia ZhaoMember of Technical Staff13Arun VijayvergiyaMember of Technical Staff14Eric

262、SiglerMember Of Technical Staff15Adam PerelmanProduct Engineering16Chelsea VossComputer Scientist17Mike HeatonMember of Technical Staff1618Joel ParishMember of Technical Staff19Dave CummingsEngineering20Rajeev NayakSoftware Engineer21Valerie BalcomEngineering22David SchnurrEngineering23Tomer KaftanM

263、ember of Technical Staff24Chris HallacyMember Of Technical Staff25Nicholas TurleyProduct26Noah DeutschProduct Design27Vik GoelMember of Technical Staff28Jonathan WardMember of Technical Staff29Aris KonstantinidisBusiness Operations30Wojciech ZarembaCo-Founder31Long OuyangResearch Scientist32Leonard

264、BogdonoffMember Of Technical Staff33Joshua GrossMember of Technical Staff34David MedinaMember of Technical Staff35Sarah Yoo-36Teddy LeeOpenAI Product&Operations1737Ryan LoweMember of Technical Staff38Dan MossingMember of Technical Staff39Joost HuizingaResearch Scientist40Roger JiangMember Of Technic

265、al Staff41Carroll WainwrightAI Research Scientist42Diogo AlmeidaComputer Scientist,Programmer43Steph Linresearcher44Marvin Zhang-45Kai XiaoML Researcher46Katarina SlamaMember of Technical Staff47Steven BillsAlignment48Alex Gray-49Jan LeikeMember of Technical Staff50Jakub PachockiPrincipal of Researc

266、h51Phil TilletMember Of Technical Staff52Shantanu JainMember Of Technical Staff53Greg BrockmanPresident&Co-Founder54Nick RyderMember Of Technical Staff55Alex PainoResearch1856Qiming YuanResearch&Engineering57Clemens WinterMember Of Technical Staff58Ben WangMember Of Technical Staff59Mo BavarianMembe

267、r Of Technical Staff60Igor BabuschkinMember of Technical Staff61Szymon SidorMember of Technical Staff62Ingmar KanitscheiderResearch Scientist63Mikhail Pavlov-64Matthias PlappertLanguage&Codex65Nik TezakMember of Technical Staff66Heewoo JunResearcher67William ZhukResearch Engineer68Vitchyr PongResear

268、ch Engineer69Lukasz Kaiser-70Jerry TworekResearch Engineer71Andrew CarrMember Of Technical Staff72Lilian WengApplied AI Research Manager73Sandhini AgarwalAI Policy Researcher74Karl CobbeResearch Scientist1875Vineet KosarajuMember Of Technical Staff76Alethea PowerMember Of Technical Staff77Stanislas

269、PoluResearch Engineer78Jesse HanMember Of Technical Staff79Raul PuriResearcher80Shawn JainMember Of Technical Staff81Beniamin ChessApplied Engineering Infrastructure82Christian GibsonSupercomputing83Oleg BoikoMember Of Technical Staff84Emy ParparitaMember Of Technical Staff85Amin TootoonchianSystems/Networking86Kyle KosicMember Of Technical Staff87Christopher HesseMember Of Technical Staff数据来源:OpenAI 官网、AMiner 科技情报平台

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(工业4.0俱乐部:ChatGPT认知白皮书(151页).pdf)为本站 (小熊小小) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部