上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

甲子光年:2023中国AIGC市场研究报告:ChatGPT的技术演进、变革风向与投资机会分析(54页).pdf

编号:116367 PDF  PPTX   54页 20.25MB 下载积分:VIP专享
下载报告请您先登录!

甲子光年:2023中国AIGC市场研究报告:ChatGPT的技术演进、变革风向与投资机会分析(54页).pdf

1、出品机构:甲子光年智库研究团队:张一甲、宋涛发布时间:2023.02目 录Part 01人工智能的概念与界定P02Part 02人工智能的技术演进与趋势P06Part 03ChatGPT带来的变革趋势P26Part 04AIGC风口下的投资机会P41现在一说起人工智能的起源,公认是1956年的达特茅斯会议。殊不知还有个前戏,1955年,美国西部计算机联合大会(Western Joint Computer Conference)在洛杉矶召开,会中还套了个小会:学习机讨论会(Session on LearningMachine)。讨论会的参加者中有两个人参加了第二年的达特茅斯会议,他们是塞弗里奇(

2、Oliver Selfridge)和纽厄尔(Allen Newell)。塞弗里奇发表了一篇模式识别的文章,而纽厄尔则探讨了计算机下棋,他们分别代表两派观点。讨论会的主持人是神经网络的鼻祖之一皮茨(Walter Pitts),他最后总结时说:“(一派人一派人)企图模拟神经系统企图模拟神经系统,而而纽厄尔则企图模拟心智纽厄尔则企图模拟心智(mindmind)但殊途同归但殊途同归。”这预示了人工智能随后几十年关于这预示了人工智能随后几十年关于“结构与功能结构与功能”两个阶级两个阶级、两条两条路线的斗争路线的斗争。尼克人工智能简史曾经,建制派被看作“唯一的主导力量”,“逻辑驱动”的人工智能曾主宰数十年

3、。彼时,人们相信依据逻辑的程序是简单的,为了抵达智能,科学家们为每个不同问题编写不同程序,纷纷变成“劳动密集型”工种。但人们低估了现实世界的复杂度,问题越大,程序越复杂,逐渐错误百出、频频崩溃,使这条路进展缓慢;另一派“野路子”便是深度学习。作为跨学科产物,深度学习不追求解释和逻辑,以神经网络开启了“暴力美学”大门计算机从数据中学习、进化,让人工智能变成“数据密集型”学科,最终从应用表现中大幅胜出,主宰当今人工智能世界。甲小姐对话特伦斯:进化比你聪明1.1 人工智能源起三大学派:路线相爱相杀,理念相辅相成,一斗六十年又称:逻辑主义、心理学派或计算机学派。原理:物理符号系统(即符号操作系统)假设

4、和有限合理性原理。起源:源于数理逻辑/逻辑推理。学派代表:纽厄尔、西蒙和尼尔逊等。主张:将符号作为人工智能的基本元素,人工智能的运行建立在由符号构成的数理逻辑之上。又称:仿生学派或生理学派。原理:神经网络及神经网络间的连接机制与学习算法。起源:源于仿生学,特别是人脑模型的研究。学派代表:麦克洛奇、皮茨、霍普菲尔德、鲁梅尔哈特等。主张:试图使机器模拟大脑,通过建立一个类似于人脑中神经元的模拟节点网络来处理信号。又称:进化主义或控制论学派。原理:控制论及感知动作型控制系统。起源:源于控制论。学派代表作:布鲁克斯的六足行走机器人,一个基于感知-动作模式的模拟昆虫行为的控制系统。主张:从还原论的立场出

5、发放弃对意识的研究,专注于人和动物等有机体行为的研究。联结主义(Connectionism)符号主义(Symbolism)行为主义(Actionism)1.2 人工智能的六大学科人工智能主要包括六大学科,当下业界讨论往往聚焦机器学习这一学科计算机视觉自然语言理解与交流认知与推理机器人学博弈与伦理机器学习暂且把模式识别、图像处理等问题归入其中暂且把语音识别、合成归入其中,包括对话包含各种物理和社会常识机械、控制、设计、运动规划、任务规划等多代理人agents的交互、对抗与合作,机器人与社会融合等议题各种统计的建模、分析工具和计算的方法感知、认知、决策人类情感、伦理与道德观念认知、决策感知、认知、

6、决策、学习、执行感知、认知、决策、学习、执行和社会协作能力感知、认知、决策、学习、执行和社会协作能力p机器学习之所以如此火爆,是因为它是一种可以让计算机自动学习和改进的技术。p与传统的程序设计方法不同,机器学习允许计算机从数据中学习规律和模式,并在未知数据上进行预测和决策。这使得机器学习在各种领域都具有广泛应用前景,包括自然语言处理、计算机视觉、机器人技术、金融、医疗、电子商务等等。机器学习火热背后的原因:数据量的爆炸式增长:随着数字化时代的到来,人类生产的数据量正在呈指数级增长,这些数据中蕴含着很多宝贵的信息,而机器学习可以通过对这些数据的分析和学习,发现其中的规律和模式,并将其应用于各种领

7、域。计算能力的提高:随着计算机硬件和软件技术的不断发展,计算能力越来越强,能够处理大规模的数据和复杂的算法,这使得机器学习变得更加高效和实用。开源框架的出现:出现了许多优秀的机器学习框架,如TensorFlow、PyTorch等,它们不仅提供了丰富的工具和算法,而且是免费开源的,使得机器学习技术更加普及和易用。商业应用的需求:机器学习技术在商业应用中也有广泛的应用,如推荐系统、广告投放、欺诈检测等等,这些应用在商业领域中起着至关重要的作用,推动了机器学习技术的快速发展。六大学科是七种能力的排列组合:感知、认知、决策、学习、执行、社会协作能力(人机交互),符合人类情感、伦理与道德观念1.3 人工

8、智能的七种能力AI七大关键能力在进化中逐步扩展累积,逐步“解放大脑”p人工智能的出现,意味着具有自主的感知、认知、决策、学习、执行、社会协作能力,符合人类情感、伦理与道德观念的智能机器逐步浮现,成为帮助人类提高生产能力和效率的新型工具。p与人类几千年来创造出来的各种“解放四肢”的工具和机器不同,其是一类逐步“解放大脑”的工具。03202020225时间AI能力感知认知决策学习执行社会协作情感伦理图:不同时期AI侧重能力进化路线当下决策+认知+学习+感知+社会协作(交互)+执行+情感?备注:此处的认知属于狭义的认知,更偏向于判断和

9、推理。七大能力之间存在阶段性侧重和先后关系,但同时也是相互关联、相互作用的,不断地相互影响和改进。感知是智能机器获取外界信息的基础。智能机器需要通过传感器、摄像头等设备收集、处理、分析环境中的信息,以便更好地理解周围的环境和物体。认知和决策能力是智能机器进行智能处理和决策的基础。通过分析、理解和推理数据和信息,智能机器可以更好地判断和决策,以便更好地执行任务。学习能力是智能机器不断优化和改进的基础。通过不断地从数据和经验中学习,智能机器可以自我改进和适应,更好地适应不同的环境和任务。执行能力是智能机器实现任务的基础。智能机器通过控制执行机器人等设备完成任务。社会协作能力是智能机器与人类和其他机

10、器进行合作的基础。智能机器需要通过自然语言处理和其他技术,与人类进行交互和合作,以便更好地实现任务。目 录Part 01人工智能的概念与界定P02Part 02人工智能的技术演进与趋势P06Part 03ChatGPT带来的变革趋势P26Part 04AIGC风口下的投资机会P412.1 AI技术的演进历程AI技术演进已经历四个阶段,如今正向全AI能力覆盖方面演进03时间AI能力202020212022感知认知决策学习执行社会协作情感伦理20232025图:AI能力进化路线下的技术演进路径p人工智能从出现到现在已经历四个阶段,第一个阶段的AI是以逻辑

11、推理为主,AI能力以聚焦决策和认知为主;第二个阶段的AI则是注重以概率统计的建模、学习和计算为主,AI能力开始聚焦感知、认知和决策;第三个阶段的AI聚焦学习环节,注重大模型的建设,AI能力覆盖学习和执行;第四个阶段则聚焦执行与社会协作环节,开始注重人机交互协作,注重人类对人工智能的反馈训练,当下正处于此阶段。p短期的未来,AI会携带多种能力走向千行百业;长期的未来,仍有很多待解问题,比如:是否会产生情感?逻辑推理为主,聚焦决策、认知能力产生情感?聚焦学习环节,大模型聚焦执行与社会协作环节以概率统计的建模、学习和计算为主,聚焦感知、认知、决策逻辑推理机器学习深度学习Transformer神经网络

12、?GPT3ChatGPT分解为五大学科2.2 AI技术宏观演进趋势:合久必分、分久必合从混沌到分科再到归一,呈现多模态多学科融合归一趋势p纵观人工智能技术发展的70年历程,AI技术宏观趋势呈现出由混沌唯一走向分化,然后再走向归一的趋势。p在人工智能发展的前30年,人工智能技术是出于一个混沌状态,并未形成完整的学科和研究领域,从80年代末开始逐步分化形成五大研究领域,但随着技术的发展,从2013年开始各大学科又开始逐步融合,未来将实现多模态融合和多学科融合归一的趋势。03时间AI能力202020212022逻辑推理机器学习深度学习Transformer

13、感知认知决策学习执行社会协作情感伦理神经网络20232025?GPT3ChatGPT计算机视觉认知科学机器人学自然语言理解机器学习图:AI能力进化路线下的技术演进路径图:AI能力的进化路线混沌状态分化为五大学科五大学科归一2.2 AI技术宏观演进趋势:范式变迁当下数据、算力、范式一路向“大”,未来不一定p人工智能研究构架在1987-2020年之间的主导逻辑是大数据、小算力、专用决策范式。GPT-3的出现改变了这一切,让大数据、大算力和通用范式成为典型模式。p值得关注:未来人工智能研究的认知构架是否会往大数据、小算力、通用小范式方向转变?图:AI能力的进化路线0198719

14、952013时间AI能力202020212022逻辑推理机器学习深度学习Transformer感知认知决策学习执行社会协作情感伦理神经网络20232025?GPT3ChatGPT计算机视觉认知科学机器人学自然语言理解机器学习大数据+小算力+专用范式逻辑推理为主大数据+大算力+通用范式大数据+小算力+通用小范式2.2 AI技术宏观演进趋势:大模型一定越大越好吗?Yes and No:AI预训练模型规模呈指数级速度增长,未来或将触达规模法则上限圣塔菲研究所前所长Geoffrey West在科普书规模中揭示了规模法则(scaling law)。在West眼中,有一种不变的标准可以衡量看似毫无关联的世

15、间万物无论是生物体的体重与寿命,还是互联网的增长与链接,甚至是企业的生长与衰败,都遵循规模法则。规模法则关心复杂系统的特性如何随着系统大小变化而变化。以规模法则的视角看待ChatGPT背后的大模型,一个自然问题是:模型一定是越大越好吗?如果数据量足够大、算力足够充沛,是否AI的效果会持续上扬?面对这个问题,业界多方的答案是Yes and No:-持Yes观点人认为,现在的“大”仍不足够大-持No观点人认为,大模型虽好,但其性能有一个上限,虽然这个上限尚不明确2018年6月 2018年10月 2019年2月2019年7月2020年6月 2021年12月 2023年2月2025年2030年2035

16、年2040年2050年2055年2060年GPT-11.17亿图:AI预训练模型的参数规模呈现走势15万亿?30万亿?100万亿?规模法则:上限在哪里?XXX万亿?新版BERT4810亿GPT-31750亿Facebook94亿GPT-215亿BERT-Large3.4亿阿里新M610万亿规模法则AI预训练模型参数规模呈现指数级速度增长,未来仍面临规模法则2.2 AI技术宏观演进趋势:通用人工智能p通用人工智慧(Artificial General Intelligence)或强人工智慧(Strong AI)是具备与人类同等智慧、或超越人类的人工智慧,能表现正常人类所具有的所有智能行为。p通用

17、人工智能是人工智能的重要目标之一,但不一定是AI的终极目标。例如,某些研究人员认为,人工智能的终极目标应该是创造具有意识和主观体验的人工智能系统,而不仅仅是模拟人类的认知和行为。因此,人工智能的终极目标可能会随着科技和人类认知的发展而不断改变和进化。七大AI能力的融合正在推动AI逼近人工智能的重要目标之一:通用人工智能决策式AI是基于规则、知识或经验,通过对输入数据进行分析和推理,从而做出决策或推荐的人工智能系统。这种AI通常用于专业领域,例如医学、金融、法律等,其目的是为了支持决策过程和提高决策效率。生成式AI是基于机器学习或深度学习等技术,从大量数据中学习并生成新的数据或内容的人工智能系统

18、。这种AI通常用于自然语言处理、图像处理、音频处理等领域,其目的是为了生成高质量的内容和实现自动化创作。通用型AI是指具有类似人类智能的广泛能力的人工智能系统,可以像人类一样进行感知、推理、学习、决策、规划等多种任务,能够在不同的领域和情境中灵活地应对和适应。这种AI是人工智能的终极目标之一,目前还没有实现。三种人工智能系统之间存在重叠和互补。例如,在决策过程中,决策式AI可以提供基于规则和知识的决策支持,生成式AI可以提供基于数据的决策参考,通用型AI可以综合考虑多种因素做出更为智能的决策。AI综合能力时间感知侧重决策式AI认知决策学习执行社会协作图:AI能力进化曲线情感伦理20131956

19、202020232030?侧重生成式AI侧重通用型AI2.2 AI技术宏观演进趋势:通用人工智能pChatGPT是一种通用性很强的大型语言模型,它被训练用于多种自然语言处理任务,例如文本生成、文本分类、语言翻译、问答等。p虽然ChatGPT在很多自然语言处理任务上表现出了惊人的能力和表现,但严格意义上讲,它并不是一个通用人工智能系统。p但由于其效果足够“像人”,ChatGPT成为很多人心中通用人工智能的雏形。七大AI能力的融合正在推动AI逼近人工智能的重要目标之一:通用人工智能AI综合能力时间感知决策式AI生成式AI认知决策学习执行社会协作图:AI能力进化曲线情感伦理201319562020通

20、用型AI20232030?ChatGPT属于生成式AI。ChatGPT是一种基于自然语言处理技术的生成式AI模型,能够生成类似于人类对话的文本输出。它使用了大规模的预训练语言模型,能够自动地从输入的文本中学习语言模式和上下文信息,然后基于这些信息生成新的文本。因此,它被广泛应用于对话系统、聊天机器人、智能客服等领域。生成式AI又可称为AIGC(AI-Generated Content 人工智能生成内容)。2.3 AIGC:集合三要素、发展三阶段AIGC在当下的火热来自三要素逐步走向成熟,推动行业进入应用落地阶段数据数据巨量化AIGC认知交互力算法跨模态融合算力内容创造力数据层面核心技术突破多模

21、态认知计算数字孪生虚拟现实全息立体应用场景算法层面感知+交互大数据语料库高精度训练集标注训练计算任务投喂算力层面硬件算力智能交互实时算力边缘计算云计算本地化AIGC的本质是内容与场景,其发展需要AI与后端基建,算法、算据和算力三要素耦合共振。AIGC的三大发展阶段是:模型赋智阶段(从现实生成数字):AIGC利用AI技术构建模拟现实世界的数字孪生模型;认知交互阶段(从数字生成数字):AI能够学习并创作更丰富的内容;空间赋能阶段(从数字生成现实):AIGC基于物联网,多模态技术获取多维信息,实现更加智能的人与机器互动。2.4 AIGC技术架构体系p在百度李彦宏发布的内部信中提到,人类进入人工智能时

22、代,IT技术的技术栈发生了根本性的变化。过去基本分为三层:芯片层,操作系统层和应用层。现在可以分为四层:芯片层、框架层、模型层和应用层。p甲子光年智库认为当下的技术全栈仍然不能满足ChatGPT推动下的新一代人工智能浪潮,未来的AI技术全栈将呈现新的技术架构体系。AIGC技术架构体系的变迁芯片层操作系统层应用层芯片层模型层应用层框架层算力层基础层/模型层应用层平台层中间层过去AI技术全栈当下AI技术全栈未来AI技术全栈算法层2.4 AIGC技术架构体系p未来,基础大模型将会逐步走向统一,形成寡头格局,开发人员将基于这些基础模型研发AI应用。p大模型的商业模式是MaaS(Model as a S

23、ervice):某家公司/某主体/某联合体开发出一个大型语言模型,然后开放API供他人使用。p甲子光年智库认为,未来在基础模型和具体AI应用研发之间会形成中间层:出现一批专门负责调整大型模型以适应具体应用需求的初创企业。在大模型与应用层之间需要一个中间层:向下对接大模型能力,向上提供个性化服务NLP零售金融教育医疗应用层中间层基础层大模型:通用模型大数据:数据规模大,追求广度大算力:算力需求高高投入:高成本投入,训练成本高高能耗:高能源消耗中小模型:专用模型小数据:不追求数据规模,而追求数据深度和专业度中算力:算力需求中等,不依赖超算能力低投入:训练成本投入较少低能耗:能源消耗较少微模型:个性

24、化模型微数据:追求数据专业度和个性化需求小算力:算力需求小,边缘算力即可满足低投入:训练成本投入较少多样化:满足千行百业需求,多样化、场景化、定制化NLPCV多模态CV医疗教育制造金融零售聊天机器人场景1金融智能客服场景2医疗诊断场景2教育数字人场景2XXXXX场景X多样化、个性化、场景化的应用落地向应用层提供专业、垂直的训练模型向基础层调用大模型能力,并反哺预训练模型大基础模型服务MaaS服务模式图:AIGC算法层技术架构拆解2.4 AIGC技术架构体系p甲子光年智库认为,AIGC将形成类似云计算的生态结构:只有足够“包罗万象”,才能支撑前端足够的“奇形怪状”。AIGC技术架构分为算力层、平

25、台层和算法层,算法层又分为基础、中间、应用三层算力层算法层AI芯片及处理器平台层AIDC智算中心AI传感器模型生产训练平台数据平台数据采集数据清洗数据标注数据合成数据鉴真基础层NLP大模型CV大模型多模态大模型中间层金融+文本医疗+图像航天+3D零售+多模态应用层智能客服聊天机器人元宇宙搜索引擎数字人教育音/视频大模型图:AIGC技术架构体系只有足够“包罗万象”,才能支撑前端足够的“奇形怪状”。2.5 AIGC驱动力与制动力三要素外,核心制约来自成本问题、数据质量问题、知识产权问题、能耗问题、安全问题发展驱动力发展制动力安全与伦理道德的挑战知识产权的挑战数据质量算力不足智算中心的算力支撑政策鼓

26、励AIGC发展驱动力与制动力重要的市场驱动力 政策 资金 人才 算力 数据 算法技术充足的资金支撑高质量数据的积累与应用预训练投入成本过高顶尖人才的坚持与信仰生产算法预训练模型多模态等AI技术成熟融合影响发展的制动力 算力不足 数据质量 投入成本高 知识产权归属 能源消耗大 安全与伦理能源消耗的挑战2.6 ChatGPT在AI技术演进历程中的地位ChatGPT的出现代表AI技术的第三次范式升级:从大模型走向AGIGPT3ChatGPT基于手写规则处理少量数据可找到一些函数与参数分类数据像人脑一样学习根据大量数据分类学习一个复杂的参数集合优化人脑学习过程关注重点而非全部使用海量学习数据不需要提前

27、进行标记和分类人类对结果的反馈成为学习过程的一部分能否打破人脑结构限制?有无可能生成情感?620023GPT2GPT120182019M2m-100BARTT5XLMRoBERTaBERTInstructGPTBigBirdALBERT逻辑推理机器学习神经网络TransformerELECTRA技术发展阶段(少量应用)应用竞争阶段(全面应用)科技研究阶段时间技术水平图:ChatGPT的技术演化路径与历史地位范式转换2.0:从深度学习到大模型的转换范式转换3.0:从大模型走向AGI范式转换1.0:从逻辑推理向概率统计的转换2.7 ChatGPT vs

28、Bertp先发优势意味着数据采集的时间窗口,形成“社会性实验”。p先发优势也意味着用户的容错心理对“第一个吃螃蟹的”有错误层面的包容性,对第二个就不一定了。胜负未分,但“先发优势”之于AI有着值得注意的重要性基于Transformer模型的预训练语言模型ChatGPTBERT通用的网络文本数据应用场景基于单词或字符级别的自回归模型预测方式基于句子级别的特征提取预训练目标模型大小训练数据大型模型标准版(BERT-Large)最大的ChatGPT-3模型自然语言处理领域的广泛应用文本分类命名实体识别关系抽取句子相似度计算生成式任务对话生成文本生成机器翻译更广泛的文本数据收集网页维基百科新闻包含3.

29、4亿个参数包含1750亿个参数上下文单词或字符整个句子固定长度的向量表示遮盖单词下一句预测上下文信息文本表示上下文下一个单词或字符文本结构、语言规律2.8 来龙:ChatGPT如何演化而来?“暴力美学”:超大规模及足够多样性的数据、超大规模的模型、充分的训练过程基于规则机器学习神经网络TransformerGPT3ChatGPT?手写规则处理少量数据可找到一些函数与参数分类数据像人脑一样学习根据大量数据分类学习一个复杂的参数集合优化人脑学习过程关注重点而非全部使用海量学习数据不需要提前进行标记和分类人类对结果的反馈成为学习过程的一部分能否打破人脑结构限制?有无可能生成情感?1950198020

30、06201720202022pChatGPT背后的GPT系列体现了LLM应该往何处去的发展理念。p很多人开始相信,揭开AGI的真正钥匙正在于:超大规模及足够多样性的数据、超大规模的模型、充分的训练过程。这条道路看似朴素,却足以让AI表现出智能“涌现”的能力,未来也许会持续带来意想不到的惊喜和惊吓。这种思想简言之就是将“参数至上和数据至上”的思想发挥到极致,从细分技术“分而治之”到“大一统、端到端”,从理论洁癖走向暴力美学。大模型的竞争力:大数据、大算力和强算法。2.8 来龙:ChatGPT如何演化而来?p各算法并非割裂关系,有多条谱系传承甚至跨代遗传。p微软阵营体现后发优势。AI算法演化之路:

31、火爆的算法在经典算法之上优化而来递归神经网络(RNN)伊辛&楞次&甘利俊一&Juergen Schmidhube蒙特卡洛树搜索(MCTS)Bruce Abramson卷积神经网络(CNN)Yan LeCun&福岛邦彦受限玻尔兹曼机(RBM)Paul Smolensky多层感知机(MLP)Hinton&Sejnowski反向传播(BP)Werbos&Hinton概率模型Yoshua Bengio高维词向量Hinton长短期记忆(LSTM)Hochreiter&Juergen Schmidhube非线性激活深度玻尔兹曼机(DBM)Hinton 生成对抗网络(GAN)Goodfellow注意力机制(

32、Attention)Deepmind(GOOG)RNN改进AlexNet&DropoutHinton深度强化学习(DQN)Deepmind(GOOG)Attention&TransformerGoogle生成预训练变压器(GPT)OpenAI双向编码表示(BERT)OpenAIGPT3openAI残差网络(ResNet)何信明等AlphaFold2何信明等AlphaFoldDeepmindchatGPT(GPT3.5)openAIMT-NLG微软&英伟达图像生成相关语言生成相关代表具有里程碑的关键创新代表相关算法开创者所在公司或阵营1900年-1980年1980年-1990年1990年-200

33、0年2000年-2010年2010-2020年2020年-至今2.8 来龙:ChatGPT如何演化而来?ChatGPT的训练过程与提升表现效果远超预期(深度),基本达到人类水准具有通用人工智能(广度)的雏形常识知识处理能力,心智达到人类9岁孩童水平伦理及避坑,展现高情商,敢于承认无知,承认错误较高的语义理解能力图2:ChatGPT的训练过程分为三个阶段图1:ChatGPT的提升表现第一阶段训练监督策略模型第二阶段训练奖励模型(RM)第三阶段强化学习优化模型数据集中随机抽取问题使用PPO模型生成回答RM模型给出质量分数基于质量分数优化PPO模型参数循环迭代出新模型数据集中随机抽取问题生成多个不同

34、的回答标注答案排名顺序排序结果数据来训练奖励模型RM模型给出高质量回答的分数数据集中随机抽取问题生成多个不同的回答标注高质量答案用标注好的数据来微调模型收集演示数据并训练有监督策略收集比较数据并训练奖励模型采用PPO强化学习算法针对奖励模型来优化策略2.8 来龙:ChatGPT如何演化而来?初代ChatGPT的训练存在六大方面的局限性图:ChatGPT训练的局限性缺乏深层语义理解能力ChatGPT训练局限性需要大算力支持其训练和部署缺乏深度推理能力深度领域知识处理有问题跨模态能力不足数据的实时性和有效性ChatGPT缺乏深度推理能力,例如不能完成高难度数学题。目前ChatGPT在常识知识方面非

35、常强大,但对领域内专业知识处理仍存在问题。因为缺乏和结构化数据的有效对接,所以目前ChatGPT会出现数据缺失和实时性错误。当前ChatGPT主要生成文本,不包括图像和视频在内的其他模态。ChatGPT可理解部分浅层语义,但缺乏深层(如模型论层)语义理解能力。ChatGPT需要大量语料数据训练模型,在应用时仍然需要大算力的服务器支持ChatGPT未来的改进方向:多模态、少人化、小型化、进化力减少人类反馈强化深层语义理解能力多模态模型发展模型实时持续学习进化能力ChatGPT的小型化CAI(Constitutional AI)的排序过程使用模型(而非人类)对所有生成的输出结果提供一个初始排序结果

36、。有三类模型压缩(model compression)可以降低模型的大小和成本。量化(quantization),即降低单个权重的数值表示的精度。比如Tansformer从FP32降到INT8对其精度影响不大。剪枝(pruning),即删除网络元素,包括从单个权重(非结构化剪枝)到更高粒度的组件如权重矩阵的通道。这种方法在视觉和较小规模的语言模型中有效。稀疏化。例如奥地利科学技术研究所(ISTA)提出的SparseGPT(arxiv.org/pdf/2301.0077)可以将GPT 系列模型单次剪枝到 50%的稀疏性,而无需任何重新训练。对 GPT-175B 模型,只需要使用单个 GPU 在几

37、个小时内就能实现这种剪枝。计算机学家Stephen Wolfram 为这一问题提出了解决方案。Stephen Wolfram 创造了的 Wolfram 语言和计算知识搜索引擎 Wolfram|Alpha,其后台通过Mathematica实现。2.9 去脉:ChatGPT将走向何方?文本到文本的AIGC 文本到图像的AIGC 文本到3D的AIGC 图像到图像的AIGC 音频相关的AIGC目 录Part 01人工智能的概念与界定P02Part 02人工智能的技术演进与趋势P06Part 03ChatGPT带来的变革趋势P26Part 04AIGC风口下的投资机会P413.1 ChatGPT有多火?

38、“有意瞄准,无意击发”自11月30日发布后,ChatGPT仅用2月便积累1亿用户数量007080901002022/11/302022/12/142022/12/282023/1/112023/1/25chatgpt搜索人数7日均线ChatGPT关键字搜索兴趣变化(单位:百万人)ChatGPT用户数量增速惊人消费级应用1亿用户达成时长(月)ChatGPT2TikTok9Instagram30Pinterest41Spotify55Telegram61Uber70Google Transalte783.2 深远意义:人类文明生产力跃迁以ChatGPT为代表的AIGC工具的出

39、现,标志着人类生产效率出现了第二次脑力效率飞跃原始时代宙线:时间(人类文明进化历程)数智时代数字时代信息时代工业时代农业时代体力脑力辅助生产效率的提升石器农具+牛机械PC/软件云、网、端、芯、链AIGC?脑力创意体力效率的提升体力输出者脑力生产效率的提升内容生产者脑力生产效率的二次飞跃内容再加工者3.2 深远意义:互联网走出强弩之末对传统内容生成模式的颠覆与重塑,解放内容生产者,让其有更多精力进行二次深加工Web1.0Web2.0Web3.0互联网时代 内容消费者 PGC内容生产形式角色转换 初次内容生产者 UGC 二次内容加工者 AIGC专业人工专业设备平台用户专业内容生产数量、质量有限、无

40、法自动化模糊推送主动检索用户设备平台用户内容生产数量多、质量有限、无法自动化精准推送主动检索AIGC生产内容平台用户多样化内容生产数量多、质量提升大、自动化生成精准推送核心环节演进用户/专业人士二次加工初次内容初次内容3.2 深远意义:人与内容的关系发生根本性变革AIGC加速元宇宙世界的内容构建,推动人与内容关系发生根本性变革Web1.0Web2.0Web3.0 单向信息输出 个体体验 单向交互体验水平交互模式内容传输 内容消费者 PGC内容生产形式角色转换 决策式AIAI技术进程 双向信息交互 复合体验 双向交互 初次内容生产者 UGC 决策式AI 信息聚联与价值共享 沉浸体验 沉浸、聚联

41、二次内容加工者AIGCAIGC 生成式AIAI互联网时代 文字、图片、视频内容载体 文字、图片、视频 元宇宙3.3 AIGC的应用领域多模态多场景,逐渐融入千行百业AIGC文本生成 结构化写作:新闻播报 非结构化写作:剧情续写 辅助性写作:帮助润色 闲聊机器人 文本交互游戏音频生成 语音克隆 文本生成特定语音 乐曲/歌曲生成图像生成 图像编辑工具:去除水印 创意图像生成:生成画作 功能性图像生成:生成海报视频生成 视频属性编辑:删除特定主体 视频自动剪辑 视频部分编辑:视频换脸等图像、视频、文本间跨模态生成 文字生成图像 文字生成演示视频 文字生成创意视频 图像/视频到文本:视觉问答系统Gam

42、e Al AI Bot NPC逻辑及剧情生成 数字资产生成策略生成虚拟人生成数字内容构建合成数据助推自动驾驶场景 应用于仿真引擎模拟驾驶场景银行和投资场景 应用于欺诈检测、交易预测、风险因素建模医疗场景 通过仿真医疗数据训练医疗诊断模型 利用合成的基因组数据进行医学研究零售场景 通过3D模拟创建合成数据集,助力无人零售工业场景 创建了虚拟工厂,在模拟平台上使用多种工具进行合作3.4 AIGC的技术应用趋势OpenAI的产品矩阵可以洞悉未来一些方向:多模态+安全产品产品说明类型ChatGPT对话模式的AI交互模型,具备回答一系列问题、承认错误、质疑不正确的前提和拒绝不适当的请求等功能。文本DAL

43、LE2是一个新的人工智能系统,可以根据自然语言的描述创建逼真的图像和艺术。例如左图通过宇航员、骑马和写实风格生成的图片图片Whisper是一种自然语言处理的神经网络模型,是一种自动语音识别系统。并且支持多种语言的转录及翻译成为英语。语音Alignment该项研究专注于训练AI系统,不断提升实用性、仿真性和安全性,进一步探索和开发AI系统在人类反馈中学习的方法。安全领域类型2020年之前2020年2022年2023年?2025年?约2030年文本领域诈骗垃圾信息识别翻译基础问答回应基础文案撰写初稿更长的文本二稿垂直领域的文案撰写实现可精调(论文等)终稿,水平高于人类平均值终稿,水平高于专业写手代

44、码领域单行代码补足多行代码生成更长的代码更精确的表达支持更多语种领域更垂直根据文本生成初版应用程序根据文本生成终版应用程序,比全职开发者水平更高图像领域艺术图标摄影模仿(产品设计、建筑等)终稿(产品设计、建筑等)终稿,水平高于专职艺术家、设计师等视频/3D/3D/游戏领域视频和3D文件的基础版/初稿二稿AI版Roblox可依个人梦想定制的游戏与电影OpenAI的产品矩阵生成式AI技术的成熟应用进程时间表p从OpenAI产品矩阵可以看出其已经布局文本、图片、语音等多模态产品,未来将逐步探索多模态的融合。p未来文本、图片、语音、代码等场景将逐步走向成熟,将助推技术向多模态融合发展。大模型成熟难度:

45、初级尝试接近成熟成熟应用路径1:文本到文本AIGC3.4 AIGC的技术应用趋势AIGC五大技术应用方向直走,然后向左转。我怎么能去超市?ChatGPT是由OpenAI基于GPT-3.5 开发的大型语言模型聊天机器人AIGC由谷歌推出的Imagen,是一个文本到图像的扩散模型,具有前所未有的摄影现实感程度和深刻的语言理解水平请给我画一张显示道路的地图AIGC请给我画一幅f非常愤怒的小鸟AIGC由Preferred Networks推出的Crypko可以创作上半身动漫形象。从草稿中创作图像修复损坏的图像AIGC谷歌推出的DreamFusion可以根据给定的文本创建3D模型请为我生成一个使用笔记本

46、电脑的3D机器人Murf AI推出的人类语音生成器可以在几分钟内发出录音室质量的声音让这个机器人来模仿我的语气吧创作一些音乐AIGCAIGCAIGC多模态融合的五大方向路径路径2:文本到图像AIGC路径3:文本到3DAIGC路径4:音频相关AIGC路径5:图像到图像AIGC3.5 经典场景:数字人与营销数字化AIGC的内容生成打通了营销数字化的最后一个环节内容自动化生成客户需求分析个性方案设计未知接触了解购买复购识别客户分析客户客户互动个性推荐成效分析引流分配互动营销运营管理成效分析客户认知购买过程厂商产品功能产品用户使用场景目标客户定位全渠道营销推广销售达成营销数字化核心流程图:营销数字化核

47、心流程目标客户定位:通过客群分析实现目标客户识别;客户需求分析:基于客户需求进行市场研判,培育线索智能分群;个性方案设计:基于分群进行个性化方案设计,设置自动化营销流程;内容自动化生成:基于个性化方案自动生成营销物料内容;全渠道营销推广:全渠道触达与互动,推送个性化方案和内容;销售达成:客户意向预测与销售意向的达成;营销复盘再推荐:事后的营销全场景可视化报表复盘与再推荐方案生成。营销数字化核心流程闭环营销复盘再推荐p在营销数字化核心流程中,内容自动化生成环节在过去是缺失状态,因此无法构成闭环,但随着AIGC的应用,将助推营销数字化实现业务闭环。过去缺失环节3.5 经典场景:数字人与营销数字化A

48、IGC与数字人的结合,推动数字人实现文本、语音、动画、音频等多模态交互3D数字人2D数字人五横体系通用框架人物形象动画生成模块语言生成模块交互模块人物生成人物表达合成显示识别感知分析决策无人物建模绑定等语音生成、动画生成(驱动、渲染)等终端显示技术语音语义识别、人脸识别、动作识别等知识库、对话管理等音视频合成显示模块人物语音生成人物动画生成音视频合成显示终端用户TTSA人物模型文本智能分析与决策识别感知p 虚拟人系统框架一般情况下由人物形象、语音生成、动画生成、音视频合成显示、交互五个核心模块构成虚拟人构建的“五横体系”。p 交互模块为可扩展项,依据是否具有交互模块可讲虚拟人分为交互型虚拟人和

49、非交互型虚拟人,其交互型虚拟人依据其驱动方式的不同,又可分为智能驱动型虚拟人和真人驱动型虚拟人。p 其中虚拟人制作过程中核心关键技术应关注:建模、驱动、渲染和人工智能。其决定了虚拟人的外在形象的美观度、动作的流畅度以及交互的自然度及虚拟人的智能程度。人物语音生成人物动画生成音视频合成显示终端用户数字化人物形象文本图2:非交互类虚拟人系统运作流程图3:智能驱动型虚拟人系统运作流程图1:虚拟人技术框架大厂拥有创新营销生态+技术+流量的完备实力,赋能品牌高效链接用户3.5 经典场景:数字人与营销数字化6.28亿月活用户量8亿网盘积累用户1.1亿全域DAU1300亿日均位置服务请求8000万全域DAU

50、百度多端优势产品矩阵,打造10亿+移动用户规模的“超级流量”3000万家庭渗透流量资源AI能力生态能力AI面部驱动AI口型驱动AI变声器Plato AI实时语言互动AI任意换妆换装AI跳舞AI唱歌高精度数字人实时直播人数字人资产数字资产空间虚拟空间百度数字人:1+2+3+X虚拟数字人生态体系一站式平台两大核心资产三大应用度晓晓、希加加合作授权品牌营销服务场景百度智能云曦灵平台四大AI引擎为依托唇形驱动表情驱动肢体驱动手势感知人像驱动引擎智能对话引擎语音交互引擎智能推荐引擎任务对话预置技术智能问答开放域对话全双工AST变声器个性化TTS定制唤醒词内容与产品推荐素材库基于百度区块链开发平台打造数字

51、藏品品牌数字资产品牌“虚拟”用户管理品牌营销赋能自研开放的数字资产可信登记平台数字艺术品交易平台星际口袋、D+商城、小度寻宇国内首款独立元宇宙APPAI智能永久复用多端兼容极限观感丰富活动场景会议会展、文博文旅文创、试乘试驾、个人空间元宇宙基础设施百度大脑百度文心大模型PLATO3.6 甲子探索场景:AIGC与新一代智库的结合p经甲子光年智库测算,借助AIGC相关工具,在研究分析的每一个环节,都可以实现40%以上效率提升。对研究流程的重塑,实现预研环节内容重构与效率提升研究项目流程AIGC研究人员关键流程A1预研工作A4问卷调研角色AIGC对研究项目全流程的重塑采购A2项目启动A3深度访谈问卷

52、发布和回收A5数据清洗A8报告确认与优化A9研究报告发布A10发布后再开发A6数据分析A7报告撰写合作伙伴确认是否需要采购是否前期预研,完成资料收集与结构化文档整理协助分析师收集客户资料协助分析师进行访谈问卷设计协助分析师进行调研问卷设计报告查错优化改进建议协助生成发布文稿,提高文稿撰写效率协助开展报告观点提炼3.6 甲子探索场景:AIGC与新一代智库的结合搭建基于AIGC的新一代智库产品架构体系,甲子光年已经具备一定基础算力层算法层公有云基础设施平台层AIDC智算中心模型生产训练平台数据平台数据采集数据清洗数据注入数据存储数据分析基础层NLP大模型CV大模型多模态大模型中间层应用层前期预研调

53、研执行统计分析报告撰写发布推广科技行业模型云计算人工智能元宇宙行业数据定义赛道指标体系产业图谱企业机构政府高校研究模型数据模型评估模型问卷模型知识图谱人脉模型能力模型研究项目全流程的重塑图:基于AIGC的新一代智库产品架构体系甲子光年具备环节甲子光年待加强的环节3.6 甲子探索场景:AIGC与新一代智库的结合甲子光年构建的甲子大脑数据平台体系,为打造基于AIGC的新一代智库产品提供基座图:甲子大脑业务闭环赋能甲子光年各业务开展政府协会科研官方智库公域数据咨询公司数据公司调研机构三方数据智库媒体FA峰会活动商学院甲子光年私域数据行业数据企业数据财务数据产品介绍专家观点定义赛道数据采集、汇总、输入

54、各业务线数据调取与使用甲子大脑数据湖解决方案核心观点数据图表评估体系研究模型数据库企业库机构库产品库案例库知识库行业数据定义赛道指标体系产业图谱人脉库企业机构政府高校能力库研究模型数据模型评估模型问卷模型智库媒体FA活动商学院各业务线实际使用数据过程中又会产生新数据,再次注入甲子大脑源数据经过数据分析师对数据进行结构化、标准化处理,再经过战略分析师对观点的归纳总结,最终形成结构化数据和观点进行输出输入端输出端目 录Part 01人工智能的概念与界定P02Part 02人工智能的技术演进与趋势P06Part 03ChatGPT带来的变革趋势P26Part 04AIGC风口下的投资机会P414.1

55、 基于技术架构的产业现状分布p当下一级市场中AIGC企业按技术架构下的产业链分布来看,84%布局算法层,11%处于算力层,只有5%布局平台层,算法层竞争度高,算力层竞争度小。算法层中又以基础层和应用层企业居多,中间层企业较少,中间层企业未来机会空间较大。从技术架构下的产业分布来看,算力层和中间层企业将更有机会平台层5%算法层84%算力层11%图1:一级市场AIGC企业按产业链分布情况39%15%30%5%11%应用层中间层基础层平台层算力层图2:一级市场AIGC企业按细分产业链分布情况算法层企业较多,算力层企业较少算法层中的中间层企业较少算法层竞争度高,算力层竞争度小。中间层企业少,未来机会空

56、间大。4.1 基于技术架构的产业现状分布p从现有中间层的AIGC企业分布情况来看,企业布局主要聚焦智能机器人、计算机视觉应用、智能交互、机器人操作系统、chatBOT等方向,反而在内容生成、推荐引擎、机器学习应用、知识图谱、机器翻译等领域布局较少,这些中间层领域具有投资价值。中间层的AIGC在内容生成、推荐引擎、机器学习应用、知识图谱、机器翻译等领域布局少52%10%9%7%6%4%4%4%3%1%100%智能机器人计算机视觉应用智能交互机器人操作系统chatBOT机器翻译知识图谱机器学习应用推荐引擎内容生成整体图:一级市场AIGC技术架构中处于中间层的企业分布情况4.2 基于技术架构的产业链

57、投资价值环节甲子光年智库认为,算力层和中间层企业具有投资价值算力层算法层AI芯片及处理器平台层AIDC智算中心AI传感器模型生产训练平台数据平台数据采集数据清洗数据标注数据合成数据溯源基础层NLP大模型CV大模型多模态大模型中间层应用层智能客服聊天机器人元宇宙搜索引擎数字人教育投资价值环节投资价值环节蓝海市场,成长空间大孵化成本低进入壁垒:专业性壁垒、深度壁垒先发优势:先训练、先迭代,具有一定容错率,发布时会有社会效应需求持续释放,成长空间大政策鼓励扶持,具有战略价值相比于大模型投入成本低专业性壁垒高先发优势:先发布属于填补空白,突破卡脖子,社会效应高文本+金融图像+医疗视频/音频+教育多模态

58、+营销4.3 基于技术架构的各环节投入回报情况的分析从投入成本和回报情况来看,中间层和应用层的投入成本低,商业回报较好投入成本(亿元)商业回报1AI芯片(28纳米)1003.50.6中间层应用层预训练大模型图:“甲子微笑曲线”技术-商业投入回报模型AIGC不同技术架构下的投资孵化成本投入对比0.5平台层:数据平台4.4 算力层的投资机会与代表企业AIGC对算力的需求指数级增长,算力供需已经失衡,需求拉动下算力层将有较大空间2018年6月2018年10月2019年2月2019年7月2019年10月2020年6月3?,4GB50?,16GB200?40GB3?160GB66?800GBGPT-3?

59、335?2TBAI预训练模型规模呈现指数级速度增长l 数据规模和模型复杂度增速远超算力增速。l 没有强大算力,数字经济将失去核心支撑。l 新计算产业,成为中国数字经济发展的必由之路、重中之重。0.30.81.84.47.915.831.64406080计算曲线HPE分析DataCompute 供需失衡:近10年来,全球算力的增长明显滞后于数据的增长。从2012年开始,全球人工智能训练所用的计算量呈现指数增长,平均每3.43个月便会翻一倍,计算量扩大了30万倍,远超过算力增长速度。模型规模指数增长:2019年,OpenAI耗资1200万美金研发GPT-3模型,建立了2600

60、P的基础算力,相比其2018年6月推出的GPT模型,数据规模增长了500倍。如果使用单块NVIDIA V100 GPU,则其完成GPT-3当前能实现的训练规模,需要长达355年之久。算力增长滞后于数据增速导致算力供需失衡预训练模型数据规模继续呈指数级增长4.4 算力层的投资机会与代表企业p 狭义的 AI 芯片指针对人工智能算法做了特殊加速设计的芯片,目前来讲,由于深度学习算法在人工智能领域认可度及应用程度不断上升,AI芯片一般指针对大量数据进行数据训练(training)与推断(inference)设计的芯片。p GPU,FPGA及ASIC是目前最常用的三类AI芯片的技术架构。高效实现机器学习

61、算法的计算硬件分类典型特征GPU图形处理器(Graphics processing unit),在计算方面具有高效的并行性。用于图像处理的GPU芯片因海量数据并行运算能力,被最先引入深度学习。功耗比较低。FPGA现场可编程门阵列(Field programmable gate array),是一种集成大量基本门电路及存储器的芯片,最大特点为可编程。具有能耗优势明显、低延时和高吞吐的特性。ASIC专用集成电路(Application specific integrated circuit,特定应用集成电路),是专用定制芯片,为实现特定要求而定制的芯片。除不能扩展应用以外,在功耗、可靠性、体积方面

62、都有优势。类脑芯片“类脑芯片”是指参考人脑神经元结构和人脑感知认知方式来设计的芯片。目前仍然处于探索阶段。针对机器学习算法针对类脑人工智能算法*本次报告不作讨论4.4 算力层的投资机会与代表企业pAI芯片根据所在服务器在网络中的位置可以分为云端AI芯片,边缘及终端AI芯片。pAI芯片根据实践中的目标不同,可大致分为两类:1)训练AI芯片:指用于构建神经网络等模型;2)推理AI芯片:利用模型进行推理预测。p边缘层计算能力的提升推动云-边-端的协同,使得更多行业的人工智能应用场景得以实现,推动AI芯片行业的发展。云端芯片侧重训练,边缘+终端层芯片侧重推理,这两类芯片均具有较高成长空间终端层边缘层云

63、计算层预测维护能效优化质量提升数据采集与分析应用部署软硬件环境分布式智能/推理边缘网关边缘控制器边缘传感器EC-SaaSEC-PaaSEC-IaaSSaaSPaaSIaaS业务编排应用开发管理数据分析/训练服务协同智能协同数据协同业务管理协同应用管理协同资源协同云端主要承载云端训练和云端推理的任务具体涉及智能数据分析、模型训练任务和部分对传输带宽要求不高的推理任务边缘和终端主要承担推理的任务需要独立完成的任务涵盖:数据收集、环境感知、人机交互以及部分推理决策控制任务边缘计算可负责范围内的数据计算和存储工作。同时,负责将连续数据汇总至计算层,最终由云计算层完成分析挖掘、数据共享工作,下发结果或模

64、型至边缘和终端层,形成云-边-端协同图:云-边-端协同示意图4.4 算力层的投资机会与代表企业训练AI芯片和推理AI芯片的代表企业图谱推理AI芯片代表企业训练AI芯片代表企业10%14%18%46%11%4.5 平台层下的数据平台投资机会与代表企业在数据处理与应用环节更为值得投资机构的关注图1:AIGC中数据平台的产业链关键环节源数据数据采集数据存储数据处理数据应用IT技术人员重要性调研反馈产业链合成数据数据采集数据标注验真溯源数据存储数据处理数据应用源数据数据源头数据抽取、清洗、加载数据存储数据挖掘、检索、分析数据标注工作数据的真伪识别与溯源工作计算机模拟技术或算法生成合成数据产业链主要职责

65、战略环节图2:AIGC中数据平台的产业链关键环节预测分析、机器学习、人工智能等先进技术的融合程度调整大型模型以适应垂直化、专业化的AI应用需求4.6 算法层下的中间层投资机会与代表企业p未来大的基础模型将会逐步走向统一,形成寡头的数个大模型格局,开发人员将基于这些基础模型研发AI应用。目前商业模式依然是某一家公司开发出一个大型语言模型,然后开放API供他人使用。未来,在基础模型和具体AI应用研发之间会有一个中间层:出现一批专门负责调整大型模型以适应具体AI应用需求的初创企业。中间层将涌现一批专门负责调整大型模型以适应具体AI应用需求的初创企业算法层基础层OpenAI GPT谷歌GLaM百度文心

66、大模型中间层文本+金融图像+医疗视频/音频+教育多模态+营销应用层智能客服聊天机器人元宇宙搜索引擎数字人教育等垂直场景投资价值环节蓝海市场,成长空间大孵化成本低进入壁垒:专业性壁垒、深度壁垒先发优势:先训练、先迭代,具有一定容错率,发布时会有社会效应云计算平台,提供算力层和平台层支撑AWS阿里云华为云百度云澜舟孟子图:中间层初创企业的商业模式提供更精准化、更专业的预训练模型并反哺给大型模型核心价值是数据飞轮,指使用更多数据可以训练出更好的模型,吸引更多用户,从而产生更多用户数据用于训练,形成良性循环。)初创企业将来不承担模型训练角色,它们可以在上述的中间层角色中发挥巨大价值更多数据训练模型模型

67、优化吸引用户数据飞轮4.7 算法层下的基础层投资机会与代表企业ChatGPT背后的大模型,是AI的基础设施,将进一步推动AIGC行业发展“海洋之光”超级计算机(国产超算)512块 GPU算力腾讯太极机器学习平台昇腾 AI 基础软硬件平台16 块 GPU数据量1.9TB 图像292GB 文本中文多模态数据集 M6-Corpus五大跨模态视频检索数据集基于万条小规模数据集数百 G 级别不同领域的高质量语料模型类型多模态预训练模型图、文、音三模态“八卦炉”(脑级AI模型)M6大模型“混元”HunYuan_tvr紫东太初孟子参数174万亿(与人脑中突触数量媲美)10 万亿万亿千亿10亿商汤AIDC,峰

68、值算力3740Petaflops3-计算机视觉模型计算机视觉模型书生(INTERN+)某世界最大规模计算器视觉模型100亿300亿商汤科技商汤科技等2企业清华大学等1阿里腾讯280 块 GPU鹏城云脑(2048 块CPU)和百度飞桨4095(Pflops-day)/2128 张GPU3390 亿条文本数据纯文本和知识图谱的4TB 语料库5000GB 高质量中文数据集NLP 大模型NLP 大模型NLP 大模型Megatron-TuringERNIW 3.0 Titan源 1.05300亿2600 亿2457 亿微软和英伟达百度和鹏程实验室浪潮信息鹏城云脑和全场景 AI 计算框架MindSpore

69、,2048 块 GPU40TB 训练数据盘古系列大模型千亿3640(Pflops-day3)/上万块V100 GPU 组成 gao 带宽集群算力超过万亿单词的人类语言数据集GPT3.51750 亿OpenAI华为云中科院自动化所澜舟多模态预训练模型结合人类参与强化学习复旦大学超算中心-对话式大型语言模型MOSS百亿复旦大学4.8 AIGC产业投资地图p大厂适合布局的环节应聚焦高投入、大算力需求、大数据量级、通用能力好的环节,因此适合布局在算力层、算法层的基础层和平台层的模型生产和训练等环节。p初创企业适合入局的环节应聚焦在投入少、算力需求不高、中低数据量级、垂直/专业场景等环节,适合布局在中间

70、层、应用层和平台层的数据平台环节适合。初创企业适合入局中间层、数据平台和应用层,大厂适合入局算力、平台和基础层算力层算法层AI芯片及处理器平台层AIDC智算中心AI传感器模型生产训练平台数据平台数据采集数据清洗数据标注数据合成数据鉴真数据溯源基础层NLP大模型CV大模型多模态大模型中间层金融+文本医疗+图像航天+3D零售+多模态应用层智能客服聊天机器人元宇宙搜索引擎数字人教育等垂直场景音/视频大模型图:AIGC技术架构体系下的产业投资地图初创企业适合入局环节初创企业适合入局环节大厂适合入局环节基础层4.8 AIGC产业投资地图算力层、数据平台、中间层及应用层具有投资价值的细分方向与初创代表企业

71、算力层算法层训练AI芯片平台层数据平台应用层智能客服聊天机器人元宇宙内容营销数字人教育新型智库推理AI芯片数据处理数据标注数据溯源合成数据光年之外中间层文本图像视频/音频3D多模态MiniMax图灵AIGC图形起源特看科技诗云科技图:AIGC技术架构体系下的初创企业产业投资地图深氧未来甲子智库院长宋涛 微信stgg_6406北京甲子光年科技服务有限公司是一家科技智库,包含智库、媒体、社群、企业服务版块,立足于中国科技创新前沿阵地,动态跟踪头部科技企业发展和传统产业技术升级案例,致力于推动人工智能、大数据、物联网、云计算、AR/VR交互技术、信息安全、金融科技、大健康等科技创新在产业之中的应用与落地扫码联系咨询合作关注甲子光年公众号甲子光年创始人张一甲 微信JJJessica0114

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(甲子光年:2023中国AIGC市场研究报告:ChatGPT的技术演进、变革风向与投资机会分析(54页).pdf)为本站 (小时候) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部