上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

2023年AI大模型ChatGPT研究进展及国内各厂商大模型对比分析报告.pdf

编号:123498 PDF 27页 2.67MB 下载积分:VIP专享
下载报告请您先登录!

2023年AI大模型ChatGPT研究进展及国内各厂商大模型对比分析报告.pdf

1、2023 年深度行业分析研究报告 2内容目录内容目录大模型概述:大模型概述:大模型提升机器理解能力,优化人机交互大模型提升机器理解能力,优化人机交互.5 5AI 大模型是实现通用人工智能(AGI)的重要方向.5大模型应用:“预训练+精调”即可对下游应用赋能,优化人类与机器交互方式.6大模型三要素:算力、算法、数据.9百度文心大模型百度文心大模型.1212模型简述:已拥有 NLP、CV、跨模态、行业等多个 AI 大模型场景.12模型 toC 应用:文心一言有望优化 C 端用户搜索、创作体验.13模型 toB 应用:开放 API 接口赋能企业,精调行业模型.14阿里巴巴通义大模型阿里巴巴通义大模型

2、.1616模型简述:由通义-M6 模型融合语言模型和视觉模型组成.16模型应用:率先应用在硬件终端天猫精灵和软件通义千问.17腾讯混元大模型腾讯混元大模型.1818模型简述:热启动降低训练成本,文字视频等多领域表现优异.18模型应用:已在广告游戏多场景落地,大幅提升效率并降低成本.20华为盘古大模型华为盘古大模型.2222模型简述:基于 ModelArts 研发设计的系列模型,NLP、CV 等方向性能优越.22模型应用:在物流、药物研发、气象等多个场景实现落地,极大提高行业效率.23字节跳动大模型字节跳动大模型.2424模型简述:AI 探索基础扎实,语言大模型和图像大模型初步布局.24模型应用

3、:可用于图文、视频内容生成等,飞书将推出智能 AI 助手“My AI”.25投资建议投资建议.2727风险提示风险提示.2727免责声明免责声明.2828FZ8VhUjZfZmVuVuVvU7NbPaQnPoOpNpMeRmMqMeRrQvM7NoPxPxNoNpNwMpMrQ3图表图表目录目录图1:消费级应用达到一亿用户花费时长(月).5图2:ChatGPT 对话演示.5图3:ChatGPT 能力实现解析.6图4:训练大模型“预训练+精调”模式.6图5:OpenAI 宣布推出插件功能.7图6:Segment Anything Model(SAM)演示.8图7:大语言模型产品应用价值链与已渗透

4、部分应用.8图8:生成式 AI 发展历程与 ChatGPT 的突出能力.9图9:主要数据集大小汇总(部分,GB).10图10:百度文心全景图.12图11:百度 NLP 大模型.13图12:中国大模型市场 2022 年评估结果百度.13图13:文心一言对话演示.14图14:百度文心大模型 API.14图15:百度文心行业大模型原理.15图16:文心行业大模型案例.16图17:阿里巴巴通义大模型系列架构.16图18:阿里巴巴通义-M6 发展历史.17图19:阿里巴巴深度语言模型 AliceMind.17图20:阿里巴巴通义-视觉大模型.17图21:鸟鸟分鸟基于通义大模型系列.18图22:鸟鸟分鸟

5、15 天训练流程.18图23:阿里巴巴通义千问.18图24:阿里巴巴通义千问百宝袋.18图25:HunYuan-tvr 在 5 个公开数据集上排名第一.19图26:HunYuan-NLP 1T 模型在 CLUE 总榜、分类榜和阅读理解榜登顶.19图27:HunYuan 大模型及解决方案.19图28:腾讯广告多媒体 AI 技术研究与应用情况.20图29:腾讯智能创作助手功能一览.20图30:腾讯游戏 AI 路网生成模型.21图31:腾讯混元助手项目组织架构.214表1:大模型比较.11表2:国内大模型概述.11表3:盘古系列模型应用场景和领域.23表4:相关公司盈利预测及估值.27大模型概述大模

6、型概述:大模型提升机器理解能力大模型提升机器理解能力,优化优化人机交互人机交互AIAI 大模型是实现通用人工智能(大模型是实现通用人工智能(AGIAGI)的重要方向)的重要方向AIAI 大模型是实现通用人工智能(大模型是实现通用人工智能(AGIAGI)的重要方向。)的重要方向。AI 大模型是基于海量多源数据打造的模型。AI大模型具备通用、可规模化复制等诸多优势,是实现 AGI(通用人工智能)的重要方向。AI 大模型当前包含自然语言处理(NLP)、计算机视觉(CV)等,统一整合的多模态大模型等。ChatGPTChatGPT 推出两个月推出两个月 MAUMAU 突破突破1 1 亿,是自然语言处理领

7、域突破性的创新,进一步理解亿,是自然语言处理领域突破性的创新,进一步理解了人类语言。了人类语言。大语言模型(Large Language Model,LLM)是一种使用了大量数据训练的深度学习算法,构建出一个能够理解人类语言并自动生成语言的模型。ChatGPT 在2022 年11 月底推出后,2023 年1 月的月活跃用户数已达1 亿,成为历史上用户增长最快的应用。ChatGPT 的自然语言处理能力超越了以往的自然语言处理模型,可以应对各种自然语言处理任务,包括机器翻译、问答、文本生成等。图1:消费级应用达到一亿用户花费时长(月)图2:ChatGPT 对话演示资料来源:Yahoo Financ

8、e,国信证券经济研究所整理资料来源:ChatGPT,国信证券经济研究所整理ChatGPTChatGPT 由由OpenAIOpenAI 研发研发,GPTGPT 模型已更新至模型已更新至GPT-4GPT-4,大力出奇迹后出现涌现能力大力出奇迹后出现涌现能力。GPT全称是 Generative Pre-trained Transformer,是OpenAI 开发的一系列延伸自转换器架构(Transformer)的自然语言生成模型。2018 年,OpenAI 推出GPT-1。2022 年11 月,OpenAI 推出了对话交互式的ChatGPT。ChatGPT 在GPT-3.5 之上用基于人类反馈的监督

9、学习和强化学习(RLHF)进行微调。人类反馈的引入,使机器更理解人类语言,让 GPT 获得更逼真的结果。ChatGPT 在逻辑推理、上下文理解等方面的能力,是模型规模达到量级后“涌现”出的。图3:ChatGPT 能力实现解析资料来源:Natural Language Processing with Deep Learning,Jesse Mu,艾瑞咨询,国信证券经济研究所整理大模型大模型应用应用:“预训练预训练+精调精调”即可对下游应用赋能即可对下游应用赋能,优化人类与优化人类与机器交互方式机器交互方式大模型借助大模型借助“预训练预训练+精调精调”等模式等模式,用相比较大模型更少量的数据即可对

10、下游应用赋用相比较大模型更少量的数据即可对下游应用赋能能。预训练大模型基于海量数据的完成了“通识”教育。在具体应用场景下,借助“预训练+精调”等模式,应用模型用相比较大模型更少量的数据即可进行相应微调,高水平完成细分应用的任务。大模型增强机器理解力,优化人类与机器交互方式,提升信息处理效率。大模型增强机器理解力,优化人类与机器交互方式,提升信息处理效率。1 1)自然语言类大模型自然语言类大模型:人类可以用自然语言方式人类可以用自然语言方式,与机器形成交互与机器形成交互。ChatGPT 为自然语言方面的大模型应用,语言文本处理是人类世界最重要的工作内容之一,如果AI 能图4:训练大模型“预训练+

11、精调”模式资料来源:IDC,百度,国信证券经济研究所整理够懂的人类自然语言,并与人类形成交互,将协助人类大幅提升语言文本处理效率,带来生产力效率提升。例如,ChatGPT 可以依托人类自然问答的方式,帮助人类完成回答问题、虚拟助手(计划旅行、预定餐厅、购买产品等)、创作、文本、编程、摘要等工作。我们也可以通过语言类大模型调用机器工具,大模型相当于人类助手。我们也可以通过语言类大模型调用机器工具,大模型相当于人类助手。根据微软论文Sparks of Artificial General Intelligence:Early experiments with GPT-4,GPT-4 能够根据人类指

12、令推断出需要哪些工具,有效地解析这些工具的输出并适当地做出回应,而无需任何专门的训练或微调。2023 年3 月23 日,OpenAI 宣布推出插件功能,帮助ChatGPT访问最新信息、进行计算或使用第三方服务。据OpenAI官网,第一批支持ChatGPT第三方插件的网站共11 个,包含电商、预定航班、订购食材、检索实时信息、检索知识库信息等领域。2)视觉类大模型:视觉类大模型:与语言模型类似,视觉类模型需要完成对图片的理解。2023 年 4月6 日,MetaAI 在官网发布了基础模型Segment Anything Model(SAM)并开源,其本质是基于Transform 模型架构,可以对图

13、像中的一切对象进行分割。交互方面,SAM可使用点击、框选、文字等各种输入提示,指定要在图像中分割的内容。精准分割为大模型图像理解的基础。图像理解可以在智能驾驶、图像识别、安防(人脸识别)等方面进行利用。图5:OpenAI 宣布推出插件功能资料来源:OpenAI 官网,国信证券经济研究所整理3)多模态融合多模态融合:多模态为语言、图片、音频等多个模态的感知和认知融合。多模态大模型能够让机器结合环境因素来模拟人与人之间的交互方式,让图像、文本、语音等模态之间的统一表示和相互生成。多模态融合也是各大模型着重努力的方向。当前,已有的大模型可在文本、图像等方面赋能,已有的渗透应用包括搜索引擎(Bing等

14、)、办公工具(Microsoft 365)、企业服务应用、垂直领域应用(金融、电商等)等等。根据2023 阿里云峰会,阿里巴巴集团董事会主席兼CEO 张勇表示“所有行业、所有应用、所有软件、所有服务都值得基于新型人工智能技术、基于AIGC 各方面技术支撑、大模型支撑重做一遍”。图7:大语言模型产品应用价值链与已渗透部分应用资料来源:艾瑞咨询,国信证券经济研究所整理图6:Segment Anything Model(SAM)演示资料来源:Meta,国信证券经济研究所整理大模型大模型三三要素:算力、算法、数据要素:算力、算法、数据大模型是大模型是“大数据大数据+大算力大算力+强算法强算法”结合的产

15、物结合的产物。1 1)算力是算力是AIAI 发展的基础设施发展的基础设施,芯片至关重要。,芯片至关重要。算力的大小代表着对数据处理能力的强弱。芯片性能越好,大模型的处理能力越快。比如,黄仁勋在2023 年2 月财报会中表示“过去十年,通过提出新处理器、新系统、新互连、新框架和算法,并与数据科学家、AI 研究人员合作开发新模型,已使大语言模型的处理速度提高了100 万倍。”2 2)算法是)算法是AIAI 解决问题的机制,源于算法理论发展、迭代优化。解决问题的机制,源于算法理论发展、迭代优化。不同算法可以看做解决问题的不同路径,算法的优劣可以用空间复杂度与时间复杂度来衡量。例如,GPT是在 Tra

16、nsformer 模型基础上发展的,Transformer 由 GOOGLE 在 2017 年提出。Transformer 相比于传统的循环神经网络(RNN)或卷积神经网络(CNN),在处理长文本时具有更好的并行性和更短的训练时间。图8:生成式 AI 发展历程与 ChatGPT 的突出能力资料来源:艾瑞咨询,国信证券经济研究所整理3 3)数据是算法训练的养料数据是算法训练的养料,前期需要给模型喂养大量数据前期需要给模型喂养大量数据,形成模型理解能力形成模型理解能力,中后中后期数据质量决定了模型精度。期数据质量决定了模型精度。机器学习中要用标注好的数据进行训练,数据标注对未经处理的初级数据进行加

17、工处理,转换为机器可识别信息,只有经过大量的训练,覆盖尽可能多的各种场景才能得到一个良好的模型。当前,数据的丰富度和量对大模型的训练至关重要,只有大量数据的训练,大模型才有理解能力涌现的可能。当前训练数据集来源多为公开数据,比如根据AlanD.Thompson 文章,列举的大模型的数据集包括维基百科、书籍、期刊、Reddit链接、Common Crawl和其他数据集等。中后期,高质量数据将提升模型的精度。比如更加事实性的数据将提升模型准确性,更加通顺的中文语言将提升模型理解中文语言能力。另外,高质量反馈数据也可提高模型性能,比如ChatGPT 采用人类强化学习RLHF,通过更专业的问题、指令、

18、人类反馈排序等加强模型理解人类语言逻辑。最后,也可以通过更精准的垂类数据,完成部分更细分领域模型搭建。我们从以上三个维度,分析当前发布的部分大模型:1)算力:算力布局主要来源于芯片的采购布局,算力基础设施的投入阻挡了部分小公司的入局。当前数据训练需要较高性能的芯片完成对整体模型神经网络的训练构建,供应厂商包括英伟达等。应用层面只需调用整体大模型里的部分神经网络,故对芯片要求没有训练模型时那么高。2)算法:OpenAI仍有先发优势,GPT-3 之后并未开源。每家公司都有自己实现大模型的路径算法,由于GPT在成立之初就坚持自己的算法路径(采用单项Transformer 架构等),并在此基础上运用大

19、量数据训练使得模型产生的涌现能力,取得了一定的成功,拥有先发优势。自 GPT-3 开始(2020年),OpenAI 便不再公布大模型相关训练及技术细节。虽然当前OpenAI 的成功提供部分借鉴,但其他公司仍需时间去研发追赶并进行模型迭代。除此以外,部分公司在特定领域拥有算法积累的先发优势,比如搜索类公司对语料的切割和识别有先发优势,视觉类公司在图像领域识别有先发优势。3)数据:当前中文语料规模与质量上不如英文语料。根据W3Techs,中文网站占全球网站数1.3%,英文网站占比 63.6%。除此以外,由于中国移动互联网发展较为成熟,大量的中文数据资源被存于各家企业或机构里,较难共享。图9:主要数

20、据集大小汇总(部分,GB)资料来源:Alan D.ThompsonWhats in my AI paper,国信证券经济研究所整理;注:确定的数据以斜体表示。仅原始训练数据集大小。表1:大模型比较企业模型参数算力数据RLHF进度OpenAIGPT31750 亿上万块 GPU(V100)45TB 预训练22.11.30 日发布 ChatGPTGoogleLaMDA1370 亿1.56TB23.3.22 日发布 BardMetaLLaMA最大 650 亿RSC 超算平台1.4T token23.2.24 日发布微软Megatron-turing 5300 亿Azure 云平台3390 亿文本暂未公

21、布产品百度文 心 大 模 型(ERNIW 3.0)2600 亿飞桨深度学习平台,百度云4TB(文本与知识图谱)23.3.16 日 发 布文 心 一言,23.3.27 日发布文心千帆大模型平台阿里M6超过 10 亿阿里云1.9TB 图像292GB 文本23.4.11 日发布通义千问腾讯混元2000 亿太极机器学习平台,腾讯云五大跨模态检索数据集暂未公布产品华为盘古200B鹏程云脑、ModelArts 40TB21.4 发布盘古大模型资料来源:OpenAI,Google,Meta,微软,文心大模型官网,通义千问官网,阿里巴巴官网,腾讯太极机器学习平台,华为云,国信证券经济研究所整理目前,国内已有百

22、度、阿里巴巴、腾讯、华为等公司对AI 大模型进行开发,各模型系列主要的NLP语言大模型、CV大模型、多模态大模型也已推出并实现部分应用落地。此外,据36氪消息,字节跳动也在语言和图像大模型上有所布局,预期将于今年年中推出字节自研大模型。具体来看:百度在 AI 方面布局多年,具有一定大模型先发优势。当前,申请文心一言 API调用服务测试的企业已突破6.5万。在行业大模型上,已经与国网、浦发、吉利、TCL、人民网、上海辞书出版社等均有案例应用。阿里通义大模型在逻辑运算、编码能力、语音处理方面见长,集团拥有丰富的生态和产品线,在出行场景、办公场景、购物场景和生活场景均有广泛应用。腾讯混元大模型已经在

23、广告投放、游戏制作投入使用,目前集团在研究对话式智能助手,预计投入使用后将对QQ 和微信生态有一定优化。华为与B 端合作紧密,预计未来应用以ToB为主。此外,华为在算法、算力上储备较为丰厚。比如“鹏城云脑II”获全球IO500 排行五连冠,拥有强大的AI 算力和数据吞吐能力。华为云 ModelArts 平台的高效处理海量数据能力,7 天完成了40TB 文本数据处理。盘古大模型最早已经在2021 年4 月正式发布,当前盘古大模型训练文本数据高达 40 TB(GPT-3 为45 TB)。表2:国内大模型概述公司公司大模型大模型底层支持底层支持模型系列模型系列应用应用百度百度文心大模型飞桨深度学习平

24、台,百度云文心 NLP 大模型(ERNIE 3.0)、文心 CV 大模型、文心跨模态大模型、文心生物计算大模型文心一言、开放 NLP 大模型 ERNIE3.0/跨模态大模型 ERNIE-ViLG/对话大模型 PLATO 的 TOB API 接口,赋能下游企业文案、AI 作画、开放域对话等方面阿里巴巴阿里巴巴通义大模型阿里云通义-M6、通义-AliceMind、通义-视觉大模型 天猫精灵、通义千问腾讯腾讯混元大模型腾讯太极机器学习平台,腾讯云混元 NLP 大模型、混元 CV 大模型、混元多模态大模型、混元文生图大模型腾讯广告、文涌(Effidit)、3D 虚拟场景自动生成、对话式智能助手华为华为

25、盘古大模型鹏程云脑、ModelArts盘古 NLP 大模型、盘古 CV 大模型、盘古科学计算大模型“物的银行”、新药研发、气象预测字节跳动字节跳动字节跳动大模型 火山引擎语言和图像大模型抖音特效、剪映 AI 生成、飞书 AI 助手“My AI”资料来源:文心大模型官网,通义千问官网,阿里巴巴官网,腾讯太极机器学习平台,鹅厂技术派,华为云,36 氪,国信证券经济研究所整理百度文心大模型百度文心大模型模型简述模型简述:已拥有已拥有 NLPNLP、CVCV、跨模态跨模态、行业等多个行业等多个 AIAI 大模型场景大模型场景文心大模型拥有多个文心大模型拥有多个 AIAI 应用场景,文心一言是基于文心应

26、用场景,文心一言是基于文心 NLPNLP 大模型的对话式产大模型的对话式产品品。根据官网介绍,文心大模型包含 NLP 大模型、CV 大模型、跨模态大模型、生物计算大模型、行业大模型等,分别可用于语言、图像、跨模态、生物、细分行业等。2023 年 3 月 16 日,百度正式官宣全新的生成式 AI 对话应用文心一言,是文心 NLP 模型应用下的产品。其能够与人对话互动,回答问题,协助创作。图10:百度文心全景图资料来源:文心大模型官网,国信证券经济研究所整理百度百度 NLPNLP 核心是核心是 ERNIEERNIE 模型模型。文心 NLP 大模型面向语言理解、语言生成等 NLP场景。百度文心 NL

27、P 大模型打造了 ERNIE 模型系列,ERNIE 问世于 2019 年,目前发展至 3.0 版本。其中语言理解和生成包含 ERNIE 3.0 Tiny、ERNIE 3.0、鹏城-百度.文心、ERNIE 3.0 Zeus,另外文心 NLP 大模型包含医疗、金融等细分领域ERNIE 模型。ERNIE 3.0 Tiny(轻量级):可用于通用语言理解。ERNIE 3.0(百亿级):可用于智能创作、摘要生成、问答、语义检索、情感分析、信息抽取、文本匹配、文本纠错等各类自然语言理解和生成任务。鹏城-百度 文心(千亿级):模型参数规模达到 2600 亿(GPT-31750 亿),可用于舆情分析、智能创作、

28、文本解析等。图11:百度 NLP 大模型资料来源:文心大模型官网,国信证券经济研究所整理文心大模型在国内市场格局中较为领先文心大模型在国内市场格局中较为领先。根据 IDC 发布2022 中国大模型发展白皮书,百度文心大模型在市场格局中在产品能力、生态能力、应用能力等方面在国内较为领先。文心一言文心一言核心优势是对核心优势是对中文的理解。中文的理解。百度作为中国语境的搜索龙头,拥有有更多的中文语料数据参与训练。比如,文心一言可以针对“洛阳纸贵”这种容易产生歧义的成语,给出较为贴切的解释。可以用成语写出藏头诗,用四川话读出文章。图12:中国大模型市场 2022 年评估结果百度资料来源:IDC,国信

29、证券经济研究所整理模型模型 toCtoC 应用:文心一言有望优化应用:文心一言有望优化 C C 端用户搜索、创作体验端用户搜索、创作体验百度已经推出对话式产品文心一言。百度已经推出对话式产品文心一言。文心一言可通过对话模式,帮助用户文学创作、商业文案创作、数理推算、中文理解、多模态生成等。例如文心一言发布会上案例,文心一言可以生成 2023 世界智能交通大会海报,解答“智能交通最适合哪个城市发展”的问题,并用四川话和视频形式展现答案。我们认为,与 New Bing类似,百度可以将对话式人工智能功能添加至搜索引擎中,优化用户搜索、创作等体验。当前,在百度 APP 内,基于文心 ERNIE 大模型

30、已实现新闻资讯信息的自动分类,新闻标题和摘要的自动生成等功能。模型模型 toBtoB 应用:开放应用:开放 APIAPI 接口赋能企业,精调行业模型接口赋能企业,精调行业模型目前目前,百度开放大模型百度开放大模型 APIAPI 接口接口,在文案在文案、AIAI 作画作画、开放域对话方面赋能开发者开放域对话方面赋能开发者和企业和企业。百度文心大模型开放了 NLP 大模型 ERNIE3.0、ERNIE-ViLG 文生图、对话大模型 PLATO。ERNIE 3.0 提供文案改写、开放问答、摘要、文案创作、小说创作、文本补全等文本理解与创作能力。ERNIE-ViLG 提供基于文本描述的 AI 作画能力

31、。PLATO 提供生成式开放域对话服务,逻辑清晰、知识多元、情感丰富,闲聊能力接近真人水平。当前已经有 650 家企业宣布接入文心一言生态,还有更多的企业在排队。据百度介绍,申请文心一言 API 调用服务测试的企业已突破 6.5 万。图14:百度文心大模型 API资料来源:文心大模型官网,国信证券经济研究所整理图13:文心一言对话演示资料来源:文心一言发布会,国信证券经济研究所整理对于具体行业来说,对于具体行业来说,百度百度也推出文心也推出文心.行业大模型行业大模型,进行行业精调。,进行行业精调。行业大模型是在百度通用大模型的基础上学习行业特色数据与知识,建设行业 AI 基础设施。图15:百度

32、文心行业大模型原理资料来源:文心大模型官网,国信证券经济研究所整理百度文心行业大模型以百度文心行业大模型以“行业知识增强行业知识增强”为核心特色。为核心特色。目前百度文心行业大模型在能源、金融、航天、制造、传媒、城市、社科以及影视等领域,与国网、浦发、吉利、TCL、人民网、上海辞书出版社等均有案例应用。我们以五个行业场景举例:在燃气行业,“深燃-百度文心”在环境巡检、安全监控等领域落地,有效解决了场景繁杂、识别困难等难题;在汽车行业,“吉利-百度文心”应用于售后服务和汽领域知识库构建等场景;在保险行业,“泰康-百度文心”应用于医疗单据识别等任务,平均字段识别错误率相对下降;在电子制造行业,“T

33、CL-百度文心”改变了传统质检算法流程,大幅提升了模型研发与运营效率,实现降本增效;在社科行业,“辞海-百度文心”用于版权保护、词条管理和知识挖掘等方面。图16:文心行业大模型案例资料来源:文心大模型官网,国信证券经济研究所整理阿里巴巴通义大模型阿里巴巴通义大模型模型简述:模型简述:由通义由通义-M6-M6 模型融合语言模型和视觉模型组成模型融合语言模型和视觉模型组成通义大模型最早发布于 2022 年 9 月 2 日,在阿里达摩院主办的世界人工智能大会“大规模预训练模型”主题论坛上。通义大模型实际上是由一系列模型组成,通义大模型实际上是由一系列模型组成,包括统一底座“M6-OFA”,三大通用模

34、型“通义-M6”“通义-AliceMind”“通义-视觉大模型”,以及行业层面的不同垂直领域专业模型。图17:阿里巴巴通义大模型系列架构资料来源:机器之心,国信证券经济研究所整理通义系列前身为通义系列前身为 M6M6,是阿里达摩院研发的通用性多模态大模型是阿里达摩院研发的通用性多模态大模型,特点是训练能耗特点是训练能耗显著降低。显著降低。M6 自 2020 年初正式启动研发,于 2021 年 1 月/3 月/5 月分别发布百亿/千亿/万亿参数多模态预训练模型。2021 年 10 月发布十万亿参数模型,并且支持使用 512 GPU 在 10 天内即训练出具有可用水平的 10 万亿模型,同等参数下

35、相较于 GPT-3 能耗降低 99%。图18:阿里巴巴通义-M6 发展历史资料来源:机器之心,国信证券经济研究所整理M6M6 融合语言模型和视觉模型,形成当前的通义系列大模型。融合语言模型和视觉模型,形成当前的通义系列大模型。2022 年 1 月,阿里M6 发布了统一大模型 M6-OFA,可以实现不同模型之间的模态表示、任务表示、模型结构的统一。以 M6-OFA 为统一底座,阿里巴巴将另外两大模型“AliceMind”“视觉大模型”与 M6 进行融合,形成了当前的通义系列架构。其中,通义通义-AliceMind-AliceMind 为深度语言模型体系,包含了通用语言模型 StructBERT、

36、生成式PALM、结构化 StructuralLM、超大中文 PLUG、多模态 StructVBERT、多语言 VEC等多个不同模型,具有阅读、写作、翻译、问答、搜索、摘要生成、对话等多种能力;通义通义-视觉大模型视觉大模型包括文本到视觉生成、语言和视觉的模态映射两大基础模型,可以提供文生图等能力。图19:阿里巴巴深度语言模型 AliceMind图20:阿里巴巴通义-视觉大模型资料来源:AliceMind,国信证券经济研究所整理资料来源:机器之心,国信证券经济研究所整理模型应用:模型应用:率先应用在硬件终端天猫精灵和软件通义千问率先应用在硬件终端天猫精灵和软件通义千问硬件终端方面硬件终端方面:天

37、猫精灵基于通义大模型推出拟声助手天猫精灵基于通义大模型推出拟声助手“鸟鸟分鸟鸟鸟分鸟”。4 月 4 日,脱口秀演员鸟鸟在微博发布了一条关于天猫精灵的演示视频。根据公司和鸟鸟的介绍,“鸟鸟分鸟”是天猫精灵联合阿里达摩院,基于通义大模型,对鸟鸟录制的一个多小时音频进行学习训练而成。从形态上看,“鸟鸟分鸟”本身是一个对话机器人,具备多轮对话能力,并且还能利用搜索引擎等工具。个性化是“鸟鸟分鸟”最大特点,具备拟人化的音色、语气、表达方式。我们推测,这意味着通用大模型将有可能在表达方式层面实现较低成本的定制化。图21:鸟鸟分鸟基于通义大模型系列图22:鸟鸟分鸟 15 天训练流程资料来源:机器之心,国信证

38、券经济研究所整理资料来源:机器之心,国信证券经济研究所整理对话式通义千问已经开始内测,包含对话式通义千问已经开始内测,包含 9 9 款款“百宝袋百宝袋”小应用。小应用。4 月 7 日,阿里云宣布大模型“通义千问”上线,并定向邀请企业用户进行测试。测试版的通义千问与 ChatGPT 和文心一言在界面上相似,都是采用问答对话的形式。此外,通义千问在对话模式之外,制作了 9 款称为“百宝袋”的小应用,可以分为三类:1)效率类:写提纲、SWOT 分析、商品描述生成;2)生活类:会放飞的菜谱、小学生作文、然后呢;3)娱乐类:彩虹屁专家、写情书、为你写诗。我们认为,未来阿里大模型有望添加至阿里系电商和钉钉

39、等场景中,带动用户体验和效率的提升。图23:阿里巴巴通义千问图24:阿里巴巴通义千问百宝袋资料来源:虎嗅,国信证券经济研究所整理资料来源:虎嗅,国信证券经济研究所整理腾讯混元大模型腾讯混元大模型模型简述:热启动降低训练成本,文字视频等多领域表现优异模型简述:热启动降低训练成本,文字视频等多领域表现优异“混元混元”AIAI 大模型大模型由由 TEGTEG 数据平台部和机器学习平台部联合主导数据平台部和机器学习平台部联合主导,涵盖涵盖计算机视计算机视觉觉、自然语言处理自然语言处理、多模态内容理解多模态内容理解、文案生成文案生成、文生视频等方向文生视频等方向。“混元”AI大模型由腾讯 17 级研究员

40、/杰出科学家(腾讯史上最高专业职级)张正友博士带队,2022 年 4 月公司首次披露研发进展,目前已更新至 2.0 版本。性能上看性能上看,“混元混元”大模型在文字大模型在文字、视频等多个领域表现优异视频等多个领域表现优异。其中 HunYuan-tvr模型在文字和视频在全球最具权威的 MSR-VTT,MSVD,LSMDC,DiDeMo 和ActivityNet 五大跨模态视频检索数据集榜单排名第一,实现该领域的大满贯;HunYuan-NLP 1T 模型在 CLUE(中文语言理解评测集合)总榜、分类榜和阅读理解榜排名第一。图25:HunYuan-tvr 在 5 个公开数据集上排名第一资料来源:鹅

41、厂技术派,国信证券经济研究所整理图26:HunYuan-NLP 1T 模型在 CLUE 总榜、分类榜和阅读理解榜登顶资料来源:腾讯太极机器学习平台,国信证券经济研究所整理技术上看技术上看,“混元混元”大模型基于腾讯太极机器学习平台研发大模型基于腾讯太极机器学习平台研发,通过改进模型与算通过改进模型与算法,大幅降低训练成本。法,大幅降低训练成本。HunYuan 利用千亿小模型帮助万亿大模型完成启动,相较从 0 启动耗时短耗能低,仅用 256 卡,最快一天内即可完成万亿参数大模型HunYuan-NLP 1T 的训练,整体训练成本仅为直接冷启动训练万亿模型的 1/8。图27:HunYuan 大模型及

42、解决方案资料来源:量子位,国信证券经济研究所整理模型应用:已在广告游戏多场景落地,大幅提升效率并降低成本模型应用:已在广告游戏多场景落地,大幅提升效率并降低成本腾讯广告业务腾讯广告业务:腾讯在广告业务中应用腾讯在广告业务中应用 AIAI 模型模型,助力广告主提升广告创作效率助力广告主提升广告创作效率、提升广告推荐系统的内容理解能力提升广告推荐系统的内容理解能力,大幅提升了广告效率大幅提升了广告效率,实现降本增效实现降本增效。在混元 AI 大模型基础上建立“巨阙”广告内容理解、“乾坤”广告智能创作、“神针”广告智能审核、“天印”广告指纹系统等四大技术平台,提升了广告系统的理解能力,让系统更加智能

43、,从而提高用户体验以及广告转化效果与广告制作效率。图28:腾讯广告多媒体 AI 技术研究与应用情况资料来源:腾讯云开发者,国信证券经济研究所整理内容创作:内容创作:腾讯智能创作助手文涌(Effidit)主要用途是帮助创作者开阔思路、提升创作后的文本水平和质量等,目前已经发布 2.0 版本。据官方介绍,文涌融合了知识抽取、文本理解、文本生成、大规模预训练模型、经典语言模型、搜索等技术,部分功能的实现使用“混元”系列 AI 大模型作为底层预训练模型。图29:腾讯智能创作助手功能一览资料来源:Effidit,国信证券经济研究所整理游戏业务游戏业务:腾讯近日提出基于 AI Bot 与 AIGC 两大方

44、向的自研 3D 虚拟场景自动生成解决方案,帮助游戏开发者以更低成本创造风格多样、贴近现实的虚拟城市,大幅提升 3D 虚拟场景的生产效率。以 3D 虚拟城市道路布局设计为例,现有技术生成的路网通常横平竖直、风格单一,要实现不同城市风格必须手动设计和反复修改,耗时至少一周耗时至少一周。腾讯解决方案只需用户输入城市主干道和海岸线,模型 1分钟内即可填充合理、多样的路网细节并支持微调操作,相比现有技术下效率提相比现有技术下效率提升近升近 100100 倍。倍。图30:腾讯游戏 AI 路网生成模型资料来源:腾讯 AI 实验室,国信证券经济研究所整理对话式智能助手对话式智能助手:腾讯集合集团内资源与顶尖人

45、才腾讯集合集团内资源与顶尖人才,正在全力打造类正在全力打造类 ChatGPTChatGPT 对对话式产品。话式产品。36 氪旗下媒体消息,腾讯类 ChatGPT 对话式产品项目组腾讯混元助手项目组(HunyuanAide)于 2023 年 2 月已经成立。该项目组联合腾讯内部多部门构建大参数语言模型,目标是通过性能稳定的强化学习算法训练,完善腾讯智能助手工具,打造腾讯智能助手,并能成为国内的业界标杆,我们预计未来AI 只能助手将广泛应用于腾讯系社交产品和办公产品等。图31:腾讯混元助手项目组织架构资料来源:职场 Bonus,国信证券经济研究所整理华为盘古大模型华为盘古大模型模型简述:基于模型简

46、述:基于 ModelArtsModelArts 研发设计的系列模型,研发设计的系列模型,NLPNLP、CVCV 等方等方向性能优越向性能优越“盘古盘古”大模型由计算机视觉大模型由计算机视觉(CVCV)大模型大模型、科学计算大模型科学计算大模型、自然语言处理自然语言处理(NLPNLP)大模型大模型、多模态大模型组成多模态大模型组成,该模型由华为云人工智能领域首席科学家田奇带领该模型由华为云人工智能领域首席科学家田奇带领的华为云的华为云 EIEI 盘古团队主导设计盘古团队主导设计。“盘古”项目自 2020 年 11 月起立项,2021 年 4月在华为开发者大会上首次正式发布,2023 年 4 月

47、8 日,团队介绍了盘古模型的应用进展,包括模型在物流、药物研发、气象预测等领域的落地。盘古模型盘古模型基于基于华为华为一站式一站式 AIAI 开发平台开发平台 ModelArtsModelArts 进行研发进行研发。ModelArts 是华为开发的 AI 生产线,具备持续构建大模型训练及推理加速能力、分布式训练能力等,并提供数据处理、算法开发、模型训练、模型管理、模型部署等 AI 应用开发全流程技术能力。图32:盘古模型基于 ModelArts 平台进行开发设计资料来源:计算机文艺复兴,华为云,国信证券经济研究所整理模型性能优异,模型性能优异,NLPNLP 大模型是首个千亿参数级中文大模型,大

48、模型是首个千亿参数级中文大模型,20212021 年位列年位列 CLUECLUE 榜榜单三项第一。单三项第一。2021 年 4 月华为云盘古 NLP 大模型发布,这是当时业界首个 2000亿参数的中文预训练模型。在 2021 年,盘古 NLP 模型在中文语言理解评测基准CLUE 榜单中总排行榜及分类、阅读理解单项均排名第一,刷新了三项榜单世界历史纪录。盘古盘古 CVCV 大模型是业界最大的大模型是业界最大的 CVCV 预训练模型。预训练模型。盘古 CV 大模型包含了 30 多亿参数和 10 亿级别的图像,已经在 100 多个场景中得到了验证。在 Image Net 1%、10%数据集上的小样本

49、分类精度上均达到业界最高水平。模型应用:在物流、药物研发、气象等多个场景实现落地,极大模型应用:在物流、药物研发、气象等多个场景实现落地,极大提高行业效率提高行业效率NLP 大模型、CV 大模型等都是华为 L0 级别的基础大模型,往上则是 L1 级别的行业大模型和 L2 级别的细分场景模型。具体而言,盘古 CV 大模型目前覆盖了工业质检、物流仓库监控、时尚辅助设计等行业和领域;盘古 NLP 大模型覆盖了智能文档检索、智能 ERP 和小语种大模型;盘古科学计算大模型则应用于气象预报、海浪预测等方面。表3:盘古系列模型应用场景和领域盘古系列盘古系列行业行业&领域领域场景场景盘古盘古 CVCV 大模

50、型大模型工业质检偏光片质检、铁路 TFDS、电力巡检、煤矿质检物流仓库监控物的银行时尚辅助设计门店半定制设计盘古盘古 NLPNLP 大模型大模型智能文档搜索类案检索智能 ERP企业财务异常检测小语种大模型阿拉伯语大模型盘古科学计算大模型盘古科学计算大模型气象预报,海浪预测盘古气象大模型、盘古药物分子大模型资料来源:华为,国信证券经济研究所整理物流仓库监控:物流仓库监控:在物流场景,华为盘古团队为浦发银行构建了“物的银行”普慧云仓。相比于传统的数字银行,它能够更彻底的做到业务流程的线上化,进一步提升效率。华为数据显示,在人员行为、货物检测方面,“物的银行”可以实现 5%到 10%的性能提升。新药

51、研发:新药研发:传统模式下,新药研发有周期长、投入大、成功率高的难题,盘古药物分子大模型是专门面向药物研发领域推出的模型,可以帮助医药公司进行 AI辅助研发,使得先导药研发周期从数年缩短到 1 个月,极大改善了新药研发过程的效率。图33:盘古药物分子大模型示意图资料来源:计算机文艺复兴,国信证券经济研究所整理气象预测:气象预测:盘古气象大模型的研究团队通过 3D Earth-Specific Transformer 的方式处理复杂的不均匀 3D 气象数据,提高 AI 大模型的预测精度。盘古气象大模型能够提供秒级的全球气象预报,其气象预测结果包括位势、湿度、风速等,其精度首次超过了欧洲气象中心的

52、数字分析的方法,并且预测速度提升了 1 万倍以上。图34:3D Earth-Specific Transformer 示意图资料来源:华为云,国信证券经济研究所整理图35:盘古气象大模型指标表现优异,预测精度超过传统方式资料来源:华为云,国信证券经济研究所整理字节跳动大模型字节跳动大模型模型简述模型简述:AIAI 探索基础扎实探索基础扎实,语言大模型和图像大模型初步布局语言大模型和图像大模型初步布局字节跳动字节跳动 AIGCAIGC 大模型将从语言和图像两种模态发力大模型将从语言和图像两种模态发力。根据 36 氪消息,字节跳动在大模型上已有所布局,分别在语言和图像两种模态上发力,预期是在今年年

53、中推出大模型。字节跳动字节跳动 AIGCAIGC 大模型尚在初期探索阶段大模型尚在初期探索阶段,有一定有一定 AIAI 基础基础。根据 36 氪,在 ChatGPT公开前,字节跳动对大模型的投入存疑。但字节跳动在工程团队和云服务团队方面并无短板。1)算力:字节并不缺 GPU。字节旗下的企业技术服务平台火山引擎,在 2021 年正式进军基础云市场(IaaS 层),为大模型所需的算力奠定了基础。4 月 18 日,火山引擎发布自研 DPU 等系列云产品,并推出新版机器学习平台:支持万卡级大模型训练、微秒级延迟网络,弹性计算可节省 70%算力成本。同时,火山引擎宣布与字节跳动国内业务并池,抖音等业务的

54、空闲计算资源可极速调度给火山引擎客户使用。2)算法:阿里巴巴 M6 大模型的原带头人杨红霞现已加入字节 AI Lab(人工智能实验室),参与语言生成大模型的研发。模型应用:可用于图文、视频内容生成等,飞书将推出智能模型应用:可用于图文、视频内容生成等,飞书将推出智能 A AI I助手助手“MyMy AIAI”抖音抖音、今日头条基于今日头条基于 AIGCAIGC 生成图文内容生成图文内容。在 AIGC 的加持下,用户上传照片后,短时间内系统即可自动生成不同风格的图片。例如,抖音上线该“漫画脸”特效后,吸引了大量用户,据抖音平台数据显示,截至 2022 年 12 月 6 日,该特效已经超 2428

55、 万人使用,并迅速飙升至特效潮流榜 TOP1。图36:抖音漫画脸特效资料来源:抖音,机器之心,国信证券经济研究所整理剪映提供剪映提供 AIAI 生成视频功能生成视频功能。剪映的创作者可以通过几个关键词或一小段文字,生成一段创意小视频。除此以外,剪映可以根据文字描述智能匹配视频素材,将视频包装为更垂直的内容作品,包括财经、历史、人文等类别。图37:剪映 AI 成片资料来源:剪映,国信证券经济研究所整理飞书将推出智能飞书将推出智能 AIAI 助手助手“MyMy AIAI”。4 月 11 日字节跳动飞书宣布将推出智能 AI助手“My AI”,My AI 将包括自动汇总会议纪要、创建报告、优化和续写文

56、字内容,在飞书 app 中,My AI 也可以通过对话形式,帮助用户自动创建日程、搜索公司内部知识库等功能。图38:飞书将推出智能 AI 助手“My AI”资料来源:飞书视频号,国信证券经济研究所整理投资建议投资建议ChatGPT 的涌现能力的实现以及应用成功,使得 AI 产业发展进入新阶段。AI 大模型增强机器理解能力,可以优化人类与机器交互方式,是效率提升的革命。大模型“预训练+精调”即可对下游应用赋能。当前,各家公司开展新一轮 AI 模型竞赛,希望借助大模型能力开展“模型即服务”的范式。算力、算法、数据是大模型能否成功的重要因素,我们重点关注在大模型领域有技术储备的国内公司腾讯我们重点关

57、注在大模型领域有技术储备的国内公司腾讯控股、阿里巴巴、百度等。控股、阿里巴巴、百度等。表4:相关公司盈利预测及估值公司代码公司代码公司名称公司名称投资评级投资评级收盘价收盘价EPSEPSPEPEPB(MRQ)PB(MRQ)20222023E2024E20222023E2024E0700.HK腾讯控股买入365.412.115.718.02620184.39988.HK阿里巴巴-SW买入94.86.46.77.61312111.89888.HK百度集团-SW增持129.67.47.99.31514121.4数据来源:wind、国信证券经济研究所预测及整理风险提示风险提示AI 技术迭代进度不及预期;AI 应用落地进度不及预期;政策风险;供应链风险等。

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(2023年AI大模型ChatGPT研究进展及国内各厂商大模型对比分析报告.pdf)为本站 (2200) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部