上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

人工智能行业海外大模型系列深度报告之一:OpenAI和微软~通用人工智能道路上矢志不渝的逐梦者-230504(52页).pdf

编号:124522 PDF 52页 5.61MB 下载积分:VIP专享
下载报告请您先登录!

人工智能行业海外大模型系列深度报告之一:OpenAI和微软~通用人工智能道路上矢志不渝的逐梦者-230504(52页).pdf

1、海外大模型系列深度报告之一:海外大模型系列深度报告之一:OpenAIOpenAI和微软和微软通用人工智通用人工智能道路上矢志不渝的逐梦者能道路上矢志不渝的逐梦者证券研究报告证券研究报告 行业深度研究行业深度研究发布日期:2023年5月4日本报告由中信建投证券股份有限公司在中华人民共和国(仅为本报告目的,不包括香港、澳门、台湾)提供。在遵守适用的法律法规情况下,本报告亦可能由中信建投(国际)证券有限公司在香港提供。同时请参阅最后一页的重要声明。分析师:于芳博分析师:于芳博SAC编号:S01分析师:金戈分析师:金戈SAC编号:S01SFC编号:BPD35

2、2分析师:分析师:阎贵成阎贵成SAC编号:S02SFC编号:BNS315 核心观点:核心观点:OpenAIOpenAI是目前是目前全球估值最高的全球估值最高的AIAI初创公司初创公司,成立目的是让通用人工智能朝着最有可能造福人类的方向发展成立目的是让通用人工智能朝着最有可能造福人类的方向发展。其研究方向大致聚焦其研究方向大致聚焦在三个领域:强化学习领域在三个领域:强化学习领域、自然语言处理领域自然语言处理领域、多模态模型领域多模态模型领域,OpenAIOpenAI最新发布的最新发布的GPTGPT-4 4模型展现了出色的自然语言处理能力模型展现了出色的自然语言处理能力,并初

3、步融并初步融合多模态能力合多模态能力。当前的当前的GPTGPT系列模型不止于生成式系列模型不止于生成式AIAI,更是点燃了实现通用人工智能的希望更是点燃了实现通用人工智能的希望。同时同时,OpenAIOpenAI也进行了商业化初探也进行了商业化初探,大模型全面大模型全面赋能微软传统业务赋能微软传统业务,与其与其AzureAzure云云、OfficeOffice 365365、DynamicsDynamics 365365均有很好的结合均有很好的结合。除个人办公领域之外除个人办公领域之外,OpenAIOpenAI在代码编程在代码编程、金融金融、医疗医疗、教教育育、零售等其他领域中均打开了零售等其

4、他领域中均打开了AIAI应用新局面应用新局面。OpenAI是目前是目前全球估值最高的全球估值最高的AI初创公司初创公司,成立目的是让通用人工智能成立目的是让通用人工智能朝着最有可能造福人类的方向发展朝着最有可能造福人类的方向发展。OpenAI成立于2015年12月,研究方向大致聚焦在三个领域:强化学习领域、自然语言处理领域、多模态模型领域。其研究方向始终关注问题的通用性解决方案,而不是聚焦在特定问题之上,与其通用人工智能的研究目标契合。OpenAIOpenAI是大语言模型的技术先驱是大语言模型的技术先驱。OpenAI基于Transformer模型开辟自回归建模路径,发布了GPT系列模型。GPT

5、-1开启了自然语言预训练时代,GPT-2证明大模型无需微调也可以完成广泛下游任务,GPT-3证实了无监督预训练路线的正确性,ChatGPT引入强化学习机制增强人机对话表现,GPT-4拥有卓越的文本处理能力,并且初步融合多模态能力。OpenAI长期坚持其技术路线并且投入大量的研究资源,是大语言模型的技术先驱。OpenAIOpenAI商业化初探商业化初探,大模型全面赋能微软传统业务大模型全面赋能微软传统业务。大语言模型所需要的庞大算力是OpenAI成立之时始料未及的,2019年开始OpenAI从非营利性企业转变为具有利润上限的营利实体OpenAI LP。随着GPT模型爆发出强大的应用潜力,Open

6、AI也开始其商业化布局。OpenAI在个人办公应用领域与微软加深合作,大模型全面赋能微软传统业务,与OpenAI的相关合作对其Azure云、Office 365、Dynamics 365均起到了相当程度的促进作用。微软23Q3财报显示,FY23Q3 Azure OpenAI已有2500个服务客户,AzureAzure云下个季度中有云下个季度中有1 1%的收入增长来自于人工智能的收入增长来自于人工智能。在个人办公领域之外在个人办公领域之外,OpenAIOpenAI在其他领域中均打开了在其他领域中均打开了AIAI应用新局面应用新局面。在代码编程领域,GPT显著提升代码编程效率和质量;在金融领域,G

7、PT成为金融领域强力的信息汇总和分析工具;在医疗领域,GPT全方位提升医疗领域的智能化与数字化;在教育领域,GPT提高教育和学习的效率和针对性;在零售领域,GPT提升零售中的业务效率和用户体验。风险提示:风险提示:技术技术发展不及预期发展不及预期、算法隐私问题算法隐私问题、应用不及预期应用不及预期、数据质量不及预期数据质量不及预期、伦理冲突风险等伦理冲突风险等。核心观点 目 录第一章第一章OpenAIOpenAI概述概述4 4第二章第二章OpenAIOpenAI技术发展路径技术发展路径1010第三章第三章大模型全面赋能微软传统业务大模型全面赋能微软传统业务2929第四章第四章OpenAIOpe

8、nAI打开打开AIAI应用新局面应用新局面4343第五章第五章风险提示风险提示4949 第一章第一章OpenAIOpenAI概述概述4 4 1.1 OpenAI:全球估值最高的人工智能创业公司 OpenAIOpenAI成立于成立于20152015年年1212月月,成立的目的是让通用人工智能成立的目的是让通用人工智能(ArtificialArtificial GeneralGeneral IntelligenceIntelligence)朝着最有可能造福人类朝着最有可能造福人类的方向发展的方向发展。公司的主要创始人包括山姆奥尔特曼(Sam Altman)、格雷格布罗克曼(Greg Brockma

9、n)、里德霍夫曼(Reid Hoffman)、杰西卡利文斯顿(Jessica Livingston)、埃隆马斯克(Elon Musk)、Amazon Web Services(AWS)等。截止2022年,OpenAI拥有大约375名员工,主要面向以下三个方面:Capabilities,不断的提高AI的功能和能力;Safety,确保这些AI系统拥有和人类一致的价值观念;Policy,确保这些AI系统能够得到适当的治理。根据路透社报道,OpenAI在2022年收入数千万美元,并预计2023、2024年收入为2亿、10亿美元。截止2023年4月29日,OpenAI历史融资额超200亿美元,当前估值为

10、290亿美元,是全球估值最高的全球估值最高的AIAI初创公司初创公司。资料来源:OpenAI,中信建投图:图:OpenAIOpenAI主要研究领域主要研究领域图:福布斯图:福布斯AIAI 5050部分企业部分企业公司公司专注领域专注领域成立年份成立年份融资金额融资金额(百万美元百万美元)OpenAl人工智能模型开发201511000Databricks数据存储和分析20133500Andurillndustries防御软件20172400Anthropic人工智能模型开发20211300Insitro药物研发2018700Scale Al数据标签提供商2016602Gong销售软件201558

11、4AlphaSense市场情报搜索2011520Shield Al自主防御软件2015520Clari销售软件2012496Eightfold Al招聘软件2016424Adept人工智能模型开发2022415强化强化学习学习自然自然语言语言多模多模态态OpenAIFiveGPT-4DALL E 2CapabilitiesCapabilitiesSafetySafetyPolicyPolicy资料来源:Forbes,中信建投 1.2 公司现任人员资料来源:wikipedia,analyticsindiamag,OpenAI,中信建投图:图:OpenAIOpenAI现任人员介绍现任人员介绍首席执

12、行官首席执行官山姆奥尔特曼是美国企业家、投资者和程序员。他是Loopt和OpenAI的首席执行官,也是联合创始人。曾担任Y Combinator的总裁,后为了更多专注于OpenAI,于2019年转任董事长,并于2020年离开YC。Sam Altman(1985-)总裁总裁格雷格布罗克曼是美国企业家、商人和投资家。他是OpenAI的联合创始人,并在创 立 时 担 任 首 席 技 术 官(CTO)。在2022年5月,卸任首席技术官,担任公司总裁,并专注于训练公司旗舰AI系统。在OpenAI之前曾担任Stripe的首席技术官。Greg Brockman(1985-)首席技术官首席技术官米拉穆拉蒂,出

13、生于阿尔巴 尼 亚。于 2018 年 加 入OpenAI,主要负责OpenAI的研究、产品开发和部署的相关工作。并在2022年5月接任Greg Brockman担任首席技术官。她对于DALL.E的成功起到了重要作用。在加入OpenAI之前,曾就职于LeapMotion和特斯拉。Mira Murati(1988-)首席运营官首席运营官布拉德莱特卡在2018年加入OpenAI,担任OpenAI首席财务官。2022年5月担任首席运营官,与人工智能应用团队合作,完善相关业务和商业战略。此前,曾担任Dropbox的战略财务总监和摩根大通的投资银行分析师。Brad Lightcap首席科学家首席科学家伊利

14、亚苏茨凯弗,人工智能科学家,是OpenAI的联合创始人,同时担任首席科学家。曾就职于谷歌,是卷积神经网络AlexNet的 发 明 者 之 一,是AlphaGo论文的众多合著者之一。在2015年底,离开 谷 歌,共 同 成 立 了OpenAI并担任首席科学家。Ilya Sutskever(1985/86-)1.3 公司愿景:以最有可能造福人类的方式推进人工智能发展 2015年公司成立之初的愿景是让通用人工智能(Artificial General Intelligence)朝着最有可能造福人类的方向发展,与此同时不受财务回报的约束。2023年初,公司对未来发展做了进一步描述,其中提到公司目标是确

15、保通用人工智能(在智能水平上胜过人类的AI系统)造福全人类。随着AI模型逐步迈向通用人工智能阶段,公司对模型的创建和部署更为谨慎。其中OpenAI提出了三条最关心的原则:期望通用人工智能最大化造福人类,最大化赋能、最小化风险,让通用人工智能成为人类能力的增强器。期望广泛和公正地分享通用人工智能的能力、使用权和治理权。期望成功应对通用人工智能可能带来的风险,通过一些功能较弱的版本来不断学习和适应,从而化解潜在的风险。资料来源:OpenAI,中信建投图:“图:“Introducing Introducing OpenAIOpenAI”中对”中对OpenAIOpenAI的愿景描述的愿景描述图:“图:

16、“Planning for AGI and beyondPlanning for AGI and beyond”中对”中对OpenAIOpenAI的目标描述的目标描述“Our goal is to advance digital intelligence in theway that is most likely to benefit humanity as awhole,unconstrained by a need to generatefinancial return.”2015.12.11“Our mission is to ensure that artificial general

17、intelligenceAI systems that are generally smarterthan humansbenefits all of humanity.”2023.1.24资料来源:OpenAI,中信建投 1.4 OpenAI融资历史:通用人工智能发展的有力保障 OpenAI一共经历了7轮融资,包括种子前融资,种子轮融资,二级市场融资和企业融资,总募集资金超过200亿美元。主要投资者包括有:微软、Y Combinator、科斯拉风险投资公司,里德霍夫曼基金会、红衫资本、基岩资本、安德森霍格威兹、马修布朗公司等。2019年开始,OpenAI开始对融资保持相对开放的态度,彼时公司

18、的大语言模型正处于GPT-2迈向GPT-3的发展阶段。训练大语言模型所需要的庞大算力是公司成立之时始料未及的,公司开始接受融资同时寻求与云厂商的广泛合作,与此同时也伴随着公司商业模式的变化。图:图:OpenAIOpenAI融资历史图融资历史图资料来源:Crunchnews,TechCrunch,中信建投 1.5 OpenAI商业模式 20192019年年,为了获取大规模投资和吸引人才从而更好完成企业使命为了获取大规模投资和吸引人才从而更好完成企业使命,OpenAIOpenAI从非营利性企业转变为具有利润上限的营利实体从非营利性企业转变为具有利润上限的营利实体OpenAIOpenAI LPLP。

19、在新的公司结构下,OpenAI就特指现在的OpenAI LP,原先的非营利实体转变为OpenAI Inc。而OpenAI LP则会受到OpenAIInc的董事会进行控制。在此结构下,所有的投资者和员工的经济回报都是有限的,所有超额的回报都会归OpenAI Inc所有。对于第一轮投资者(First Close Partners)的回报上限定为了投资的100倍,后续的投资回报率会不断降低。OpenAIOpenAI的主要盈利模式包括:会员订阅费的主要盈利模式包括:会员订阅费、APIAPI许可费许可费、与微软合作带来的商业收入与微软合作带来的商业收入。图:图:OpenAIOpenAI商业模式变化情况商

20、业模式变化情况图:图:OpenAIOpenAI的主要盈利模式的主要盈利模式资料来源:Fortune,中信建投OpenAI会员订阅费ChatGPT plus付费版本,每月收费20美元API流量费微软合作收入使用API的方式接入OpenAI模型(例如GPT-4、Dall E2等),按生成内容长度和图片数量收费大模型融入githubcopilot、bing等软件,创造商业收入资料来源:OpenAI,中信建投 第二章第二章OpenAIOpenAI技术发展路径技术发展路径1010 2.1 人工智能发展历程 人工智能大致可以分为三个发展阶段:弱人工智能人工智能大致可以分为三个发展阶段:弱人工智能、强人工智

21、能强人工智能、超人工智能超人工智能。弱人工智能(Weak artificial intelligence)或称狭义人工智能(Artificial Narrow Intelligence)是实现部分思维的人工智能,且仅专注于某项特定任务。弱人工智能不需要具有人类完整的认知能力,甚至是完全不具有人类所拥有的感官认知能力,只处理特定的问题。弱人工智能专注于模仿人类如何执行基本动作,例如记忆或感知事物、解决简单问题。比如:AI模型AlphaGo战胜了顶尖的人类选手,但是局限于特定问题,仍然不能被称之为强人工智能。当前人工智能技术发展处于弱人工智能相对成熟当前人工智能技术发展处于弱人工智能相对成熟、强人

22、工智能曙光乍现的阶段强人工智能曙光乍现的阶段。图:人工智能发展的三个阶段图:人工智能发展的三个阶段图:图:AlphaGoAlphaGo战胜顶尖人类棋手战胜顶尖人类棋手资料来源:indikaai,中信建投资料来源:Financial Times,中信建投 2.2 强人工智能 强人工智能也指通用人工智能强人工智能也指通用人工智能(artificialartificial generalgeneral intelligenceintelligence,AGIAGI),具备非常通用的“智能能力”,包括推理能力、规划能力、抽象思考能力、理解复杂概念的能力、快速学习的能力、从经验中学习能力等,并且在这些方

23、面达到或超过人类水平,强人工智能是人工智能研究的主要目标之一。强人工智能的目标是创建一个能够与人类一样自适应强人工智能的目标是创建一个能够与人类一样自适应、灵活地处理各种问题和任务的智能系统灵活地处理各种问题和任务的智能系统。强人工智能使得人工智能具备意识、感性、知识和自觉等人类特征,有潜力为每个人提供几乎任何认知方面的帮助,可以为人类的聪明才智和创造力提供巨大助力。图:强人工智能具备的能力图:强人工智能具备的能力图:强人工智能主要玩家图:强人工智能主要玩家OpenAIOpenAI和和DeepMindDeepMind资料来源:中信建投AGI推理能推理能力力规划能规划能力力从经验从经验中学习中学

24、习抽象思抽象思考考理解复理解复杂概念杂概念快速学快速学习习资料来源:aibots.my,中信建投 2.3 OpenAI技术发展路线 从时间维度上看从时间维度上看,OpenAIOpenAI的研究方向大致聚焦在三个领域:强化学习领域的研究方向大致聚焦在三个领域:强化学习领域、自然语言处理领域自然语言处理领域、多模态模型领域多模态模型领域。在强化学习领域,OpenAI采用通用的强化学习策略来来帮助AI应对灵活多变的困难问题;在自然语言处理领域,OpenAI开辟自回归建模路径,大语言模型无需在特定领域微调也有出色的任务表现;在多模态模型领域,OpenAI围绕Transformer主架构不断增强多模态能

25、力。OpenAIOpenAI的研究方向始终关注问题的通用性解决方案的研究方向始终关注问题的通用性解决方案,而不是聚焦在特定问题之上而不是聚焦在特定问题之上,与其通用人与其通用人工智能的研究目标契合工智能的研究目标契合。图:图:OpenAIOpenAI技术发展路径技术发展路径资料来源:OpenAI,中信建投201520232015.122015.12OpenAIOpenAI成立成立2016.62016.6OpenAIOpenAI GymGym强化学习工具包强化学习工具包2017.82017.8OpenAIOpenAI FiveFiveDota2Dota2战胜职业选手战胜职业选手2018.6201

26、8.6GPTGPT-1 1开启预训练时代开启预训练时代2019.22019.2GPTGPT-2 2零微调完成下游任务零微调完成下游任务2020.72020.7GPTGPT-3 3证实技术路线正确性证实技术路线正确性2021.22021.2CLIPCLIP图文配对模型图文配对模型2021.22021.2DALLEDALLE文字到图像生成文字到图像生成2022.112022.11ChatGPTChatGPT为大语言模型引入强化学习为大语言模型引入强化学习2023.32023.3GPTGPT-4 4初步融合多模态初步融合多模态2017.82017.8DactylDactyl机械手训练系统机械手训练系

27、统2022.42022.4DALLEDALLE 2 2图像质量升级图像质量升级强化学习阶段强化学习阶段自然语言阶段自然语言阶段多模态阶段多模态阶段 2.4 OpenAI Gym:强化学习算法开发和评估工具包 2015年之前,深度学习的发展已经如火如荼,OpenAI成立之后,首先关注的是深度学习与强化学习的结合领域。强化学习适合决策和运动控制相关领域,涉及一系列决策相关问题,例如机器人的电机控制、玩电子游戏和棋盘游戏等,强化学习帮助AI代理在复杂、不确定环境中取得良好表现。OpenAIOpenAI GymGym是是OpenAIOpenAI最早期的开源研究成果最早期的开源研究成果,是一个用于开发和

28、评估强化学习算法的工具包是一个用于开发和评估强化学习算法的工具包。假定环境中存在一个AI代理(例如机器人),AI代理的每一次行动都会从环境中获得相应的反馈和奖励,强化学习算法寻求最大化奖励途径,促进AI代理与环境交互达到最优状态。OpenAI Gym中有一系列环境,包括经典控制、雅达利游戏、棋盘游戏、机器人控制,同时OpenAI Gym中可以对强化学习算法进行评估。图:图:OpenAIOpenAI GymGym的一系列环境的一系列环境图:图:OpenAIOpenAI GymGym实现实现AIAI代理与环境的有效互动代理与环境的有效互动资料来源:OpenAIGym,中信建投资料来源:OpenAI

29、Gym,中信建投 2.5 OpenAI Five在多人竞技游戏中击败人类顶尖选手 OpenAI研究早期涉及各类游戏对战,其中包括著名的Dota 2对战机器人,在2017年8月在1v1比赛中击败了世界的顶尖选手。OpenAI Five的目标是寻找最大化与人类玩家对战获胜的策略,模型训练过程中通过强化学习来实现这一目标,设置了最大化的奖励函数,奖励函数中包括:角色死亡、资源收集等与胜率相关的信号。游戏过程中,OpenAI Five通过程序接口和游戏进行交互,直接从游戏中获取诸如生命值、位置等具体的状态值,在获取观测到的状态后,通过LSTM长短期记忆网络进行处理,之后AI反馈一个离散化的动作指令,如

30、移动、攻击、使用技能等。从2018年6月开始,OpenAI Five就从OpenAI内部逐步进行了与人类对战的测试,直至2019年4月,OpenAI Five以2-0击败了职业战队OG,并在接下来的4天时间中,在线上与3193支不同的人类队伍进行了7257场比赛,达到了99.4%的胜率。Dota 2复杂程度接近现实世界中的问题,OpenAIOpenAI FiveFive的成功证明强化学习在困难的任务当中也能够取得超越人类的表现的成功证明强化学习在困难的任务当中也能够取得超越人类的表现。图:图:简化版本的简化版本的OpenAIOpenAI FiveFive模型架构模型架构图:模型视角下的图:模型

31、视角下的Dota2Dota2游戏游戏资料来源:Dota 2 with Large Scale Deep Reinforcement Learning,中信建投资料来源:OpenAI,中信建投 2.6 Dactyl系统通过强化学习实现机械手的灵活操控 在研究早期,OpenAI也尝试通过强化学习策略去解决机械手的操作问题。2018年7月,OpenAI发布了机械手训练系统Dactyl,Dactyl采用了与OpenAI Five相同的强化学习算法和代码从头开始学习,Dactyl通过机械手完成了对物体的精准抓握和灵活控制,甚至完成了绕轴旋转、盘核桃之类的复杂机械手操作。Dactyl首先在OpenAI G

32、ym中的MuJoCo物理引擎构建了机器人的模拟版本,在虚拟环境中对AI机器人进行训练,然后再把策略应用在实体机器人身上。训练过程中还会增加大量的动态随机事件,让AI在这个过程中自己领悟出完成任务的诀窍,整个训练过程中无需任何微调。在虚拟环境中,通过强化学习训练得到的操作技能使得机械手到达前所未有的灵活度。图:图:DactylDactyl系统系统实现机械手的精准操控过程实现机械手的精准操控过程资料来源:OpenAI,Learning Dexterous In-Hand Manipulation,中信建投通过通过3 3个个CNNCNN模型实现三路模型实现三路摄像头的信息处理摄像头的信息处理摄像头信

33、息融合得到摄像头信息融合得到物体的具体姿态信息物体的具体姿态信息在虚拟环境中通过强化在虚拟环境中通过强化学习训练机械手操作学习训练机械手操作神经网络给出针对目神经网络给出针对目标的具体操作指令标的具体操作指令通过通过长短期记忆网络理长短期记忆网络理解环境中的物理过程解环境中的物理过程 2.7 OpenAI基于Transformer模型开辟自回归建模路径 2017年,Google在Attention is All You Need论文提出Transformer模型,将注意力机制引入到自然语言模型之中,在自然语言的翻译任务中取得极高的准确度,随后通过不断挖掘Transformer模型能力,Tran

34、sformer模型在自然语言的理解和生成也取得了巨大的成功,当前已经成为自然语言处理领域的基础模型。OpenAIOpenAI开辟自回归建模路径开辟自回归建模路径。基于Transformer模型衍生出三条路径,分别为BERT、T5、GPT路径。BERT采用掩码建模策略,利用双向文本信息学习语言信息,在文本理解、情感分析方面具备一定优势;GPT采用自回归的建模策略,通过对上文文本学习预测下文,在零样本或者少样本的生成方面表现优异。图:图:TransformerTransformer模型结构模型结构图:自然语言模型发展路径图:自然语言模型发展路径资料来源:Attention is All You N

35、eed,中信建投多头自注意力机制多头掩码自注意力机制前馈神经网络前馈神经网络EncoderDecoder资料来源:真格基金,中信建投 2.8 GPT-1开启了自然语言预训练时代 在GPT-1之前,传统的NLP模型往往使用大量的数据对有监督的模型进行任务相关的模型训练,但是这种有监督学习的任务需要大量的人工数据标注,而且只能做到特定领域的自然语言理解,极大的限制了自然语言模型的技术发展。OpenAIOpenAI率先将预训练的方法引入到自然语言处理领域率先将预训练的方法引入到自然语言处理领域。OpenAI采用Transformer的Decoder部分作为GPT主体架构,通过在无标签的数据集上训练得

36、到一个通用的语言模型,随后在下游任务中做进一步微调训练,自然语言模型开始从专业领域走向通用领域。GPT-1的诞生(2018.6)开启了自然语言预训练时代,随后诞生的BERT模型(2018.10)也沿袭了类似的思路,但是采用Transformer的Encoder部分作为主体架构。图:图:GPTGPT-1 1预训练之后在下游任务中的微调预训练之后在下游任务中的微调图:图:GPTGPT模型与模型与BERTBERT模型比较模型比较资料来源:Improving Language Understanding by Generative Pre-Training,中信建投分类任务蕴含任务相似任务多选任务GP

37、TGPT主体主体不同下游任务不同下游任务双向表示双向表示单向表示单向表示资料来源:BERT:Pre-training of Deep Bidirectional Transformers for Language Understanding,中信建投 2.9 GPT-2证明大模型无需微调也可以完成广泛下游任务 2019年2月GPT-2模型被提出,GPT-2的目标旨在训练一个泛化能力更强的词向量模型,GPT-2在GPT-1的模型架构基础上并没有做过多的创新与设计,但是省去了后续的fine-tune过程,同时使用了更多的网络参数和更大的数据集。GPTGPT-2 2使用无监督的预训练模型完成下游任务

38、使用无监督的预训练模型完成下游任务。GPT-1在构建下游特定任务输入时引入了起始、截断和终止符,在微调过程中教会了机器去识别这些特定符号。GPT-2训练过程采用多任务学习模式,选用提示取代特定符号去做下游任务,例如使用“translate to English”实现翻译任务,“answer the question”去实现阅读理解任务。GPT-2验证了通过海量数据和大量参数训练出来的词向量模型有迁移到其它类别任务中的潜力,证明了预训练大模型在无需微调的情况下也可以完成广证明了预训练大模型在无需微调的情况下也可以完成广泛的下游任务泛的下游任务。图:图:GPTGPT-1 1和和GPTGPT-2 2

39、模型基础架构保持一致模型基础架构保持一致图:图:GPTGPT-2 2实现了模型规模上的扩充实现了模型规模上的扩充资料来源:Improving Language Understanding by Generative Pre-Training,CSDN,中信建投Model Name参数量参数量层数层数词向量长度词向量长度注意力头数注意力头数GPT-1117M1276812GPT-2 Small117M1276812GPT-2 Medium345M24102416GPT-2 Large762M36128016GPT-2 Extra Large1542M48160024BERT-Base110M12

40、76812BERT-Large340M24102416GPTGPT-1 1GPTGPT-2 2 SmallSmall资料来源:CSDN,中信建投 2.10 GPT-3证实了无监督预训练路线的正确性 GPT-2证明了语言模型无监督预训练的有效性,确立了大模型参数巨量化的技术路径。在此基础上,参数规模更加庞大的参数规模更加庞大的GPTGPT-3 3在在20202020年年5 5月被提出月被提出,证实了无监督预训练路线的正确性证实了无监督预训练路线的正确性。GPT-3相比GPT-2最显著的改变体现在三个方面:参数量显著提升:从GPT-2的15亿参数提升至GPT-3的1750亿,Transformer

41、层数从48层提升至96层。训练数据集不断扩充:从GPT-2的40GB上升至GPT-3的45TB,滑动窗口提升至2048,关联语义挖掘能力进一步提升。使用少样本学习策略替代GPT-2的零样本学习策略,在少量任务样本训练(Few-shot)设定下,在部分测试中,GPT-3的表现超越了特定领域微调后的自然语言模型,例如在阅读理解测试TriviaQA中,GPT-3表现超越了微调后的最好模型(SOTA)。图:巨量参数和少样本学习显著提升模型表现图:巨量参数和少样本学习显著提升模型表现图:图:GPTGPT-3 3在阅读理解测试中表现超越在阅读理解测试中表现超越SOTASOTA资料来源:Language M

42、odels are Few-Shot Learners,中信建投训练样本量模型参数量资料来源:Language Models are Few-Shot Learners,中信建投 2.11 ChatGPT引入强化学习机制增强人机对话表现 在在GPTGPT-3.53.5版本的基础上,通过版本的基础上,通过3 3个步骤实现基于人类反馈的强化学习微调(个步骤实现基于人类反馈的强化学习微调(RLHFRLHF),得到人机对话模型),得到人机对话模型ChatGPTChatGPT。步骤步骤1 1:监督微调(SFT)使用精选的人类回答来微调预训练的语言模型以应对各种查询;步骤步骤2 2:奖励模型微调 使用一个

43、包含人类对同一查询的多个答案打分的数据集来训练一个独立的奖励模型(RW);步骤步骤3 3:RLHF 训练 利用近端优化策略算法(PPO),根据奖励模型的奖励反馈进一步微调 SFT 模型。RLHF触发了大语言模型的多项能力,其中包括:应尽翔实的回应、公正的答复、拒绝不当问题等,通过与人类答案的对齐过程,显著提升了大模型的人机对话体验。图:基于人类反馈的强化学习微调图:基于人类反馈的强化学习微调图:图:RLHFRLHF提升了自然语言模型的多方面表现提升了自然语言模型的多方面表现资料来源:OpenAI,中信建投遵循指令遵循约束幻觉问答合适用语资料来源:Training language models

44、 to follow instructions with human feedback,中信建投 2.12 GPT-4:卓越的文本处理能力,初步融合多模态能力 2023年3月15日,OpenAI发布多模态预训练大模型GPT-4,相较于过去的GPT系列模型,提升包括几个方面:具备多模态信息处理能力,能够接受图像和文本两种模态的输入,再通过文字给出正确的文本答复。文本处理能力更为出色,在为机器学习模型评判标准和为人类设计的专业测试中均取得良好表现。安全性和真实性显著提升,模型训练结束之后进行了大量的规范性调试,减少了幻觉事实的输出概率。GPT-4构建了用于模型性能预测的深度学习堆栈,能够在模型训练

45、早期,在仅有1/10001/10000训练计算量情况下外推实现GPT-4模型某些方面性能的准确预测,降低了模型训练过程中的试错成本,缩短了整体训练周期。图:图:GPTGPT-4 4模型在各类人类考试中的表现模型在各类人类考试中的表现图:深度学习堆栈实现模型性能的准确预测图:深度学习堆栈实现模型性能的准确预测资料来源:AGIEval:A Human-Centric Benchmark for Evaluating Foundation Models,中信建投SATLSATGMAT&GRE中国高考中国律师资格考试公务员考试美国高中数学竞赛资料来源:GPT-4 technical report,中信

46、建投 2.13 Codex赋予大模型代码生成能力、增强逻辑思维能力 20212021年年6 6月月,OpenAIOpenAI发布具备代码生成能力的发布具备代码生成能力的CodexCodex模型模型。Codex模型系列是GPT-3系列的后代,它经过了自然语言和来自Github数十亿行代码的训练,该模型系列精通十几种语言,包括 C#、Python、JavaScript、Go、Perl、PHP、Ruby、Swift等语言,其具备代码语言的编写、补全、添加注释、测试等能力。基于代码的预训练显著提升了大模型的推理能力基于代码的预训练显著提升了大模型的推理能力。关于大模型是否具有推理能力得到了大量的研究,

47、一个结论是百亿参数级别以上的大模型可能具备简单的逻辑推理能力,通过思维链的提示可以激发大模型之中的推理能力。Codex(code-davinci-002)与GPT-3的模型主体保持一致,仅仅将训练文本从文本数据集切换到文本和代码数据集上,在大多数的推理测试中,模型的推理测试成绩都得到了显著的提升。图:图:GPTGPT-3 3系列模型演进过程系列模型演进过程图:图:GPTGPT-3 3和和CodexCodex模型在推理测试中的表现模型在推理测试中的表现资料来源:知乎,中信建投自然语言模型推自然语言模型推理能力显著提升理能力显著提升MethodGSM8KAsDivMulti ArithSVAMPS

48、ingleEqCommonsenseQAStrategyQACLUTRRGPT-3 davinci(175B):Greedy Decode8.731.431.421.238.248.259.333.6Self-Consistency18.952.868.644.659.657.465.942.5Diverse30.9(+12.0)57.6(+4.8)87.6(+19.0)46.9(+2.3)65.1(+5.5)75.0(+17.6)67.9(+2.0)92.5(+50.0)text-davinci-002:Greedy Decode37.160.870.760.073.365.560.318.

49、4Self-Consistency58.276.988.478.287.272.970.715.8Diverse70.2(+12.0)83.5(+6.6)96.4(+8.0)82.7(+4.5)86.5(-0.7)79.2(+6.3)73.1(+2.4)68.5(+52.7)code-davinci-002:Greedy Decode55.375.588.870.587.573.473.832.9Self-Consistency76.786.298.685.893.777.378.335.6Diverse82.3(+5.6)88.7(+1.5)99.8(+1.2)87.0(+1.2)94.9(

50、+1.2)79.9(+2.6)77.7(-0.6)95.9(+60.1)在在训练文本中引入代码得训练文本中引入代码得到了推理能力的大幅提升到了推理能力的大幅提升资料来源:On the Advance of Making Language Models Better Reasoners,中信建投 2.14 绽放源于技术路线的长期坚持 在GPT-1模型发布后4个月,Google发布了自己的语言模型BERT,其采用编码器作为模型主体且采用双向编码结构。从性能上看,与GPT-1模型参数规模相当的BERTBASE性能超越GPT-1,参数量更大的BERTLARGE更是形成了压倒性优势,双向结构的BERT模

51、型很快得到了学术界的广泛欢迎。GPTGPT可能是一条难度更高可能是一条难度更高、同时天花板更高的技术路径同时天花板更高的技术路径。直到1750亿参数量的GPT-3模型诞生,在各类下游任务中无需微调便可取得良好成绩,越来越多的企业和研究机构才开始转向GPT技术路线,BERT路线的影响力开始逐渐转弱。OpenAI在自然语言模型方面的领先得益于公司对于其技术路径的长期坚持,即使早期并未得到学术界的广泛仍可。图:大语言模型发展树状图图:大语言模型发展树状图图:图:BERTBERT模型的性能超越模型的性能超越GPTGPT-1 1资料来源:Harnessing the Power of LLMs in P

52、ractice:A Survey on ChatGPT and Beyond,中信建投图:图:BERTBERT与与GPTGPT论文的引用数论文的引用数523757329288639950000040000500006000070000BERTGPTGPT-1GPT-2GPT-3BERTGPTGPT-3 3之后,之后,解解码器路线开始码器路线开始得到逐步重视得到逐步重视资料来源:BERT:Pre-training of Deep Bidirectional Transformers for Language Understanding,中信建投资料来源:Webof Scie

53、nce,中信建投 2.15 多模态领域的基石性模型CLIP 20202020年后年后,OpenAIOpenAI开始逐步涉足多模态研究领域开始逐步涉足多模态研究领域,20212021年年3 3月发布了图文配对模型月发布了图文配对模型CLIPCLIP。CLIP利用文本信息监督视觉任务自训练,训练数据集为网络搜集得到的4亿个“文本-图像”对,采用Vision Transformer模型和ResNet实现图像的特征提取,将不同模态的原始数据映射到统一或相似的语义空间,实现不同模态信号间的相互理解,模型在这种对应关系中学习到文本和图像这两种不同模态信息背后的内涵,为多模态的生成模型奠定了基础。CLIPC

54、LIP在零样本学习任务上表现较好在零样本学习任务上表现较好。与机器视觉中常用的先预训练然后微调不同,CLIP可以直接使用提示进行零样本学习图像分类,在某个具体下游任务上实现分类。CLIP在具体的细粒度对象分类、地理定位、视频中的动作识别和OCR等27个数据集的任务中表现十分优异。图:图:CLIPCLIP模型实现图文信息配对模型实现图文信息配对图:图:CLIPCLIP在诸多零样本学习任务上表现较好在诸多零样本学习任务上表现较好资料来源:OpenAI,中信建投资料来源:Learning Transferable Visual Models From Natural Language Supervi

55、sion,中信建投 2.16 DALLE模型实现文本到图像的跨模态生成 与与CLIPCLIP模型同期模型同期,OpenAIOpenAI开始关注多模态的生成任务开始关注多模态的生成任务,公布了图像生成模型公布了图像生成模型DALLEDALLE。DALLEDALLE模型包括三个主体部分:模型包括三个主体部分:dVAEdVAE、TransformerTransformer和和CLIPCLIP。首先通过dVAE将图像信息转序列,后将图像序列和文本序列融合拼接,将拼接输入的数据输入transformer中进行自回归训练,在图像生成过程中,通过文本序列自回归得到图像序列,在dVAE中实现图像的还原生成过程

56、,最后通过训练好的CLIP模型进行匹配打分来把控生成质量。20222022年年4 4月提出的月提出的DALLEDALLE 2 2进一步升级进一步升级。首先是利用CLIP文本编码器将图像描述映射到表示空间,其次利用扩散先验从CLIP文本编码映射到相应的CLIP图像编码,最后通过反向扩散从表示空间映射到图像空间,生成众多可能图像中的一个。图:图:DALLEDALLE模型主体结构模型主体结构图:图:DALLEDALLE 2 2模型主体结构模型主体结构资料来源:Zero-Shot Text-to-Image Generation,OpenAI,中信建投基于基于CLIPCLIP模型构建起图像模型构建起图

57、像和文本的统一语义关系和文本的统一语义关系基于扩散模型实现基于扩散模型实现高质量的图像生成高质量的图像生成图像信息图像信息转序列转序列文本信息文本信息转序列转序列文本序列和图像序列融合文本序列和图像序列融合资料来源:Hierarchical Text-Conditional Image Generation with CLIP Latents,中信建投 2.17 Whisper实现语音到文本的跨模态生成 2022年9月,OpenAI提出自动语音识别(ASR)系统Whisper,根据从网络收集的68万小时的多语言和多任务监督数据进行训练,Whisper支持99种语言,英语语料内容大约占据2/3。

58、WhisperWhisper架构采用标准的架构采用标准的TransformerTransformer模型编码器模型编码器-解码器解码器。输入音频被分成30秒一段的片段,然后转换成log-Mel频谱图传递到编码器。编码器来计算注意力,最后把数据传递给解码器,解码器被训练来预测相应的文本,并添加特殊标记,这些标记用来对单个模型执行诸如语言识别、多语言语音转录和英语语音翻译等任务。图:语音识别模型图:语音识别模型WhisperWhisper主体架构主体架构图:图:WhisperWhisper在长文本转录方面具有较强竞争力在长文本转录方面具有较强竞争力资料来源:OpenAI,中信建投资料来源:Robu

59、st Speech Recognition via Large-Scale Weak Supervision,中信建投 2.18 未来技术展望 着眼于通用人工智能的发展目标,我们预计,OpenAI的研究会沿着两个方向进一步延升:多模态能力不断提升;大模型充当AI代理、能力范围不断扩大。多模态能力不断提升多模态能力不断提升。GPT-4初步融入了多模态能力,具备了图像的识别和理解能力,OpenAI在图像生成方面也颇有建树,预期未来在大语言模型基础之上,也会融入图像生成等多模态能力。大模型充当大模型充当AIAI代理代理,通过调用各种专业化工具进一步扩大能力范围通过调用各种专业化工具进一步扩大能力范围

60、。大语言模型未来将与搜索引擎、代码编程工具、实体机器人等专业化工具进一步深化融合,打造更强大高效的多任务解决方案,为现实世界中的复杂任务提供全面的支持,让大模型成为日常生活中的个人助理,充分释放个人创造力。图:大语言模型与图:大语言模型与AIGCAIGC模型的融合途径模型的融合途径图:图:AIAI代理进一步扩大语言模型能力范围代理进一步扩大语言模型能力范围资料来源:One Small Step for Generative AI,One GiantLeap for AGI:A Complete Survey on ChatGPT in AIGC Era,中信建投资料来源:Tool Learni

61、ng with Foundation Models,中信建投 第三章第三章大模型全面赋能微软传统业务大模型全面赋能微软传统业务2929 大语言模型具备出色的文本理解与处理能力大语言模型具备出色的文本理解与处理能力,个人办公领域涉及到大量的文本处理工作个人办公领域涉及到大量的文本处理工作,与大语言模型的优势高度契合与大语言模型的优势高度契合,是大语言模型最佳落地场景是大语言模型最佳落地场景。微软业务多聚焦在个人办公领域,是OpenAI的最佳合作伙伴之一。微软和OpenAI合作始于2016年,2019年7月合作关系得到进一步巩固,随后不断在Aure云、大模型模型方面加强合作。OpenAIOpenA

62、I与微软达成人工智能行业的一次双赢合作与微软达成人工智能行业的一次双赢合作。OpenAI的通用人工智能研究需要庞大的计算能力做支撑,同样需要充足的资金支持去支付运营成本和科研人员薪酬。微软也亟待OpenAI的合作增强其AI技术实力,微软作为OpenAI先进人工智能技术的首选商业合作伙伴,获得了人工智能技术商业化的竞争力。3.1 个人办公是自然语言大模型的最佳落地场景资料来源:微软,OpenAI,中信建投图:微软和图:微软和OpenAIOpenAI合作历程合作历程 3.2 大模型以云为基,全面赋能微软传统业务资料来源:中信建投图:微软产品体系下各业务与大模型结合下的新功能及展望图:微软产品体系下

63、各业务与大模型结合下的新功能及展望 3.3 微软分业务经营情况资料来源:微软财报,中信建投备注:微软财年为上年7月1日至当年6月30日 微软FY2023Q3的营业收入为528.57亿美元,同比增长7.1%,营业利润达到223.5亿美元,同比增长9.7%,毛利率为69%。生产力及业务流程:生产力及业务流程:FY2023Q3营业收入175.2亿美元,同比增长10.9%。得益于Office 365 copilot的推出,Office 365Commerical营收同比增长14%,用户量增加11%,而Microsoft 365的订阅量达到6540万,同比增长12%。Dynamics产品营收同比增长25

64、%。智能云业务:智能云业务:FY2023Q3营业收入220.8亿美元,同比增长15.9%,其中Azure和其他云服务收入增长27%。个人计算业务:个人计算业务:2023Q3营业收入132.6亿美元,同比降低8.7%。受PC需求疲软影响,Windows OEM收入和设备收入分别减少28%和30%。New Bing的推出带来了搜索量和用户量的提升叠加收购Xandr,搜索和新闻广告业务收入同比增长10%。图:微软营业收入和营业利润情况(亿美金)图:微软营业收入和营业利润情况(亿美金)图:微软图:微软主营业务收入构成(亿美元)主营业务收入构成(亿美元)118.49151.22130.36140.86

65、133.14174.65145.20 143.56133.30142.37132.60123.19133.53135.52146.91150.39159.36157.89 166.00164.70170.02175.16129.86146.01151.18173.75169.64183.27190.51209.09203.30215.08 220.810.00100.00200.00300.00400.00500.00600.00个人计算业务生产力及业务流程智能云1,103.601,258.431,430.151,680.881,982.701,557.26350.58429.59529.59

66、699.16833.83642.6914.3%14.0%13.7%17.5%18.0%6.4%19.5%22.5%23.3%32.0%19.3%2.3%0.0%5.0%10.0%15.0%20.0%25.0%30.0%35.0%0.00500.001,000.001,500.002,000.002,500.00FY2018FY2019FY2020FY2021FY2022FY23Q1-Q3营业收入营业利润营收yoy利润yoy资料来源:微软财报,中信建投 3.4 OpenAI服务与Azure云深度融合 MicrosoftMicrosoft AzureAzure是全球第二大云服务提供平台是全球第二大

67、云服务提供平台。Azure智能云平台是微软的公用云端服务平台,遍布全球42个区域覆盖百余个数据中心,根据Synergy数据,2023Q1 Microsoft Azure占到23%的云服务提供商市场份额,仅次于亚马逊AWS。大模型对微软大模型对微软AzureAzure云服务产生直接促进作用云服务产生直接促进作用。OpenAI成立之初,与微软就Azure云展开了合作,后续OpenAI把服务逐步转移到微软Azure云上运行。自然语言大模型背后需要庞大的算力和通信带宽做支撑,对Azure云服务产生了直接促进作用。Azure OpenAI服务允许通过API访问OpenAI的模型,包括GPT-4、Chat

68、GPT、Codex、DALL-E 2和Embeddings模型系列。微软智能云业务FY2023Q1-Q3营收639亿美金,单Q3营收221亿美元,同比增长16%,其中Azure和其他云服务收入增长27%。FY23Q3 Azure OpenAI已有2500个服务客户,下个季度中有一个百分点的收入增长来自于人工智能下个季度中有一个百分点的收入增长来自于人工智能。图:微软智能云业务收入情况及增速图:微软智能云业务收入情况及增速图:图:23Q123Q1云服务提供商市场份额情况云服务提供商市场份额情况32%23%10%4%3%3%2%2%21%Amazon AWSMicrosoft AzureGoogl

69、e CloudAlibaba CloudIBM CloudSalesforceORACLETencent CloudOther322.19389.85483.66600.8752.51639.1417.4%21.0%24.1%24.2%25.3%17.60%0.0%5.0%10.0%15.0%20.0%25.0%30.0%00500600700800营业收入(亿美金)yoy资料来源:微软财报,中信建投资料来源:Synergy,中信建投 3.5 OpenAI助力Azure云增强其生态优势和协同效应 MicrosoftMicrosoft AzureAzure云具备较强的生态优

70、势和协同效应云具备较强的生态优势和协同效应。Azure云提供Office 365、Dynamics、LinkedIn等Saas化服务,微软IaaS、PaaS、SaaS各产品均采用同类数据模型,形成较强的协同优势。近期近期,AzureAzure云市场份额占比持续不断上升云市场份额占比持续不断上升。OpenAIOpenAI与与MicrosoftMicrosoft AzureAzure云深度融合之后云深度融合之后,实现了其实现了其SaasSaas化服务的全面赋能化服务的全面赋能。通过将大模型能力融入Office 365、Dynamics、LinkedIn等产品,不断增强其丰富生态下的产品能力。Azu

71、re OpenAI同时提供大模型的全栈式工具,其中包括预训练的大模型、大模型的应用微调、用于检测和减轻人工智能有害输出的工具、基于用户的访问控制和专用网络的企业级安全性保障。全栈工具促进企业级应用与大模型的结合,进一步增强云上业务的协同优势。图:云服务提供商市场份额变化情况图:云服务提供商市场份额变化情况图:图:MicrosoftMicrosoft AIAI产品组合产品组合资料来源:worldwide,中信建投0.0%10.0%20.0%30.0%40.0%50.0%60.0%18Q118Q218Q318Q419Q119Q219Q319Q420Q120Q220Q320Q421Q121Q221Q

72、321Q422Q122Q222Q322Q423Q1Amazon AWSMicrosoft AzureGoogle CloudOther资料来源:微软,中信建投 3.6 ChatGPT进一步强化Office操作便捷、功能强大的优势 OfficeOffice因为操作简单因为操作简单、功能强大而快速占领市场功能强大而快速占领市场。微软Word具备“所见即所得”的编辑模式和支持鼠标操作的简洁模式,Excel支持自动计算公式,支持宏等功能,让用户能在简便操作下完成复杂任务。Office因为操作简单、功能强大而快速占领市场,据worldwide数据,2022年Office 365在全球办公套件领域市场中份

73、额占比为45.5%。微软推出的微软推出的MicrosoftMicrosoft 365365 CopilotCopilot,通过大型语言模型进一步强化通过大型语言模型进一步强化OfficeOffice 365365操作简单操作简单、功能强大的优势功能强大的优势。Microsoft365 Copilot将大语言模型与Microsoft Graph中的数据以及Microsoft 365应用程序相结合,重塑个人生产力。通过copilot应用程序,大语言模型中深刻融入到个人工作流程中,为个人工作者释放生产力、提升创造力同时增强技能。Copilot同时提供商务聊天模式,汇集文档、演示文稿、日历等数据来源,

74、增强团队成员的信息融合。目前目前MicrosoftMicrosoft 365365CopilotCopilot仍在试用阶段仍在试用阶段,未来有望推出定价从而拉动未来有望推出定价从而拉动OfficeOffice 365365业务量价齐升业务量价齐升。图:图:20222022年全球办公软件市场份额情况年全球办公软件市场份额情况图:图:Microsoft 365 CopilotMicrosoft 365 Copilot资料来源:worldwide,中信建投50.3%45.5%2.4%0.5%Google AppsMicrosoft Office 365Microsoft PowerPointAdob

75、e Acrobat Pro资料来源:微软官网,中信建投 3.7 ChatGPT进一步强化Office操作便捷、功能强大的优势 WordWord:Copilot协助用户实现文档的创建、编写、润色、总结,让用户专注于创造力富集、重要的工作之中。ExcelExcel:Copilot可以根据用户需求生成模型,快速实现数据的定量分析,同时提供强大的可视化功能。Copilot协助用户快速理解和分析数据,寻找潜藏在数据背后的客观事实。PowerPointPowerPoint:可以通过Copilot直接基于相关的Word,一键生成演示文稿;也可以通过自然语言的命令,根据提示或大纲创建新的演示文稿;也可以通过语

76、言命令来调整布局、重新格式化文本、添加动画效果。OutlookOutlook:Copilot帮助用户筛选和总结重要的电子文件内容,并根据自然语言命令自动生成相关的电子邮件。通过Copilot可以有效地减少办公中阅读浏览电子邮件和回复电子邮件的时间,显著提高办公效率。图:图:WordWord中根据用户需求生成文档初稿中根据用户需求生成文档初稿图:图:PowerPointPowerPoint根据根据WordWord一键生成相关演示文稿一键生成相关演示文稿资料来源:微软官网,中信建投资料来源:微软官网,中信建投 3.8 Dynamics 365通过大模型进一步实现企业运行的降本增效资料来源:微软官网

77、,中信建投 DynamicsDynamics 365365是微软面对企业现代化需求推出的智能化应用组合是微软面对企业现代化需求推出的智能化应用组合。Dynamics 365融合企业的销售业务和信息管理服务,统一整合Dynamics CRM和Dynamics NA ERP等产品,有效连接组织架构下的人员、数据和操作流程,降低企业的运行成本并且简化了商业流程。大模型助力大模型助力DynamicsDynamics 365365 CopilotCopilot实现企业运行的降本增效实现企业运行的降本增效。CRM(客户关系管理)、ERP(企业资源管理)系统中经常需要执行繁琐的任务操作,比如数据的手工输入、

78、内容生成和事实记录。微软率先将大语言模型与其CRM、ERP系统进行融合,帮助用户实现任务自动化、提供工作创意、并获得见解,从而快速推进交易、深入理解客户需求,提升客户问题的响应速度。例如Dynamics 365下的Viva Sales,允许卖家使用Microsoft 365和Microsoft Teams自动将数据捕获到CRM系统中,消除了手动数据输入,同时通过AI推荐最佳的营销行动,缩短整个销售周期,Viva Sales用户每月收费40美元。图:图:VivaViva SalesSales通过通过AIAI建议缩减销售周期建议缩减销售周期图:图:CustomerCustomer Insights

79、Insights利用生成式利用生成式AIAI提供实时客户数据分析提供实时客户数据分析资料来源:微软官网,中信建投 3.9 Dynamics 365 Copilot通过AI加强核心竞争力 微软具有的强大的报告和数据分析能力,凭借这一优势Dynamics 365占据ERP市场主导地位。根据Software Connect数据,2022年ERP市场中,微软市场份额占比超过30%。引入大模型之后,进一步加强Dynamics在ERP方面的优势。根据Worldwide数据,2021年微软在CRM的市场占比为5.3%。在CRM领域中面对Salesforce和Oracle的竞争中,核心竞争力主要是简单易操作的

80、界面和集成度高的相关办公软件(可以与Access和Outlook集成)。Dynamics 365 Copilot通过自然语言模型进一步提高自身操作便捷的优势,通过简单语言命令完成相关操作。也可以通过AI增强与其他微软产品的联系,提升高集成度下的工作效率。图:图:20222022全球全球ERPERP市场份额情况市场份额情况图:图:20年年CRMCRM市场份额情况市场份额情况31.50%11.80%8.10%6.10%5.10%1.60%1.60%29.70%MicrosoftSAPDeltekSageOracleWorkdayEpicorOther资料来源:Soft

81、ware Connect,中信建投18.1%19.6%16.8%18.4%19.5%23.8%7.2%6.5%5.6%5.3%4.8%5.4%9.4%7.1%5.7%5.2%4.8%5.1%4.0%3.4%3.7%4.0%5.3%3.2%3.5%3.6%3.8%3.8%0.0%5.0%10.0%15.0%20.0%25.0%30.0%35.0%40.0%45.0%50.0%SAPOracleMicrosoftAdobe资料来源:Worldwide,中信建投 3.10 Linkedin通过引入GPT-4提高商业社交效率 LinkedIn(领英)是面向商业的社交网站,于2003年5月正式推出。与F

82、acebook和Myspace等其他社交网站不同,LinkedIn强调用户之间的专业联系,而不仅仅是用于娱乐与社交的网站与应用。用户可以在个人资料界面制作简历、介绍自己的职业、技能和工作经验,通过搜索等方式建立自己在工作上的联系和社交网络。微软在2016年完成了对LinkedIn的收购。LinkedinLinkedin通过引入大语言模型加快招聘流程通过引入大语言模型加快招聘流程、提升商业效率提升商业效率。Linkedin将GPT-4融入到AI助理之中,帮助招聘单位加快招聘流程,AI助理根据公司名称、职业名称、工作类型等信息快速生成职位描述;针对个人用户,AI助理可以根据用户的工作经历和相关工作

83、技能,提供关于个人页面标题和摘要的撰写建议。图:图:LinkedinLinkedin利用大模型快速实现职位描述利用大模型快速实现职位描述图:图:AIAI助理提供的写作建议助理提供的写作建议资料来源:Linkedin,中信建投资料来源:Linkedin,中信建投 3.11 Bing引入GPT-4有效提升搜索效率与交互体验 20232023年年2 2月月7 7日日,微软推出了引入大模型驱动的微软推出了引入大模型驱动的NewNew BingBing和和EdgeEdge浏览器浏览器。在引入了GPT-4后,bing优化了相关的搜索体验,大语言模型可以帮助查看来自整个互联网下的搜索结果,自动查找、整合和汇

84、总相关答案,同时bing提供了相应的网站索引,方便进一步查看。根据根据FYFY2323Q Q3 3财报数据财报数据,BingBing移动应用的每日安装量增长了移动应用的每日安装量增长了4 4倍倍。随着GPT-4的引入,Bing新增了Bing Chat等功能,可以通过交互式聊天的方式进行更复杂的搜索,用户可以通过不断的交流来完善自己的要求。GPT-4的引入让Bing也不再仅仅拥有搜索的功能,还可以根据用户的相关要求,撰写电子邮件、生成具体的文案、内容来帮助用户产生灵感。图:使用图:使用BingBing生成旅行计划生成旅行计划图:图:BingBing搜索每日访问人次(百万)搜索每日访问人次(百万)

85、资料来源:微软,中信建投303540455055NewNew BingBing资料来源:similarweb,中信建投 3.12 Bing率先引入多模态生成能力 20232023年年3 3月月2121日日,微软将微软将BingBing ImageImage CreatorCreator集成到集成到NewNew BingBing当中当中。Bing Image Creator可以通过AI的方式根据文字描述生成相应图片,该功能基于OpenAI的多模态模型DALL-E,Bing不仅可以搜索网络上已经存在的图像,还可以根据用户的相关描述,直接生成相关的图像,进一步提升Bing用户的体验。BingBing

86、推出了推出了KnowledgeKnowledge CardsCards 2 2.0 0功能功能。Bing新增的图谱卡片会出现在必应搜索结果页面的右侧,可以通过提供图像、短视频、图表、时间线等方式帮助用户快速探索感兴趣的内容,增加用户在使用Bing时的搜索体验和内容交互方式,使查找资料的过程更加高效和有趣。图:图:Bing Image CreatorBing Image Creator的图片生成功能的图片生成功能图:图:BingBing的的Knowledge Cards 2.0Knowledge Cards 2.0功能功能资料来源:微软,中信建投资料来源:微软,中信建投 3.13 Windows

87、有望凭借ChatGPT再度提升其市场份额资料来源:微软,中信建投 ChatGPTChatGPT与与WindowsWindows融合进一步增强融合进一步增强WindowsWindows操作的便捷性操作的便捷性。微软计划将Bing With ChatGPT接入到Windows 11的任务栏中,以此提高用户的操作性,同时让Windows用户能够更容易的找到系统中的任何文件和信息,以此提高Windows便捷的操作性。WindowsWindows有望凭借有望凭借ChatGPTChatGPT再度提升市场份额再度提升市场份额。Windows的早期成功主要是因为它的兼容性和开放性,2013年windows在操

88、作系统中的市场份额占比在90%以上,随着MacOS系统的不断优化和其他操作系统的加入,Windows逐步下滑至2023年初的74.1%。Windows操作系统积极与大语言模型融合,同时搭载ChatGPT的Windows11操作系统份额快速提升至18.12%,我们认为,Windows有望凭借大模型再度提升其市场份额。图:图:ChatGPTChatGPT融入融入Windows 11Windows 11任务栏任务栏图:图:20232023年年1 1月操作系统市场份额情况月操作系统市场份额情况图:图:WindowsWindows操作系统份额变化情况操作系统份额变化情况68.86%9.55%18.12%

89、0%10%20%30%40%50%60%70%80%90%100%21-0121-0221-0321-0421-0521-0621-0721-0821-0921-1021-1121-1222-0122-0222-0322-0422-0522-0622-0722-0822-0922-1022-1122-1223-01Win10Win7Win8.1Win8WinXPWinVistaWin2003OtherWin1174.1%15.3%2.9%2.4%5.3%WindowsmacOSLinuxChrome OSOthers资料来源:StatCounter,中信建投资料来源:StatCounter,中

90、信建投 第四章第四章OpenAIOpenAI打开打开AIAI应用新局面应用新局面4343 4.1 GPT-4显著提升代码编程效率和质量资料来源:Github Copilot,中信建投 GPTGPT-4 4可以根据需求自动生成可以根据需求自动生成、修改修改、优化代码优化代码,提高编程的效率和质量提高编程的效率和质量。以往在编程过程中,程序员需要经历搜索相关代码,学习代码,编写代码的复杂过程。而GPT-4通过学习和整合大量代码,可以根据所写代码上下文意图进行匹配,直接生成相关代码,还可以帮助程序员修改代码中的错误,大大提升程序员的编程效率和编程质量。OpenAIOpenAI和和GithubGith

91、ub合作推出合作推出AIAI辅助代码生成工具辅助代码生成工具GithubGithub CopilotCopilot。Copilot可以通过注释了解程序员的目的,自动匹配相关代码,并根据上下文进行理解,生成所需要的代码。除此之外,还可以帮助程序员减少重复性的代码编程工作,自动AI生成接下来的代码,而代码准确性也会随着上下文的理解而不断提升,让程序员可以专注于创新性的代码编程。2022年6月底,Github Copilot已正式上线,定价每月 10 美元或每年 100 美元,对学生用户和流行开源项目的维护者免费提供。图:使用图:使用GitHub CopilotGitHub Copilot直接生成相

92、关代码直接生成相关代码图:使用图:使用GitHub CopilotGitHub Copilot显著提升程序员工作效率显著提升程序员工作效率资料来源:Github Copilot,中信建投 4.2 GPT-4成为金融领域强力的信息汇总和分析工具 GPT-4具备优秀的数据整合、搜索和分析的能力,在投研、投顾、营销、客服、运营、风控等各类金融业务场景下都将具有广泛的应用和可观的潜力,可以为金融业投资者和金融从业人员提供更高质量的信息和数据分析服务。MorganMorgan StanleyStanley利用利用GPTGPT-4 4来实现企业运作中多维度的提升来实现企业运作中多维度的提升。Morgan

93、Stanley内部数据库中包含了大量高质量的涵盖全球资本市场、资产类别、行业分析和经济区域等方面的见解。这些数据以PDF形式存储在多个内部网站中,而GPT-4的应用让这些丰富而深刻的知识以一种更可用和可操作的形式出现,助力公司内部数据与知识应用高效化。彭博社彭博社(Bloomberg)发布拥有发布拥有500亿个参数的针对金融领域的自然语言模型亿个参数的针对金融领域的自然语言模型BloombergGPT。BloombergGPT在常规金融问答(ConvFinQA)、情绪分析(FIQA SA)、包含观点的金融专业词汇分析(FPB)、通过对新闻标题研究得到特定商品价格的上涨或者下跌信息等金融领域的测

94、试中均表现优异,同时不会牺牲通用自然语言模型的基准性能。图:咨询图:咨询GPTGPT-4 4如何在如何在Morgan StanleyMorgan Stanley开通线上账户开通线上账户图:图:BloombergGPTBloombergGPT外部金融任务测试结果外部金融任务测试结果资料来源:OpenAI,中信建投资料来源:BloombergGPT:A Large Language Model for Finance,中信建投 4.3 GPT-4全方位提升医疗领域的智能化与数字化 医疗领域同样是大语言模型结合的优秀场景医疗领域同样是大语言模型结合的优秀场景,GPTGPT-4 4可以提升医疗领域的智

95、能化与数字化可以提升医疗领域的智能化与数字化。GPT-4可以帮助医生和护士快速准确的撰写病例和医疗记录,节约时间和成本,同时根据病例,检查结果等信息,提供合理的诊断建议和治疗方案,辅助医生做出决策,提高医疗质量和安全性。GPT-4还可以在知识普及、诊断辅助,科研支持等方面与医疗进行结合,提升医疗诊断水平和效率。Dragon Ambient eXperience(DAX)是Nuance和微软联合推出的首个用于医疗保健的全人工智能自动化临床文档应用程序。该应用程序与GPT-4深度结合,通过对话式、环境AI和多模态输入数据,自动生成电子病例,导入医疗信息化系统,不需要医生手动记录和导入,大大提高了医

96、疗效率和管理效率,助力医疗领域进行数字化转型,并提供更好的医患体验。图:图:DADAX X提供全方位的人工智能医疗解决方案提供全方位的人工智能医疗解决方案图:图:DADAX X自动生成文档示意图自动生成文档示意图资料来源:Nuance,中信建投资料来源:Nuance,中信建投 4.4 GPT-4提高教育和学习的效率和针对性 教育领域,GPT-4可以提高教育和学习的效率和针对性。GPT-4可以作为教师的辅助工具,帮助教师准备教案、出题、批改作业、评估学生水平等;也可以作为学生的学习伙伴,根据学生的水平和喜好,提供针对性的学习方案,帮助学生复习、练习、拓展知识、提高学习兴趣。CheggMate是C

97、hegg打造的AI学习平台。通过引入GPT-4模型,CheggMate将GPT-4的强大功能与Chegg广泛的内容库和专家库相结合,通过AI提供更为快速和更具对话性的问题回复,通过实时AI导师的方式,提供定制化教育服务,适应学生的学习需求,提供个性化评估和练习测试,提供更加良好的学习体验。Khan Academy是一个非盈利的教育平台。其2022 年开始测试最新版本的Open AI语言模型,将向部分参与者提供 Khanmigo试点计划。结合GPT-4打造的 Khanmigo AI助手可以为学习者提供定制化的教育以及为教师提升工作效率。图:图:CheggMateCheggMate交流页面交流页面

98、图:图:KhanmigoKhanmigo帮助教师设计教学方案帮助教师设计教学方案资料来源:CheggMate,中信建投资料来源:Khanmigo,中信建投 4.5 GPT-4提升零售中的业务效率和用户体验 GPTGPT-4 4帮助企业不断的创新和提升服务质量帮助企业不断的创新和提升服务质量,提升零售业的业务效率和用户体验提升零售业的业务效率和用户体验。GPT-4在零售业中,可以帮助企业生成个性化的商品推荐和描述,根据消费者的喜好,生成不同的商品信息,增加消费者的兴趣和体验;同时,也可以通过GPT-4构建智能的客服对话,提升用户的售后体验。Stripe是一个支付平台是一个支付平台,借助借助GPT

99、4的能力进行更好地服务客户的能力进行更好地服务客户、回答技术问题以及识别虚假信息回答技术问题以及识别虚假信息。Stripe借助GPT-4的能力可以扫描隐藏网站并且做出汇总,节省了人工精力更好地服务客户。此外,借助GPT-4,Stripe能够快速理解用户的问题,阅读详细的文档,梳理想关信息分并总结出解决方案,极大提升工作效率。GPT-4还会帮助识别虚假信息,通过分析社区Discord 中帖子的语法,就会发现欺诈团队,以方便相关工作人员将他们清除出去。图:图:利用利用StripeStripe中的中的Docs AIDocs AI搜集信息搜集信息图:图:StipeStipe引入引入GPTGPT-4 4

100、去提升用户体验和对抗虚假信息去提升用户体验和对抗虚假信息资料来源:Stripe,中信建投Docs AI搜集并总结出关于test mode的信息资料来源:Stripe,中信建投 第五章第五章风险提示风险提示4949 风险提示技术发展不及预期:技术发展不及预期:人工智能模型属于先进AI算法,若后续算法更新迭代效果不及预期,则会影响人工智能模型演进及拓展,进而会影响其商业化落地等;算法隐私问题:算法隐私问题:人工智能在进行预训练过程中,使用了大量数据,其中会涉及相关隐私问题;应用不及预期:应用不及预期:人工智能算法与相关应用落地之间还存在一定距离,需要注意应用落地不及预期风险;数据质量不及预期:数据

101、质量不及预期:人工智能模型需要大量的高质量数据进行训练,若数据数量和质量存在短板,则会影响模型效果;伦理冲突风险:伦理冲突风险:人工智能模型将进一步推动人工智能迈向通用型人工智能,人工智能进一步智能化将产生人工智能欺骗、人工智能上瘾等一系列伦理问题;感谢樊文辉对本报告的贡献。分析师介绍分析师介绍阎贵成:阎贵成:中信建投证券通信&计算机行业首席分析师,北京大学学士、硕士,专注于云计算、物联网、信息安全、信创与5G等领域研究。近8年中国移动工作经验,6年多证券研究经验。系2019-2021年新财富、水晶球通信行业最佳分析师第一名,2017-2018年新财富、水晶球通信行业最佳分析师第一名团队核心成

102、员。金戈:金戈:中信建投证券研究发展部计算机行业联席首席分析师,帝国理工学院工科硕士,擅长云计算、金融科技、人工智能等领域。于芳博于芳博:中信建投人工智能组首席分析师,北京大学空间物理学学士、硕士,2019年7月加入中信建投,主要覆盖人工智能等方向,下游重点包括智能汽车、CPU/GPU/FPGA/ASIC、EDA和工业软件等方向。评级说明评级说明投资评级标准评级说明报告中投资建议涉及的评级标准为报告发布日后6个月内的相对市场表现,也即报告发布日后的6个月内公司股价(或行业指数)相对同期相关证券市场代表性指数的涨跌幅作为基准。A股市场以沪深300指数作为基准;新三板市场以三板成指为基准;香港市场

103、以恒生指数作为基准;美国市场以标普 500 指数为基准。股票评级买入相对涨幅15以上增持相对涨幅5%15中性相对涨幅-5%5之间减持相对跌幅5%15卖出相对跌幅15以上行业评级强于大市相对涨幅10%以上中性相对涨幅-10-10%之间弱于大市相对跌幅10%以上 分析师声明分析师声明本报告署名分析师在此声明:(i)以勤勉的职业态度、专业审慎的研究方法,使用合法合规的信息,独立、客观地出具本报告,结论不受任何第三方的授意或影响。(ii)本人不曾因,不因,也将不会因本报告中的具体推荐意见或观点而直接或间接收到任何形式的补偿。法律主体说明法律主体说明本报告由中信建投证券股份有限公司及/或其附属机构(以下

104、合称“中信建投”)制作,由中信建投证券股份有限公司在中华人民共和国(仅为本报告目的,不包括香港、澳门、台湾)提供。中信建投证券股份有限公司具有中国证监会许可的投资咨询业务资格,本报告署名分析师所持中国证券业协会授予的证券投资咨询执业资格证书编号已披露在报告上海品茶。在遵守适用的法律法规情况下,本报告亦可能由中信建投(国际)证券有限公司在香港提供。本报告作者所持香港证监会牌照的中央编号已披露在报告上海品茶。一般性声明一般性声明本报告由中信建投制作。发送本报告不构成任何合同或承诺的基础,不因接收者收到本报告而视其为中信建投客户。本报告的信息均来源于中信建投认为可靠的公开资料,但中信建投对这些信息的准确性及

105、完整性不作任何保证。本报告所载观点、评估和预测仅反映本报告出具日该分析师的判断,该等观点、评估和预测可能在不发出通知的情况下有所变更,亦有可能因使用不同假设和标准或者采用不同分析方法而与中信建投其他部门、人员口头或书面表达的意见不同或相反。本报告所引证券或其他金融工具的过往业绩不代表其未来表现。报告中所含任何具有预测性质的内容皆基于相应的假设条件,而任何假设条件都可能随时发生变化并影响实际投资收益。中信建投不承诺、不保证本报告所含具有预测性质的内容必然得以实现。本报告内容的全部或部分均不构成投资建议。本报告所包含的观点、建议并未考虑报告接收人在财务状况、投资目的、风险偏好等方面的具体情况,报告

106、接收者应当独立评估本报告所含信息,基于自身投资目标、需求、市场机会、风险及其他因素自主做出决策并自行承担投资风险。中信建投建议所有投资者应就任何潜在投资向其税务、会计或法律顾问咨询。不论报告接收者是否根据本报告做出投资决策,中信建投都不对该等投资决策提供任何形式的担保,亦不以任何形式分享投资收益或者分担投资损失。中信建投不对使用本报告所产生的任何直接或间接损失承担责任。在法律法规及监管规定允许的范围内,中信建投可能持有并交易本报告中所提公司的股份或其他财产权益,也可能在过去12个月、目前或者将来为本报告中所提公司提供或者争取为其提供投资银行、做市交易、财务顾问或其他金融服务。本报告内容真实、准

107、确、完整地反映了署名分析师的观点,分析师的薪酬无论过去、现在或未来都不会直接或间接与其所撰写报告中的具体观点相联系,分析师亦不会因撰写本报告而获取不当利益。本报告为中信建投所有。未经中信建投事先书面许可,任何机构和/或个人不得以任何形式转发、翻版、复制、发布或引用本报告全部或部分内容,亦不得从未经中信建投书面授权的任何机构、个人或其运营的媒体平台接收、翻版、复制或引用本报告全部或部分内容。版权所有,违者必究。中信建投证券研究发展部中信建投证券研究发展部中信建投(国际)中信建投(国际)北京东城区朝内大街2号凯恒中心B座12层电话:(8610)8513-0588联系人:李祉瑶邮箱:上海浦东新区浦东南路528号南塔2106室电话:(8621)6882-1612联系人:翁起帆邮箱:深圳福田区益田路6003号荣超商务中心B座22层电话:(86755)8252-1369联系人:曹莹邮箱:香港中环交易广场2期18楼电话:(852)3465-5600联系人:刘泓麟邮箱:charleneliucsci.hk52

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(人工智能行业海外大模型系列深度报告之一:OpenAI和微软~通用人工智能道路上矢志不渝的逐梦者-230504(52页).pdf)为本站 (刺猬) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部