上海品茶

2024云厂商AI算力自用需求、外供竞争格局及相关产业公司梳理分析报告(36页).pdf

编号:163227 PDF 36页 6MB 下载积分:VIP专享
下载报告请您先登录!

2024云厂商AI算力自用需求、外供竞争格局及相关产业公司梳理分析报告(36页).pdf

1、2023 年深度行业分析研究报告 正文目录正文目录 核心观点核心观点.4 2005-2023 年复盘:云资本开支持续扩大,年复盘:云资本开支持续扩大,AI 贡献新动能贡献新动能.5 波动溯源:结构性调整与经营性平衡是重要影响因素.7 传统驱动:IaaS+PaaS+SaaS 服务贡献早期动能.12 新兴驱动:扩大资本开支成为共识,AI 算力成为新一轮建设重点.13 AI 需求需求 1:云厂商加速:云厂商加速 MaaS 布局,满足外供训练布局,满足外供训练&推理推理.16 Amazon:云计算先发者,23 年加速 AI 追赶.17 Microsoft:MaaS 转型顺利,商业化逐步落地.18 Go

2、ogle:MaaS 布局日趋完善,初创 AI 企业热门选择.19 AI 需求需求 2:大模型渗透基础业务,大厂自用需求或放量:大模型渗透基础业务,大厂自用需求或放量.21 理论:大模型落地推荐系统,具备技术可行性.22 传统架构:大模型与 CRM 的单点/多点整合,效能优化是重点.23 新兴架构:重塑范式,打造基于 Transformer 的第三代推荐系统.28 实践:Meta、Google 加速探索大模型的推荐场景落地.29 Meta:“三步走”战略明确,统一推荐系统或将 26 年落地.29 Google:生成式大模型迭代搜索算法,SGE 进展顺利.32 影响:模型变化影响算力要求,自用 G

3、PU 需求或将放量.34 相关产业公司梳理相关产业公司梳理.36 图表目录图表目录 图表 1:云 CapEx 复盘与展望:AI 推动算力建设进入新周期.4 图表 2:海外云厂商资本开支情况复盘及展望(2005-2026E).5 图表 3:2005-2009 年海外云厂商资本开支变化情况.6 图表 4:2010-2015 年海外云厂商资本开支变化情况.6 图表 5:2016-2019 年海外云厂商资本开支变化情况.6 图表 6:2020-2023 年海外云厂商资本开支变化情况.6 图表 7:2006-2023 年海外云厂商资本开支同比增速情况及波动(同比减少)归因.7 图表 8:Amazon 资

4、本开支波动原因详解.8 图表 9:2015-2023 年 AWS 数据中心占地面积变化.8 图表 10:Microsoft 资本开支波动原因详解.9 图表 11:Google 资本开支波动原因详解.11 图表 12:Meta 资本开支波动原因详解.12 图表 13:2008-2023 年海外云厂商资本开支与全球云计算市场规模同频共振.12 图表 14:2020Q1-2024Q1 云业务收入同比增速变化.13 图表 15:公有云(IaaS+PaaS)市场规模预测(按工作负载分类).13 图表 16:22Q2-24Q1 Microsoft 季度资本开支及环比变化.14 图表 17:22Q2-24Q

5、1 Google 季度资本开支及环比变化.14 图表 18:22Q2-24Q1 Amazon 季度资本开支及环比变化.14 图表 19:22Q2-24Q1 Meta 季度资本开支及环比变化.14 图表 20:23Q4 及 24Q1 年海外云厂商资本开支指引对比.15 图表 21:主流云厂商 MaaS 服务差异化对比.16 图表 22:云托管仍是海外企业模型服务的重要来源.17 图表 23:Amazon MaaS 服务布局.17 图表 24:Microsoft MaaS 服务布局.18 图表 25:微软 AI 业务推进情况梳理.19 图表 26:Google MaaS 服务布局.19 图表 27

6、:Google AI+应用布局.20 图表 28:Google MaaS 合作客户案例.20 图表 29:搜索/广告/推荐相关业务在大厂中的收入占比.21 图表 30:搜索/广告/推荐技术流程示意及潜在大模型融合方向.22 图表 31:大模型+推荐系统研究发展趋势及代表论文.22 图表 32:大模型与传统推荐模型可实现优势互补.23 图表 33:基于深度学习的推荐系统架构及 LLM 可应用场景.23 图表 34:LLM 在传统推荐系统各环节的典型研究成果.24 图表 35:LLM 在特征工程阶段的应用场景及研究成果概览.24 图表 36:LLM 在特征编码阶段可强化文本信息的理解.25 图表

7、37:LLM 在打分排序阶段的应用场景举例.25 图表 38:LLM 在用户交互阶段的应用场景范例.26 图表 39:LLM 在流程控制阶段的应用范例.26 图表 40:传统推荐架构下大模型与推荐系统融合的演进趋势.27 图表 41:生成式推荐架构采用文本序列统一用户及项目表征.28 图表 42:生成式推荐模型有望成为第三代推荐系统.28 图表 43:Meta 推荐系统迭代已进入第三阶段.29 图表 44:Meta 提出首个生成式推荐系统模型.29 图表 45:Meta GRs 实现三大技术突破.30 图表 46:长序列处理速度较传统深度学习模型显著提升.30 图表 47:以 1.5 倍吞吐量

8、服务 285 倍复杂的模型(相同推理成本).30 图表 48:Eval Hit Rate100 与训练量呈幂律 scaling 趋势.30 图表 49:Eval Hit Rate500 与训练量呈幂律 scaling 趋势.30 图表 50:Meta 搭建 4K GPU 集群服务传统推荐模型.31 图表 51:Meta 的生成式推荐模型在召回/排序任务中超越传统推荐模型.31 图表 52:Google 搜索算法加速迭代,SGE 引入大模型能力.32 图表 53:SGE 提供更精准、更个性、更智能的搜索体验.32 图表 54:Google SGE 界面概览.33 图表 55:千亿模型推理的 A1

9、00 等效 GPU 需求量约为 2.4 万张.34 图表 56:大模型推理算力需求测算(以 10 亿月活为测算基准).34 图表 57:NVIDIA 出货量与 Meta 需求量对比示意图.35 核心观点核心观点 大模型时代,大模型时代,AI 需求有望拉动需求有望拉动云厂商资本开支持续扩大,全球算力需求将持续向上。云厂商资本开支持续扩大,全球算力需求将持续向上。复盘历史:复盘历史:2005-2023 年云资本开支整体保持扩大趋势,2009、2015、2023 年 Amazon、Microsoft、Google、Meta 合计支出规模出现小幅波动,剔除结构性调整因素影响,我们发现除 2009 年

10、Google、Microsoft 受经营压力影响有意缩小 CapEx 支出之外,过去近 20年时间,云厂商用于数据中心建设的资本开支并未出现明显缩减。从历史复盘的视角看,CapEx 支出扩大得益于自用/外供两方面因素影响。自用视角下云厂商核心业务完成 SaaS转型,伴随用户规模扩大,自用算力需求稳定增长;外供视角下海外企业加速业务上云、数据上云,伴随云化比例提升,云托管需求带动外供算力需求稳步抬升。需求展望需求展望:大模型成为新一代技术变革关键,正全面重塑 IT 产业结构,同样从自用/外供两个维度展望,我们发现扩大 AI 算力建设已成为海外云厂商公司共识,新一轮云基础设施建设周期全面开启。对于

11、外供视角下的需求增长,目前市场共识较高,受益于 MaaS 需求拉动,Microsoft、Google、Amazon 的云收入增速自 23Q3 开始逐步企稳,各家 MaaS 布局竞争日趋激烈,算力规模和模型能力是后续的竞争关键。对于自用视角下的需求增长,或仍存在较大的市场预期差,大模型正加速向推荐/搜索/广告等传统互联网业务渗透,我们认为,若大模型实现在传统业务场景的算法替代,云厂商自用的 AI 推理需求将加速释放。以 Meta 10 亿月活用户数应用为测算基准,若生成式推荐模型全面替换传统算法,对应A100 等效 GPU 需求超 52 万张,远高于目前推荐场景的 4,000 张 GPU 算力规

12、模。图表图表1:云云 CapEx 复盘与展望:复盘与展望:AI 推动算力建设进入新周期推动算力建设进入新周期 资料来源:Amazon 官网、Microsoft 官网、Google 官网、Meta 官网、云计算白皮书,中国信通院(2023)、华泰研究 2005-2023 年年复盘:云资本开支持续扩大,复盘:云资本开支持续扩大,AI 贡献新动能贡献新动能 资本开支资本开支总体呈扩大趋势,总体呈扩大趋势,AI 成为新一轮云基础设施建设助推剂。成为新一轮云基础设施建设助推剂。回顾 2005-2023 年Amazon(亚马逊)、Microsoft(微软)、Google(谷歌)、Meta(脸书)的资本开支

13、变化,海 外 云 厂 商 资 本 开 支 呈 现 总 体 扩 大 趋 势。四 家 企 业 合 计 资 本 开 支 在 2010 年(yoy+113.02%)、2016 年(yoy+29.46%)、2020 年(yoy+38.76%)等年份明显提速,主要得益于云计算业务在当年出现重要增长驱动。我们认为,2005-2022 年海外云厂商资本开支的增长驱动是云计算业务的持续成长,进入 2023 年云计算+AI 成为新的双轮引擎,头部云厂商资本开支有望持续扩大,进而带动全球算力需求持续增长。根据 Visible Alpha一致预测,2026 年四家合计资本支出将达 2,399 亿美元,2023-202

14、6 年 CAGR 为 18.86%。图表图表2:海外云厂商资本开支情况复盘海外云厂商资本开支情况复盘及展望(及展望(2005-2026E)资料来源:Amazon 官网、Microsoft 官网、Google 官网、Meta 官网、云计算白皮书,中国信通院(2023)、Visible Alpha、华泰研究 1)萌芽萌芽期(期(2005-2009 年年):此阶段以 IaaS(Infrastructure as a service,基础设施即服务)建设为主。2006 年,Amazon 率先推出 Simple Storage Service(S3)与 Elastic Compute Cloud(EC2

15、),正式布局云计算服务,存算分离的核心理念确立。2005-2008 年合计资本开支保持上涨,CAGR 为 45.63%。2009 年合计资本开支同比下降 44.46%,主要受 Microsoft(平衡经营压力)、Google(2008 年收购 Double Click,快速扩大自用服务器建设)资本开支下降影响,2009 年 Amazon 资本开支仍然维持上涨,同比增长 11.68%。2)发展期()发展期(2010-2015 年):年):此阶段 Microsoft、Google 正式入局云计算市场,云服务建设开始从 IaaS 向 PaaS(Platform as a Service,平台即服务)

16、层逐步拓展,算力需求进一步增长。2009 年 Heroku 推出第一款公有云 PaaS,2010 年微软推出 Windows Azure平台,2012 年 Google 推出 Google Compute Engine 预览版,云计算正式进入稳步发展期。2010-2015 年合计资本开支持续上涨,CAGR 为 25.71%。云计算在此阶段逐步实现技术沉淀与客户积累,海外企业逐步推进数据上云,软件公司开始尝试 SaaS 订阅转型。图表图表3:2005-2009 年海外云厂商资本开支变化情况年海外云厂商资本开支变化情况 图表图表4:2010-2015 年海外云厂商资本开支变化情况年海外云厂商资本开

17、支变化情况 资料来源:Amazon 官网、Microsoft 官网、Google 官网、Meta 官网、华泰研究 资料来源:Amazon 官网、Microsoft 官网、Google 官网、Meta 官网、华泰研究 3)成熟期()成熟期(2016-2022 年):年):此阶段云计算技术基本成熟,SaaS(Software as a Service,软件即服务)应用加速发展,各家云业务实现快速增长,据 Gartner 统计,全球公有云市场规模从 2018 年的 1,824 亿美元增长至 2022 年的 4,910 亿美元,CAGR 为 28%。2018-2022 年 Microsoft Azur

18、e、Google Cloud、Amazon AWS 业务收入的同比增速分别保持在31%、37%、28%以上,高于行业平均水平。伴随云收入快速增长,企业资本开支规模持续扩大,2016 到 2019 年期间合计资本开支 CAGR 为 28.58%,19 年合计资本支出达 649亿美元;受益于线上办公需求增长及云厂商自研/投资的大模型训练需求,2020-2022 年云厂商资本开支继续扩大,CAGR 为 27.34%,22 年合计支出达 1,460 亿美元。4)升级期()升级期(2023 年至今):年至今):此阶段生成式 AI 成为重要增量需求,以 AI 为核心 MaaS(Model as a ser

19、vice,模型即服务)服务成为新一轮算力建设重要推动。2023 年(自然年)Microsoft 资本支出为 352 亿美元,同比增长 42.13%;Google 资本支出为 323 亿美元,同比增长 2.43%;Amazon 资本支出为 481 亿美元,同比减少 17.47%(主要由于仓储物流、履约支出相关支出减少);Meta 资本支出为 273 亿美元,同比减少 13.25%(主要由于非 AI 服务器支出减少)。根据 Visible Alpha 一致预测数据显示,2024-2026 年四家合计资本开支将分别达到 1,993、2,211、2,399 亿美元,2024-2026 年 CAGR 为

20、 18.86%。图表图表5:2016-2019 年海外云厂商资本开支变化情况年海外云厂商资本开支变化情况 图表图表6:2020-2023 年海外云厂商资本开支变化情况年海外云厂商资本开支变化情况 资料来源:Amazon 官网、Microsoft 官网、Google 官网、Meta 官网、华泰研究 资料来源:Amazon 官网、Microsoft 官网、Google 官网、Meta 官网、华泰研究 20.3641.4951.1262.8935.26103.75%23.21%23.04%-44.46%-60%-40%-20%0%20%40%60%80%100%120%0070

21、20052006200720082009(亿美元)MicrosoftgoogleAmazonMetaYoY75.1180.88111.96178.50229.76235.78113.02%7.68%38.43%59.43%28.72%2.62%0%20%40%60%80%100%120%140%05003002001320142015(亿美元)MicrosoftgoogleAmazonMetaYoY305.24386.69646.64648.8629.46%26.68%67.22%0.34%0%10%20%30%40%50%60%70%80%0100

22、20030040050060070080020019(亿美元)MicrosoftgoogleAmazonMetaYoY900.341218.191460.051428.5238.76%35.30%19.85%-2.16%-5%0%5%10%15%20%25%30%35%40%45%02004006008001,0001,2001,4001,6001,8002020202120222023(亿美元)MicrosoftgoogleAmazonMetaYoY 波动波动溯源溯源:结构性调整与经营性平衡是:结构性调整与经营性平衡是重要影响重要影响因素因素 资本开支资本开支扩大扩大趋

23、势持续,趋势持续,增速波动主要受结构性调整、经营性平衡两类因素影响。增速波动主要受结构性调整、经营性平衡两类因素影响。回顾资本开支的同比增速变化,我们对 2005-2023 年同比下降的年份进行了回溯归因,历史增速波动主要受资本开支结构性调整与公司经营性平衡两类因素影响。1)结构性调整:)结构性调整:资本开支主要包括购买新的机器、设备、房屋等长期资产,为了剔除购置房产等其他资本开支影响,我们整理了云厂商资产和设备科目下计算设备的资产净增值与同比增速,可以看到计算设备的资产净增值同比增长但总资本开支同比减少的年份,多受到资本开支结构性调整的影响;同时还包括未考虑用于数据中心的融资租赁成本的年份;

24、2)经营性平衡:)经营性平衡:为保证公司经营质量,维持良好的现金流水平,在公司经营承压的年份,公司多采取减少资本开支的经营举措,可以看到在总体营收增速放缓或同比减少的年份,总资本开支同比减少多受到公司经营性平衡的影响。图表图表7:2006-2023 年海外云厂商资本开支同比增速情况及波动(同比减少)归因年海外云厂商资本开支同比增速情况及波动(同比减少)归因 注:图中底色标注含义详见图例,主要标注同比增长较快及同比减少的年份 资料来源:Amazon Investor 官网、Microsoft Investor 官网、Google Investor 官网、Meta Investor 官网、华泰研究

25、 Amazon:资本开支三次波动向下,结构性调整:资本开支三次波动向下,结构性调整三三次次。回顾 Amazon 的资本开支同比增速,2013 年、2015 年、2023 年分别同比减少 9%、6%、17%。1)2013 年年主要主要由于结构性调整由于结构性调整:2013 年资本开支为 34.4 亿美元(yoy-9%),13Q1-Q4资本开支分别为 6.70、8.55、10.38、8.80 亿美元(yoy+73.58%/+30.14%/+44.97%/-56.54%);13Q4 资本开支同比大幅减少,主要由于 12Q4 公司以 14 亿美元购买了企业办公大楼,剔除相关影响,2013 年资本支出同

26、比增长 43%;2)2015 年年主要主要由于由于未考虑未考虑 AWS 的融资租赁成本的融资租赁成本:2015 年资本开支为 45.9 亿美元(yoy-6%),15Q1-Q4 资本开支分别为 8.71、12.13、11.95、13.09 亿美元(yoy-19.35%/-5.97%/-13.28%/+14.42%);2015 年统计口径下资本开支不包含融资租赁(大部分用于支持 AWS),实际上 2015 年 Amazon 增加 AWS 数据中心租赁;综合来看,2015 年资本开支(含融资租赁)超 90 亿美元,相较于 2014 年的 89 亿美元略有增长。3)2023 年主要由于结构性调整:年主

27、要由于结构性调整:2023 年资本开支为 481.3 亿美元(yoy-17%),23Q1-Q4 资本开支分别为 130.70、104.12、112.98、133.53 亿美元(yoy-4.89%/-26.15%/-24.89%/-13.52%);2023 年资本开支同比减少主要由于公司的仓储物流及履约开支减少。图表图表8:Amazon 资本开支波动原因详解资本开支波动原因详解 时间时间 官方电话会官方电话会 官方解释官方解释 2013 2012Q4 业绩说明会(2013-01-29)Trailing 12 months capital expenditures were$3.79 billio

28、n.This amount includes$1.4 billion in purchases of our previously leased corporate office space as well as property for development of additional corporate office space located in Seattle,Washington which we purchased in the fourth quarter.The increase in capital expenditures reflects additional inv

29、estments in support of continued business growth consisting of investing in technology infrastructure including Amazon Web Services and additional capacity to support our fulfillment operations.译文:过去 12 个月资本开支为 37.9 亿美元,其中 14 亿美元用于购买之前租用的企业办公空间以及位于华盛顿州西雅图的新增公司办公空间,这些购买都发生在 2012Q4。资本开支的增加反映了公司为支持持续业务

30、增长而进行的额外投资,包括对技术基础设施(例如 Amazon Web Services)的投入,以及增加支持履行运营的容量。2015 2015Q4 业绩说明会(2016-01-28)Capital expenditures does not include the impact of property and equipment acquired under capital and finance lease obligations.These capital expenditures and capital leases reflect additional investments in s

31、upport of continued business growth,due to investments in technology infrastructure,the majority of which is to support AWS,and additional capacity to support our fulfillment operations.译文:资本支出不包括通过资本和融资租赁义务获得的不动产和设备的影响。这些资本支出和资本租赁反映了支持持续业务增长的额外投资,其中大部分用于支持 AWS 以及增加履行运营所需的容量。Keep in mind that we did

32、 have a-although the year-over-year increase in capital expenditures and capital leases was not as great as we saw in 2013 to 2014,we did spend over$9 billion on those.We grew from in the$5 billion range in 2013 to$8.9 billion in 2014 and now over$9 billion in 2015.译文:虽然包括融资租赁在内的资本支出同比增长没有 2013 年至 2

33、014 年那么显著,但 2015年含融资租赁在内的资本支出仍超过 90 亿美元(2013 年 50 亿美元,2014 年 89 亿美元)。2023 2023Q4 业绩说明会(2024-01-29)In 2023,full year CapEx was$48.4 billion,which was down$10.2 billion year-over-year,primarily driven by lower spend on fulfillment and transportation.As we look forward to 2024,we anticipate CapEx to in

34、crease year-over-year,primarily driven by increased infrastructure CapEx,support growth of our AWS business,including additional investments in generative AI and large language models.译文:2023 年全年资本开支为 484 亿美元,同比减少 102 亿美元,主要是由于履约和运输开支的减少。展望 2024 年,我们预计资本开支将同比增加,主要是由于基础设施资本开支的增加,支持 AWS 业务的增长,包括在生成式人工

35、智能和大语言模型上的额外投资。资料来源:Amazon Investor 官网、华泰研究 图表图表9:2015-2023 年年 AWS 数据中心占地面积变化数据中心占地面积变化 资料来源:Amazon 年报、华泰研究 6,7078,12110,22114,14416,43518,06426,11233,48038,20405,00010,00015,00020,00025,00030,00035,00040,000CY2015CY2016CY2017CY2018CY2019CY2020CY2021CY2022CY2023(千平方英尺)租赁面积自有面积 Microsoft:资本开支:资本开支三三次

36、波动向下,经营性平衡次波动向下,经营性平衡两两次,结构性调整次,结构性调整一一次次。由于财年划分不同,我们以 Microsoft 财年为时间维度对其资本开支进行分析(FY2006 对应 CY05Q3、CY05Q4、CY06Q1、CY06Q2 四个季度)。回顾 Microsoft 的资本开支同比增速,FY2009财年、FY2010 财年、FY2012 财年分别同比减少 2%、37%、2%。1)FY2009 财财年年主要主要由于经营性平衡由于经营性平衡:FY2009 资本开支为 31.19 亿美元(yoy-2%),FY09Q1-Q4 资本开支分别为 7.78、8.42、6.32、8.67 亿美元(

37、yoy+52.55%/+21.15%/-16.73%/-28.82%);2009 年资本开支同比减少,主要由于公司经营业绩承压,FY09Q3-Q4 营收分别同比下降 5.58%、17.29%,FY2009 财年全年营收同比下降 3.28%。2)FY2010 财财年年主要主要由于由于未考虑融资租赁成本未考虑融资租赁成本:FY2010 年资本开支为 19.77 亿美元(yoy-37%),FY10Q1-Q4 资本开支分别为 4.35、3.76、4.08、7.58 亿美元(yoy-44.09%/-55.34%/-35.44%/-12.57%);FY2010 财年资本开支同比大幅下降,主要由于未考虑云服

38、务相关的融资租赁成本,FY2010 财年包括融资租赁在内的资本开支为 58 亿美元,同比增长 8%,主要用于支持云服务的使用和需求增长。3)FY2012 财年主要由于财年主要由于经营性平衡经营性平衡:FY2012 财年资本开支为 23.05 亿美元(yoy-2%),FY12Q1-Q4 资本开支分别为 4.36、4.98、7.49、6.22 亿美元(yoy-22.70%/+1.43%/+13.83%/-3.12%);FY2012 财年资本开支同比略有下降主要出于提升经营质量考量,FY2012 财年公司营收 737 亿美元,同比增长 5.40%,相较于 FY2011 增速放缓。图表图表10:Mic

39、rosoft 资本开支波动原因详解资本开支波动原因详解 Amazon 官方电话会官方电话会 华泰研究华泰研究 FY 2009 FY2009Q4 业绩说明会(2009-07-24)We expect fiscal 2010 CapEx to be about$2 billion,down from the$3.1 billion in fiscal 2009,and to stay at or below that level for fiscal 2011 as we continue to focus on cash flow.In fiscal 2010,CapEx spend will

40、be below depreciation expense for the first time in years,helping continue the recent trend of free cash flow being greater than net income.译文:预计 FY2010 资本开支将为 20 亿美元,低于 2009 财年的 31 亿美元,预计 FY2011 将保持这个水平或更低,因为我们将加强对于现金流的关注。FY2010 资本开支将首次低于折旧费用,有助于延续近期自由现金流超过净利润的趋势。FY 2010 FY2010Q4 业绩说明会(2010-07-22)N

41、ow back to total Company results.In line with expectations,capital expenditures including finance leases were$5.8 billion,up 8%year-over-year to support growing usage and demand for cloud services.Cash paid for PP&E was$4.7 billion.Cash flow from operations was$18.7 billion and increased 16%year-ove

42、r-year driven by healthy cloud billings and collections.And free cash flow was$13.9 billion,up 16%.译文:包括融资租赁在内的资本开支为 58 亿美元,同比增长 8%,以支持云服务的使用和需求增长。不含融资租赁的资本开支为 47 亿美元,经营活动现金流为 187 亿美元,主要得益于健康的云计费和收款推动,同比增长 16%,自由现金流为 139 亿美元,同比增长 16%。FY 2012 FY2011Q4 业绩说明会(2012-07-21)We expect our effective tax rate

43、 to be 19%to 21%for the first quarter and full fiscal year,and we still expect capital expenditures for the full fiscal year to be about$2.5 billion.译文:我们预计 FY2012Q1 和 FY2012 的有效税率将为 19%至 21%,并且我们预计 FY2012资本支出约为 25 亿美元。资料来源:Microsoft Investor 官网、华泰研究 Google:资本开支七次波动向下,经营性平衡:资本开支七次波动向下,经营性平衡两两次,结构性调整

44、次,结构性调整五五次次。回顾 Google 的资本开支同比增速,2008 年、2009 年、2011 年、2012 年、2015 年、2019 年、2020 年分别同比减少 2%、66%、14%、5%、10%、6%、5%。1)2008 年主要由于年主要由于结构性调整结构性调整:2008 年资本开支为 23.6 亿美元(yoy-2%),08Q1-Q4资本开支分别为 8.42、6.98、4.52、3.68 亿美元(yoy+41.00%/+21.29%/-18.30%/-45.76%);2008 年资本开支同比减少 2%,云计算相关资产(Information technology assets)净

45、增值同比增长 8%,标志用于数据中心建设的资本开支并无明显缩减;2)2009 年主要由于年主要由于经营性平衡:经营性平衡:2009 年资本开支为 8.1 亿美元(yoy-66%),09Q1-Q4资 本 开 支 分别 为 2.63、1.39、1.86、2.21 亿 美 元(yoy-68.78%/-80.01%/-58.73%/-39.82%);2009 年资本开支同比大幅减少,主要由于公司重视经营质量,谨慎选择资本开支的投入时机,2009 年公司营收 237 亿美元,同比增长 8.51%,相较于 2008 年增速明显放缓(2008 年 yoy+31.35%)。3)2011 年年主要由于主要由于结

46、构性调整结构性调整:2011 资本开支为 34.4 亿美元(yoy-14%),11Q1-Q4资本开支分别为 8.90、9.17、6.80、9.51 亿美元(yoy+272.38%/+92.65%/-10.29%/-62.63%);2011Q4 资本开支同比下降明显,主要由于 2010Q4 资本开支中包含购买纽约办公大楼的开支;同时从云计算相关资产净增值角度来看,2011 年云计算相关资产净增值同比增长 73%,标志用于数据中心建设的资本开支并无明显缩减。4)2012 年主要由于年主要由于结构性调整结构性调整:2012 资本开支为 32.7 亿美元(yoy-5%),12Q1-Q4 资本 开 支

47、分 别 为 6.07、7.74、8.72、10.20 亿 美 元(yoy-31.80%/-15.59%/+28.24%/+7.26%);2012 年资本开支同比小幅下降,2012 年云计算相关资产净增值同比增长 19%,标志用于数据中心建设的资本开支并无明显缩减。5)2015 年年主要由于结构性调整:主要由于结构性调整:2015 资本开支为 99.2 亿美元(yoy-10%),15Q1-Q4资本开支分别为 29.27、25.15、23.73、21.00 亿美元(yoy+24.82%/-4.95%/-1.82%/-40.86%);2015Q4 资本开支同比大幅下降,主要由于 14Q4 资本开支中

48、包含房地产购买,同时从云计算相关资产净增值角度来看,2015 年云计算相关资产净增值同比增长 50%,标志用于数据中心建设的资本开支并无明显缩减。6)2019 年年主要由于主要由于经营性平衡经营性平衡:2019 资本开支为 235.5 亿美元(yoy-6%),19Q1-Q4资本开支分别为 46.38、61.26、67.32、60.52 亿美元(yoy-36.46%/+11.85%/+27.45%/-14.53%);2019 年资本开支略有下降,一方面由于 18Q1 购买位于纽约的办公大楼,另一方面由于公司整体业务增速放缓,2019 年公司营收 1619 亿美元,同比增长 18.30%,相较于

49、2018 年增速有所放缓(2018 年 yoy+23.42%)。7)2020 年年主要由于主要由于结构性调整结构性调整:2020 资本开支为 222.8 亿美元(yoy-5%),20Q1-Q4资本开支分别为 60.05、53.91、54.06、54.79 亿美元(yoy+29.47%/-12.00%/-19.70%/-9.47%);2020 年资本开支略有下降,云计算相关资产净增值同比增长 35%,标志用于数据中心建设的资本开支并无明显缩减。userid:93117,docid:163088,date:2024-05-27, 图表图表11:Google 资本开支波动原因详解资本开支波动原因详解

50、 Amazon 官方电话会官方电话会 华泰研究华泰研究 2008 2008Q4 业绩说明会(2009-01-22)Our CapEx for the quarter was$368 million.As in previous quarters,the majority of this CapEx is related to our IT infrastructure investments,including datacenters,production of servers,and networking equipment.译文:2008Q4 资本开支为 3.68 亿美元,与前几个季度一样

51、,大部分资本开支都与我们的 IT基础设施投资有关,包括数据中心、服务器生产和网络设备。2009 2009Q1 业绩说明会(2009-04-17)Capex for the quarter was$263.0 million and related primarily to our data center operation.This is down significantly from prior period.Google will continue to make significant investments to support our core business and please

52、 keep in mind that capex can be lumpy from quarter to quarter.译文:2009Q1 资本开支为 2.63 亿美元,主要与我们的数据中心运营有关,同比显著下降。谷歌将继续进行重大投资以支持我们的核心业务,资本开支可能存在季度性差异。There is no doubt though that because of the economies of scale that we have now with the size of the company and our better efficiencies,working at Mores

53、law,doing more with less,we obviously see a positive trend that are actually demonstrated in the last few quarters but I just want to reiterate that this thing is lumpy.译文:毫无疑问,由于公司规模扩大带来的规模经济和更高的效率,公司在摩尔定律的驱动下以更少的投入实现了更多的产出,这种积极的趋势在过去几个季度中得到了明显体现。然而,我想重申的是,这种情况可能会有波动性。2011 2010Q4 业绩说明会(2011-01-21)O

54、ur operating cash flow was very strong at$3.5 billion for the quarter.CapEx for the fourth quarter was$2.5 billion,I mean,obviously significantly above the last quarter,but remember that the majority of this increase was from the purchase of the New York building.译文:2010Q4 的经营现金流非常强劲,达到 35 亿美元,资本开支为

55、 25 亿美元,同比显著增加,主要由于本季度购买了纽约的一栋大楼。2012 2012Q1 业绩说明会(2012-04-12)Look,its lumpy because theres just timing decisions,right.We would-theres probably a few areas where we would have like to actually make investments in Q1 and for a bunch of logistics reasons or otherwise,we couldnt.译文:确实会有波动,这是因为存在时间安排上的

56、决策。可能有一些领域我们原本希望在第一季度进行投资,但由于各种物流原因或其他原因,我们未能如愿。2015 2014Q4 业绩说明会(2015-01-29)Lastly,if you go through the CapEx line,you will note that weve made real estate purchases in Q4,which helped us relieve both pressure on our work space for current employees but also to accommodate our future growth.And th

57、is also resulted in a large sequential increase in our real estate capital expenditures this quarter.译文:最后,如果你查看资本支出明细,你会注意到我们在第四季度(2014Q4)进行了房地产购买,这不仅帮助我们缓解了当前员工的办公空间压力,也为未来的增长提供了空间。这也导致了本季度房地产资本支出的显著环比增加。2019 2019Q1 业绩说明会(2019-04-29)With respect to CapEx,the year-on-year decline reflects the purch

58、ase of a building in New York in the first quarter of 2018.As discussed on our call last quarter,while we anticipate that our full year CapEx investments will exceed those in 2018,the growth in investments should be at a meaningfully lower rate than in 2018.We continue to expect a sizable investment

59、 in both compute requirements to support long-term growth,as well as in office facilities.译文:2019 年资本支出同比下降明显,主要由于 2018Q1 公司在纽约购买了一栋大楼。正如上季度电话会议上讨论的那样,我们预计 2019 年全年的资本支出投资将超过 2018 年,但投资增长的速度应显著低于 2018 年。我们仍然预期在计算需求和办公设施方面会有大量投资。2020 2019Q4 业绩说明会(2020-02-03)In terms of CapEx in 2020,we intend to incr

60、ease our investment in both technical infrastructure and office facilities versus 2019.Within technical infrastructure,the investments in particular support ongoing demand for machine learning across our business,as well as for Cloud,Search,Ads,and YouTube.译文:对于 2020 年的资本支出,我们计划增加在技术基础设施和办公设施方面的投资。在

61、技术基础设施方面,主要支持我们业务中对机器学习的持续需求,以及对云计算、搜索、广告和YouTube 的需求。资料来源:Google Investor 官网、华泰研究 Meta:资本开支一次波动向下,主要:资本开支一次波动向下,主要由于由于结构性调整结构性调整。回顾 Meta 的资本开支同比增速,2023 年资本支出为 272.7 亿美元,同比减少 13.25%,23Q1-Q4 资本开支分别为 68.42、62.16、65.43、76.65 亿美元(yoy+25.75%/-17.91%/-30.21%/-15.24%)。2023 年含融资租赁资本开支为 281 亿美元,主要是由于对服务器、数据中

62、心和网络基础设施的投资。从云计算相关资产净增值角度来看,2023 年云计算相关资产(Servers and network assets)净增值同比增长 43%,标志用于数据中心建设的资本开支并无明显缩减。图表图表12:Meta 资本开支波动原因详解资本开支波动原因详解 Amazon 官方电话会官方电话会 华泰研究华泰研究 2023 2023Q4 业绩说明会(2024-02-01)Capital expenditures,including principal payments on finance leases,were$7.9 billion,driven by investments i

63、n servers,data centers and network infrastructure.译文:2023Q4 包括对融资租赁的本金支付在内的资本开支为 79 亿美元,主要是由于对服务器、数据中心和网络基础设施的投资。资料来源:Meta Investor 官网、华泰研究 传统驱动:传统驱动:IaaS+PaaS+SaaS 服务贡献早期动能服务贡献早期动能 早期云厂商资本开支以云业务(早期云厂商资本开支以云业务(IaaS+PaaS+SaaS)为核心驱动,资本开支显著扩大的)为核心驱动,资本开支显著扩大的年份与云业务增速较快的年份基本对应。年份与云业务增速较快的年份基本对应。回顾 2008-

64、2023 年全球云计算市场发展历程,全球公有云服务市场规模增长在 2010 年、2016 年、2020 年出现显著提速,分别同比增长73.73%、32.21%、45.31%,为应对云服务需求的持续释放,公有云厂商强化算力基础设施建设,资本开支规模在对应年份显著扩大。2022 年,在宏观经济下行和通胀压力的双重影响下,全球公有云服务市场增速明显下降。以 Amazon、Microsoft、Google 云业务为例,三家企业的云业务增速明显下滑,CY 2022Q4 Amazon、Microsoft、Google 云业务同比增速分别为 20%、31%、33%,增速同比下降 20pct、15pct、12

65、pct。伴随大语言模型开启生成式 AI 新周期,大模型训练、推理需求成为云资本开支增长的新兴动力。图表图表13:2008-2023 年海外云厂商年海外云厂商资本开支与全球云计算市场规模同频共振资本开支与全球云计算市场规模同频共振 资料来源:Gartner、Amazon Investor 官网、Microsoft Investor 官网、Google Investor 官网、华泰研究 图表图表14:2020Q1-2024Q1 云业务收入同比增速变化云业务收入同比增速变化 注:各家公司均为自然年口径 资料来源:Amazon Investor 官网、Microsoft Investor 官网、Goo

66、gle Investor 官网、华泰研究 新兴驱动新兴驱动:扩大资本开支成为共识,:扩大资本开支成为共识,AI 算力算力成为新一轮成为新一轮建设建设重点重点 云厂商积极布局云厂商积极布局 MaaS 服务服务,扩大资本开支成为企业共识。,扩大资本开支成为企业共识。进入大模型时代,云服务增长呈现传统服务与大模型服务双轮驱动的新局面。1)传统云服务稳步传统云服务稳步提升:提升:根据 Gartner预测,2025 年在应用软件、基础设施软件、业务流程服务、系统基础设施等市场中将有51%的 IT 支出从传统解决方案转向公有云(2022 年为 41%),据 IDC 预测,2027 年全球公有云 IaaS+

67、PaaS 市场规模有望达 6,198 亿美元,2023-2027 年 CAGR 为 24.7%;2)模型服务快速增长:模型服务快速增长:2023 年云厂商加快针对 AI 大模型训练、推理的云端算力建设,23Q3开始 Google、Amazon、Meta 资本开支环比增长,微软 23Q4 资本开支环比下降主要受第三方合同交付影响,部分资本开支递延至 24Q1,扩大资本开支成为企业共识。图表图表15:公有云公有云(IaaS+PaaS)市场)市场规模预测(按工作负载分类)规模预测(按工作负载分类)资料来源:IDC、华泰研究 2,052 2,592 3,277 4,099 5,072 6,198 01

68、,0002,0003,0004,0005,0006,0007,00020222023E2024E2025E2026E2027E(亿美元)开发工具与应用商业应用数据管理数字设备协作应用基础设施技术应用 图表图表16:22Q2-24Q1 Microsoft 季度季度资本开支资本开支及环比变化及环比变化 图表图表17:22Q2-24Q1 Google 季度资本开支及环比变化季度资本开支及环比变化 资料来源:Microsoft 官网、华泰研究 资料来源:Google 官网、华泰研究 图表图表18:22Q2-24Q1 Amazon 季度资本开支及环比变化季度资本开支及环比变化 图表图表19:22Q2-2

69、4Q1 Meta 季度资本开支及环比变化季度资本开支及环比变化 资料来源:Amazon 官网、华泰研究 资料来源:Meta 官网、华泰研究 24 年资本开支规模有望快速增长,看好全球算力需求持续上涨。年资本开支规模有望快速增长,看好全球算力需求持续上涨。根据 CY23Q4 财报后的公开业绩说明会指引(具体表述详见图表 20),Microsoft、Google、Meta、Amazon 均明确表示 24 年将扩大资本开支规模。根据 CY24Q1 财报后的公开业绩说明会指引,各家公司态度更加明确,Microsoft 表示预计 2025 财年资本开支将高于 2024 财年;Google 表示24 年季

70、度资本开支将保持或超过 24Q1 水平(120 亿美元),全年 CapEx 或超 480 亿美元(对应 yoy+49%);Amazon 表示 24Q1(140 亿美元)或为 24 年资本开支最低季度,全年 CapEx 支出或超 560 亿美元(对应 yoy+16%);Meta 再次上调全年 CapEx 指引至350-400 亿美元(高于此前的 300-370 亿美元),按指引中值计算,预计同比增长 37%。29%-9%0%5%35%11%-2%13%-20%-10%0%10%20%30%40%02040608010012022Q222Q322Q423Q123Q223Q323Q424Q1(亿美元

71、)Microsoft资本开支qoq-30%7%4%-17%10%17%37%9%-40%-20%0%20%40%60%020406080Q222Q322Q423Q123Q223Q323Q424Q1(亿美元)Google资本开支qoq3%7%3%-15%-20%9%18%4%-40%-20%0%20%40%020406080018022Q222Q322Q423Q123Q223Q323Q424Q1(亿美元)Amazon资本开支qoq39%24%-4%-24%-9%5%17%-17%-40%-20%0%20%40%60%0070809

72、010022Q222Q322Q423Q123Q223Q323Q424Q1(亿美元)Meta资本开支qoq 图表图表20:23Q4 及及 24Q1 年海外云厂商资本开支指引对比年海外云厂商资本开支指引对比 公司公司 23Q4 电话会指引电话会指引 24Q1 电话会指引电话会指引 Microsoft We expect capital expenditures to increase materially on a sequential basis,driven by investments in our cloud and AI infrastructure and the flip of a

73、delivery date from Q2 to Q3 from a third-party provider noted earlier.译文:我们预计 FY24Q3(即 CY24Q1)资本开支将在历史基础上显著增显著增加加,主要由于在云计算和人工智能基础设施方面的投资、以及第三方供应商交付日期从 FY24 Q2 调整到 FY24 Q3 所驱动。We expect capital expenditures to increase materially on a sequential basis driven by cloud and AI infrastructure investments

74、.译文:我们预计由于云计算和人工智能基础设施的投资,资本支出将在历史基础上显著增加显著增加。In FY2025,that focus on execution should again lead to double-digit revenue and operating income growth to scale to meet the growing demand signal for our cloud and AI products,we expect FY2025 capital expenditures to be higher than FY2024.译文:在 2025 财年,在

75、公司经营策略下,收入和营业利润将再次实现两位数增长,我们将扩大规模以满足云计算和人工智能产品日益增长的市场需求。因此,预计预计 2025 财年的资本支出将高于财年的资本支出将高于 2024 财年财年。Google The step-up in CapEx in Q4 reflects our outlook for the extraordinary applications of AI to deliver for users,advertisers,developers,cloud enterprise customers and governments globally and the

76、long-term growth opportunities that offers.In 2024,we expect investment in CapEx will be notably larger than in 2023.译文:第四季度资本开支的增加反映了我们对人工智能应用前景的看法,这些应用将为全球用户、广告商、开发者、云企业客户、政府提供服务,并将带来长期的增长机会。2024 年我们预在资本开支将显著超过显著超过 2023 年。With respect to CapEx,our reported CapEx in the first quarter was$12 billion

77、,once again driven overwhelmingly by investment in our technical infrastructure with the largest component for servers followed by data centers.The significant year-on-year growth in CapEx in recent quarters reflects our confidence in the opportunities offered by AI across our business.Looking ahead

78、,we expect quarterly CapEx throughout the year to be roughly at or above the Q1 level.译文:关于资本支出,24Q1 资本支出为 120 亿美元,再次由基础设施投资所推动,其中最大的部分是服务器,其次是数据中心。最近几个季度资本支出同比大幅增长,反映了我们对 AI 业务的信心。展望未来,我们预展望未来,我们预计全年每个季度资本支出大致会在第一季度的水平或以上计全年每个季度资本支出大致会在第一季度的水平或以上。Amazon As we look forward to 2024,we anticipate CapE

79、x to increase year-over-year,primarily driven by increased infrastructure CapEx,support growth of our AWS business,including additional investments in generative AI and large language models.译文:展望 2024 年,我们预计资本开支将同比增加同比增加,主要是由于基础设施资本开支的增加,以支持我们 AWS 业务的增长,包括在生成式 AI 和大型语言模型上的额外投资。We anticipate our ove

80、rall capital expenditures to meaningfully increase year-over-year in 2024,primarily driven by higher infrastructure CapEx to support growth in AWS,including generative AI.译文:我们预计 2024 年的整体资本支出将同比显著增加显著增加,主要由更高的基础设施资本支出驱动,以支持 AWS 的增长,包括生成式人工智能。Right now,in Q1,we had$14 billion of CapEx.We expect that

81、 to be the low quarter for the year.译文:24Q1 资本支出为 140 亿美元,预计这是预计这是 24 年最低的季度支出。年最低的季度支出。Meta We dont have a clear expectation for exactly how much this will be yet,but the trend has been that state-of-the-art large language models have been trained on roughly 10 x the amount of compute each year.译文:

82、我们还没有一个明确的预期,到底需要多少计算能力,但是趋势是,最先进的大型语言模型每年的计算量大约增加每年的计算量大约增加 10 倍。倍。We anticipate our full year 2024 capital expenditures will be in the range of$30 billion to$37 billion,a$2 billion increase of the high end of our prior range.We expect growth will be driven by investments in servers,including both

83、AI and non-AI hardware,and data centers as we ramp up construction on sites with our previously announced new data center architecture.译文:我们预计 2024 年资本开支将在 300-370 亿美元,较公司之前预测的公司之前预测的最高值增加了最高值增加了 20 亿美元亿美元。我们预期资本开支增长将由服务器投资推动,包括 AI、非 AI 硬件以及我们将加快建设先前宣布的新数据中心站点。We anticipate our full year 2024 capita

84、l expenditures will be in the range of$35 billion to$40 billion,increased from our prior range of$30 billion to$37 billion as we continue to accelerate our infrastructure investments to support our AI roadmap.While we are not providing guidance for years beyond 2024,we expect CapEx will continue to

85、increase next year as we invest aggressively to support our ambitious AI research and product development efforts.译文:我们预计,2024 年年资本支出将在资本支出将在 350 亿到亿到 400 亿美元亿美元,高于此前300 亿到 370 亿美元的预期范围,我们将继续加快基础设施投资,以支持公司的人工智能路线图。虽然我们没有提供 2024 年以后的指导,但我们我们预计预计 25 年的资本支出将继续增加年的资本支出将继续增加,因为我们将积极投资以支持我们雄心勃勃的人工智能研究和产品开

86、发工作。资料来源:Amazon Investor 官网、Microsoft Investor 官网、Google Investor 官网、Meta Investor 官网、华泰研究 AI 需求需求 1:云厂商云厂商加速加速 MaaS 布局,满足布局,满足外供外供训练训练&推理推理 外供视角看,云厂商的外供视角看,云厂商的 AI 算力建设算力建设主要通过满足企业的大模型训练及推理需求。主要通过满足企业的大模型训练及推理需求。23 年开始,云厂商加速 MaaS(Model as a Service,模型即服务)服务布局,构建大模型端到端服务体系。目前 MaaS 服务架构主要包括算力层、模型层、工具

87、层、应用层。1)算力层:)算力层:包括外购算力(英伟达、AMD 等)与自研芯片(Microsoft Maia 100 芯片、Google TPU芯片、Amazon Trainium 芯片)两类方案;2)模型层:)模型层:主要包括独家模型/自研模型、第三方模型两类方案,云厂商可提供百余种模型选择;3)工具层:工具层:主要提供模型微调、数据接地、安全监测、Agent 定制等模型训练、应用开发工具;4)应用层:)应用层:主要提供代码助手、云助手、办公助手等云厂商 AI 服务,同时支持企业级的定制应用部署。成熟大模型运营有望带来成熟大模型运营有望带来 3,169 亿美元的服务器增量市场,云托管仍是海外

88、企业的主流选亿美元的服务器增量市场,云托管仍是海外企业的主流选择方案。择方案。对比各家公司 MaaS 的最新进展,1)工具层:软件能力正逐步趋同,数据质量与数据规模的重要性日益凸显;2)应用层:主要与各家公司原有产品布局相关;3)模型层:独家供应的优质模型与自研小模型成为重要发力点;4)算力层:重点在可用算力规模及算力使用效率。总结来看,我们认为,算力规模与模型能力是后续的竞争重点。根据华泰研究预测,全球成熟大模型运营有望带来 3,169 亿美元的服务器增量市场,较 2023年 211 亿美元的 AI 服务器市场而言,仍有较大成长空间(具体测算参考华泰计算机团队2024 年 4 月 12 日专

89、题报告全球 AI 算力需求继续向上)。根据 a16z调查,海外企业的大模型部署中 72%的企业选择使用模型 API 服务,其中 52%来自云厂商托管。图表图表21:主流云厂商主流云厂商 MaaS 服务差异化对比服务差异化对比 资料来源:Amazon 官网、Microsoft 官网、Google 官网、华泰研究 图表图表22:云托管仍是海外企业模型服务的重要来源云托管仍是海外企业模型服务的重要来源 资料来源:16 Changes to the Way Enterprises Are Building and Buying Generative AI,a16z(2024)、华泰研究 Amazon:

90、云:云计算先发者计算先发者,23 年加速年加速 AI 追赶追赶 Amazon re:Invent 2023 大会展示大会展示 AI 布局。布局。Amazon 作为云计算服务的先发布局者,2017-2023 年公有云服务市占率始终保持行业第一。2023 年 11 月 28 日 Amazon re:Invent 2023 大会召开,针对 Amazon MaaS 服务布局展开全面介绍。1)算力层:)算力层:发布自研 AI 芯片 Trainium 2,提到 Anthropic 计划用 Trainium 2 芯片构建模型;宣布 Amazon成为在云端配备英伟达 GH200 Grace Hopper 芯片

91、的首家云大厂;2)模型层:)模型层:宣布扩大与 Anthropic(投资 40 亿美元)的合作;3)工具层:)工具层:通过 Amazon Bedrock 提供模型微调、RAG、持续预训练、Agents 开发、安全防护等能力;4)应用层:)应用层:推出 Amazon Q 问答助手,定价 20 美元/人/月,可应用在企业云服务、代码开发、数据分析等场景,并支持Salesforce、Microsoft、Google、Slack 等 40 多家公司的商业应用程序开箱即用。图表图表23:Amazon MaaS 服务布局服务布局 资料来源:Amazon 官网、华泰研究 立足云业务客户优势,立足云业务客户优

92、势,B 端业务拓展顺利。端业务拓展顺利。得益于云计算客户的多年合作积累,Amazon的 MaaS 服务尽管推出时间相对较晚,但仍然取得了较好的实质进展。根据公司 2023 年股东信内容,Amazon 的 MaaS 服务已实现在 Amgen(安进公司)、Merck(默克)、Salesforce(赛富时)、Accor(雅高酒店集团)、MUFG(三菱日联金融集团)、Axiata Group Berhad(亚通集团)等多行业企业客户的合作落地。根据 Amazon re:Invent 2023大会介绍,Amazon MaaS 服务已合作超 10,000 家成熟企业。2024 年,Amazon 的 AI

93、布局进一步推进,24Q1 发布 Rufus(AI 购物助理)、Fit Insights Tool(个性化尺码推荐)等AI 工具;2024 年 4 月宣布吴恩达博士加入 Amazon 董事会,负责生成式 AI 相关技术落地。Microsoft:MaaS 转型顺利,转型顺利,商业化逐步落地商业化逐步落地 战略投资战略投资 OpenAI 掌握商业化先机,掌握商业化先机,MaaS 服务布局完善。服务布局完善。微软成为生成式 AI 商业落地的先行者,原因有二:一是,凭借对 OpenAl 的投资,微软天然掌握先进模型的接触与应用机会,早在 2021 年微软就发布了初代版本的 Github Copilot

94、助手,开展了产品化试点;二是,作为以企业客户为核心客群的软件厂商,微软的 SaaS 应用全面覆盖了企业的业务管理流程,具备广泛的 Al+产品整合触点,实现了商业化落地内部验证。2023 年 11 月 16日微软 Ignite 大会介绍了 MaaS 服务整体布局。1)算力层:)算力层:发布自研 AI 芯片 Maia 100;2)模型层:)模型层:提供 OpenAI 模型的独家供应;3)工具层:)工具层:提供完善的端到端工具,推出Copilot Studio 允许客户自定义 A I 助手;4)应用层:)应用层:进一步明确 Copilot 商业版图,分为Copilot(免费版)、Copilot Pr

95、o(个人版,20 美元/人/月)、Copilot for Microsoft 365(企业版,30 美元/人/月)、Copilot for Sales/Service(升级版,50 美元/人/月)四类订阅方案。图表图表24:Microsoft MaaS 服务布局服务布局 资料来源:Microsoft 官网、华泰研究 商业化进展顺利,商业化进展顺利,24Q1 AI 贡献的贡献的 Azure 收入占比达收入占比达 7%。根据公司业绩说明会,AI 业务已在云收入中初步体现,FY23Q4(23Q2)AI 占 Azure 收入比重为 1%,FY24Q1(23Q3)提升至 3%,FY24Q2(23Q4)提

96、升至 6%,FY24Q3(24Q1)提升至 7%。根据 23Q4 业绩说明会,Azure AI 客户数已从 23Q3 的 18,000 家提升至 23Q4 的 53,000 家。不同于 Amazon、Google,Microsoft 具有良好的 B 端 SaaS 应用产品基础,自有应用的AI 整合触点更加丰富。目前 Microsoft 365 全线产品基本实现 Copilot 升级。图表图表25:微软微软 AI 业务推进情况梳理业务推进情况梳理 资料来源:Microsoft 官网、华泰研究 Google:MaaS 布局日趋完善布局日趋完善,初创,初创 AI 企业热门选择企业热门选择 应用应用+

97、工具服务全面升级,工具服务全面升级,Google MaaS 能力提升。能力提升。2024 年 4 月 9 日,Google Cloud Next 2024 大会举办“The new way to cloud”开幕演讲,对于 Google MaaS 服务布局进行更新。1)算力层:)算力层:发布新一代 AI 芯片 TPU v5p,计算能力相较上一代提升 4 倍,Character.AI 开始使用 TPU 实现大模型的训练、推理;推出搭载 NVIDIA H100 芯片的全新 A3 Mega VM 虚拟机,预计将于 24 年 5 月上市;2)模型层:)模型层:发布 Gemini 1.5 Pro,上下文

98、窗口从 128K tokens 提升到 1M tokens(约等于 70 万个单词或 3 万行代码),是目前已发布的上下文窗口最大的闭源模型;3)工具层:)工具层:强化工具层功能布局,推出 Google Search Grounding(通过 Google 搜索实现联网数据接地)、AutoSxS(模型能力对比)、Prompt Management(提示此优化)、Agent Builder(智能体创建)等功能;4)应用层:)应用层:全面升级 Gemini for Google Cloud,实现 AI 助手与 Workspace、Bigquery、数据库、云安全、代码开发等云服务的全面整合。图表图

99、表26:Google MaaS 服务布局服务布局 资料来源:Google 官网、华泰研究 图表图表27:Google AI+应用布局应用布局 资料来源:Google 官网、华泰研究 成为初创成为初创 AI 企业的热门选择,加速成熟企业的热门选择,加速成熟 B 端客户拓展。端客户拓展。根据 Google Cloud Next 2024 大会介绍,超多 60%的 Generative AI 初创企业以及接近 90%的 GenAI 独角兽企业都是 Google Cloud 客户。同时,Google MaaS 服务已经在 Bayer(拜耳)、Best Buy(百思买)、Discover Financi

100、al(发现金融服务公司)、IHG Hotels&Resorts(洲际酒店集团)、Mercedes-Benz(梅赛德斯-奔驰)、Covered California(加州全保)等各行业客户落地。图表图表28:Google MaaS 合作客户案例合作客户案例 资料来源:Google 官网、华泰研究 AI 需求需求 2:大模型大模型渗透渗透基础业务,基础业务,大厂大厂自用需求自用需求或或放量放量 从自用视角看,从自用视角看,大模型大模型向搜索向搜索/推荐推荐/广告等互联网传统业务广告等互联网传统业务渗透,渗透,或带动自用或带动自用 AI 算力需求算力需求加速释放加速释放。除提供 MaaS 服务外,海

101、外科技厂商积极探索大模型在搜索/广告/推荐场景的技术落地,自用算力需求旺盛。从收入结构上看,搜索/广告/推荐相关业务在 Meta、Google、Amazon 收入占比均超过 50%,算法效果提升对于企业经营来说意义重大;从技术迭代上看,相较于传统推荐模型,大模型具备更好的外部知识与泛化能力,可实现跨域个性化推荐,优化算法效果;从业务进展上看,23 年 5 月 Microsoft 开放 Bing Chat 功能,23 年 10 月 Google 推出生成搜索体验(Search Generative Experience,SGE),24 年 2月 Amazon 推出 Rufus AI 购物助手,2

102、4 年 3 月 Meta 在电话会(Morgan Stanley 2024 Technology,Media&Telecom Conference)中介绍公司正在打造跨产品的 AI 推荐模型。图表图表29:搜索搜索/广告广告/推荐推荐相关业务在大厂中的收入占比相关业务在大厂中的收入占比 注:图中 Meta、Google、Amazon 收入为 2023 年收入,Microsoft 为 FY2023 收入,单位均为亿美元 资料来源:Amazon 官网、Microsoft 官网、Google 官网、Meta 官网、华泰研究 大模型发挥大模型发挥增强增强数据特征、数据特征、强化语义理解、强化语义理解、

103、优化交互范式优化交互范式等等作用作用,有助于有助于算法效果提升算法效果提升。搜索/广告/推荐算法存在需求共性(匹配用户的兴趣和需求)与技术共性(分为过滤候选、排序候选、个性化输出),大模型与搜索/广告/推荐等业务融合,具备较强的技术可行性。1)增强数据特征增强数据特征:大模型相较于传统推荐模型,具有更强的外部通用知识和逻辑推理能力,可以对用户画像、项目内容进行有效的特征补充;2)强化语义理解:)强化语义理解:在过滤候选阶段,大模型可发挥自然语言理解能力,可以更好地理解用户的查询/行为意图,实现更精准的内容筛选;3)优化交互范式优化交互范式:大模型可同时发挥多轮对话、情绪感知等能力,通过生成式方

104、式,将传统的列表式输出转变为对话式输出,提供更具个性化、交互感的反馈结果。本章节以推荐系统为例,针对大模型+推荐系统的理论、实践、潜在影响进行了深度分析。图表图表30:搜索搜索/广告广告/推荐推荐技术技术流程示意流程示意及潜在大模型融合方向及潜在大模型融合方向 资料来源:推荐系统三十六式,CSDN、华泰研究 理论:大模型理论:大模型落地落地推荐推荐系统,具备技术可行性系统,具备技术可行性 大模型大模型落地推荐系统具备技术可行性,拥有落地推荐系统具备技术可行性,拥有丰富的理论研究基础丰富的理论研究基础。为了深入解答大模型如何实现在搜索/广告/推荐场景的技术落地,我们以推荐系统为例,详细总结了大模

105、型在传统推荐系统的落地方向与研究进展。方向一:方向一:不改变推荐系统的分层推荐架构,实现 LLM与传统 CRM 的单点/多点融合,强化推荐系统某项步骤的效果,2021-2023 年期间的论文研究多为此类研究方向;方向二:方向二:从数据建模、模型结构等方向全面重塑推荐系统,打造生成式推荐系统,2024 年多篇论文转向此类研究方向。总结来看,传统架构下 LLM 的融合作用仍存在局限性,新技术架构有望更好地释放大模型的技术潜能。图表图表31:大模型大模型+推荐系统研究发展趋势及代表论文推荐系统研究发展趋势及代表论文 资料来源:How Can Recommender Systems Benefit f

106、rom Large Language Models:A Survey(2024)、华泰研究 传统架构传统架构:大模型与大模型与 CRM 的单点的单点/多点整合多点整合,效能优化是重点,效能优化是重点 传统架构下,传统架构下,大模型大模型可实现可实现与传统推荐与传统推荐模型模型的的优势互补。优势互补。参考论文How Can Recommender Systems Benefit from Large Language Models:A Survey(JIANGHAO LIN,2024-02),传统推荐模型(Conventional Recommendation Model,CRM),只能利用数据

107、集内的知识,缺乏对于语义信息及深度意图的推理能力,同时跨域推荐能力较弱;大语言模型通过大规模预训练语料和自监督训练,引入了外部世界知识,具备较强语义理解与泛化能力,可有效补充传统推荐模型的不足,有望提升推荐性能,优化用户体验。图表图表32:大模型与传统推荐模型可实现优势互补大模型与传统推荐模型可实现优势互补 资料来源:How Can Recommender Systems Benefit from Large Language Models:A Survey(2024)、华泰研究 传统推荐架构下,传统推荐架构下,LLM 可实现单点或多点整合。可实现单点或多点整合。基于深度学习的推荐系统包括六个

108、阶段。1)数据采集:)数据采集:主要通过线上收集用户行为和记录,得到原始数据(Raw data);2)特征)特征工程:工程:主要对原始数据进行筛选加工,将原始数据进一步处理为结构化数据(Structured data);3)特 征 编 码:)特 征 编 码:对 结 构 化 数 据 进 行 编 码,得 到 对 应 的 向 量 表 示(Neural embeddings);4)打分排序:)打分排序:对候选物品进行打分排序,得到要呈现给用户的排序列表(Ranked items list);5)用户交互:)用户交互:向目标用户展示推荐项目的方式及用户向推荐系统提供反馈的方式;6)流程控制:)流程控制:

109、作为中央控制器,把控推荐系统的整体流程。根据已有研究,LLM 可实现以上阶段的单点或多点整合。伴随基础模型的能力提升,大模型+推荐系统呈现出从单点到多点、从辅助环节到核心环节、从浅层融合到深度应用的转变。图表图表33:基于深度学习的推荐系统架构及基于深度学习的推荐系统架构及 LLM 可应用场景可应用场景 注:标星的为常见的大模型应用环节 资料来源:How Can Recommender Systems Benefit from Large Language Models:A Survey(2024)、华泰研究 图表图表34:LLM 在传统推荐系统各环节的典型研究成果在传统推荐系统各环节的典型研

110、究成果 注:图中英文展示了各环节的典型研究项目名称及对应的论文发表年份,以 U-BERT 21 为例,该项目旨在实现文本编码增强,论文于 2021 年发表 资料来源:How Can Recommender Systems Benefit from Large Language Models:A Survey(2024)、华泰研究 特征工程:利用特征工程:利用 LLM 外部知识实现原始数据补充。外部知识实现原始数据补充。在特征工程阶段,LLM 可以将原始特征(如项目描述、用户画像、用户行为等)作为输入,生成辅助的文本特征,实现原始数据的特征增强,丰富模型的训练数据。此部分研究工作主要分为两类:1

111、)用户)用户(user)级和项目级和项目(item)级特征级特征增强:增强:利用 LLM 的外部知识完善用户画像、项目画像,更好地进行用户偏好建模及项目内容理解;2)实例级训练样本生成:)实例级训练样本生成:利用 LLM 的推理能力直接生成项目样本,丰富训练数据集。图表图表35:LLM 在特征工程阶段的应用场景在特征工程阶段的应用场景及研究成果概览及研究成果概览 资料来源:How Can Recommender Systems Benefit from Large Language Models:A Survey(2024)、华泰研究 特征编码:利用特征编码:利用 LLM 作为文本编码器,为文

112、本信息提供更好的语义理解。作为文本编码器,为文本信息提供更好的语义理解。在特征编码阶段,LLM 发挥强大的语义理解能力,实现用户表征、物品表征的文本特征增强。除此之外,LLM 还可以以自然语言为桥梁,对齐不同领域的异构信息,实现模型的跨域推荐。传统的推荐模型多基于 ID 进行 item 的表征学习和推荐,大语言模型转而使用自然语言描述 item,解决过去依赖 ID 的问题,可以更好地实现模型的跨域推荐,基于 Item Sequence(将item 所有相关内容,如标题、品牌、价格等属性拼接成句子)推荐即为典型代表。图表图表36:LLM 在特征编码阶段可强化文本信息的理解在特征编码阶段可强化文本

113、信息的理解 资料来源:How Can Recommender Systems Benefit from Large Language Models:A Survey(2024)、华泰研究 打分排序:使用打分排序:使用 LLM 作为打分作为打分/排序工具,得到相关性更好的输出列表。排序工具,得到相关性更好的输出列表。打分排序是推荐系统中较为关键的部分,LLM 可作为项目的打分/排序工具,目前多通过在 LLM 训练中引入打分/排序等任务来实现。1)项目评分:)项目评分:利用 LLM 对候选项目进行逐一评分,最后根据分数排序得到最终的项目列表;2)项目生成:)项目生成:通过生成式的方式直接生成排序列

114、表;3)混合任务:混合任务:LLM 天然适合多任务场景(包括评分任务、生成任务等),可以规范不同推荐场景的输入输出,并在跨域样本上进行预训练,使用者后续可通过 Prompt 执行对应任务。图表图表37:LLM 在打分排序阶段的应用场景在打分排序阶段的应用场景举例举例 资料来源:How Can Recommender Systems Benefit from Large Language Models:A Survey(2024)、华泰研究 用户交互用户交互:使用:使用 LLM 提供多轮对话的交互体验,实现用户需求的深度挖掘。提供多轮对话的交互体验,实现用户需求的深度挖掘。传统的推荐模式下,推荐

115、多为单回合交互,仅对推荐后的单次用户行为(是否点击、是否购买)进行监控。基于 LLM 的推荐交互多以多轮对话的形式呈现,可以通过整合对话中的上下文并应用广泛的开放世界知识,丰富对于用户偏好、项目建议、定制化需求等内容的理解。根据用户交互模型不同,可分为任务导向型用户交互、开放式用户交互。1)任务导向型:)任务导向型:假设用户具有明确的意图,而推荐系统需要支持用户的决策过程或协助用户找到相关的项目,LLM 被集成为推荐系统的一个组件,专门用于分析用户的意图;2)开放式:)开放式:假设用户的意图不明确,系统需要逐渐获取用户的兴趣或通过交互(包括主题对话、闲聊、问答等)引导用户最终实现推荐目标,LL

116、M 不局限于对话生成功能,而是兼具意图引导与获取功能。图表图表38:LLM 在在用户交互用户交互阶段的应用场景阶段的应用场景范例范例 资料来源:How Can Recommender Systems Benefit from Large Language Models:A Survey(2024)、华泰研究 流程控制:流程控制:LLM 不再仅应用于推荐系统中的某一部分,而是参与到推荐流程的整体控制。不再仅应用于推荐系统中的某一部分,而是参与到推荐流程的整体控制。随着基础模型的参数量扩大,LLM 开始表现出上下文学习、指令遵循、逐步推理、工具使用等能力,因此使用 LLM 作为推荐系统的流程控制器

117、(可以看作是推荐场景下的 Agent),可以使推荐过程更具交互性与可解释性。以 Google 发布的 RecLLM 为例,LLM 实现在推荐系统的多点落地,并成为整体流程运行的决策单元,LLM 能够管理对话、理解用户偏好、实现项目排名,甚至提供可控的基于 LLM 的用户模拟器生成合成对话。图表图表39:LLM 在流程控制阶段的应用在流程控制阶段的应用范例范例 资料来源:Is Chatgpt fair for recommendation?evaluating fairness in large language model recommendation(2023)、华泰研究 LLM 落地呈现出

118、从落地呈现出从单点到多点单点到多点、从、从辅助环节辅助环节到到核心环节核心环节的的演进演进趋势。趋势。从工程实践的角度来看,LLM+RS 落地存在两类变量因素,一是大模型是否需要微调(Tune or Not tune LLM),二是推理阶段是否需要引入传统推荐模型(With or w/o CRM)。回顾学术研究发展趋势(从第一象限到第三象限到第二、四象限再到第一象限),我们得到两大结论,一是一是 LLM与与推荐系统推荐系统协同至关重要协同至关重要,二是二是 LLM 基础能力决定基础能力决定其在推荐系统中的其在推荐系统中的应用深度应用深度。1)LLM 与推荐系统协同至关重要与推荐系统协同至关重要

119、:伴随基础模型参数量扩大与通用能力提升,LLM+RS研究从“微调 LLM+CRM 参与”(第一象限)向“不微调 LLM+CRM 不参与”(第三象限)演进,但从实践结果看,第三象限模型效果普遍落后于其他象限结果,证明尽管大模型具备通用知识,但推荐系统域内专有知识仍然具有重要作用。因此后续延续研究向“不微调LLM+CRM 参与”(第二象限,引入 CRM 进行协同),“微调 LLM+CRM 不参与”(第四象限,引入 CRM 数据进行协同)演进,通用能力+垂直数据的技术路径成为主流共识。2)LLM 基础能力决定基础能力决定其其应用深度应用深度:伴随基础模型的能力提升,LLM 在推荐系统中的应用深度愈发

120、深入;以第一象限为例(相同象限内对应相似的工程方案),早期使用规模较小的 LLM 时,LLM 主要用在特征编码等辅助环节场景;后续随基础模型参数量及泛化能力变化,LLM 开始应用于打分排序等核心环节,并逐步实现特征工程、特征编码、打分排序等多点融合,后续演进出将 LLM 作为流程控制器的全环节部署架构。图表图表40:传统推荐架构下大模型与推荐系统融合的演进趋势传统推荐架构下大模型与推荐系统融合的演进趋势 资料来源:How Can Recommender Systems Benefit from Large Language Models:A Survey,JIANGHAO LIN(2024)、

121、华泰研究 新兴架构新兴架构:重塑范式,打造基于重塑范式,打造基于 Transformer 的的第三代第三代推荐系统推荐系统 新新兴兴架构架构有助于充分释放有助于充分释放 LLM 的的跨域推荐能力跨域推荐能力。传统架构下,LLM 被视为基于深度学习的推荐系统的赋能工具,核心在于发挥 LLM 的文本理解与生成能力,通过文本特征增强以提升推荐内容的相关性,本质上是在特定环节使用 LLM 替代传统深度学习模型。新兴架构下,生成式推荐模型全面参考大语言模型的训练方法与应用范式,用文本统一表示,用Prompt 统一任务,构建全新的统一生成式推荐范式。1)用文本统一表示:)用文本统一表示:将项目信息构造成序

122、列(Sequence)形式,形成模型的训练语料,同时解决了传统推荐模型下数据异构问题,可以更好地实现跨域推荐;2)用)用 Prompt 统一任务:统一任务:Prompt learning 思想非常简单,即对每一个任务使用一个 Prompt 去进行描述,推荐模型经过大量语料训练同样具有较好的泛化能力,用户可以通过构造不同的 Prompt 描述,引导模型完成特定的工作。图表图表41:生成式推荐架构采用文本序列统一用户及项目表征生成式推荐架构采用文本序列统一用户及项目表征 资料来源:Text Is All You Need:Learning Language Representations for

123、Sequential Recommendation(2023)、华泰研究 生成式生成式推荐模型有望成为基于深度学习推荐系统之后的第三代推荐系统。推荐模型有望成为基于深度学习推荐系统之后的第三代推荐系统。推荐系统的技术迭代受到数据体量、个性化需求、泛化能力要求等因素变化驱动。第一代推荐系统(以1992 年提出协同过滤概念为重要标志)主要解决信息过载问题;第二代推荐系统(以2016 年 Google 推出 Wide&Deep 推荐框架为重要标志)主要解决推荐的个性化问题;第三代推荐系统(以 Meta 提出 Generative Recommendations 为重要标志)旨在构建具备泛化能力的统一

124、推荐模型,同时提升用户意图理解与项目推荐效果。图表图表42:生成式推荐模型有望成为第三代推荐系统生成式推荐模型有望成为第三代推荐系统 资料来源:A Brief History of Recommender Systems(2022)、Actions Speak Louder than Words:Trillion-Parameter Sequential Transducers for Generative Recommendations(2024)、华泰研究 实践:实践:Meta、Google 加速探索大模型的推荐场景落地加速探索大模型的推荐场景落地 Meta:“三步走”战略明确,统一推荐系

125、统或将“三步走”战略明确,统一推荐系统或将 26 年落地年落地 Meta 重视推荐系统重视推荐系统 AI 升级,战略布局升级,战略布局进入第三阶段进入第三阶段。根据 Meta 在 Morgan Stanley 2024 Technology,Media&Telecom Conference 的公开采访纪要,Meta 正改变过去将为每个产品单独设计推荐模型的做法,转而构建跨产品线(Reels、Feed、Groups 等)的统一 AI 推荐模型。全新的 AI 推荐系统已成为 Meta 2026 年技术路线图的重要组成部分,预计分为三个阶段逐步落地。阶段一:阶段一:将现有推荐系统由 CPU 推理转向

126、 GPU 推理,优化推荐系统性能与体验;阶段二:阶段二:完成 AI 推荐模型在 Facebook Reels 的功能测试与技术验证,相较于传统推荐模型(同样运行在 GPU 上),新推荐模型下用户在 Reels 的观看时长增加约 8-10%;阶段三:阶段三:为 AI 推荐模型提供更多的学习数据,并将 AI 推荐系统推广至更多产品,正式完成生成式推荐大模型的跨产品线落地,用统一大模型代替原有的独立模型。图表图表43:Meta 推荐系统迭代推荐系统迭代已进已进入第三阶段入第三阶段 资料来源:Morgan Stanley 2024 Technology,Media&Telecom Conference

127、、华泰研究 首个生成式推荐系统大模型有望带来新一轮技术革新。首个生成式推荐系统大模型有望带来新一轮技术革新。2024 年 4 月,Meta 发布首个生成式推荐系统论文Actions Speak Louder than Words:Trillion-Parameter Sequential Transducers for Generative Recommendations,开创性提出了基于 Transformer 的生成式推荐(Generative Recommenders,GRs)架构,并验证了 Scaling Law 同样适用。我们认为,Meta 在推荐系统上的技术创新有望带动推荐系统向更

128、通用、更个性、更安全的方向演进。1)更通用:)更通用:GRs 将异构特征统一编码为单一的时间序列,从特征建模的源头解决不同推荐场景下的特征异构问题,奠定了跨域推荐能力基础;2)更个性:)更个性:GRs 将用户的长期行为序列作为新的生成建模模式,相较于传统序列推荐系统(仅考虑用户交互)可以更好地捕捉用户的兴趣和行为;3)更安全:)更安全:通过减少对大量异构特征的依赖,GRs可以更好地保护用户隐私,同时有助于降低平台与用户价值观不一致的问题。图表图表44:Meta 提出首个生成式提出首个生成式推荐系统推荐系统模型模型 资料来源:Actions Speak Louder than Words:Tri

129、llion-Parameter Sequential Transducers for Generative Recommendations(2024)、华泰研究 Meta 生成式推荐系统生成式推荐系统突破突破三大三大技术问题,技术问题,Scaling Law 同样适用。同样适用。1)特征简化:特征简化:GRs 将异构特征(用户 ID、历史行为、关注列表、地理位置等多类特征)统一编码为时间序列,相较于传统序列推荐,Meta 构建的长序列具备更强的特征交叉能力,有效降低了信息损失,同时将后续的召回和排序统一定义为序列建模任务;2)计算效率)计算效率:Meta 提出新的HSTU(Hierarchic

130、al Sequential Transduction Units)模型架构与 M-FALCON 算法;采用 HSTU 结构,GRs 处理长序列(8192 长度)的速度相较传统深度学习模型提高 5.3-15.2倍;采用 M-FALCON 算法,GRs 能够在相同的推理成本下,服务于 285 倍复杂的模型,并将吞吐量提升 1.5 倍;3)模型扩展性:)模型扩展性:验证了 Scaling Law 同样适用于大规模推荐模型,通过序列长度、embedding 维数的扩大,能够有效实现 GRs 模型的 Scaling。图表图表45:Meta GRs 实现三大技术突破实现三大技术突破 资料来源:Action

131、s Speak Louder than Words:Trillion-Parameter Sequential Transducers for Generative Recommendations(2024)、华泰研究 图表图表46:长序列处理速度较传统深度学习模型显著提升长序列处理速度较传统深度学习模型显著提升 图表图表47:以以 1.5 倍吞吐量服务倍吞吐量服务 285 倍复杂的模型(相同推理成本)倍复杂的模型(相同推理成本)资料来源:Actions Speak Louder than Words:Trillion-Parameter Sequential Transducers for

132、Generative Recommendations(2024)、华泰研究 资料来源:Actions Speak Louder than Words:Trillion-Parameter Sequential Transducers for Generative Recommendations(2024)、华泰研究 图表图表48:Eval Hit Rate100 与与训练训练量呈幂律量呈幂律 scaling 趋势趋势 图表图表49:Eval Hit Rate500 与训练量呈与训练量呈幂律幂律 scaling 趋势趋势 资料来源:Actions Speak Louder than Words:

133、Trillion-Parameter Sequential Transducers for Generative Recommendations(2024)、华泰研究 资料来源:Actions Speak Louder than Words:Trillion-Parameter Sequential Transducers for Generative Recommendations(2024)、华泰研究 生成式推荐系统实践生成式推荐系统实践面临面临计算计算+数据数据挑战,挑战,Meta 算力建设有望持续扩大算力建设有望持续扩大。1)计算计算能力能力:推荐系统的应用场景是十亿级用户与十亿级内容

134、的计算与匹配,以 Meta 为例,截至 23 年仅 Facebook 月活用户接近 30 亿,仅 Instagram 探索页面每秒需要完成 9,000 万次推理,推荐大模型单日的 Token 推理量大于普通语言模型 1-2 月的推理量,计算能力拓展是实践落地的重点;2)训练数据训练数据:传统推荐系统词汇表体量达数十亿级,如何构建更多、更长的序列是提升模型推荐效果的关键,同时根据 Scaling Law 定律,需要同步增加序列长度和计算资源,以此确保模型在更大规模数据下的性能和质量。综合来看,在计算与数据的双重挑战下,自用推理算力有望成为又一建设重点。根据 Meta 的电话会中表述,Meta 正

135、积极配置新数据中心以支持新的推荐模型,我们认为,自用 AI 算力规模有望加速扩大。图表图表50:Meta 搭建搭建 4K GPU 集群服务传统推荐模型集群服务传统推荐模型 资料来源:Metas evolution of network for AI,Meta(2023)、华泰研究 技术革新落地,技术革新落地,AI 推荐系统未来可期。推荐系统未来可期。根据论文可知,Meta 已经实现生成式推荐大模型在自有产品(拥有数十亿用户的大型互联网平台)的技术落地,根据试验结果可知,相较于传统推荐模型,在线 A/B 测试中,GRs 用户参与度(E-Task)提升 12.4%,消费事件(C-Task)参与度提

136、升 4.4%。我们认为,GRs 后续有望朝两大方向加速推进。1)更强)更强的用户理解:的用户理解:通过增加序列长度、引入多模态信号,生成式推荐系统有望更加深入地挖掘和建模用户的行为模式,进一步强化推荐系统的个性化程度与用户满意度;2)更广泛的)更广泛的应用场景:应用场景:统一的推荐模型可以有效提升跨产品线用户的使用体验,同时可以将所有项目纳入统一排名系统,实现推荐内容的快速扩充。Meta 已布局 AI 视频推荐系统,成长可期。图表图表51:Meta 的生成式推荐模型在召回的生成式推荐模型在召回/排序任务中超越传统推荐模型排序任务中超越传统推荐模型 资料来源:Actions Speak Loud

137、er than Words:Trillion-Parameter Sequential Transducers for Generative Recommendations(2024)、华泰研究 Google:生成式大模型迭代生成式大模型迭代搜索算法,搜索算法,SGE 进展顺利进展顺利 生成式大模型迭代生成式大模型迭代 Google 搜索算法搜索算法,SGE 塑造全新搜索体验。塑造全新搜索体验。回顾 Google 搜索算法迭代历程,可以看到搜索场景是 AI 应用的重要领域。2001 年起,AI 模型开始逐步渗透搜索场景。2001 年 Google 使用机器学习技术为网络搜索提供拼写建议;201

138、5 年 Google 推出搜索领域首个深度学习系统 RankBrian,实现用户意图的深入理解;2018 年 Google 将神经网络技术引入搜索场景,帮助理解用户查询和页面概念的模糊表示并完成相关性匹配;2019 年 Google 将 Bert 模型应用于搜索的检索与排序;2022 年 Google 发布搜索领域多任务统一模型 MUM,MUM 使用 T5 text-to-text 框架,拥有 75 种语言理解能力,可完成多模态信息理解;2023 年 Google 发布生成式搜索体验(Search Generative Experience,SGE),旨在通过大模型重塑搜索体验,为用户提供更精

139、准、更个性、更智能的搜索结果。图表图表52:Google 搜索算法搜索算法加速加速迭代迭代,SGE 引入大模型能力引入大模型能力 资料来源:Googles Algorithm Updates:A Comprehensive Guide to Ranking Factors and Timeline(2024)、Supercharging Search with generative AI(2023)、华泰研究 SGE 以大模型为技术底座,提供更精准、更个性、更以大模型为技术底座,提供更精准、更个性、更智能智能的搜索体验。的搜索体验。根据 Google I/O 2024 大会介绍,SGE 底层模

140、型为定制版本 Gemini 模型,不同于 Google Bard 等对话工具,SGE 将 LLM 与搜索的核心排名系统结合,提供更加可靠检索结果。SGE 具备精准、个性、智能等三大特征。1)更精准:)更精准:SGE 既实现了用户意图的深度理解,又提供搜索结果的总结式回答(AI Overviews)与参考链接,实现搜索结果的精准展示;2)更个性:)更个性:SGE 基于用户搜索的语义深度理解,提供“提问跟进”选项,同时提供个性化广告推荐;3)更)更智能智能:除检索任务外,SGE 提供计划生成、图像生成等生成式功能,同时支持拍摄视频搜索等多模态检索能力。我们认为,伴随基础模型能力升级,SGE 体验有

141、望持续优化。图表图表53:SGE 提供提供更精准、更个性、更智能的搜索体验更精准、更个性、更智能的搜索体验 资料来源:Generative AI in Search:Let Google do the searching for you(2024)、华泰研究 SGE 测试范围逐步扩大,可靠性、安全性仍是产品的关注重点。测试范围逐步扩大,可靠性、安全性仍是产品的关注重点。2023 年 5 月,Google 在I/O 大会上正式推出 SGE,并通过搜索实验室项目(Search Labs)开启产品测试。一年时间里 SGE 的测试范围逐步扩大,产品功能得到同步优化。1)地理地理范围范围拓展拓展:SGE

142、 最早在美国、印度、日本等地测试,后续拓展至拉丁美洲、南美洲、撒哈拉以南非洲、亚太地区等 120 多个国家和地区,目前 AI Overviews 功能已开放美国地区公测版本,据Google 预计 24 年底 SGE 将覆盖超 10 亿人;2)语言拓展:)语言拓展:最早提供英语、印度语、日语支持,后续增加西班牙语、葡萄牙语、韩语、印尼语等 4 种新语言;3)功能拓展:)功能拓展:实现跟进问题、翻译功能、购物查询等功能的持续优化,同时 Google 在试验 SGE 的原生广告格式,出现在 AI 概述上方/下方的广告内容,具备较强的搜索相关性,用户反馈良好。面向未来,平衡响应流畅性与信息质量、确保中

143、立客观、防止幻觉偏见仍是后续关注重点。图表图表54:Google SGE 界面概览界面概览 资料来源:A new way to search with generative AI,An overview of SGE,Google(2023)、华泰研究 影响:影响:模型变化影响算力模型变化影响算力要求,自用要求,自用 GPU 需求需求或将或将放量放量 大模型大模型对于传统算法的替代,带来更强的算力对于传统算法的替代,带来更强的算力推理推理需求。需求。基于 Transformer 的大模型通常有解码器模块堆叠形成,解码模块通过计算 Token 化的文本数据,实现大模型推理。推理过程实质上就是对大

144、模型参数的再次遍历,输入向量经过注意力机制的计算转化为输出结果。推理过程所需要的算力可以由公式 C2NBS 来刻画(详细分析可参照华泰计算机团队 2024 年 4 月 12 日专题报告全球 AI 算力需求继续向上),即计算量=2 x 模型参数量 x 训练集大小。据我们测算,在 ChatGPT 同等访问量下,千亿参数模型推理所需算力需求超 5000 PFlop/s,对应 GPU 需求 2.4 万张。根据 Meta 论文,推荐系统每天需要处理的Token 数量比语言模型在 1-2 个月内处理的 Token 数量多几个数量级。综合来看,我们认为,大模型在推荐系统的深度落地有望带来更大的推理算力需求。

145、图表图表55:千亿模型推理的千亿模型推理的 A100 等效等效 GPU 需求量需求量约约为为 2.4 万张万张 模型模型 1 模型模型 2 模型模型 3 模型模型 4 模型模型 5 模型模型 6 模型参数(亿)模型参数(亿)500 1,000 3,000 5,000 10,000 20,000 总算力需求(总算力需求(PFlop/s-day)86,914 180,772 625,648 1,181,636 3,057,716 8,893,209 预训练算力需求(预训练算力需求(PFlop/s-day)3,472 13,889 125,000 347,222 1,388,889 5,555,55

146、6 30 天推理算力需求(天推理算力需求(PFlop/s-day)83,333 166,667 500,000 833,333 1,666,667 3,333,333 30 次调优算力需求(次调优算力需求(PFlop/s-day)108 216 648 1,080 2,160 4,320 总总 GPU 需求(需求(A100,张)张)12,891 27,760 107,022 217,940 633,727 2,058,844 预训练预训练 GPU 需求(张)需求(张)989 3,957 35,613 98,924 395,695 1,582,779 推理推理 GPU 需求(张)需求(张)11,

147、871 23,74223,742 71,225 118,708 237,417 474,834 调优调优 GPU 需求(张)需求(张)31 62 185 308 615 1,231 总服务器需求(总服务器需求(8 卡,卡,台)台)1,611 3,470 13,378 27,242 79,216 257,355 预训练预训练 GPU 需求(台)需求(台)124 495 4,452 12,365 49,462 197,847 推理推理 GPU 需求(台)需求(台)1,484 2,968 8,903 14,839 29,677 59,354 30 次调优次调优 GPU 需求(台)需求(台)4 8 2

148、3 38 77 154 资料来源:NVIDIA 官网、华泰研究预测 若全面替换大模型推理,若全面替换大模型推理,10 亿月活应用的亿月活应用的 A100 等效等效 GPU 需求超需求超 52 万张万张,远高于,远高于 Meta目前推荐场景下目前推荐场景下 4,000 张张 GPU 的算力规模的算力规模。以 Meta 论文介绍的 GRs 为例,目前测试的生成式推荐模型参数量与 GPT-3 相近,估算模型参数量为 2,000 亿,训练数据量为 1,000亿 Token。按照 10 亿月活测算,假设每次用户访问会进行 80 次推荐(平均使用时长约40 分钟,按每分钟推荐 2 次估算),每次推荐消耗的

149、 Token 数量为 2,000 个(序列长度为1,024,单次推荐涉及召回、排序两次预测)。考虑到算力基础设施建设是按照峰值需求确定,因此我们进一步假设峰值 Token 需求为均值的 5 倍,则计算得每月消耗的 Token 数量峰值为 3.1 亿,对应推理算力需求 123,457 PFlop/s,对应 A100 等效 GPU 需超 52 万张。根据 Meta 在 2023 OCP Global Summit 介绍,Meta 目前排名推荐场景/模型训练场景 AI算力规模分别为 4,000/32,000 个 GPU,推理:训练约为 1:8。若完成大模型对于底层算法(2023 年 Facebook

150、 family 月活用户 39.8 亿亿)的全部替换,推荐场景下推理算力需求仍有较大的释放空间,预计需要 200 万张万张 A100 等效等效 GPU。图表图表56:大模型推理算力需求测算大模型推理算力需求测算(以(以 10 亿月活为测算基准)亿月活为测算基准)参数假设参数假设 1 参数假设参数假设 2 参数假设参数假设 3 参数假设参数假设 4 参数假设参数假设 5 参数假设参数假设 6 推理算力需求(推理算力需求(PFlop/s)61,728 123,457 185,185 308,642 617,284 925,926 推理 Token 峰值消耗数量(亿个)3.1 3.1 3.1 3.1

151、 3.1 3.1 秒均 Token 消耗量(亿个)0.62 0.62 0.62 0.62 0.62 0.62 月活用户数(亿)10 10 10 10 10 10 每次访问推荐次数(次)80 80 80 80 80 80 每次推荐 Token 数量(个)2,000 2,000 2,000 2,000 2,000 2,000 峰值倍数 5 5 5 5 5 5 模型参数量(亿个)1,000 2,000 3,000 5,000 10,000 15,000 30 天推理算力需求(天推理算力需求(PFlop/s-day)1,851,852 3,703,704 5,555,556 9,259,259 18,

152、518,519 27,777,778 推理推理 GPU 需求(张)需求(张)263,797 527,593 791,390 1,318,983 2,637,966 3,956,948 资料来源:Meta 官网、Actions Speak Louder than Words:Trillion-Parameter Sequential Transducers for Generative Recommendations(2024)、华泰研究预测 自用推理算力需求或超预期自用推理算力需求或超预期。FY2024 NVIDIA(英伟达)数据中心业务营收为 475 亿美元,剔除 Mellanox 业务收入

153、后,数据中心业务约为 389 亿美元,按照 A100 单价 2 万美元估算,FY2024 等效 A100 出货量约为 200 万张。根据英伟达电话会,当前推理需求约占数据中心的 40%。根据上文测算,仅 Meta 的全部社交 APP(按 Facebook family 月活用户39.8 亿测算)全面替换大模型作为底层算法,有望带来 200 万张等效 A100 增量需求,基本与 NVIDIA FY24 全年出货量相当。我们认为,云厂自用算力需求有望超预期释放。图表图表57:NVIDIA出货量与出货量与 Meta 需求量对比示意图需求量对比示意图 资料来源:NVIDIA 官网、Meta 官网、华泰研究测算 相关产业公司相关产业公司梳理梳理 综合来看,云厂商新一轮基础设施建设周期已全面开启,得益于外供、自用需求的双重拉动,云厂商 CapEx 支出有望持续扩大。我们认为,AI 有望拉动全球算力继续向上,首选关注海外算力产业链,其次关注国产算力产业链,最后关注 AI 应用的潜在变化。1)海外算力产业链:)海外算力产业链:包括光模块(中际旭创、天孚通信、新易盛)、AI 服务器(工业富联、浪潮信息);2)国产算力产业链:)国产算力产业链:包括海光信息、寒武纪、神州数码等;3)AI 应用:应用:包括金山办公、福昕软件、泛微网络等。

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(2024云厂商AI算力自用需求、外供竞争格局及相关产业公司梳理分析报告(36页).pdf)为本站 (2200) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
会员动态
会员动态 会员动态:

 185**08... 升级为高级VIP wei**n_...  升级为至尊VIP

151**13...   升级为至尊VIP  136**32... 升级为高级VIP

wei**n_... 升级为至尊VIP    132**99...  升级为高级VIP

 Hen** H... 升级为高级VIP wei**n_...   升级为至尊VIP

wei**n_... 升级为标准VIP   S** 升级为标准VIP

wei**n_... 升级为至尊VIP   wei**n_... 升级为高级VIP

 wei**n_... 升级为高级VIP 188**66...  升级为至尊VIP

wei**n_...  升级为高级VIP  181**98... 升级为标准VIP

 wei**n_... 升级为至尊VIP 180**15... 升级为高级VIP 

 136**53... 升级为标准VIP  wei**n_... 升级为至尊VIP

150**25... 升级为至尊VIP   wei**n_...  升级为标准VIP

wei**n_... 升级为标准VIP wei**n_... 升级为标准VIP

 wei**n_...  升级为高级VIP 135**09...  升级为至尊VIP

 微**... 升级为标准VIP  wei**n_... 升级为标准VIP 

wei**n_... 升级为标准VIP  wei**n_...  升级为至尊VIP

wei**n_... 升级为至尊VIP   wei**n_... 升级为标准VIP 

138**02...  升级为至尊VIP  138**98...  升级为标准VIP

微**... 升级为至尊VIP  wei**n_... 升级为标准VIP

wei**n_... 升级为高级VIP  wei**n_... 升级为高级VIP

 wei**n_... 升级为至尊VIP 三**... 升级为高级VIP

186**90... 升级为高级VIP  wei**n_... 升级为高级VIP

 133**56... 升级为标准VIP 152**76...   升级为高级VIP

wei**n_...   升级为标准VIP wei**n_...  升级为标准VIP 

wei**n_...  升级为至尊VIP wei**n_...  升级为标准VIP

133**18...  升级为标准VIP wei**n_... 升级为高级VIP 

 wei**n_...  升级为标准VIP 微**...  升级为至尊VIP 

  wei**n_... 升级为标准VIP wei**n_... 升级为高级VIP 

187**11... 升级为至尊VIP   189**10...   升级为至尊VIP

188**51... 升级为高级VIP 134**52...  升级为至尊VIP 

134**52... 升级为标准VIP wei**n_...  升级为高级VIP

 学**... 升级为标准VIP  liv**vi... 升级为至尊VIP

大婷  升级为至尊VIP  wei**n_... 升级为高级VIP

wei**n_...  升级为高级VIP 微**... 升级为至尊VIP 

 微**... 升级为至尊VIP wei**n_... 升级为至尊VIP  

wei**n_... 升级为至尊VIP  wei**n_... 升级为至尊VIP 

 战**  升级为至尊VIP 玍子  升级为标准VIP 

 ken**81... 升级为标准VIP  185**71...  升级为标准VIP

wei**n_... 升级为标准VIP   微**...  升级为至尊VIP 

 wei**n_... 升级为至尊VIP  138**73...  升级为高级VIP

 138**36...  升级为标准VIP 138**56... 升级为标准VIP

wei**n_... 升级为至尊VIP  wei**n_...   升级为标准VIP

137**86... 升级为高级VIP  159**79...  升级为高级VIP

wei**n_... 升级为高级VIP    139**22...  升级为至尊VIP

 151**96... 升级为高级VIP wei**n_...  升级为至尊VIP

186**49... 升级为高级VIP  187**87... 升级为高级VIP

wei**n_... 升级为高级VIP   wei**n_... 升级为至尊VIP

sha**01... 升级为至尊VIP wei**n_... 升级为高级VIP

 139**62... 升级为标准VIP wei**n_... 升级为高级VIP  

 跟**... 升级为标准VIP 182**26... 升级为高级VIP 

 wei**n_... 升级为高级VIP   136**44... 升级为高级VIP