上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

互联网行业:大陆企业获GPT赋能数据安全将成关键考量-230410(18页).pdf

编号:121501 PDF 18页 1.30MB 下载积分:VIP专享
下载报告请您先登录!

互联网行业:大陆企业获GPT赋能数据安全将成关键考量-230410(18页).pdf

1、 请仔细阅读在本报告尾部的重要法律声明 大陆企业获 GPT 赋能,数据安全将成关键考量 AzureAzure OpenAIOpenAI 获获 GPTGPT 能力,大陆企业率先布局能力,大陆企业率先布局 随着 3 月份的两次升级,目前微软 Azure 上的 OpenAI 服务已经可以使用 ChatGPT 和 GPT-4 模型。虽然国内大模型当前发展十分迅速,但我们认为,在数据、算力、算法等因素的限制下,一段时期内 AIGC 行业仍会由微软等海外大厂主导,且 AI发展日新月异,当前来看国内的商用 GPT 使用权限依然是稀缺资源,受限于 GPT-4 模型当前的高定价、微软对 Azure OpenAI

2、的权限管理以及数据跨境的政策监管,我们认为,大陆现有的Azure OpenAI 客户凭借其 GPT 模型使用权限的短期稀缺性以及相对成熟应对政策监管的能力,有望进一步巩固在市场中的领先地位,构筑起竞争壁垒。技术层面海外大模型仍占据领先地位技术层面海外大模型仍占据领先地位 数据方面,英文互联网数据质量相对较高,清洗起来也相对容易;尽管中文互联网的数据量很大,但数据质量存在一定差距,且互联网巨头之间的数据相互封闭,数据孤岛化现象严重,这使得数据抓取变得相对困难。算力方面,中国的 AI 大模型发展正受到算力“卡脖子”,更具确定性的解决方案还是依靠于自研芯片和服务器,当前国产顶级芯片仍难以超越英伟达和

3、 AMD 高端产品,预期全球市场仍将由海外龙头垄断。算法方面,GLUE 测评排名中,前十名得分均在 90 分以上,已经十分接近乃至超越人类平均水平,其中来自国内得分大模型仅有百度 ERNIE 及阿里 AliceMind,在英文回答水平上海外顶级模型仍占据绝对优势,而国产大模型在攻克了数据和算力的难关后有望另辟蹊径实现中文水平上的突破。Azure OpenAIAzure OpenAI 进驻进驻中国中国香港香港,数据安全为关键因数据安全为关键因素素 Azure OpenAI 在中国香港实装 GPT-4 模型及 ChatGPT,大陆企业使用速度预计会有显著提升,对于国内企业来说,此次Azure Op

4、enAI 在中国香港实装 GPT-4 和 ChatGPT 意味着其可以更便捷地获取和应用先进的 AI 技术,同时数据传输速度和安全性都有望大幅提升。由于使用如 Azure OpenAI 等海外大模型需要将数据跨境传输,因此受到境内和境外的数据传输政策限制,内部来看,数据出境安全评估办法规定涉及重要数据和个人信息的出境,必须接受安全评估,不排除后期数据出境限制更加严格,使得 GPT 模型使用受限;外部来看,2019年美国国家安全和个人数据保护法案(尚未生效),对于美国用户数据出境,尤其是传输至中国进行明确的限制,若企业使用海外大模型数据出境经由美国,则也需面对这方面的数据传输风险。评级及分析师信

5、息 行业评级:推荐 行业走势图 证券分析师:朱芸证券分析师:朱芸 邮箱: SAC NO:S01 -30%-23%-16%-9%-2%5%2022/032022/062022/092022/122023/03标普500纳斯达克100科技指数证券研究报告|行业点评报告 仅供机构投资者使用 Table_Date 2023 年 04 月 10 日 171391 证券研究报告|行业点评报告 请仔细阅读在本报告尾部的重要法律声明 2 投资建议:投资建议:我们认为 AIGC 模型迭代正在加速,AI 发展日新月异,当前海外顶级模型仍占据领先地位,已接入 Azure OpenAI 获得原生

6、GPT-4 和 ChatGPT 赋能的企业有着一定的先发优势,可率先开始根据需求部署 AI 解决方案和应用;同时,国内大模型有望在特定领域及中文处理上另辟蹊径实现赶超。后续国内率先落后续国内率先落地地 Azure OpenAIAzure OpenAI 应用的标的应用的标的有望受益有望受益,包括万科(2202.HK)、创梦天地(1119.HK)、医脉通(2192.HK),以及以及国内已实现自研大模型的企业国内已实现自研大模型的企业,包括阿里巴巴(9988.HK)、腾讯(0700.HK)、百度(9888.HK)。风险提示风险提示 技术落地商业化不及预期;人工智能在部分领域应用的监管风险;数据出海的

7、政策风险。RUiWiXOXkYhUsRpMoMaQ8Q9PnPnNsQoNjMoOnRkPmNmN8OrQrRvPrRpNxNoOsO 请仔细阅读在本报告尾部的重要法律声明 正文目录 1.Azure OpenAI 重磅升级,数家企业获得 GPT加持.4 1.1.Azure 接入 GPT-4及 ChatGPT,大陆公司获 GPT赋能.4 1.2.GPT 模型在大陆仍为稀缺资源,看好现有参与者.5 2.技术层面来看大模型仍是海外巨头更优.6 2.1.技术加速成熟下 AIGC模型百花齐放.6 2.2.数据端:英文天然数据优势,中文数据仍有改进空间.7 2.3.算力端:进口受限,海外巨头仍将长期领先.

8、8 2.4.算法端:英文语义测评海外模型占优,国产大模型有望在中文领域突围.10 3.Azure OpenAI 进驻中国香港,商业应用潜力有待发掘.11 3.1.Azure OpenAI 进驻中国香港,大陆传输速度提升.11 3.2.Azure OpenAI 未来可持续赋能众多行业,能力上限取决于企业本身.12 3.3.OpenAI 亚洲大规模封号,数据安全是未来 AIGC重要因素.13 4.投资建议.15 5.风险提示.16 图表目录 图 1 Azure 云上 AI及机器学习相关服务.4 图 2 MOSS回答中文时更像“官方套话”.8 图 3 MOSS 能较好完成英文任务.8 图 4 美国和

9、中国大陆半导体制造业市场份额.9 图 5 Power Platform 帮助客户构建应用程序.13 图 6 Github Copilot 大幅提高开发者工作效率.13 图 7 CarMax 利用 OpenAI 将客户评价总结为摘要.13 图 8 Kepro 使用 Azure AI 优化临床文档.13 图 9 部分 OpenAI 账号于上月底被大规模封禁.14 表 1 微软 Azure OpenAI 发展进程.4 表 2 中国大陆已接入 Azure OpenAI 企业.5 表 3 Azure OpenAI 模型定价.6 表 4 中美主要语言大模型参数对比.7 表 5 国产 AI 芯片与 NVID

10、IA、AMD 高端产品技术规格对比.9 表 6 GLUE 通用语言理解测评排名.10 表 7 CLUE 中文语言理解测评排名(1.1版及 1.0版综合得分).11 表 8 中国大陆使用主流地区服务器网络延迟.12 表 9 数据出境安全评估办法重点内容.15 表 10 受益标的.15 证券研究报告|行业点评报告 请仔细阅读在本报告尾部的重要法律声明 4 1.1.AzureAzure OpenAIOpenAI 重磅升级,重磅升级,数家企业获得数家企业获得 GPTGPT 加持加持 1.1.1.1.AzureAzure 接入接入 GPTGPT-4 4 及及 ChatGPTChatGPT,大陆公司获,大

11、陆公司获 GPTGPT 赋能赋能 AzureAzure OpenAIOpenAI 为为企业赋能企业赋能 AIAI 能力。能力。微软 Azure OpenAI 服务最早于 2021 年 11月推出,允许通过 REST API 访问 OpenAI 的强大语言模型,包括 GPT-3、Codex 和 Embeddings 模型系列。这些模型可以轻松适应特定的任务,包括但不限于内容生成、汇总、语义搜索和自然语言到代码的转换。用户可以通过 REST API、Python SDK 或 Azure OpenAI Studio 中基于 Web 的界面访问该服务。图 1 Azure 云上 AI 及机器学习相关服务

12、 AzureAzure 获得获得 ChatGPTChatGPT 及及 GPTGPT-4 4,AIAI 能力进一步强化。能力进一步强化。3 月 10 日,微软宣布,可以在基于云计算的操作系统 Azure 上的 OpenAI 服务中使用 ChatGPT;此后 3 月 21日,微软又宣布 Azure OpenAI 加入 GPT-4。开发者可以将定制的人工智能驱动的体验,直接整合到他们自己的应用程序中,包括增强现有的机器人来处理突发问题,以实现更快的客户支持解决方案,创建具有个性化优惠的新广告副本等。表 1 微软 Azure OpenAI 发展进程 时间时间 进展进展 功能变化功能变化 2021 年

13、11 月 微软发布 Azure OpenAI 服务 允许通过 REST API 访问 OpenAI 的强大语言模型 2022 年 5 月 扩展 Azure OpenAI 服务 加入 GPTGPT-3 3、Codex 等模型 2023 年 1 月 Azure OpenAI 推出正式版 加入 GPTGPT-3.53.5、Codex、DALLDALLE 2E 2 2023 年 3 月 Azure OpenAI 获得 ChatGPT 功能 加入 GPTGPT-4 4 以及以及 ChatGPTChatGPT 大陆可通过大陆可通过 AzureAzure OpenAIOpenAI使用使用GPTGPT 模型,

14、数家公司已率先接入。模型,数家公司已率先接入。中国大陆企业如果需要使用大模型,由于受到芯片进口的限制,目前可行的路径一是使用本土算力 证券研究报告|行业点评报告 请仔细阅读在本报告尾部的重要法律声明 5 平台及自研模型,如百度文心一言、华为盘古模型;二是通过数据出海接入海外云平台及大模型,如 Azure OpenAI,目前其已经加入 GPT-4 模型及 ChatGPT,因此国内的Azure OpenAI 商业用户可以直接使用 ChatGPT。虽然国内大模型当前发展十分迅速,但我们认为,在算力和数据等因素的限制下,一段时期内 AIGC 行业仍会由微软等海外大厂主导,且 AI 发展日新月异,国内已

15、接入 Azure OpenAI 的数家公司可率先开始软件和服务的适配,有十分显著的先发优势。截至目前大陆已有数家公司接入 Azure OpenAI,因此已经能实现 GPT 模型以及ChatGPT 的使用,其中五家为 A 股及港股上市公司,目前对 GPT 模型的使用主要集中在广告营销、影音娱乐、游戏开发、数据分析等,以及万科将其用于公司内部的管理系统。总体而言不论是将 AI 作为一项业务增量,或是辅助营销与管理,我们认为GPT-4 和 ChatGPT 都将为公司赋能,使业务焕发活力。表 2 中国大陆已接入 Azure OpenAI 企业 公司公司 股票代码股票代码 接入时间接入时间 主要业务主要

16、业务 接入接入 GPTGPT 用途用途 吉宏吉宏股份股份 002803.SZ002803.SZ 2023 年 1月 公司的主要产品为彩色包装纸盒、彩色包装箱、塑料软包装等,广泛应用于快速消费品的外包装。赋能公司跨境电商业务中的选品、素材制作、广告投放、翻译、客服等业务节点;已提交 OpenAI Plugin(GPT 插件)申请 万兴万兴科技科技 300624.SZ300624.SZ 2023 年 2月 25 日 面向全球海量新生代互联网用户提供潮流前沿、简单便捷的数字创意软件产品与服务 已于多个产品内落地虚拟人、文生图、AI 智能抠像、AI 智能降噪、AI 音乐重组、AI 换脸等功能 万科万科

17、 2202.HK2202.HK 2023 年 3月 9 日 国内领先的城市配套服务商,业务聚焦于全国经济最具活力的三大经济圈及中西部重点城市 在客户反馈分析平台搭载 GPT 模型,将自动采集、舆情分析、大数据处理、AI 模型研判等功能集合应用于服务需求管理和隐患预警 创梦创梦天地天地 1119.HK1119.HK 2023 年 3月 23 日 在中国的游戏发行市场占据领先地位,2017年在中国所有独立手游发行商中排名第一 在公司游戏产品研发、Fanbook AI 生态建设等多个领域展开深化合作,实现 Microsoft Azure 和Fanbook 技术团队协同研发,打造多场景的 AI 应用落

18、地 医脉医脉通通 2192.HK2192.HK 2023 年 4月 3 日 中国最大的在线专业医生平台,公司致力于协助医生作出更好的临床决策。公司的医脉通平台亦广获中国医生认可,已成为最值得信赖的专业医疗平台 进一步加强数智化能力,特别是在提升平台内容生产效率和用户智能交互等方面,持续为药械企业客户提供更丰富、更高效的数字化精准营销解决方案。瑞泰瑞泰信息信息 -2023 年 3月 30 日 致力于用科技加速企业增长,赋能企业营销服务数字化转型 根据客户需求自动生成营销文案或者图片素材用于创意制作;实现智能机器人与客户交互;帮助销售团队快速回应客户的询问,提供产品信息、报价等信息,实现轻松销售跟

19、进 售后售后宝宝 -2023 年 3月 31 日 面向企业用户提供的数字化客户服务管理运营平台 服务响应智能化;客户服务数据更易用;利用 AI构建构建内部知识库 神策神策数据数据 -2023 年 4月 3 日 提供神策分析云、神策营销云、神策数据根基平台三大产品方案,帮助企业完成全渠道的数据采集与全域用户 ID 打通、全场景多维度数据分析,全通道的精准用户触达 智能化指标生成与管理;数据分析模型与 AI 深度融合,对话式分析方式降低数据分析门槛 傲途傲途 -2023 年 4月 3 日 专注海外私域营销的 SaaS 服务品牌 发力于更细致的海外社媒和社交营销场景,如批量化 PGC 内容分发、内容

20、型 IP 建设、聊天机器人、营销自动化、SocialSelling 等多项功能服务 资料来源:证券时报,万科官网,和讯资讯,IT 之家,医脉通,傲途,亿邦动力,华西证券研究所 1.2.1.2.GPTGPT 模型在大陆模型在大陆仍为仍为稀缺资源,看好现有参与者稀缺资源,看好现有参与者 GPTGPT 模型权限仍是稀缺资源,模型权限仍是稀缺资源,看好现有看好现有参与者发挥其参与者发挥其先发优势先发优势。当前来看国内的商用 GPT 使用权限依然是稀缺资源,一方面Azure OpenAI 中 GPT-4 的价格是 GPT-3.5 的 15 倍起,另一方面目前 Azure OpenAI 服务主要面向已经与

21、 Microsoft 建立合 证券研究报告|行业点评报告 请仔细阅读在本报告尾部的重要法律声明 6 作关系、用例风险较低以及承诺融入缓解措施的企业客户。此外,不仅是微软对Azure OpenAI 的限制和监管手段,由于使用 Azure OpenAI 需要接入海外数据中心,数据出境在政策层面受到数据安全法等法规的严格限制。我们认为,短期内大陆 GPT模型使用权限具有稀缺性,现有的 Azure OpenAI 客户凭借其率先开始软件和服务适配以及相对成熟应对政策监管的能力,有望进一步巩固在市场中的领先地位,构筑起竞争壁垒。表 3 Azure OpenAI 模型定价 类型类型 模型模型 定价定价 单位

22、单位 语言模型语言模型 Text-Ada$0.0004 每 1,000 个标记 Text-Babbage$0.0005 Text-Curie$0.002 Text-Davinci$0.02 Code-Cushman$0.024 Code-Davinci$0.1 ChatGPT(gptChatGPT(gpt-3.53.5-turbo)turbo)$0.002$0.002 GPTGPT-4 8K context4 8K context$0.03$0.03(输入)(输入)/$0.06/$0.06(输出)(输出)GPTGPT-4 32K context4 32K context$0.06$0.06(输

23、入)(输入)/$0.12/$0.12(输出)(输出)图像模型图像模型 DallDall-E E$2$2 每 100 张图像 微调模型微调模型 Text-Ada$0.0004 每 1,000 个标记 Text-Babbage$0.0005 Text-Curie$0.002 Text-Davinci$0.02 Code-Cushman$0.024 Text-Ada$20 每计算小时训练数 Text-Babbage$22 Text-Curie$24 Text-Davinci$84 Code-Cushman$26 Text-Ada$0.05 每小时托管数 Text-Babbage$0.08 Text-

24、Curie$0.24 Text-Davinci$3 Code-Cushman$0.54 嵌入模型嵌入模型 Ada$0.0004 每 1,000 个标记 Babbage$0.005 Curie$0.02 DavinciDavinci$0.2$0.2 2.2.技术层面来看技术层面来看大模型仍是海外大模型仍是海外巨头巨头更优更优 2.1.2.1.技术加速成熟下技术加速成熟下 AIGCAIGC 模型模型百花齐放百花齐放 ChatGPTChatGPT:ChatGPT 是一款基于人工智能技术的自然语言处理工具,由 OpenAI 与微软合作于 2022 年 11 月推出,它能与用户进行类似人类的对话,还能提

25、供更多功能。ChatGPT 是一个聊天机器人,针对对话进行了优化;而 GPTGPT 是一种语言模型,是是一种语言模型,是 证券研究报告|行业点评报告 请仔细阅读在本报告尾部的重要法律声明 7 ChatGPTChatGPT 背后的“大脑”背后的“大脑”,它可以定制以实现不同的功能,如文本摘要、文案撰写、解析文本和翻译语言等,此外,它还提供了一个开放的 API,让任何人都可以利用GPT-3 或 GPT-4 构建自己的 AI 应用程序,并使用其功能。BardBard:谷歌的 Bard 是一个实验性的对话式 AI 服务,由由 LaMDALaMDA(Language ModeLanguage Model

26、 l for Dialogue Applicationsfor Dialogue Applications)驱动驱动,目前已向部分测试者开放,Bard 的目标是整合世界各地的知识,以及大型语言模型的力量、智能和创造力。它从网络上获取信息,提供新颖、高质量的回答。文心一言:文心一言:百度文心一言(ERNIE Bot)是百度全新一代知识增强大语言模型,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。文心一言是知识增强的大语言模型,基于飞桨深度学习平台和基于飞桨深度学习平台和 E ERNIERNIE、PlatoPlato 模模型型,持续从海量数据和大规模知识中融合学习具

27、备知识增强、检索增强和对话增强的技术特色。盘古:盘古:华为即将推出其最新的盘古大模型 4,将是超过任何其他类似应用的最先进、最强大的自然语言处理应用。根据华为云官网显示,华为即将上线的“盘古系列AI 大模型”分别为:NLP 大模型、CV 大模型、以及科学计算大模型。其中,盘古“NLP 大模型”是被认为最接近人类中文理解能力的 AI 大模型,而盘古“CV 大模型”首次兼顾了图像判别与生成能力。通义千问:通义千问:作为最早投入预训练语言模型研究的团队之一,阿里达摩院研发了阿里通义 AliceMind,该体系涵盖预训练模型、多语言预训练模型、超大中文预训练模型等,具备阅读理解、机器翻译、对话问答、文

28、档处理等多种能力。混元:混元:腾讯的混元 AI 大模型目前主要涵盖自然语言处理(Natural language processing;NLP)、电脑视觉(Computer vision)、多模块等基础模型;预期未来将进一步结合音讯、影像、视讯等多模块信息,打造更强大的多模块 AI 大模型。表 4 中美主要语言大模型参数对比 ChatGPTChatGPT BardBard 文心一言文心一言 盘古盘古 通义千问通义千问 混元助手混元助手 所属所属公司公司 微软/OpenAI 谷歌 百度 华为 阿里达摩院 腾讯 推出推出时间时间 2022/11/30 2023/2/6 2023/3/16 2021

29、/9/5 2023/4/7 即将推出 参数参数量量 1,750 亿(GPT-3.5)1,370 亿 2,600 亿 2,000 亿 超过 10 万亿 超过万亿 算力算力 英伟达 A100、H100 自研 TPU v4 昆仑芯 昇腾 910 含光 800 英伟达 A100(来自浪潮信息)算法算法 GPT-3.5,GPT-4 LaMDA ERNIE、PLATO NLP 大模型、CV 大模型、科学计算大模型 AliceMind HunYuan-NLP-1T 资料来源:华为云,界面新闻,IT 之家,谷歌,新京报,新浪,阿里云,第一财经,icspec,华西证券研究所 2.2.2.2.数据数据端:端:英文

30、英文天天然然数据优势数据优势,中文数据仍有改进空间,中文数据仍有改进空间 英文互联网具备天生数据优势,中文数据孤岛化严重。英文互联网具备天生数据优势,中文数据孤岛化严重。英文互联网上的数据质量相对较高,清洗起来也相对容易,因为英文互联网上有大量相对准确的知识类信息,这些信息可以用于模型训练,故ChatGPT 能够很好地回答问题。然而,尽管中文互联网产生的数据量很大,但数据质量却与英文数据存在一定差距,这可能会影响模型训 证券研究报告|行业点评报告 请仔细阅读在本报告尾部的重要法律声明 8 练的效果,从而对中文大型语言模型的发展产生一定的制约。此外,中国国内的数据大量存储于移动端 APP 中,并

31、且互联网巨头之间的数据相互封闭,导致数据孤岛化现象严重,这使得数据抓取变得相对困难。这种情况可能会限制数据的共享与交流,进一步加大中美在大型语言模型发展方面的数据数量和质量差距。短期来看英文大模型仍占据数据资源优势。短期来看英文大模型仍占据数据资源优势。以复旦大学发布的语言模型 MOSS 为例,由于受到中文互联网数据的限制,其模型基座学习了 3000 多亿个英文单词,中文词语只学了约 300 亿个,因此在英文上表现更好。为了缩小数据数量和质量的差距,中国的开发者需要构建更多高质量的中文数据集、优化数据清洗技术,且大厂需加强数据共享和交流,短期来看我们认为在数据资源上以英文为主的大模型仍占据着较

32、大的优势。图 2 MOSS 回答中文时更像“官方套话”图 3 MOSS 能较好完成英文任务 资料来源:36 氪,华西证券研究所 资料来源:36 氪,华西证券研究所 2.3.2.3.算力算力端:端:进口受限,进口受限,海外海外巨头仍将长期领先巨头仍将长期领先 高端高端 GPUGPU 进口受限,进口受限,自研芯片是破局关键自研芯片是破局关键。GPU 是当前全球数据中心处理 AI 应用的标配,占据超九成市场份额。根据 BCG 数据,2018 年和 2019 年中国大陆在半导体制造业的市场份额正式超越美国,随着中美博弈不断激化、以及美国对中国半导体行业发展速度的警惕,2022 年 8 月,美国政府推出

33、的出口许可管制限制英伟达和 AMD向中国和俄罗斯销售高端人工智能芯片,包括英伟达 A100、H100,AMD MI100、MI200 等,当前大陆的高端芯片均为存货,剩余使用寿命在 4-6 年,主要的替代品为英伟达 A800 芯片,计算性能与 A100 基本相同,但数据传输速度被降低了 30%,且长期处于缺货状态。总体而言,中国的 AI 大模型发展正受到算力“卡脖子”,更具确定性的解决方案还是依靠于自研芯片和服务器。证券研究报告|行业点评报告 请仔细阅读在本报告尾部的重要法律声明 9 图 4 美国和中国大陆半导体制造业市场份额 资料来源:Semiconductor Industry Assoc

34、iation,BCG,华西证券研究所 国产芯片国产芯片参数参数仍有差距,仍有差距,预计海外巨头仍将维持领先预计海外巨头仍将维持领先。根据 Wccftech,2022Q3独立 GPU 市场中英伟达和 AMD 分别占据 88%、8%市场份额。根据海光信息招股书公布技术指标数据,当前国内高端 GPU 相比国际巨头在显存频率、带宽等参数上还有一定差距,但在典型应用场景下,深算一号已基本能够达到国际上同类型高端产品的水平。去年 8 月壁仞科技发布了首款通用 GPU 芯片 BR100,其称已创出全球算力纪录,但在一些关键参数上,仍难以超越英伟达最新的 H100 GPU,20 个 H100 GPU 便可承托

35、相当于全球互联网的流量,使其能够帮助客户推出先进的推荐系统以及实时运行数据推理的大型语言模型。在国际市场上,英伟达和 AMD 在高性能计算和人工智能领域具有丰富的产品线和完善的生态系统,叠加长期积累的技术优势和市场地位,预计仍将长期维持 AI 算力芯片领域的龙头地位。表 5 国产 AI 芯片与 NVIDIA、AMD 高端产品技术规格对比 品牌品牌 海光海光信息信息 英伟达英伟达 AMDAMD 型号型号 深算一号 Ampere 100 MI100 生产工艺生产工艺 7nm FinFET 7nm FinFET 7nm FinFET 核心数量核心数量 4096(64 Cus)2560 CUDA pr

36、ocessors 120 CUs 640 Tensor processors 内核频率内核频率 Up to 1.5 GHz(FP64)Up to 1.53 GHz Up to 1.5 GHz(FP64)Up to 1.7 GHz(FP32)Up to 1.7 GHz(FP32)显存容量显存容量 32 GB HBM2 80 GB HBM2e 32 GB HBM2 显存位宽显存位宽 4096 bit 5120 bit 4096 bit 显存频率显存频率 2.0 GHz 3.2 GHz 2.4 GHz 显存带宽显存带宽 1024 GB/s 2039 GB/s 1228 GB/s TDPTDP 350

37、 W 400 W 300 W CPU to GPUCPU to GPU 互联互联 PCIe Gen4 x 16 PCIe Gen4 x 16 PCIe Gen4 x 16 GPU to CPUGPU to CPU 互联互联 xGMI x 2 NVLink Infinity Fabric x 3 Up to 184 GB/s Up to 600 GB/s Up to 276 GB/s 证券研究报告|行业点评报告 请仔细阅读在本报告尾部的重要法律声明 10 2.4.2.4.算法算法端端:英文语义测评英文语义测评海外模型占优,国产大模型有望在海外模型占优,国产大模型有望在中文领域突围中文领域突围 从

38、语义测评来看,从语义测评来看,国外顶级模型仍占据优势国外顶级模型仍占据优势。从排名数据来看,当前大模型在国内与国外的差距主要体现在综合得分方面。在英文 GLUE 测评排名中,前十名得分均在 90 分以上,已经十分接近乃至超越人类平均水平,其中来自国内得分大模型仅有百度 ERNIE 及阿里 AliceMind,二者分别为文心一言、通义千问背后的语言模型;而国内中文 CLUE 测评中排名前五的得分在 86 分左右,在 1.1 测评中腾讯混元大模型和阿里 AliceMind 占据前两名,而 1.0 测评中华为盘古模型占据第 6 名位置。虽然国内 AI 大模型在某些具体任务上已经取得了一定的成绩,但总

39、体而言,国内大模型在与国外顶级模型的竞争中仍然存在一定差距,这主要是算力、数据质量以及技术研发等多方面因素综合影响的结果,我们预计在英文回答水平上海外顶级模型仍占据绝对优势,而国产大模型在攻克了数据和算力的难关后有望另辟蹊径实现中文水平上的突破。表 6 GLUE 通用语言理解测评排名 排排名名 名称名称 模型模型 综合得综合得分分 CoLACoLA SSTSST-2 2 MRPCMRPC STSSTS-B B QQPQQP 1 Microsoft Alexander v-team Turing ULR v6 91.3 73.3 97.5 94.2/92.3 93.5/93.1 76.4/90.

40、9 2 JDExplore d-team Vega v1 91.3 73.8 97.9 94.5/92.6 93.5/93.1 76.7/91.1 3 Microsoft Alexander v-team Turing NLR v5 91.2 72.6 97.6 93.8/91.7 93.7/93.3 76.4/91.1 4 DIRL Team DeBERTa+CLEVER 91.1 74.7 97.6 93.3/91.1 93.4/93.1 76.5/91.0 5 5 ERNIE Team ERNIE Team-百度百度 ERNIEERNIE 91.191.1 75.575.5 97.897

41、.8 93.9/91.893.9/91.8 93.0/92.693.0/92.6 75.2/90.975.2/90.9 6 6 AliceMind&AliceMind&DIRL DIRL-阿里阿里 StructBERT+StructBERT+CLEVERCLEVER 9191.0 0 75.375.3 97.797.7 93.9/91.993.9/91.9 93.5/93.193.5/93.1 75.6/90.875.6/90.8 7 DeBERTa Team-Microsoft DeBERTa/TuringNLRv4 90.8 71.5 97.5 94.0/92.0 92.9/92.6 76

42、.2/90.8 8 HFL iFLYTEK MacALBERT+DKM 90.7 74.8 97 94.5/92.6 92.8/92.6 74.7/90.6 9 PING-AN Omni-Sinitic ALBERT+DAAF+NAS 90.6 73.5 97.2 94.0/92.0 93.0/92.4 76.1/91.0 10 T5 Team-Google T5 90.3 71.6 97.5 92.8/90.4 93.1/92.8 75.1/90.6 证券研究报告|行业点评报告 请仔细阅读在本报告尾部的重要法律声明 11 表 7 CLUE 中文语言理解测评排名(1.1 版及 1.0 版综合得

43、分)排排行行 模型模型 研究机构研究机构 综合综合得分得分1.11.1 AFQMAFQMC C TNEWSTNEWS1.11.1 IFLYIFLYTEKTEK OCNLI_OCNLI_50K50K WSC1WSC1.1.1 CSLCSL CMRC2CMRC2018018 CHIDCHID1.11.1 C3 C3 1.11.1 1 1 HunYuanHunYuan-NLP 1TNLP 1T 腾讯混元腾讯混元 AIAI 大模型大模型 86.986.9 85.185.1 70.470.4 67.567.5 86.586.5 96.096.0 96.296.2 87.987.9 98.898.8 93

44、.793.7 2 2 通义通义-AliceMindAliceMind 阿里达摩院阿里达摩院 NLPNLP 86.786.7 84.184.1 73.573.5 67.467.4 85.985.9 94.394.3 95.095.0 86.886.8 99.299.2 94.094.0 3 HUMAN CLUE 86.7 81.0 71.0 80.3 90.3 98.0 84.0 92.4 87.1 96.0 4 CHAOS OPPO 研究院融智团队 86.6 83.4 73.2 65.8 86.4 94.6 95.7 87.2 99.2 93.5 5 WenJin Meituan NLP 86

45、.3 84.5 73.0 64.4 86.2 94.4 95.7 86.3 98.9 93.4 排排行行 模型模型 研究机构研究机构 综合综合得分得分1.01.0 AFQMAFQMC C TNEWSTNEWS1.01.0 IFLYIFLYTEKTEK OCNLI_OCNLI_50K50K WSC1WSC1.0.0 CSLCSL CMRC2CMRC2018018 CHIDCHID1.01.0 C3 C3 1.01.0 1 ShenZhou QQ 浏览器实验室 85.9 80.6 74.2 67.7 86.4 96.6 91.0 87.9 95.6 92.7 2 HUMAN CLUE 85.6 8

46、1.0 71.0 80.3 90.3 98.0 84.0 92.4 87.1 96.0 3 Mengzi 澜舟科技-创新工场 84.9 81.8 75.1 65.1 82.6 96.6 89.9 84.0 96.0 92.4 4 Motian QQ 浏览器搜索 84.1 78.3 73.2 65.5 85.0 94.8 90.2 85.3 94.4 88.5 5 BERTSG Sogou Search 83.8 79.9 74.2 64.5 85.9 95.2 89.0 83.8 93.1 87.4 6 6 PanguPangu 华为云华为云-循环智能循环智能 83.083.0 78.178.

47、1 72.172.1 65.265.2 83.383.3 95.595.5 87.787.7 84.584.5 93.393.3 85.685.6 7 MT-BERTs Meituan NLP 81.1 77.4 70.0 64.3 83.5 89.7 87.4 83.2 89.8 80.3 8 LICHEE 腾讯看点 80.5 77.0 70.5 64.2 81.3 90.7 87.4 79.8 87.5 82.2 9 roberta_selfrun OPPO 小布助手 80.2 77.9 69.4 63.9 80.4 93.1 87.3 80.1 90.1 77.3 10 BERTs BE

48、RTs 80.2 76.8 69.9 63.9 82.9 89.0 86.8 80.5 89.5 78.4 3.3.AzureAzure OpenAIOpenAI 进驻进驻中国中国香港,香港,商业应用潜力有待发掘商业应用潜力有待发掘 3.1.3.1.AzureAzure OpenAIOpenAI 进驻进驻中国中国香港香港,大陆传输,大陆传输速度提升速度提升 中国香港开放中国香港开放 AzureAzure OpenAIOpenAI,大陆传输速度进一步提升。,大陆传输速度进一步提升。在 3 月 23 日的Microsoft AI Day 活动中,Microsoft 中国香港公布企业级 GPT 功能

49、开放给中国香港企业用户使用,同时表示 4 月份正式开通 GPT-4 技术。中国香港作为国际金融和科技中心,拥有世界上最发达的互联网基础设施之一,Azure OpenAI 在中国香港实装GPT-4 模型及 ChatGPT 后,大陆企业使用速度预计会有显著提升。首先,从地理位置上看,中国香港距离大陆非常近,这意味着数据传输的延迟将降低,企业在使用Azure OpenAI 时将获得更佳的用户体验;其次,中国香港拥有强大的数据中心资源,这将有助于提高大陆企业接入 Azure OpenAI 的稳定性和可靠性,并且由于中国香港政府对于数据隐私和安全的高度重视,这也将有助于保障大陆企业在使用 Azure O

50、penAI 时的数据安全。对于国内企业来说,此次 Azure OpenAI 在中国香港实装 GPT-4 和 ChatGPT 意味着其可以更便捷地获取和应用先进的 AI 技术,同时数据传输速度和安全性都有望大幅提升。证券研究报告|行业点评报告 请仔细阅读在本报告尾部的重要法律声明 12 表 8 中国大陆使用主流地区服务器网络延迟 服务器位置服务器位置 大陆延迟大陆延迟 中国香港中国香港 深圳延迟深圳延迟 9ms9ms-20ms20ms,中部地区延迟为,中部地区延迟为3030-50ms50ms,东北延迟为,东北延迟为6060-80ms80ms 新加坡 中国香港的延迟为 32ms,广东佛山延迟为44

51、ms 美国 最快的区域能达到 130ms,平均延迟在 180ms 左右 日本 上海为 38ms,江苏 45ms 韩国 江浙沪地区能达到 30-40ms,周边地区能达到40-70ms 资料来源:A5 互联,华西证券研究所 3.2.3.2.A Azure OpenAIzure OpenAI 未来未来可可持续持续赋能众多赋能众多行业行业,能力上限取决于能力上限取决于企业本身企业本身 AzureAzure OpenAIOpenAI 服务在互联网、游戏、金融、零售、医药乃至自动驾驶、智能制服务在互联网、游戏、金融、零售、医药乃至自动驾驶、智能制造领域拥有着广阔的应用前景。造领域拥有着广阔的应用前景。Az

52、ure OpenAI 服务提供了有 SLA 保证的企业级服务和完善的安全防护措施,同时微软也在积极支持各行业客户,共同探索和开发基于OpenAI 的更多创新场景,并帮助企业打造自己专属的业务创新解决方案及应用落地。目前微软官方演示的商业应用案例主要有 Power Platform、Github Copilot、CarMax、Kepro,但这仅仅是冰山一角,以当前 Azure 的强大算力和 GPT-4 模型的能力,Azure OpenAI 的商业应用上限更多取决于企业和开发者的创意与需求。PowerPower PlatformPlatform:微软已将 GPT 模型集成到其 Power Apps

53、 平台中。这一举措旨在帮助从无编程经验的“公民开发者”到拥有深度编程专业知识的专业开发者构建提高业务生产力或流程的应用程序,而无需了解如何编写计算机代码或公式。在 Power Apps 中,GPT 模型可用于构建各种应用程序,如审查非营利性捐赠、管理新冠疫情期间的旅行或减少维护风力涡轮机所需的加班时间等。GithubGithub CopilotCopilot:GitHub Copilot 是一款人工智能辅助编程工具,OpenAI Codex 支持,能够在用户编写代码时提供类似自动补全的建议。用户可以通过开始编写所需的代码或用自然语言撰写注释来描述期望代码完成的任务,从而获得 GitHub Co

54、pilot 的建议。CarMaxCarMax:在美国最大的二手车零售商 CarMax,购车者不再需要花费大量时间去查找并阅读大量规格和评价。得益于强大的 AI 语言模型,潜在买家现在可以看到CarMax 销售的每个品牌、型号和年份车辆的客户评价摘要,这些摘要涵盖了约45,000 辆车的庞大库存中的约 5,000 种组合。在短短几个月内,CarMax 便利用 GPT-3 模型生成了大量原创内容,这样的速度以前是不可能实现的。KeproKepro:Kepro 使用了 Microsoft Azure 中针对医疗领域的 AI 产品:Text Analytics for health,以实现大规模临床文

55、档审查的自动化。公司利用自然语言处理技术快速准确地解析非结构化临床文档,并构建了神经网络,分析多个专业的医疗文档,且能自动填充针对 Medicare 和 Medicaid 审查员的 12 种不同文档模板的表格。证券研究报告|行业点评报告 请仔细阅读在本报告尾部的重要法律声明 13 图 5 Power Platform 帮助客户构建应用程序 图 6 Github Copilot 大幅提高开发者工作效率 资料来源:Github 官网,华西证券研究所 图 7 CarMax 利用 OpenAI 将客户评价总结为摘要 图 8 Kepro 使用 Azure AI 优化临床文档 3.3.3.3.OpenAI

56、OpenAI 亚洲大规模封号,亚洲大规模封号,数据安全是未来数据安全是未来 AIGCAIGC 重要因素重要因素 OpenAIOpenAI 大规模封号,进一步利好已接入企业。大规模封号,进一步利好已接入企业。根据每日经济新闻,OpenAI 官方从 3 月 30 号开始大面积封号,禁止使用亚洲节点登录,OpenAI 还在短时间内无法注册新账号。此次出现大规模封号的原因可能在于,一是许多账号是用程序批量注册的,一台机器用一个 IP 在短时间内注册了大量账号;二是出现 API 滥用的情况,例如,在不支持的地区使用了 ChatGPT API,或者利用多个账号获取 API 并对外提供服务。此次封号事件或许

57、意味着微软和 OpenAI 开始更加严格地管理 GPT 账号,当前对大陆企业来说,接入 Azure OpenAI 是唯一合法合规使用 GPT 模型的途径,我们认为已经接入 Azure OpenAI 的企业可以在确保合规和安全性的前提下充分利用 GPT 模型,改进内部工作效率或为客户提供可靠的 AI 服务。证券研究报告|行业点评报告 请仔细阅读在本报告尾部的重要法律声明 14 图 9 部分 OpenAI 账号于上月底被大规模封禁 政策方面政策方面仍需注意内外风险因素仍需注意内外风险因素。由于使用如 Azure OpenAI 等海外大模型需要将数据跨境传输,因此受到境内和境外的数据传输政策限制。内

58、部来看,内部来看,数据出境安全评估办法于 2022 年 7 月 7 日公布,自 2022 年 9 月1 日起施行,使用 Azure OpenAI 涉及重要数据和个人信息的出境,必须接受安全评估,需要向网信部门申报。目前已有数家企业落地了 Azure OpenAI 的应用,但不排除后期数据出境限制更加严格,使得 GPT 模型使用受限。外部来看,外部来看,2019 年美国国家安全和个人数据保护法案(尚未生效),对于美国用户数据出境,尤其是传输至中国进行明确的限制,旨在规制所有基于数据提供在线服务公司(包括“受管辖公司”),不得将任何用户数据或解密该数据所需的信息直接或间接地传输到中国、俄罗斯等任何

59、“有疑虑国家”,而其定义的“受管辖公司”实际非常广泛,大部分互联网企业都可归入其管制范围。如果该法案最终通过,则会极大限制美国与中国间的数据传输。实践上,自 2020 年以来,美国以用户数据隐私和国家安全审查为由对 TikTok(抖音海外版)和微信国际版持续进行打压,若企业使用海外大模型数据出境经由美国,则也需面对这方面的数据传输风险。证券研究报告|行业点评报告 请仔细阅读在本报告尾部的重要法律声明 15 表 9 数据出境安全评估办法重点内容 具体事项具体事项 适用范围适用范围 数据处理者向境外提供在中华人民共和国境内运营中收集和产生的重要数据和个人信息的安全评估 须向网信部须向网信部门申报情

60、形门申报情形 数据处理者向境外提供重要数据 关键信息基础设施运营者和处理 100 万人以上个人信息的数据处理者向境外提供个人信息 自上年 1 月 1 日起累计向境外提供 10 万人个人信息或者 1 万人敏感个人信息的数据处理者向境外提供个人信息 国家网信部门规定的其他需要申报数据出境安全评估的情形 重点评估事重点评估事项项 数据出境的目的、范围、方式等的合法性、正当性、必要性 境外接收方所在国家或者地区的数据安全保护政策法规和网络安全环境对出境数据安全的影响;境外接收方的数据保护水平是否达到中华人民共和国法律、行政法规的规定和强制性国家标准的要求 出境数据的规模、范围、种类、敏感程度,出境中和

61、出境后遭到篡改、破坏、泄露、丢失、转移或者被非法获取、非法利用等的风险 数据安全和个人信息权益是否能够得到充分有效保障 数据处理者与境外接收方拟订立的法律文件中是否充分约定了数据安全保护责任义务 遵守中国法律、行政法规、部门规章情况 国家网信部门认为需要评估的其他事项 评估部门评估部门 国务院有关部门、国家网信部门、省级网信部门、专业机构 4.4.投资建议投资建议 我们认为 AIGC 模型迭代正在加速,AI 发展日新月异,当前海外顶级模型仍占据领先地位,已接入 Azure OpenAI 获得原生 GPT-4 和 ChatGPT 赋能的企业有着一定的先发优势,可率先开始根据需求部署 AI 解决方

62、案和应用;同时,国内大模型有望在特定领域及中文处理上另辟蹊径实现赶超。后续国内率先落地后续国内率先落地 Azure OpenAIAzure OpenAI 应用的应用的标的有望受益标的有望受益,包括万科(2202.HK)、创梦天地(1119.HK)、医脉通(2192.HK),以及国内已实现自研大模型的企业以及国内已实现自研大模型的企业,包括阿里巴巴(9988.HK)、腾讯(0700.HK)、百度(9888.HK)。表 10 受益标的 代码代码 简称简称 最新收盘最新收盘价(港价(港元)元)PEPE EPSEPS 2022A2022A 2023E2023E 2024E2024E 2022A2022

63、A 2023E2023E 2024E2024E 2202.HK2202.HK 万科企业万科企业 12.00 5.65 5.34 5.00 2.18 2.25 2.4 1119.HK1119.HK 创梦天地创梦天地 4.16 25.58 13.57-2.02 0.16 0.31 2192.HK2192.HK 医脉通医脉通 10.72 58.55 0.18 9988.HK9988.HK 阿里巴巴阿里巴巴-SWSW 97.75 56.47 16.21 13.85 6.09 7.12 0700.HK0700.HK 腾讯控股腾讯控股 385.40 17.50 20.06 17.68 22.12 19.1

64、9 21.78 9888.HK9888.HK 百度集团百度集团-SWSW 142.90 47.23 21.99 19.12 2.80 6.49 7.46 资料来源:Wind,华西证券研究所,数据截至 2023 年 4 月 7 日,盈利预测皆为 Wind 一致预测 证券研究报告|行业点评报告 请仔细阅读在本报告尾部的重要法律声明 16 5.5.风险提示风险提示 技术落地商业化不及预期;人工智能在部分领域应用的监管风险;数据出海的政策风险。证券研究报告|行业点评报告 请仔细阅读在本报告尾部的重要法律声明 17 分析师与研究助理简介分析师与研究助理简介 朱芸:执业证书编号:S0

65、1 海外首席分析师。北京大学硕士。曾任天有投资集团有限公司副总裁、浙商证券海外&教育首席分析师、西南证券海外&计算机首席分析师,2022年3月加入华西证券研究所。分析师承诺分析师承诺 作者具有中国证券业协会授予的证券投资咨询执业资格或相当的专业胜任能力,保证报告所采用的数据均来自合规渠道,分析逻辑基于作者的职业理解,通过合理判断并得出结论,力求客观、公正,结论不受任何第三方的授意、影响,特此声明。评级说明评级说明 公司评级标准公司评级标准 投资投资评级评级 说明说明 以报告发布日后的 6 个月内公司股价相对上证指数的涨跌幅为基准。买入 分析师预测在此期间股价相对强于上证指数达到或超过 15%增

66、持 分析师预测在此期间股价相对强于上证指数在 5%15%之间 中性 分析师预测在此期间股价相对上证指数在-5%5%之间 减持 分析师预测在此期间股价相对弱于上证指数 5%15%之间 卖出 分析师预测在此期间股价相对弱于上证指数达到或超过 15%行业评级标准行业评级标准 以报告发布日后的 6 个月内行业指数的涨跌幅为基准。推荐 分析师预测在此期间行业指数相对强于上证指数达到或超过 10%中性 分析师预测在此期间行业指数相对上证指数在-10%10%之间 回避 分析师预测在此期间行业指数相对弱于上证指数达到或超过 10%华西证券研究所:华西证券研究所:地址:北京市西城区太平桥大街丰汇园 11 号丰汇

67、时代大厦南座 5 层 网址:http:/ 证券研究报告|行业点评报告 请仔细阅读在本报告尾部的重要法律声明 18 华西证券免责声明华西证券免责声明 华西证券股份有限公司(以下简称“本公司”)具备证券投资咨询业务资格。本报告仅供本公司签约客户使用。本公司不会因接收人收到或者经由其他渠道转发收到本报告而直接视其为本公司客户。本报告基于本公司研究所及其研究人员认为的已经公开的资料或者研究人员的实地调研资料,但本公司对该等信息的准确性、完整性或可靠性不作任何保证。本报告所载资料、意见以及推测仅于本报告发布当日的判断,且这种判断受到研究方法、研究依据等多方面的制约。在不同时期,本公司可发出与本报告所载资

68、料、意见及预测不一致的报告。本公司不保证本报告所含信息始终保持在最新状态。同时,本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者需自行关注相应更新或修改。在任何情况下,本报告仅提供给签约客户参考使用,任何信息或所表述的意见绝不构成对任何人的投资建议。市场有风险,投资需谨慎。投资者不应将本报告视为做出投资决策的惟一参考因素,亦不应认为本报告可以取代自己的判断。在任何情况下,本报告均未考虑到个别客户的特殊投资目标、财务状况或需求,不能作为客户进行客户买卖、认购证券或者其他金融工具的保证或邀请。在任何情况下,本公司、本公司员工或者其他关联方均不承诺投资者一定获利,不与投资者分享投资收益,

69、也不对任何人因使用本报告而导致的任何可能损失负有任何责任。投资者因使用本公司研究报告做出的任何投资决策均是独立行为,与本公司、本公司员工及其他关联方无关。本公司建立起信息隔离墙制度、跨墙制度来规范管理跨部门、跨关联机构之间的信息流动。务请投资者注意,在法律许可的前提下,本公司及其所属关联机构可能会持有报告中提到的公司所发行的证券或期权并进行证券或期权交易,也可能为这些公司提供或者争取提供投资银行、财务顾问或者金融产品等相关服务。在法律许可的前提下,本公司的董事、高级职员或员工可能担任本报告所提到的公司的董事。所有报告版权均归本公司所有。未经本公司事先书面授权,任何机构或个人不得以任何形式复制、转发或公开传播本报告的全部或部分内容,如需引用、刊发或转载本报告,需注明出处为华西证券研究所,且不得对本报告进行任何有悖原意的引用、删节和修改。

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(互联网行业:大陆企业获GPT赋能数据安全将成关键考量-230410(18页).pdf)为本站 (Azure) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部