《中国移动:我国人工智能大模型发展动态(2023)(12页).pdf》由会员分享,可在线阅读,更多相关《中国移动:我国人工智能大模型发展动态(2023)(12页).pdf(12页珍藏版)》请在三个皮匠报告上搜索。
1、我国人工智能大模型发展动态我国人工智能大模型发展动态中国移动研究院2023 年 4 月2/12摘要摘要国内大模型研发应用领域热潮持续高涨。据不完全统计,目前国内至少有 19 家企业及科研院所涉足人工智能大模型训练,主要分为大型科技公司、科研院校和初创科技团队三类。从大模从大模型的布局体系来看型的布局体系来看,百度、阿里、华为等大型科技公司从算力层、平台层、模型层、应用层进行了四位一体的全面布局,科研院校及初创科技公司主要以研发大模型算法及细分领域应用为主;从从大模型参数量看大模型参数量看,大型科技公司的参数量远大于科研院所,但基本都处于千亿及以上规模;从大模型应用方向看从大模型应用方向看,大部
2、分企业前期以内部应用为主,后续主要向 B 端企业拓展服务,预计少数企业将在 C 端市场形成规模。总体来说总体来说,业界普遍认为国内大模型与 GPT-3 的水平相当,与 GPT-4 仍有较大差距。3/12一、一、我国人工智能大模型总体情况我国人工智能大模型总体情况据不完全统计,截止到 2023 年 4 月 18 日,国内至少有 19家企业及科研院所涉足人工智能大模型训练,主要分为大型科技公司、科研院校和初创科技团队三类。具体来看:百度、阿里等12 家大型科技公司和中国科学院、清华大学等 3 家科研院校已经提供开放测试,或有明确的推出时间计划;字节跳动、搜狗创始人王小川、美团创始人王慧文、创新工场
3、创始人李开复等则是最近对外宣布组建团队,进军大模型研发领域。其中,字节跳动旗下火山引擎于 4 月 18 日发布自研 DPU(数据处理器)等系列云产品,推出新版机器学习平台,可以支持万卡级大模型训练、微秒级延迟网络,为预训练模型提供强大的算力支持。从大模型的布局体系来看从大模型的布局体系来看,科技大厂在算力层科技大厂在算力层、平台层平台层、模模型层型层、应用层进行了四位一体的全面布局应用层进行了四位一体的全面布局。百度、阿里、华为三家均从芯片到应用进行自主研发的全面布局,如百度的“昆仑芯+飞桨平台+文心大模型+行业应用”、阿里的“含光 800 芯片+M6-OFA 底座+通义大模型+行业应用”、华
4、为的“昇腾芯片+MindSpore 框架+盘古大模型+行业应用”。垂直行业科技企业和科研院校,主要以研发大模型算法及细分领域应用为主,自有算力相对薄弱,很少涉及芯片领域自主研发。从大模型参数量看从大模型参数量看,科技大厂的参数量远大于科研院所科技大厂的参数量远大于科研院所。科技大厂的大模型参数量较大:阿里通义千问大模型参数在 10 万亿级以上、腾讯混元大模型和华为盘古大模型参数量均在万亿级4/12以上、百度文心一言大模型参数量在 2 千亿级以上、京东言犀大模型的参数量为千亿级;垂直行业科技企业已经上线的参数量普遍在千亿级以上;而科研院校大模型的参数量在千亿级及以下。从大模型应用方向看从大模型应
5、用方向看,大部分企业前期以内部应用为主大部分企业前期以内部应用为主,后后续主要向续主要向 B B 端企业拓展服务端企业拓展服务,预计少数企业将在预计少数企业将在 C C 端市场形成规端市场形成规模模。目前,百度文心大模型、华为盘古大模型、中国科学院紫东太初大模型均在 B 端垂类市场积累了标杆应用案例,腾讯混元大模型、阿里通义大模型则更多聚焦公司自身业务。而在 C 端市场应用方面,百度文心一言、阿里通义千问、腾讯混元助手三类大模型最有可能向此方向拓展,但目前只有百度文心一言大模型正在进行友好客户测试,阿里通义千问大模型则计划在今年 9 月份进行公测,腾讯混元助手大模型则处于计划开发状态。从大模型
6、业界评估看从大模型业界评估看,国内大模型与国内大模型与 GPT-4GPT-4 有较大差距,但有较大差距,但科技大厂具备追赶实力。科技大厂具备追赶实力。目前国内大模型处于百花齐放的状态,但业界普遍认为,第一梯队当属百度第一梯队当属百度、阿里巴巴阿里巴巴、腾讯腾讯、华为四华为四家家。综合实力方面,四家企业在大模型研发投入、技术能力和人才团队实力较强;商用推进方面,四家企业均依托现有业务领域更容易形成大模型应用规模效应。5/126/12二、二、典型企业的大模型发展情况典型企业的大模型发展情况针对第一梯队整体布局的百度、阿里、华为、腾讯四家公司,以及垂直领域入局的商汤公司的进一步分析,发现各家企业在大
7、模型领域探索路径各有特色。(一)(一)百度文心大模型:早布局,内外双向发力百度文心大模型:早布局,内外双向发力1 1、总体概况总体概况百度是国内领先布局百度是国内领先布局 AIAI 领域的科技大厂,也是我国最早发领域的科技大厂,也是我国最早发布知识增强大语言模型产品的企业布知识增强大语言模型产品的企业。2010 年,百度成立了人工智能自然语言处理部,是中国最早布局 AI 的企业之一。据百度披露,其在 AI 领域累计投入研发总额超过千亿元,专利数量连续五年居全国第一。早在 2019 年,百度就发布文心大模型 ERNIE(以下简称文心大模型),目前已迭代至千亿级参数的 ERNIE 3.0 Zeus
8、。2023 年 3 月,百度相继发布了知识增强大语言模型产品“文心一言”和企业级产品“文心千帆”,可以为多个行业提供 API 接口及相应的开发工具链百度以百度以“昆仑芯昆仑芯+飞桨平台飞桨平台+文心大模型文心大模型+行业应用行业应用”在算力在算力层层、平台层平台层、模型层模型层、应用层具备完整布局应用层具备完整布局。在算力层在算力层,算力基础设施均由百度智算中心支持,昆仑芯二代(百度持股 70%)已广泛应用在文心大模型,预计昆仑芯三代将于 2024 年初量产;在在平台层平台层,百度飞桨 PaddlePaddle 是其自主研发的深度学习平台,文心大模型通过百度飞桨平台,实现模型训练、推理部署和场
9、景7/12应用;该平台对外部 535 万开发者提供 EasyDL、BML 等开发工具和各种 API;在模型层,在模型层,文心大模型具备自然语言处理、计算机视觉、多模态以及生物计算四大类能力;在应用层在应用层,文心大模型将应用在电力、燃气、金融、生物医药、航天、传媒、城市、影视、制造、社科等多个行业。2 2、市场应用和推广情况市场应用和推广情况百度文心大模型积极拓展内外部应用百度文心大模型积极拓展内外部应用,目前面向公众和企业目前面向公众和企业用户同时进行开放测试用户同时进行开放测试。内部应用层面内部应用层面,文心大模型已经率先应用于百度搜索、信息流、智能驾驶、百度地图、小度智能屏等内部重要产品
10、上;外部应用层面外部应用层面,文心大模型在金融、能源、制造、城市、传媒、互联网等行业有标杆应用案例,实现真实场景应用的同时获取大量行业数据反哺大模型的优化。据媒体公开信息显示,目前 600 多家企业宣布加入文心大模型生态。3 3、内外部评估情况内外部评估情况百度 CEO 李彦宏在 3 月对外宣称,文心一言和 GPT-3 版本相相差一两个月差一两个月的时间。目前文心一言是业界唯一一个对大众用户开放测试的知识增强大语言模型产品,根据研究团队最新测试,文心一言的文本生成能力较强,针对 3 月份业界质疑的“文生图不达中文意境”的问题已经进行了修正,但仍存在常识性错误、“一本正经地胡编乱造”等现象。8/
11、12(二)(二)阿里通义大模型:建生态,率先内部应用阿里通义大模型:建生态,率先内部应用1 1、总体概况总体概况阿里以阿里以“含光含光 800800 芯片芯片+M6-OFA+M6-OFA 底座底座+通义大模型通义大模型+行业应用行业应用”成为大模型全部环节的重要参与者成为大模型全部环节的重要参与者。2019 年,阿里达摩院开启大模型研究。2022 年 9 月,阿里正式发布通义大模型,包括通义M6 多模态模型、通义 AliceMind 自然语言处理模型、通义视觉计算机视觉模型。2022 年 11 月,阿里推出 AI 开源社区“魔搭”(ModelScope),旨在打造下一代“模型即服务”的共享平台
12、,整合业界多方模型提供者,为开发者提供预训练基础模型和 API 接口。目前该平台已有超过 300 个开源模型,包括阿里自有的通义大模型系列以及澜舟科技孟子系列模型等外部资源和能力。2023年 4 月,阿里正式发布了“通义千问”产品,该产品基于 10 万亿级参数的大模型底座 M6-OFA,未来将具有多轮交互及复杂指令理解、可多模态融合、支持外部增强 API 等多种能力。另外,阿里不仅拥有最多的英伟达 A100 芯片,还拥有自研芯片含光 800、倚天 710 芯片,共同为人工智能大模型提供算力。2 2、市场应用和推广情况市场应用和推广情况通义通义大大模型模型将全面支撑阿里系所有产品将全面支撑阿里系
13、所有产品。目前阿里通义大模型主要定向邀请企业用户测试主要定向邀请企业用户测试,尚未向公众尚未向公众客户客户开放开放。内部应用内部应用层面层面,阿里已宣布旗下所有产品未来将全面改造接入通义大模型,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等;外部应用外部应用层层9/12面面,阿里通义大模型目前正探索与 OPPO、太平洋保险、吉利汽车电子等企业,在电子、金融、汽车等领域开展合作。3 3、内外部评估情况内外部评估情况根据对阿里专家的调研,通义千问大模型主要偏向文本主要偏向文本,但但目前还不具备图片、视频生成能力;目前还不具备图片、视频生成能力;在预训练语料数据集方面,其质量和规模上都逊于 Open
14、AI 和百度,总体相当于总体相当于 GPT-3GPT-3,与,与百度文心百度文心一言一言效果相近效果相近。而外部业界测试显示,通义千问大模型在文字创作领域,尤其在语言翻译领域表现较为出色,但在复杂理科计算方面仍有提升空间。(三)(三)华为盘古大模型:全栈式服务,深耕行业应用华为盘古大模型:全栈式服务,深耕行业应用1 1、总体概况总体概况华为打造了华为打造了“昇腾芯片昇腾芯片+MindSpore+MindSpore 框架框架+盘古大模型盘古大模型+行业应行业应用用”四位一体的完整体系,主要面向企业市场提供全栈式服务四位一体的完整体系,主要面向企业市场提供全栈式服务。2020 年,华为启动研发盘古
15、大模型。2021 年 4 月,华为正式发布盘古大模型,包括自然语言处理、计算机视觉、科学计算等大模型。其中,盘古自然语言处理大模型可应用于智能文档搜索、智能 ERP、小语种大模型等领域;盘古计算机视觉大模型则聚焦分类、分割、检测等视觉场景,可应用于工业质检领域;科学计算大模型则主要用于解决各种科学问题,如气象预报、海浪预测等。另外,华为盘古大模型依托自研的昇腾 910、920 系列芯片,与 MindSpore 框架形成一个整体,为企业提供全栈式的应用服务。10/122 2、市场应用和推广情况市场应用和推广情况据华为公开信息显示,盘古大模型盘古大模型在能源、零售、金融、工业、医疗、环境、物流等
16、100100 多个行业完成场景验证多个行业完成场景验证。但截止 2023年 4 月 16 日,华为云官网尚未尚未显示盘古大模型上线上线状态。3 3、内外部评估情况内外部评估情况据华为公开信息显示,在医药领域,利用盘古药物分子大模型让先导药的研发周期从数年缩短至一个月,研发成本降低 70%;在气象领域,依托盘古气象大模型,可提供秒级全球气象预报,预测速度提高万倍以上,台风轨迹预测准确度世界第一,相比欧洲气象局提升约 20%;在工业领域,盘古机器视觉大模型使样本筛选效率提升约 30 倍,筛选质量提升约 5 倍,开发成本降低 90%。另外,外部评估暂无最新信息。(四)(四)腾讯混元大模型:练内功,高
17、度适配自有业务腾讯混元大模型:练内功,高度适配自有业务1 1、总体概况总体概况腾讯构建腾讯构建了了“太极机器学习平台太极机器学习平台+混元大模型混元大模型”,同时腾讯启同时腾讯启动了动了“混元助手混元助手”知识增强大语言模型项目知识增强大语言模型项目。2016 年,腾讯成立了 AI Lab 实验室。2022 年 4 月,腾讯对外披露了混元大模型,涉及自然语言处理、计算机视觉、多模态等多个领域。腾讯自研的太极机器学习平台为混元大模型提供算力,可支持 10TB 级模型训练、TB 级模型推理计算能力等。另据媒体报道,2023 年 3月,腾讯对标 ChatGPT 已成立“混元助手”战略级项目组。11/
18、122 2、市场应用和推广情况市场应用和推广情况混元大模型目前主要服务于腾讯内部业务。混元大模型目前主要服务于腾讯内部业务。截止 2023 年 4月 16 日,腾讯混元大模型尚未对企业和公众客户开放测试。内内部应用层面部应用层面,混元大模型已成功应用应用于腾讯广告于腾讯广告,将全面接入微将全面接入微信端信端、QQQQ 端端和王者荣耀、英雄联盟游戏端游戏端,提供智能聊天、内容推荐、情感分析、故事生成、角色塑造等功能;外部应用层面外部应用层面,业界推测腾讯混元大模型将在游戏、社交、金融、教育、医疗等领域发展生态,但腾讯尚未公开其明确的行业应用方向。3 3、内外部评估情况内外部评估情况据腾讯公开信息
19、显示,混元大模型精准地把广告投放给特定人群,相比以前的小模型算法,腾讯混元大模型已累计给广告主带来 15%的 GMV 提升。另外,外部评估暂无最新信息。(五)(五)商汤日日新大模型:目标成为通用人工智能新基建商汤日日新大模型:目标成为通用人工智能新基建1 1、总体概况总体概况商汤以商汤以“AIAI 大装置大装置 SenseCoreSenseCore 算力平台算力平台+新新 SenseNovaSenseNova 大模大模型型”为企业提供模型训练基地。为企业提供模型训练基地。2018 年,商汤启动大模型研究。2022 年,商汤推出了 320 亿参数量的通用视觉模型,在自动驾驶、工业质检、医疗影像等多个领域落地应用。2023 年 4 月,商汤发布大模型“日日新 SenseNova”,推出自然语言处理、内容生成、自动化数据标注、自定义模型训练、模型研发功能等多种能力。另外,商汤的 AI 大装置“SenseCore”是亚洲最大的算力平台之12/12一,可以同时支持 20 个千亿级参数的大模型训练,最高可支持万亿参数超大模型的训练。2 2、市场应用和推广情况市场应用和推广情况日日新大模型目前已已面向政企客户开放面向政企客户开放测试测试。在应用层面,根据其官方网站显示,该模型计划支持智能汽车、智慧生活、智慧商业、智慧城市等业务板块。