《弗若斯特沙利文:人工智能行业中国AI语音识别市场研究报告(19页).pdf》由会员分享,可在线阅读,更多相关《弗若斯特沙利文:人工智能行业中国AI语音识别市场研究报告(19页).pdf(19页珍藏版)》请在三个皮匠报告上搜索。
1、 报告提供的任何内容(包括但不限于数据、文字、图表、图像等)均系弗若斯特沙利文公司独有的高度机密性文件(在报告中另行标明出处者除外)。未经弗若斯特沙利文公司事先书面许可,任何人不得以任何 方式擅自复制、再造、传播、出版、引用、改编、汇编本报告内容,若有违反上述约定的行为发生,弗若斯特沙利文公司保留采取法律措施,追究相关人员责任的权利。弗若斯特沙利文开展的所有商业活动均使用“弗 若斯特沙利文”或“Frost & Sullivan”的商号、商标,弗若斯特沙利文无任何前述名称之外的其他分支机构,也未授权或聘用其他任何第三方代表弗若斯特沙利文开展商业活动。 中国 AI 语音识别市场研究报告 A Fro
2、st & Sullivan Research Report 2020 Frost & Sullivan. All rights reserved. This document contains highly confidential information and is the sole property of Frost & Sullivan No part of it may be circulated, quoted, copied or otherwise reproduced without the written approval of Frost & Sullivan 1 目录
3、1 AI 语音识别定义与解读 . 2 2 中国 AI 语音识别市场概览 . 3 2.1 AI 语音识别产业链分析 . 3 2.2 中国 AI 语音识别市场驱动因素 . 5 2.2.1 需求端:下游需求增长,AI 语音识别市场空间稳步提高 . 5 2.2.2 技术端:算力、算法、大数据升级,AI 语音识别准确率持续提升 . 6 2.2.3 政策端:人工智能上升至国家战略地位,AI 语音识别行业加快布局和落 地 . 7 2.3 中国 AI 语音识别市场趋势洞察 . 7 2.3.1 云计算渐发展,商业化前景更广阔 . 7 2.3.2 多技术协同发展,语音交互更生动 . 8 2.3.3 语音技术渐开放
4、,普惠生态更繁荣 . 10 2.4 中国 AI 语音识别市场关键成功因素分析 . 10 3 中国 AI 语音识别市场竞争格局分析 . 12 3.1 沙利文企业增长评价数据来源和研究主体 . 12 3.2 中国 AI 语音识别市场企业增长评价结果及分析 . 12 3.3 沙利文评价模型的设计 . 16 4 研究方法和研究范围介绍 . 18 4.1 研究方法 . 18 4.2 研究范围 . 18 nMoRmMnQxOoPpQmNsPmRsM7NdN8OtRrRsQnNlOrQoMeRpOyQ6MrQrPuOqQqMNZqRpP 2020 Frost & Sullivan. All rights r
5、eserved. This document contains highly confidential information and is the sole property of Frost & Sullivan No part of it may be circulated, quoted, copied or otherwise reproduced without the written approval of Frost & Sullivan 2 1 AI 语音识别定义与解读 语音识别是人机交互的入口,是指机器/程序接收、解释声音,或理解和执行口头命令 的能力。在智能时代,越来越多
6、的场景在设计个性化的交互界面时,采用以对话为主的交互 形式。一个完整的对话交互是由“听懂理解回答”三个步骤完成的闭环,其中, “听懂”需要语音识别(Automatic Speech Recognition, ASR)技术; “理解”需要自然语 言处理 (Natural Language Processing, NLP) 技术; “回答” 需要语音合成 (Text To Speech, TTS)技术。三个步骤环环相扣,相辅相成。语音识别技术是对话交互的开端,是保证对话 交互高效准确进行的基础。 语音识别技术自 20 世纪 50 年代开始步入萌芽阶段,发展至今,主流算法模型已经经 历了四个阶段:包
7、括模板匹配阶段、模式和特征分析阶段、概率统计建模阶段和现在主流的 深度神经网络阶段。目前,语音识别主流厂商主要使用端到端算法,在理想实验环境下语音 识别准确率可高达 98%以上。 图 1-1:AI 语音识别发展历程 来源:fsTEAM软件采编,沙利文研究院绘制 2020 Frost & Sullivan. All rights reserved. This document contains highly confidential information and is the sole property of Frost & Sullivan No part of it may be circ
8、ulated, quoted, copied or otherwise reproduced without the written approval of Frost & Sullivan 3 2 中国 AI 语音识别市场概览 2.1 AI 语音识别产业链分析 中国 AI 语音识别市场参与者众多,主要分为上游、中游、下游。 图 2-1:AI 语音识别产业链分析 来源:沙利文研究院绘制 上游:底层技术提供强力支撑,云计算助推 AI 语音应用普及-语音识别解码过程中包 含了声学模型和语言模型的识别建模和模型训练两个部分。 在运行过程中训练数据量和 计算量需求极大,传统的 CPU 或者单一处理器几
9、乎无法快速单独完成一个完整的模型 训练过程,主要原因在于 CPU 内部仅含少量逻辑单元,且指令执行是逐一进行的串行 计算, 使用该架构进行语音识别运算的处理时间过长, 无法满足海量数据计算的实时性 需求。因此,能提供海量数据处理、存储以及高性能运算能力的云计算技术成为语音识 别行业的应用热点。 目前, 主流语音识别公司的模型训练和语音识别基本都在云端采用 GPU 并行架构或异构计算方案进行。 2020 Frost & Sullivan. All rights reserved. This document contains highly confidential information and
10、 is the sole property of Frost & Sullivan No part of it may be circulated, quoted, copied or otherwise reproduced without the written approval of Frost & Sullivan 4 中游: 语音技术持续升级, 生态圈建立赋能产业-语音识别的中游主要为将语音识别技 术实现商业化落地的硬件及软件服务供应商。 根据终端消费者类型, 语音识别的中游厂 商主要可以分为消费级市场和专业级市场, 其中消费级市场中的主要语音识别产品包括 消费级智能硬件、 智能音箱
11、及语音输入法等, 专业级市场的语音识别产品则主要以行业 解决方案 (以项目制交付的软 硬件产品及服务) 和平台化技 术输出(SDK 或 API 形式的 智能语音开放平台) 两种形式 呈现, 其中更为垂直落地的解 决方案形式在目前专业级商 业化收入市场中占比更高。 目 前, 智能语音开放平台在智能 语音市场中收入占比较小的 主要原因是, 以阿里、 百度及 科大讯飞为首的各大厂商为加速 AI 语音技术对下游应用场景的渗透,采用多种优惠甚 至免费形式向开发者提供语音识别服务, 希望将语音识别技术应用在更多软件及场景中, 与广大开发者携手建立一个完整的 AI 产业生态圈。 下游分析:行业应用多样化,一
12、站式服务需求广-语音识别作为 AI 交互的重要入口, 在人工智能领域属于最重要和发展最为成熟的技术之一, 目前已经以多种商业化形式广 泛应用于下游市场。 从应用领域来看, 目前消费级市场主要应用于智能硬件、 智能家居、 智慧教育、车载系统等领域,专业级市场主要应用于医疗、公检法、教育、客服、语音 审核等领域。 广泛的应用领域也就意味着更加多元化的使用场景, 然而目前的语音识别 技术对于使用场景具有较强的限制性。 尽管快速更新迭代的神经网络结构已经将安静环 境下的近场语音识别的错误率降低至 3%以下,但现实环境中多数应用场景无法满足理 想的环境条件,因此在进行语音识别时需要同时考虑到各种噪声、信
13、道等因素。为使语 音识别技术在更广泛的使用场景下保持良好的表现,AI 语音厂商需要提供硬件与软件 协同的一站式服务, 并根据用户实际痛点进行针对性优化, 从而有效提升在多元下游场 景下语音识别的渗透率。 2020 Frost & Sullivan. All rights reserved. This document contains highly confidential information and is the sole property of Frost & Sullivan No part of it may be circulated, quoted, copied or oth
14、erwise reproduced without the written approval of Frost & Sullivan 5 2.2 中国 AI 语音识别市场驱动因素 2.2.1 需求端:下游需求增长,AI 语音识别市场空间稳步提高 在过去五年间,中国 AI 语音的需求最先在消费级市场爆发,主要得益于互联网及智能 硬件设备厂商加大语音识别的投入经费,以及厂商为提前占据市场推行的智能音箱硬件补 贴。目前,消费级产品及服务主要包括智能音箱、智能车载和智能硬件及消费级互联网增值 服务。然而,目前包括直接面向消费者的产品及服务在内,语音识别的相关应用及使用场景 仍具有局限性。未来,在消费级
15、产品供应商和开发者共同构建产业生态圈的过程中,语音识 别技术将更好地与其他语音交互技术及软件功能融合, 为消费者提供更优质的体验, 未来 AI 语音识别市场将迎来广阔的发展空间。 对于专业级市场而言, 主要的产品形式包括智能语音开放平台和行业解决方案, 下游应 用领域目前主要包括数字化水平相对较高的智慧医疗、智慧教育、企业客服、司法政务、金 融领域等。 AI 语音识别作为人机交互的重要入口之一, 除了在语音识别的领域表现出色外, 也要能更好地与其他智能语音技术(包括语义理解、远场语音识别、唤醒目标检测、全双工 交互、个性化识别技术等)进行融合,从而综合提升真实场景中的用户体验。近年来 AI 语
16、 音识别专业级市场的快速增长主要原因除了深度神经网络算法为语音识别带来的准确率大 幅提升外,更重要的是其他智能语音和 AI 技术的发展带来了更广阔的应用场景,预计未来 专业级市场的商业化需求将得到进一步释放。 2020 Frost & Sullivan. All rights reserved. This document contains highly confidential information and is the sole property of Frost & Sullivan No part of it may be circulated, quoted, copied or
17、otherwise reproduced without the written approval of Frost & Sullivan 6 图 2-2:中国 AI 语音识别市场商用收入规模,2015-2024 年预测 * 统计对象包括:1)专业级市场:智能语音行业解决方案、智能语音开放平台等; 2)消费级市场:与语音识别直接相关的硬 件设备,如智能音箱及相应消费级软件和服务如个性化教与学平台、语音输入法、智慧考试等。以上商业化收入仅包括智能语音 直接相关收入,硬件收入及其他技术相关收入不纳入本市场规模。 来源:沙利文研究院绘制 2.2.2 技术端:算力、算法、大数据升级,AI 语音识别准确
18、率持续提升 在过去 5-10 年,AI 语音识别技术的快速商业化的主要原因在于技术端的快速发展,如 计算能力的提升、算法框架的优化和大数据的升级等。 图 2-3:中国 AI 语音识别市场技术发展情况 来源:沙利文研究院绘制 从计算能力来看,芯片处理能力的大幅提升、GPU 的大量应用、云服务的普及还 有硬件价格的快速下降共同为人工智能计算能力的提升提供了重要支撑; 从算法框架来看, 目前主流语音识别模型已经以深度神经网络为主导, 神经网络的 出现及普及为语音识别准确率的提升起到了重要作用; 2020 Frost & Sullivan. All rights reserved. This docu
19、ment contains highly confidential information and is the sole property of Frost & Sullivan No part of it may be circulated, quoted, copied or otherwise reproduced without the written approval of Frost & Sullivan 7 从大数据来看, 更加贴近真实使用场景的语料库也为语音识别技术提供了更加有效 的训练素材,从而大幅提升了 AI 语音识别产品及服务的使用体验。以上底层技术 的升级,为语音识别
20、技术的准确率提升及商用渗透提供了强大的市场驱动力。 2.2.3 政策端:人工智能上升至国家战略地位,AI 语音识别行业加快布局和落地 人工智能发展水平一定程度上体现了各国最高的科技水平。 考虑到人工智能发展对于国 家经济发展的重要性,中国政府已针对人工智能行业颁布了多项国家层面的发展政策,自 2017 年以来人工智能行业已经连续三年被写入全国政府工作报告内。具体支持政策包 括项目发展基金、人才引进政策及其他国家扶持政策。目前,语音识别技术属于中国 AI 领 域中最为成熟落地的技术之一, 在国家政策的强力扶持下, 预计未来能够加速在垂直行业的 渗透和布局。 同时,在中国制造 2025的大背景和智
21、能经济新形态下,各省市响应中央号召,截 至 2019 年上半年,已有 30 多个省市发布人工智能相关规划或专项政策,以人工智能为技 术手段,发挥当地产业集群优势,促进产学研融合及协同发展。 图 2-4:国家及地方相关政策及影响 来源:沙利文研究院绘制 2.3 中国 AI 语音识别市场趋势洞察 2.3.1 云计算渐发展,商业化前景更广阔 AI 语音识别发展至今,主流算法模型已经从模板匹配阶段转变为深度神经网络阶段。 在深度神经网络算法下,考虑到训练过程中大量数据的使用,计算量巨大,对于应用企业而 言,采用本地计算方式的算力门槛过高。而在当下的智能时代,日渐普及的云计算环境提升 2020 Fros
22、t & Sullivan. All rights reserved. This document contains highly confidential information and is the sole property of Frost & Sullivan No part of it may be circulated, quoted, copied or otherwise reproduced without the written approval of Frost & Sullivan 8 AI 语音识别运算效率的同时也降低了企业的进入门槛, 因此大大促进了 AI 语音的技
23、术发展。 语音识别终端把采集到的语音片段进行模数转换后, 进行传送和决策, 然后通过通信网络将 语音数据上传至云端进行语音识别,反馈结果至语音识别终端。在此过程中,云计算可以完 成语音数据库和语言数据库的训练, 最高效输出反馈结果, 促进 AI 语音技术的准确率提高。 基于云计算的发展, 部分头部厂商也在逐渐推出基于云上的语音产品, 商业化落地的步 伐正在加快。在个别应用场景领域中,基于云计算的 AI 语音技术应用市场销售规模已近乎 领先于头部的基于传统硬件厂商所服务的市场规模,大量的独立软件开发商(ISV)趋于与 云上语音技术厂商达成合作关系, 从而在低成本的情况下在云开放平台上获取最前沿的
24、云上 智能语音技术和行业语音解决方案。 例如, 现已有超过 5 万家语音客户与阿里云智能语音达 成合作,覆盖多行业场景,包括中国移动、中央电视台、招商银行在内的传统行业的大型企 业。其中,在电话客服行业,与阿里达成合作的独立软件开发商(ISV)头部 8 家用户年销 售额接近 6 亿元人民币,在法院语音识别市场的联盟商 2019 年也达到年销售额 1.6 亿元人 民币。基于云计算的 AI 语音技术能够满足 ISV 在录音文件识别、实时语音识别、一句话识 别、语音自学习平台、短文本语音合成、长文本语音合成、语音唤醒、声纹识别、语音模组 和语音交互 SDK 等方面的技术需求,从而支撑他们实现和拓展更
25、多的应用场景和渠道的发 展需求。 2-5:神经网络模拟对于内存大小和计算能力的需求关系 来源:沙利文研究院绘制 2.3.2 多技术协同发展,语音交互更生动 语音识别属于人工智能中的感知智能, 其核心功能是将物理世界的信息转化成可供计算 2020 Frost & Sullivan. All rights reserved. This document contains highly confidential information and is the sole property of Frost & Sullivan No part of it may be circulated, quote
26、d, copied or otherwise reproduced without the written approval of Frost & Sullivan 9 机处理的信息, 为后续的认知智能提供基础。 因此, 语音识别作为人工智能的重要感知入口, 除了实现本身的单一功能外,还可以与其他 AI 技术进行深度集成,应用于更广泛的生活场 景中。通过前端语音交互提供入口,后端互联网提供服务,多种技术协同发展的形式,不仅 为单一的技术赋能,同时也能推动 AI 语音相关产业创新,有利于未来新兴产业的崛起。如 服务机器人、智能客服等新兴产业在 AI 语音识别的技术推动下正在快速发展。 技术融合已
27、成为当下的趋势,只有将多种技术充分结合,才能为用户带来更多价值。以 公检法领域为例,通过融合声学信号、模式识别、自然语言处理、语音合成等技术,可以实 现智慧庭审、 电信网络反欺诈、 虚拟法官、 声纹研判、 智能接警、 警务智能语音服务等功能, 为公检参与者提供全面高效的服务。 2-6:语音识别在公检法领域的技术应用和落地 来源:沙利文研究院绘制 2020 Frost & Sullivan. All rights reserved. This document contains highly confidential information and is the sole property of
28、 Frost & Sullivan No part of it may be circulated, quoted, copied or otherwise reproduced without the written approval of Frost & Sullivan 10 2.3.3 语音技术渐开放,普惠生态更繁荣 智能硬件的“智能” ,体现在强大的感知能力、机器学习、自然语言理解等,而这些功 能十分依赖于大数据以及云计算技术的支撑。 目前, 这些数据和计算资源基本掌握在大型 AI 语音识别厂商手中,给 AI 生态的发展无形中增设了障碍。此外,随着云计算、语音识别等 技术的发展, A
29、I 语音将会渗透到各行各业中, 但各行业都有其独特的属性, 很难有一套通用 的 AI 语音技术适用于所有的行业。为适应多元化的行业应用,提高开发和应用效率,应渐 渐将定制化模型的能力开放,使开发者在前期模型训练阶段不拘于行业属性,授之以渔,定 制行业特属的算法模型,真正做到普惠生态。 目前,AI 语音厂商正在逐渐开始构建这样的普惠生态。AI 语音厂商基于可靠的技术基 础赋能行业升级,将软件和硬件结合,提供芯片端到语音算法、平台的一站式服务,并通过 平台化的方式开放其智能语音算法能力, 赋能其他合作伙伴高效开发针对性产品, 为整个 AI 生态提供更为普惠的服务。打造 AI 普惠生态系统,需与 A
30、I 行业独立软件开发商达成合作, 为其落地更多的应用场景降低技术使用门槛,合作提供更贴近需求、量身定制的解决方案。 如, 百度宣布语音技术接口永久免费开放, 提供语音识别、 语音合成、 语音唤醒多平台 SDK。 阿里云的语音交互技术服务平台聚焦语音的核心能力, 在基于云的开放式平台为中下游 ISV 提供包括了语音原子能力、开箱即用的行业模型、和自学习平台的一站式服务,紧靠行业伙 伴,和客户一起打造更贴近需求的产品。 2.4 中国 AI 语音识别市场关键成功因素分析 (1)强劲的技术支撑 AI 语音从技术突破开始,到应用、终端和场景的不断突破,再回归到技术,渐成业内共 识。 语义识别的加入、 知
31、识图谱的构建和技术的快速迭代, 也为智能语音技术进入 3%红线、 未来将会是一个普惠 AI 的时代,技术开放将会是 AI 时代非常重要的特点。尤其在当 下竞争激烈的环境下, AI 语音识别厂商技术的差距已经不太明显, 若能开放语音技术能力, 赋能行业伙伴,不仅可以快速抓住用户,占领市场,还能促进整体生态繁荣发展,普惠 AI 应用市场。 2020 Frost & Sullivan. All rights reserved. This document contains highly confidential information and is the sole property of Fros
32、t & Sullivan No part of it may be circulated, quoted, copied or otherwise reproduced without the written approval of Frost & Sullivan 11 甚至达到更高识别率带来可能。 但由于 AI 语音发展时间从整个技术长河的角度而言并不长, 从听清逐渐实现听懂, 最后到满足用户随心所欲, 还需要不断的训练、 试验, 以及技术迭代。 对于语音识别厂商而言,如何在现实场景下将声学、语言学等多学科技术融合,实现技术迭 代和算法提升,从而提供高准确率的语音识别服务是行业的重要成功因
33、素之一。 (2)充足的语料积累 如果算法是 AI 语音技术的引擎, 那么 数据就是燃料。算法需要庞大的基于真实 场景的数据,并需要对数据进行相对精确 的标注,例如在建立声纹识别训练库时, 至少要保证性别比例分布为 50%5%, 并包含有不同年龄区间、不同地域口音等 训练样本。 因此, 对于语音识别厂商而言, 在垂直行业的真实场景下积累充足且及时的语音资料和文本资料, 并针对以上资料加以标注 及进行实时更新和迭代是优化用户体验和提升客户粘度的关键, 也是语音识别行业的关键成 功因素之一。 (3)丰富的场景土壤 应用、终端和场景带来了大量应用数据,更为应用于语音识别的机器学习、深度学习带 来了技术
34、突破。语音识别技术的爆发是源于大数据,数据量越多,语音识别的算法准确性越 高,语音识别的识别准确率相应越高。 此外, 语音识别技术需要丰富的场景土壤来培养快速的复杂场景处理能力。 在消费级用 户需求方面, 从语音识别技术发展的开端起, 消费者对语音识别技术就建立了高预期希 望利用新技术提升生活体验, 将高准确率的语音识别技术创造性地融入到日常场景中。 在专 业级用户需求方面,司法、医疗、教育、电信、交通等行业的政府及企业级用户需要语音识 别系统在实际业务应用中表现出功能的可靠性和稳定性, 因此, 这些专业级用户在选择语音 识别产品时会通过严格的招投标选择最具实力和行业经验的 AI 语音识别产品
35、和服务供应商。 面对日益提升的用户需求,AI 语音厂商需要积累丰富的场景经验,培养快速的复杂场景处 理能力以赢得市场。此外,用户在选定语音识别供应商后倾向于长期保持稳定合作,这也成 为 AI 语音厂商持续成功的因素之一。 2020 Frost & Sullivan. All rights reserved. This document contains highly confidential information and is the sole property of Frost & Sullivan No part of it may be circulated, quoted, copi
36、ed or otherwise reproduced without the written approval of Frost & Sullivan 12 3 中国 AI 语音识别市场竞争格局分析 沙利文通过深度访谈和调研市场领导者、参与者、用户及行业专家,查阅公开信息,制 定了一套包含一系列评价指标和市场权重的评价体系,并基于该评价体系对中国 AI 语音主 流厂商进行客观公正的评估,分析其在中国的 AI 语音行业中增长力情况。 3.1 沙利文企业增长评价数据来源和研究主体 本报告数据来源于技术指数、市场数据及 AI 语音识别领域开发人员、服务提供商、行 业专家访谈等。报告的评价主体为中国
37、AI 语音识别主流厂商,按照其属性可分为 IT 及互联 网厂商、语音技术厂商两类。 IT 及互联网厂商:IT 及互联网厂商包括百度、阿里巴巴、腾讯、搜狗、小米等厂商。凭 借在互联网时代积累的大量资本,IT 及互联网厂商在众多科技领域成为了主要“玩家” 。与 依靠人工智能技术起家的 AI 垂直类企业不同,IT 及互联网厂商侧重以流量导向和满足庞大 用户群体验和创新需求为导向去做 AI 开发,更多以流量和用户体验为导向,同时,会比传 统的语音技术厂商更加注重创新实践。 语音技术厂商: 语音技术厂商也可以分为传统语音技术厂商和创业厂商。 传统语音技术 厂商包括科大讯飞、小 i 机器人、捷通华声等拥有
38、自己的核心智能语音芯片以及语音相关软 件系统的厂商,创业厂商包括云知声、思必驰、出门问问等专注于某些垂直领域(如汽车、 家电)来推广自己的语音技术和产品的厂商。 3.2 中国 AI 语音识别市场企业增长评价结果及分析 通过以上评价和模型计算,可得到综合评价值排名如下: 2020 Frost & Sullivan. All rights reserved. This document contains highly confidential information and is the sole property of Frost & Sullivan No part of it may be
39、circulated, quoted, copied or otherwise reproduced without the written approval of Frost & Sullivan 13 图 3-2:中国 AI 语音识别主流厂商竞争力分析 注:圆点颜色深浅代表客户指数值大小,圆点颜色最深表示客户指数值越大。 来源:沙利文研究院绘制 基于本模型的评价,阿里巴巴、科大讯飞、百度、腾讯均处于高竞争力区间,且阿里巴 巴在增长指数、创新指数和客户指数三个维度均表现突出。 阿里巴巴 阿里智能语音交互服务是业内领先的云原生语音服务平台, 对阿里集团内服务于超 过 99%语音场景,对外提供各
40、类云上语音产品。 (1)在语音识别全产业链方面, 阿里云上语音技术在大量数据积累、 算法积累 (独创的下一代端到端语音识别技术 SCAMA和SAN-M算法, 基于CPU服务器的高并发、 实时/离线的语音识别能力) 、 工程积累(云原生 AI 技术、大规模弹性计算能力、支撑集团日均数亿请求服务能 力) 和阿里达摩研究院技术同步上云的成果加持下, 极大提升了语音交互的准确率 和性能。阿里智能语音交互技术已解锁并成熟布局于多个场景中,包括智能客服、 2020 Frost & Sullivan. All rights reserved. This document contains highly co
41、nfidential information and is the sole property of Frost & Sullivan No part of it may be circulated, quoted, copied or otherwise reproduced without the written approval of Frost & Sullivan 14 智能质检、法庭庭审实时记录、实时演讲字幕、访谈录音转写、声纹登录、设备端 语音交互等场景,在政务、金融、物流、教育、电商、泛互联网、医疗、餐饮等多 个领域均有应用案例以及大量的客户积累。 (2)在市场方面,目前,阿里
42、智能语音 分别在电话客服和法院语音识别的市场都占有领先的位置 (全国电话客服领域最大 的技术合作联盟; 与法院行业龙头应用厂商全部达成合作, 覆盖近万间线下法庭和 超过 1.5 万间线上法庭) 。阿里语音 AI 技术能在多个领域快速落地,占领市场并成 为行业客户认知度前列的云上语音技术厂商, 关键因素之一是与大量的独立软件开 发商结成了阿里语音 AI 产业联盟。 (3)在企业经营和战略方面,阿里云在基建技 术的布局的规划方面,将继续加大投入对云操作系统、服务器、芯片、网络等核心 技术的研发,为语音 AI 与云的结合带来更具想象力的应用场景和价值空间。 (4) 在创新方面, 阿里重视对技术的研发
43、投入和对行业的贡献, 其智能语音核心技术能 力是下一代端到端语音识别技术 SCAMA、SAN-M 技术和 DFSMN 技术,这几种 技术都是业界首次在非科研领域的应用并大获成功, 使得语音交互的准确率在高并 发的情况下获得大幅度提高, 同时 DFSMN 也已经面向全行业开源, 为行业整体技 术提升做贡献。另外阿里在业内率先推出了自学习平台改变了语音 AI 生产关系, 即便行业实践者没有很多语音领域的专业知识, 也能够用阿里云自学习产品, 通过 灌注入行业内的数据和知识, 就能够获得所在行业不错的语音交互效果。 阿里的智 慧大屏解锁了多场景,阿里达摩院全球首创多模态语音交互方案,与语音、视觉、
44、自然语言理解多 AI 技术融合,能够实现在强噪音环境下的免唤醒人机交互,具有 突出的产品组合优势。 (5)在客户服务方面,阿里智能语音最为主要的商业策略就 是为其合作伙伴提供语音原子能力、 多个领域开箱即用模型和“自学习”平台, 赋 予客户产品“能说、会说、懂你”式的智能人机交互体验,在将阿里云智能语音领 2020 Frost & Sullivan. All rights reserved. This document contains highly confidential information and is the sole property of Frost & Sullivan No part of it may be circulated, quoted, copied or otherwise reproduced without the written approval of Frost & Sullivan 15 先技术赋能于产业联盟企业的同时, 构建一个更为完整和繁荣的 AI 语音应用生态, 普惠市