上海油压(上海油压会所/上海按摩会所)

《人工智能行业研究报告2017年(37页)（37页）.pdf》由会员分享，可在线阅读，更多相关《人工智能行业研究报告2017年(37页)（37页）.pdf（37页珍藏版）》请在三个皮匠报告上搜索。

1、2017年6月 36氪研究院人工智能行业研究报告（2017年） 2 报告摘要人工智能（Artificial Intelligence）是指使用机器代替人类实现认知、识别、分析、决策等功能，其本质是对人的意识与思维的信息过程的模拟。在AI发展的不同阶段，驱动力各有侧重，我们可以将AI的发展划分为三个阶段：技术驱动阶段、数据驱动阶段和场景驱动阶段。其中技术驱动阶段集中诞生了基础理论、基本规则和基本开发工具。在此阶段，算法和计算力对AI的发展起到主要推动作用，其中计算力主要包含芯片、超级计算机、云计算等三个维度。在市场规模方面，综合考虑我国人工智能的爆发节点、技术成熟度以及全球

2、AI市场规模等因素，我们保守估计最迟至2019年我国AI的市场规模将突破百亿元，而2022年这一数字应在700亿元左右。人工智能目前仍处于发展的早期阶段，整体看来技术的发展将先于应用层面，但技术层面仍存在瓶颈需要突破；应用场景将不断丰富，它的扩充将会反过来驱动支撑技术的持续发展，AI的整体市场规模将继续扩大。相比应用场景层面的发展，基础应用层的技术将会是AI中较早发展的部分。不过，从AI整体发展阶段来讲，我们认为AI仍处于早期，虽然语音识别、计算机视觉等感知层的技术目前已经取得了一定成就，但语义识别等认知层的技术仍不甚完善，即使是像计算机视觉这样的感知层技术也存在发展不均衡的

3、问题。随着AI支撑技术的不断发展，AI将持续拓展更多的应用场景；而愈发多样化的应用场景需求又会反过来驱动支撑技术，从而带动整个AI行业的持续发展。但各应用场景的发展并非均衡，整体看来将从垂直领域AI逐渐过渡到通用型AI。总体来说，AI最重要的还是要将技术与应用场景相结合，无法落地的技术很难得到资本青睐和市场认可，而有闭环、垄断性的数据，并且其技术能够与实际应用场景结合的公司将有望产生难以被替代的商业价值。 36kr-人工智能行业研究报告（2017年） 2017.6 目录 Contents 一. 人工智能综述 AI是使用机器代替人类实现认知、分析、决策等功能的综合学科计算力、算

4、法、数据量与应用场景是AI爆发的主要驱动力国内外巨头在AI领域纷纷布局资本扶持下，未来AI的市场规模应在百亿元以上人工智能产业链图二. 人工智能的技术支持层 AI产业链综述 AI技术支撑层：数据标注、语音识别、语义识别与计算机视觉三. 人工智能的应用场景层 AI+安防 AI+医疗 AI+金融 AI+家居、AI+教育与其他应用场景四. 人工智能行业总结 AI行业总结 AI未来发展&投资机会简析人工智能综述 CHAPTER I AI是使用机器代替人类实现认知、分析、决策等功能的综合学科计算力、算法、数据量与应用场景是AI爆发的主要驱动力国内外巨头在AI领域纷纷布局资本扶持下，未

5、来AI的市场规模应在百亿元以上人工智能产业链图 5 36kr-人工智能行业研究报告（2017年） 2017.6 人工智能（Artificial Intelligence）是指使用机器代替人类实现认知、识别、分析、决策等功能，其本质是对人的意识与思维的信息过程的模拟，是一门综合了计算机科学、生理学、哲学的交叉学科。凡是使用机器代替人类实现认知、识别、分析、决策等功能，均可认为使用了人工智能技术。作为一种基础技术，理论上讲人工智能能够被应用在各个基础行业（如AI+金融、AI+医疗、AI+传统制造业等），同时也有其如机器人这样具体应用行业的概念。本报告将以2017年上半年为时间

6、节点，对包括发展驱动力、巨头布局、投融资情况、预测的市场规模等在内的人工智能行业到目前为止的整体发展情况做简要分析，并对包括数据标记、语音识别、语义识别、计算机视觉等技术领域以及安防、医疗、金融等应用场景在内的细分领域及其典型企业进行简析，探索人工智能领域未来发展趋势和可能的投资/创业机会。行业概述 AI是使用机器代替人类实现认知、分析、决策等功能的综合学科 1.1 行业概述 1.2 行业驱动力 1.3 巨头布局 1.4 行业市场规模自然语言处理计算机视觉语音识别智慧家居智慧工业关键硬件算法模型路径规划GPUNPU 传感器深度学习（CNN、RNN等） CPU 基础应

7、用技术产品技术支撑层基础应用层方案集成层图片来源：36氪研究院注释：结合了物联网与人工智能的智能制造行业也是AI的重要应用场景之一，关于该领域的详细研究讨论请见 36氪研究院系列报告新制造研究报告。 6 在AI发展的不同阶段，驱动力各有侧重，我们可以将AI的发展划分为三个阶段：技术驱动阶段、数据驱动阶段和场景驱动阶段。技术驱动阶段集中诞生了基础理论、基本规则和基本开发工具。在此阶段，算法和计算力对AI的发展起到主要推动作用。现在主流应用的基于多层网络神经的深度算法，一方面不断加强从海量数据库中自行归纳物体特征的能力，一方面不断加强对新事物多层特征提取、描述和还

8、原的能力。对算法来说，归纳和演绎同样重要，最终目的是提高识别效率。最新ImageNet测试结果显示，AI错误率低达 3.5%，而人类对同一数据库识别错误率在5.1%1，理想情况下，计算机图像识别能力已超越人类。技术驱动：算法和计算力是主要驱动力行业驱动力 28.20% 25.80% 16.40% 11.70% 7.30% 6.70% 3.50% 0 20 40 60 80 100 120 140 160 0% 5% 10% 15% 20% 25% 30% 2010-2016年 ImageNet 图像识别错误率 2010年 NEC美国 2011年 Xerox 2012年 AlexNe

9、t 2013年 Clarifi 2014年 VGG 2015年 GoogleNet 2016年 ResNet 8层神经网络 8层神经网络 19层神经网络 22层神经网络 152层神经网络来源：公开资料整理如上图所示，每年在ImageNet测试中错误率最低的算法模型都不尽相同（从NEC到ResNet），这也反映了人们对于算法的不断探究、更迭过程。 1根据公开资料整理定位测试优化技术驱动数据驱动预测分析精准画像场景驱动决策支持场景模型 1.1 行业概述 1.2 行业驱动力 1.3 巨头布局 1.4 行业市场规模 36kr-人工智能行业研究报告（2017年） 2017.6 7 提

10、高识别效率除依靠算法之外，也离不开计算力的支持。计算力可以分三个维度展开：芯片、超级计算机、云计算。芯片：人工智能领域作为一个数据密集的领域，传统的数据处理技术难以满足高强度并行数据的处理需求。为解决此问题，继CPU之后，相继出现了 GPU、NPU、FPGA、DSP等“AI”芯片。1999 年，Nvidia公司发布了全球首款图片处理芯片GPU； 2016年，寒武纪发布了全球首款深度学习专用处理器芯片NPU，芯片的更迭、进步可从根本上提高计算性能。计算力的三驾马车：芯片、超级计算机、云计算行业驱动力 Nvidia GPUGeForce 256寒武纪NPU1A 超级计算机：其

11、基本组成组件与个人电脑的概念无太大差异，但规格与性能则强大许多，是一种超大型电子计算机。我国自主超级计算机“神威太湖之光”，其处理器为众核CPU“申威26010”，整台 “神威太湖之光”共包含40960块处理器；打败李世石的AlphaGo共包含1202个CPU和176个GPU；打败柯洁的升级版AlphaGo使用到了TPU，但数量只有 4 颗。（未完接下页） 36kr-人工智能行业研究报告（2017年） 2017.6 1.1 行业概述 1.2 行业驱动力 1.3 巨头布局 1.4 行业市场规模 8 可以发现，真正用于人工智能的超级计算机芯片还只是处于CPU、GPU层，如何将更适用于

12、网络神经算法的NPU、FPGA等芯片量产化并融合入超级计算机芯片矩阵，是在人工智能发展的第一阶段技术驱动阶段应该重点努力的方向之一。计算力的三驾马车：芯片、超级计算机、云计算行业驱动力云计算：与主要应用于密集型计算的超级计算机不同，云计算依靠其灵活的扩展能力主要应用于社交网络、企业IT建设和信息化等数据密集型、I/O密集型的领域。我们分析认为，当AI跨越入第二阶段数据驱动阶段后，算法和计算力将变成人工智能领域的基础设施“水、电、煤”。就目前看来，多项算法开源平台已将AI算法引入统一、公用阶段，运算力也必将向同样的趋势发展。云计算则是一个初步尝试，未来，计算力的发

13、展方向或将是云计算和超级计算机技术结合，为企业提供既可密集运算又可灵活扩展的计算服务，将人工智能赋能全行业。众核CPU“申威26010神威太湖之光 36kr-人工智能行业研究报告（2017年） 2017.6 1.1 行业概述 1.2 行业驱动力 1.3 巨头布局 1.4 行业市场规模 9 人工智能发展的第二个阶段，算法和计算力已基本不存在壁垒，数据将成为主要驱动力，推动人工智能更迭。此阶段，大量结构化、可靠的数据被采集、清洗和积累，甚至变现。例如，大量的数据基础上可以精确地描绘消费者画像，制定个性化营销方案，提高成单率，缩短达到预设目标的时间，推动社会运行效率提升。到了人工

14、智能发展的第三个阶段，场景驱动作为主要驱动力，不仅可以针对不同用户做个性化服务，而且可在不同的场景下执行不同的决策。此阶段，对数据收集的维度和质量的要求更高，并且可实时根据不同的场景，制定不同的决策方案，推动事件向良好的态势发展，帮助决策者更敏锐的洞悉事件根本，产生更精准更智慧的决策。数据驱动：描绘个性化画像；场景驱动：给予决策支持行业驱动力 “场景驱动”不仅会驱动人类决策，也会驱动机器的自我进化和升级。 “场景驱动”的基础是经过治理的数据。 “场景驱动”的“场景“对应的是有应用价值的场景。用户基本信息 LBS数据挖掘社交网络数据其他用户画像建模标签A 标签

15、B 标签C 来源：36氪研究院图示：“场景驱动”三要素来源：互联网 36kr-人工智能行业研究报告（2017年） 2017.6 1.1 行业概述 1.2 行业驱动力 1.3 巨头布局 1.4 行业市场规模 10 公司人工智能领域布局百度 2016年，百度发布了人工智能平台级解决方案“天智”，这是继“天算”“天像”和“天工” 之后的第四大平台级解决方案。至此，百度云实现了人工智能、智能大数据、智能多媒体和智能物联网全方位的智能平台服务。 2016年8月，投资激光雷达公司VelodyneLiDAR。 2017年以来，百度收购了xPerception、渡鸦科技，参与投资了蔚来汽车、8i等AI

16、公司。腾讯 2016 年4 月，腾讯成立人工智能实验室，基于计算机视觉、语音识别、自然语言处理和机器学习四个垂直领域，围绕内容、社交、游戏和平台工具四大特色业务场景，腾讯AI致力于将人工智能工具以API形式开放出去。 2016年，碳云智能完成近10亿元的A轮融资，腾讯为主要投资方之一。 2017年，腾讯买入电动汽车制造商特斯拉(Tesla)5%股权，腾讯成为特斯拉的第五大股东。阿里巴巴阿里云面向人工智能的布局,核心爆点就三个：ET医疗大脑、ET工业大脑和机器学习平台PAI2.0 2017年3月，阿里宣布开始推动“NASA”计划，着重发力机器学习、芯片、IoT、操作系统和生物识别。

17、 Apple 2017年5月，苹果收购了人工智能公司Lattice Data。该公司使用人工智能推理引擎去处理非结构化的“暗数据”，将其变成结构化信息，从而发挥更大的作用。 Google 2014年1月，收购Deepmind、收购后，DeepMind仍保持独立运营的，目标是开发能够“独立思考”的软件。 2016年9月，收购api.ai，能够协助谷歌指导开发者持续开发优秀的自然语言界面。 2016年3月与海尔达成战略合作，共同推动智能家居发展。 Microsoft2017年6月，Element AI完成了1.02亿美元A轮融资，微软是主要投资方之一。 2017年6月，收购了以色列初创公司He

18、xadite，以便将AI支持的安全功能整合到企业版 Windows 10中。 Facebook2015年1月，收购语音指令创业公司Wit.AI，帮助Messenger创建语音输入模式。 36kr-人工智能行业研究报告（2017年） 2017.6 巨头布局国内外巨头在AI领域的布局 1.1 行业概述 1.2 行业驱动力 1.3 巨头布局 1.4 行业市场规模信息来源：根据公开资料整理人工智能的技术支持层 CHAPTER II AI产业链综述 AI技术支撑层数据标注语音识别语义识别计算机视觉 12 36kr-人工智能行业研究报告（2017年） 2017.6 正如报告开头所述，人工智能

19、是指使用机器代替人类实现认知、识别、分析、决策等功能，是一门综合了计算机科学、生理学、哲学的交叉学科。完整的人工智能产业链可以分为技术支撑层、基础应用层和方案集成层，或者说应用场景层。技术支撑层主要由AI芯片、传感器等硬件和算法模型（软件）和两部分构成。其中传感器与IoT的感知层相似，包括GPU、FPGA、NPU等在内的AI芯片负责运算，算法模型则负责训练数据。基础应用层的技术则是为了让机器完成对外部世界的探测，主要由计算机视觉、语音识别等感知层和语义识别等认知层构成，这些技术是机器能够做出分析判断的基础。此外，在感知与认知技术之下还有数据标注作为其底层支撑。方案集

20、成层是集成了某种或多种基础应用技术的、面向如工业、自动驾驶、家居、仓储物流、金融、医疗等不同应用场景的产品或方案。本篇报告将主要围绕AI中基础应用层和方案集成层，即应用场景层进行分析。人工智能产业链综述 AI产业链主要包括技术支撑层、基础应用层和方案集成层 2.1 AI产业链综述 2.2 AI技术支撑层 13 产业链图人工智能产业链图 2017.6 36kr-人工智能行业研究报告（2017年）技术圈计算机视觉语义识别语音识别语料采集场景圈家居金融医疗安防教育 2.1 AI产业链综述 2.2 AI技术支撑层 14 36kr-人工智能行业研究报告（201

21、7年） 2017.6 语音识别是将语音转换为文本的技术，是自然语言处理的一个分支。前台主要步骤分为信号搜集、降噪和特征提取三步，提取的特征在后台由经过语音大数据训练得到的语音模型对其进行解码，最终把语音转化为文本，实现达到让机器识别和理解语音的目的。根据公开资料显示，目前语音识别的技术成熟度较高，已达到95%的准确度。然而，需要指出的是，从95%到99%的准确度带来的改变才是质的飞跃，将使人们从偶尔使用语音变到常常使用。医疗卫宁健康语音识别过程虽存在难点，但目前技术已趋于成熟语音识别技术 - 行业概述语音识别作为一种一维时域信号，在实际操作中主要有两个难点。首先是数

22、据的获取、清洗。语音识别需要大量细分领域的标准化语料数据作为支撑，尤其是各地方言的多样性更是加大了语料搜集的工作量。据媒体消息，苹果iOS 10.3版本中Siri已支持上海话。第二个难点是语音特征的提取，目前主要通过具备多层神经网络的深度学习来解决，多层的神经网络相当于一个特征提取器，可对信号进行逐层深化的特征描述，最终从部分到整体，从笼统到具象，做到最大程度地还原信号原始特征。语音数据库训练语音模型语音信号前端识别降噪特征提取数据挖掘信号处理统计建模模型匹配识别结果图示：语音识别技术架构 2.1 AI产业链综述 2.2 AI技术支撑层数据标注

23、语音识别语义识别计算机视觉 15 36kr-人工智能行业研究报告（2017年） 2017.6 医疗卫宁健康语音识别虽市场庞大但已出现领航者，留给创业公司的机会不多语音识别技术 - 行业概述据Research and Markets研究报告显示，全球智能语音市场将持续显著增长，预计到2020年，全球语音市场规模预计将达191.7亿美元。根据Capvision 报告显示，从语音行业市场份额角度来看，全球范围内，由Nuance领跑，国内则是科大讯飞占据主导地位。 Nuance 31.60% 谷歌 28.40% 苹果 15.40% 微软 8.10% 科大讯飞 4.50% IBM 4

24、.10% 其他 8.00% 全球智能语音企业市场份额科大讯飞 44.20% 百度 27.80% 苹果 6.90% Nuance 3.00% 小i机器人 2.70% 捷通华声 2.20% 海天瑞声 2.00% 中科信利 1.60% 其他 9.60% 中国智能语音企业市场份额来源：Capvision，36氪研究院 2.1 AI产业链综述 2.2 AI技术支撑层数据标注语音识别语义识别计算机视觉 16 36kr-人工智能行业研究报告（2017年） 2017.6 科大讯飞创办于1999年，主要从事智能语音及语言技术、人工智能技术研究，软件及芯片产品的开发，而应用集成则由下游的开发商或客

25、户自己完成。根据公开资料显示，科大讯飞是目前我国少数掌握核心技术的语音领域企业之一，已于2008年5月在深圳证券交易所挂牌上市。医疗卫宁健康科大讯飞专注于To B的语音识别技术，目前已领跑中文语音市场语音识别企业案例- 科大讯飞科大讯飞拥有六大核心技术，分别是语音识别、语音合、自然语言处理、语音评测、声纹识别和手写识别。其中更重要的是其同时拥有语音合成和语音识别，能够把“听”和“说”组合起来。此外科大讯飞还提出讯飞超脑计划，瞄准语音理解力市场。图示：科大讯飞核心技术简介来源：科大讯飞官网，36氪研究院技术说明语音识别技术让计算机能够“听懂”人类的语音，将语音中包

26、含的文字信息“提取”出来。语音合成技术让机器将文字信息转化为声音信息，即让机器像人一样开口说话。自然语言处理技术基础研究对自然语言内在规律的研究，主要包括词典编撰、分词断句、词性分析、语言模型、语法分析、语义分析、语用分析等。应用研究面向不同的应用，研发相关的自然语言处理技术，主要包括拼音输入法、信息检索、信息抽取、自动摘要、机器翻译、语音合成、语音识别、文本匹配等。语音评测技术又称计算机辅助语言学习，机器自动对用户发音进行评分、检错并矫正。声纹识别技术通过语音信号提取相关特征，进而识别出说话人身份等，广泛应用于信息安全、电话银行、智能门禁以及娱乐增值等领域。手写识别

27、技术让计算机能够“认识”用户在手写设备上书写的文字信息。 1来源于科大讯飞官网硬件研发软件研发语音方案研发集合方案后的产品制作面向C端软件研发C端用户使用端用户使用讯飞负责开发引擎、语音合成和语音识别芯片图示：科大讯飞在语音生态链中所处的环节 2.1 AI产业链综述 2.2 AI技术支撑层数据标注语音识别语义识别计算机视觉 17 36kr-人工智能行业研究报告（2017年） 2017.6 科大讯飞以讯飞超脑、AIUI 为内核，积极打造基于讯飞开放平台的AI 生态，面对不同场景，推出覆盖全行业的语音产品及服务，深耕智慧教育、智慧城市、智慧汽车、智慧医疗以及智慧家居五个行

28、业，全方位挖掘G 端、B 端及C 端客户。医疗卫宁健康随着人工智能热度高涨，科大讯飞等企业技术得以规模性落地语音识别企业案例- 科大讯飞 5.6 7.8 12.5 17.8 25.0 33.2 1.3 1.8 2.8 3.8 4.3 4.8 0 10 20 30 40 2001420152016 科大讯飞2011-2016年营业总收入净利润图示：科大讯飞主要客户举例随着全球范围内人工智能热度的高涨，语音识别作为其中重要的技术应用层落地项目也愈加多元化。科大讯飞在智慧教育、智慧城市、智能家居、智能汽车、机器人等领域规模化的应用，促进了其营收近几年内持

29、续稳定走高，尤其是在教育行业，科大讯飞构建了智慧考试、智慧校园、智慧课堂、智慧学习等一体化的智慧教育产品体系，2017年智慧课堂产品有望成为其在教育行业收入和毛利的重要增长点。 2.1 AI产业链综述 2.2 AI技术支撑层数据标注语音识别语义识别计算机视觉 18 从世界范围来看，Nuance是全球最大的独立语音识别公司之一。Nuance于1994年成立于美国麻省伯灵顿，并于2000年4月在纳斯达克上市。Nuance曾为苹果、三星提供语音支持服务，在语音识别领域一度处于垄断地位，后随深度算法的普及，各巨头逐渐开始自主研发语音识别技术，差距逐渐缩小。但直到今天，其发布

30、的Dragon Drive（声龙驾驶）互联汽车语音和内容平台，仍为众多知名车企提供着车载语音技术支持，如梅赛德斯-奔驰、戴姆勒、宝马、丰田、雷克萨斯、荣威等汽车品牌。此外，还有重点布局家居领域的语音企业云知声。云知声于2012年6月创办于北京，目前融资轮次为 B+，是智能语音领域新锐玩家。据官方数据显示，云知声目前已覆盖了476个城市，覆盖用户超过1.8 亿，代表客户有网易易信、锤子手机、乐视超级电视等。智能设备互联家居跨平台信息娱乐个性化内容情景感知车辆传感器信息用户档案行为偏好驾驶历史声纹验证图示：声龙驾驶平台 Dragon Drive 个性化情景化

31、无缝连接物联网智能化汽车级自然语言理解情景化推理大数据持续学习混合解决方案（本地嵌入及云端服务）为卓越性能而设计无缝连接稳健可靠 Nuance领衔全球市场，云知声重点布局家居领域语音识别企业案例- Nuance云知声 36kr-人工智能行业研究报告（2017年） 2017.6 2.1 AI产业链综述 2.2 AI技术支撑层数据标注语音识别语义识别计算机视觉 19 应用系统基础资源语义识别是自然语言处理(NLP)技术的重要组成部分。NLP在实际应用中最大的困难还是语义的复杂性，此外，深度学习算法也不是语义识别领域的最优算法。但随着整个AI行业发展进

32、程加速，将为NLP 带来长足的进步。语义识别是人工智能的重要分支之一，解决的是“ 听得懂”的问题。其最大的作用是改变人机交互模式，将人机交互由最原始的鼠标、键盘交互转变为语音对话的方式。此外，我们认为目前的语义识别行业还未出现绝对垄断者，新进入的创业公司仍具备一定机会。鼠标键盘交互 Page PC时代触摸交互 App 移动时代语音交互 API IoT时代人机交互的发展智能交互对话聊天深度问答机器翻译机器人知识挖掘词典语料网页日志知识库基本方法规则方法统计与机器学习方法基础架构 /平台图示：NLP通用架构示意图形态分析组块分析语义表示对话理解句子生成分词/词性

33、主干分析语义计算观点提取摘要生成专名识别储存分析逻辑推理情感分析篇章生成用户行为预测用户建模词法语言分析文本理解句法语义篇章语音生成解决“听得懂”的语义识别领域中，新进入者仍具有一定机会语义识别技术 - 行业概述 36kr-人工智能行业研究报告（2017年） 2017.6 2.1 AI产业链综述 2.2 AI技术支撑层数据标注语音识别语义识别计算机视觉 20 我们认为，基于语音识别和语义识别的智能语音交互技术在车载场景中存在刚需，也会成为最先爆发的领域之一。并且，随着车联网的纵深化发展，相关硬件趋于免费，依靠语音交互天然流量入口，做个性化增值服务将

34、是未来车载领域的主要盈利点。图示：语音交互各场景主要玩家智能家居智能车载虚拟助理无人驾驶机器人智能客服从1996年至今，国内至今仍在运营的人工智能公司接近400家1。从下图可看出，自然语言处理（NLP）无论在创业热度、获投数量还是获投金额都处于细分领域的前三。据 Global Market Insights数据，预计到 2024年市场规模达到110亿美元。 96 92 77 38 26 15 10 0 20 40 60 80 100 120 人工智能主要细分领域公司数量单位：/个 58 53 48 22 18 12 8 0 20 40 60 80 人工智能主要细分领域获投数量

35、单位：个 28 20 16 8 7 6 0 20 40 60 80 人工智能主要细分领域获投金额单位：亿元人民币来源：36氪研究院语义识别技术拥有多样性的应用领域以及行业参与者语义识别技术 - 行业概述 1数据来自36氪研究院 36kr-人工智能行业研究报告（2017年） 2017.6 2.1 AI产业链综述 2.2 AI技术支撑层数据标注语音识别语义识别计算机视觉 21 36kr-人工智能行业研究报告（2017年） 2017.6 科技巨头尤其是微软早在2008年就已开始布局语义技术领域。对于巨头来说，自主研发耗时久、投入高，同时效果也是未知的，直接收购是多数巨头选择

36、的最快方式。医疗卫宁健康科技巨头乐衷于收购，小而美的企业更偏好细分场景语义识别技术 - 行业概述公司语义识别领域布局微软2008年，收购语义搜索公司Powerset，开始步入智能语音交互领域 2014年，微软推出全球首款语音助手Cortana 2016年6月，收购语义分析公司Wand Labs，以提升Cortana智能语音体验 2017年1月，收购了Maluuba，强化了Cortana语义和文本理解能力苹果2010年，收购Siri语音助手；2014年4月，收购Novauris；2015年10月，收购VocallQ 百度2017年2月，收购渡鸦科技，渡鸦团队并入度秘事业部关于语义

37、识别领域的创业公司，国内代表企业有出门智能360、出门问问、三角兽、蓦然认知等。其中，三角兽的智能语音交互功能已被应用在Rokid、锤子手机、威马汽车等产品上。此外，由于自然语境和细分行业语境下，同一名词可能具备不同含义，因此除了行业通用型的语义识别公司之外，还存在一些深耕细分场景的公司，例如律师行业国外有基于 IBM Watson的ROSS，国内有无讼、法律谷等。来源：公开资料收集 2.1 AI产业链综述 2.2 AI技术支撑层数据标注语音识别语义识别计算机视觉 22 36kr-人工智能行业研究报告（2017年） 2017.6 计算机视觉（computer vision

38、，简称CV）是指用计算机来模拟人的视觉系统，实现人的视觉功能，以适应、理解外界环境和控制自身运动。主要解决的是物体识别、物体形状和方位确认以及物体运动判断这三个问题。计算机视觉识别系统通常需要三个过程：目标检测、目标识别、行为识别，分别解决了“去背景”、“是什么”、“干什么”的问题。医疗卫宁健康计算机视觉主要研究如何使机器具备“看”的能力计算机视觉 - 行业概述计算机视觉在技术流程上，首先要得到实时数据，此步骤可通过一系列传感器获取，少部分数据可直接在具备MEMS功能的传感器端完成处理，大部分数据会继续传输至大脑平台，大脑由运算单元和算法构成，在此处进行运算并给出

39、决策支持。目标检测图像预处理图像分割目标识别行为识别模型建立行为预断特征提取目标分类判断匹配摄像头类单目摄像头双目摄像头 TOF摄像头雷达类激光雷达红外雷达毫米波雷达图像获取图像传感器产生数据运算单元硬件云端 CPU GPU NPU TPU 云计算雾计算流计算结果输出决策支持算法开源平台 CNN RNN GNN Google Facebook IBM 百度图示：计算机视觉技术流程 2.1 AI产业链综述 2.2 AI技术支撑层数据标注语音识别语义识别计算机视觉 23 36kr-人工智能行业研究报告（2017年） 2017.6 计算机

40、视觉应用场景可分为两大类：图像识别和人脸识别，每类又可继续划分为动、静共四个类别，基本覆盖了目前计算机视觉的各项应用场景。其中动态人脸识别技术是目前创业热度最高的细分领域，尤其是金融和安防场景，是其重点布局场景。医疗卫宁健康动态人脸识别是最热领域，金融和安防是最热场景计算机视觉 - 行业概述国内，计算机视觉领域的企业最早出现在1997年， 2014年出现创业高潮，企业平均年龄在3.9岁1。下表格为该领域目前存续的具备代表性的创业公司。公司名称成立时间融资信息核心业务合作企业未来发展预期商汤科技2014 2017年4月，获赛领资本战略投资6000万美元投资人脸识别

41、华为、小米、英伟达、京东、银联、科大讯飞等继续深入金融、商业、安防、互联网 +等领域旷视科技2011 2016年12月，获鸿海集团、建银国际C轮1 亿美元投资人脸识别蚂蚁金服、万科、美图秀秀、世纪佳缘等或将进军机器人视觉技术领域格林深瞳2013 2014年6月，获红杉资本A轮数千万美元投资人脸识别北京新天地、中国农业银行等或将进军无人驾驶行业依图科技2012 2017年5月，获高瓴资本,云锋基金等C轮3.8 亿人民币人脸识别、车辆识别招商银行、浦发银行、贵州省/福建省交通厅、江苏省/厦门市公安厅等做强金融和安防领域的人像和车辆识别技术触

42、景无限2010 2017年3月，获清控银杏、正和岛A+轮5000 万人民币投资计算机视觉图像识别人脸识别动态静态动态静态辅助驾驶鉴黄/暴工业视觉监控分析以图搜图商品识别医疗影像诊断文字识别金融/安防物业物业/社保社保金融教育人像美颜/娱乐聚类分析安防图像编辑 1数据来源于36氪研究院 2.1 AI产业链综述 2.2 AI技术支撑层数据标注语音识别语义识别计算机视觉 24 36kr-人工智能行业研究报告（2017年） 2017.6 计算机视觉作为一种人工智能的基础技术应用，使用场景多样，市场潜力巨大。其中人脸识别领域在 2016年已接近百亿规模，

43、中国市场在全球范围扮演着十分重要的角色。医疗卫宁健康各细分领域成熟度相差大，其中人脸识别未来几年市场潜力巨大计算机视觉 - 行业概述 0 50 100 150 200 250 300 350 400 450 500 20017E2018E2019E2020E 人脸识别市场规模（亿元人民币）中国全球来源：Capvision，36氪研究院由此可见，计算机视觉各细分领域的成熟度目前相差较大。人脸识别、指纹识别等所在的生物特征识别领域相对来说技术成熟度、工业化程度较高。在物体和场景识别方面，由于识别的物体种类繁杂，表现形态多样，技术成熟度较低。对于计算机

44、视觉而言，其主要瓶颈在于受图片质量、光照环境的影响，现有图像识别技术较难解决图像残缺、光线过爆、过暗的图像。此外，受制于被标记数据的体量和数量，若无大量、优质的细分应用场景数据，该特定应用场景的算法迭代很难实现突破。 2.1 AI产业链综述 2.2 AI技术支撑层数据标注语音识别语义识别计算机视觉 25 36kr-人工智能行业研究报告（2017年） 2017.6 商汤科技创办于2014年11月，位于北京，2017年4 月完成了赛领资本领投的战略投资6000万美元。商汤科技专注于核心算法开发，通过视觉技术赋予计算机视觉感知和认知的能力，业务覆盖金融、商业、安防、互联网+等

45、行业，意图为企业提供低门槛的计算机视觉技术，打造“商汤驱动”的人工智能商业生态。医疗卫宁健康专注计算机视觉算法研发，推动视觉技术融入各行各业计算机视觉企业案例商汤科技商汤科技的核心能力在于其能够自主开发原创深度学习模型，其自有的高性能算法库相对行业内开源平台库，较大程度提高了算法效率，带来2-5倍的性能提升1。性能的提升直接导致的是极大地降低了计算机视觉硬件门槛，例如一般情况下双目、深度摄像头才具备视频处理能力，但利用商汤科技的算法模型，单目摄像头也具备此能力。此外，商汤科技自身构建了具备200块GPU链接能力的DeepLink超算平台，过去耗时1个月的运算，现

46、在只需5-6个小时即可完成。硬件门槛降低+计算能力提升，使得大部分企业快速接入计算机视觉技术成为现实。智慧金融个人远程身份认证解决方案纸质票据电子化解决方案智慧商业刷脸门禁考勤系统智能场地化迎宾机、广告机智慧安防智能人群分析解决方案智能人脸布控解决方案互联网+ 人脸美颜视频美化以图搜图人物相册分类图示：商汤科技业务一览 1数据来自于商汤科技官网 2.1 AI产业链综述 2.2 AI技术支撑层数据标注语音识别语义识别计算机视觉 26 36kr-人工智能行业研究报告（2017年） 2017.6 作为算法层企业，商汤科技通过与京东、小米、新浪微博

47、等应用层级公司合作，使得自己的算法可以很好地融合多类细分领域的特点，快速移植复制到各行各业。除此之外，商汤还在技术层与多家企业合作，例如，商汤科技与科大讯飞合作研发具备人脸+语音双重识别的产品；与英伟达合作研发适用于深度学习的GPU芯片，该芯片可实时处理双路视频，为智慧视频提供支持。医疗卫宁健康以开放的心态，打造“商汤驱动 ”的人工智能商业生态计算机视觉企业案例商汤科技商汤科技诞生于香港中文大学的多媒体实验室，团队成员主要由两部分构成，其一是来自MIT、斯坦福、香港大学、清华大学等高校及其实验室的科研人员；其二是来自谷歌、百度、微软、阿里巴巴等产业界的商业人员。商

48、汤科技意图将实验室最新成果与商业变现之间的时空差距缩到最低限度。 2017年4月，商汤科技宣布完成了新一轮的战略融资，将进一步加速商业化布局。智慧金融其他互联网+ 智慧商业智慧安防图示：商汤科技客户实例 2.1 AI产业链综述 2.2 AI技术支撑层数据标注语音识别语义识别计算机视觉 27 36kr-人工智能行业研究报告（2017年） 2017.6 除商汤科技这类依靠算法作为计算机视觉解决方案的流派之外，还存在触景无限这类专注于前端嵌入式硬件并搭载软件的打法。触景无限成立于2010年，提供嵌入式智能感知平台视觉卡，并于2017年 3月完成A+轮5000万元人民币融资

49、。触景无限视觉卡基于英伟达、英特尔等嵌入式芯片，融合了人脸识别、物体识别、双目测距、GPS、TOF、 IMU等多种传感器、数据处理平台和压缩算法模型，提供的嵌入式智能感知平台，具备体积小、功耗低、实时图像处理、处理能力高、多目摄像头支持、通用API接口等特点。例如基于深度学习的人脸识别技术运行在视觉卡上能达到每帧100ms的速度（分辨率为1080P时的检测+识别速度），在1:1人证比对的情况下识别率大于99%，在1:50000的情况下识别率大于90%。通过该视觉卡，信息处理可以直接在前端完成，帮助前端硬件完成“感”与“知”的融合。在具体产品方面，截止2017年6月，触景无限视觉卡已完成两代视觉卡的研发，其中一代V10X系列已于2016年底实现量产，二代V20X系列亦于日前发布。相较于一代，二代基于Intel-Movidius芯片研发，芯片体积更小（一元硬币大小），功耗更低（低至2 瓦），处理速度更强（约1Tflops）。两代视觉卡产品均可用于安防、无人机、机器人、智能家居、智能汽车辅助驾驶等领域。

上海品茶

人工智能行业研究报告2017年(37页)（37页）.pdf

报告推荐

相关图表

相关报告

热门报告