《人工智能行业研究报告2017年(37页)(37页).pdf》由会员分享,可在线阅读,更多相关《人工智能行业研究报告2017年(37页)(37页).pdf(37页珍藏版)》请在三个皮匠报告上搜索。
1、2017年6月 36氪研究院 人工智能行业研究报告 (2017年) 2 报告摘要 人工智能(Artificial Intelligence)是指使用机器代替人类实现认知、识别 、分析、决策等功能,其本质是对人的意识与思维的信息过程的模拟。 在AI发展的不同阶段,驱动力各有侧重,我们可以将AI的发展划分为三个 阶段:技术驱动阶段、数据驱动阶段和场景驱动阶段。其中技术驱动阶段 集中诞生了基础理论、基本规则和基本开发工具。在此阶段,算法和计算 力对AI的发展起到主要推动作用,其中计算力主要包含芯片、超级计算机 、云计算等三个维度。 在市场规模方面,综合考虑我国人工智能的爆发节点、技术成熟度以及全 球
2、AI市场规模等因素,我们保守估计最迟至2019年我国AI的市场规模将 突破百亿元,而2022年这一数字应在700亿元左右。 人工智能目前仍处于发展的早期阶段,整体看来技术的发展将先于应用层面 ,但技术层面仍存在瓶颈需要突破;应用场景将不断丰富,它的扩充将会反 过来驱动支撑技术的持续发展,AI的整体市场规模将继续扩大。 相比应用场景层面的发展,基础应用层的技术将会是AI中较早发展的部分。 不过,从AI整体发展阶段来讲,我们认为AI仍处于早期,虽然语音识别、 计算机视觉等感知层的技术目前已经取得了一定成就,但语义识别等认知 层的技术仍不甚完善,即使是像计算机视觉这样的感知层技术也存在发展 不均衡的
3、问题。 随着AI支撑技术的不断发展,AI将持续拓展更多的应用场景;而愈发多样 化的应用场景需求又会反过来驱动支撑技术,从而带动整个AI行业的持续 发展。但各应用场景的发展并非均衡,整体看来将从垂直领域AI逐渐过渡 到通用型AI。 总体来说,AI最重要的还是要将技术与应用场景相结合,无法落地的技术 很难得到资本青睐和市场认可,而有闭环、垄断性的数据,并且其技术能 够与实际应用场景结合的公司将有望产生难以被替代的商业价值。 36kr-人工智能行业研究报告(2017年) 2017.6 目 录 Contents 一. 人工智能综述 AI是使用机器代替人类实现认知、分析、决策等功能的综合学科 计算力、算
4、法、数据量与应用场景是AI爆发的主要驱动力 国内外巨头在AI领域纷纷布局 资本扶持下,未来AI的市场规模应在百亿元以上 人工智能产业链图 二. 人工智能的技术支持层 AI产业链综述 AI技术支撑层:数据标注、语音识别、语义识别与计算机视觉 三. 人工智能的应用场景层 AI+安防 AI+医疗 AI+金融 AI+家居、AI+教育与其他应用场景 四. 人工智能行业总结 AI行业总结 AI未来发展&投资机会简析 人工智能综述 CHAPTER I AI是使用机器代替人类实现认知、分析、决策等功能的综合学科 计算力、算法、数据量与应用场景是AI爆发的主要驱动力 国内外巨头在AI领域纷纷布局 资本扶持下,未
5、来AI的市场规模应在百亿元以上 人工智能产业链图 5 36kr-人工智能行业研究报告(2017年) 2017.6 人工智能(Artificial Intelligence)是指使用机器代 替人类实现认知、识别、分析、决策等功能,其本质 是对人的意识与思维的信息过程的模拟,是一门综合 了计算机科学、生理学、哲学的交叉学科。凡是使用 机器代替人类实现认知、识别、分析、决策等功能, 均可认为使用了人工智能技术。 作为一种基础技术,理论上讲人工智能能够被应用在 各个基础行业(如AI+金融、AI+医疗、AI+传统制造 业等),同时也有其如机器人这样具体应用行业的概 念。 本报告将以2017年上半年为时间
6、节点,对包括发展驱 动力、巨头布局、投融资情况、预测的市场规模等在 内的人工智能行业到目前为止的整体发展情况做简要 分析,并对包括数据标记、语音识别、语义识别、计 算机视觉等技术领域以及安防、医疗、金融等应用场 景在内的细分领域及其典型企业进行简析,探索人工 智能领域未来发展趋势和可能的投资/创业机会。 行业概述 AI是使用机器代替人类实现认知 、分析、决策等功能的综合学科 1.1 行业概述 1.2 行业驱动力 1.3 巨头布局 1.4 行业市场规模 自然语言处理 计算机视觉 语音识别 智慧家居智慧工业 关键硬件算法模型 路径规划GPUNPU 传感器深度学习(CNN、RNN等) CPU 基础应
7、用技术 产品 技术支撑层 基础应用层 方案集成层 图片来源:36氪研究院 注释:结合了物联网与人工智能的智 能制造行业也是AI的重要应用场景之 一,关于该领域的详细研究讨论请见 36氪研究院系列报告新制造研究报 告。 6 在AI发展的不同阶段,驱动力各有侧重,我们可以 将AI的发展划分为三个阶段:技术驱动阶段、数据 驱动阶段和场景驱动阶段。 技术驱动阶段集中诞生了基础理论、基本规则和基 本开发工具。在此阶段,算法和计算力对AI的发展 起到主要推动作用。现在主流应用的基于多层网络 神经的深度算法,一方面不断加强从海量数据库中 自行归纳物体特征的能力,一方面不断加强对新事 物多层特征提取、描述和还
8、原的能力。对算法来说 ,归纳和演绎同样重要,最终目的是提高识别效率 。最新ImageNet测试结果显示,AI错误率低达 3.5%,而人类对同一数据库识别错误率在5.1%1, 理想情况下,计算机图像识别能力已超越人类。 技术驱动:算法和计算力是主要 驱动力 行业驱动力 28.20% 25.80% 16.40% 11.70% 7.30% 6.70% 3.50% 0 20 40 60 80 100 120 140 160 0% 5% 10% 15% 20% 25% 30% 2010-2016年 ImageNet 图像识别错误率 2010年 NEC美国 2011年 Xerox 2012年 AlexNe
9、t 2013年 Clarifi 2014年 VGG 2015年 GoogleNet 2016年 ResNet 8层神经网络 8层神经网络 19层神经网络 22层神经网络 152层神经网络 来源:公开资料整理 如上图所示,每年在ImageNet测试中错误率最低的 算法模型都不尽相同(从NEC到ResNet),这也反 映了人们对于算法的不断探究、更迭过程。 1根据公开资料整理 定位测试优化 技术驱动 数据驱动 预测分析精准画像 场景驱动 决策支持场景模型 1.1 行业概述 1.2 行业驱动力 1.3 巨头布局 1.4 行业市场规模 36kr-人工智能行业研究报告(2017年) 2017.6 7 提
10、高识别效率除依靠算法之外,也离不开计算力的 支持。计算力可以分三个维度展开:芯片、超级计 算机、云计算。 芯片:人工智能领域作为一个数据密集的领域,传 统的数据处理技术难以满足高强度并行数据的处理 需求。为解决此问题,继CPU之后,相继出现了 GPU、NPU、FPGA、DSP等“AI”芯片。1999 年 ,Nvidia公司发布了全球首款图片处理芯片GPU; 2016年,寒武纪发布了全球首款深度学习专用处理 器芯片NPU,芯片的更迭、进步可从根本上提高计 算性能。 计算力的三驾马车:芯片、超级 计算机、云计算 行业驱动力 Nvidia GPUGeForce 256寒武纪NPU1A 超级计算机:其
11、基本组成组件与个人电脑的概念无 太大差异,但规格与性能则强大许多,是一种超大 型电子计算机。我国自主超级计算机“神威太湖之 光”,其处理器为众核CPU“申威26010”,整台 “神威太湖之光”共包含40960块处理器;打败李 世石的AlphaGo共包含1202个CPU和176个GPU; 打败柯洁的升级版AlphaGo使用到了TPU,但数量 只有 4 颗。(未完接下页) 36kr-人工智能行业研究报告(2017年) 2017.6 1.1 行业概述 1.2 行业驱动力 1.3 巨头布局 1.4 行业市场规模 8 可以发现,真正用于人工智能的超级计算机芯片还 只是处于CPU、GPU层,如何将更适用于
12、网络神经 算法的NPU、FPGA等芯片量产化并融合入超级计 算机芯片矩阵,是在人工智能发展的第一阶段技 术驱动阶段应该重点努力的方向之一。 计算力的三驾马车:芯片、超级 计算机、云计算 行业驱动力 云计算:与主要应用于密集型计算的超级计算机不 同,云计算依靠其灵活的扩展能力主要应用于社交 网络、企业IT建设和信息化等数据密集型、I/O密集 型的领域。 我们分析认为,当AI跨越入第二阶段数据驱动阶 段后,算法和计算力将变成人工智能领域的基础设 施“水、电、煤”。就目前看来,多项算法开源 平台已将AI算法引入统一、公用阶段,运算力也必 将向同样的趋势发展。云计算则是一个初步尝试, 未来,计算力的发
13、展方向或将是云计算和超级计算 机技术结合,为企业提供既可密集运算又可灵活扩 展的计算服务,将人工智能赋能全行业。 众核CPU“申威26010神威太湖之光 36kr-人工智能行业研究报告(2017年) 2017.6 1.1 行业概述 1.2 行业驱动力 1.3 巨头布局 1.4 行业市场规模 9 人工智能发展的第二个阶段,算法和计算力已基本 不存在壁垒,数据将成为主要驱动力,推动人工智 能更迭。此阶段,大量结构化、可靠的数据被采集 、清洗和积累,甚至变现。例如,大量的数据基础 上可以精确地描绘消费者画像,制定个性化营销方 案,提高成单率,缩短达到预设目标的时间,推动 社会运行效率提升。 到了人工
14、智能发展的第三个阶段,场景驱动作为主 要驱动力,不仅可以针对不同用户做个性化服务, 而且可在不同的场景下执行不同的决策。此阶段, 对数据收集的维度和质量的要求更高,并且可实时 根据不同的场景,制定不同的决策方案,推动事件 向良好的态势发展,帮助决策者更敏锐的洞悉事件 根本,产生更精准更智慧的决策。 数据驱动:描绘个性化画像; 场景驱动:给予决策支持 行业驱动力 “场景驱动”不仅会驱动人 类决策,也会驱动机器的自 我进化和升级。 “场景驱动”的基础是经过 治理的数据。 “场景驱动”的“场景“对 应的是有应用价值的场景。 用户基本信息 LBS数据挖掘 社交网络数据 其他 用户画像建模 标签A 标签
15、B 标签C 来源:36氪研究院 图示:“场景驱动”三要素 来源:互联网 36kr-人工智能行业研究报告(2017年) 2017.6 1.1 行业概述 1.2 行业驱动力 1.3 巨头布局 1.4 行业市场规模 10 公司人工智能领域布局 百度 2016年,百度发布了人工智能平台级解决方案“天智”,这是继“天算”“天像”和“天工” 之后的第四大平台级解决方案。至此,百度云实现了人工智能、智能大数据、智能多媒体和智 能物联网全方位的智能平台服务。 2016年8月,投资激光雷达公司VelodyneLiDAR。 2017年以来,百度收购了xPerception、渡鸦科技,参与投资了蔚来汽车、8i等AI
16、公司。 腾讯 2016 年4 月,腾讯成立人工智能实验室,基于计算机视觉、语音识别、自然语言处理和机器学 习四个垂直领域,围绕内容、社交、游戏和平台工具四大特色业务场景,腾讯AI致力于将人工 智能工具以API形式开放出去。 2016年,碳云智能完成近10亿元的A轮融资,腾讯为主要投资方之一。 2017年,腾讯买入电动汽车制造商特斯拉(Tesla)5%股权,腾讯成为特斯拉的第五大股东。 阿里 巴巴 阿里云面向人工智能的布局,核心爆点就三个:ET医疗大脑、ET工业大脑和机器学习平台PAI2.0 2017年3月,阿里宣布开始推动“NASA”计划,着重发力机器学习、芯片、IoT、操作系统和 生物识别。
17、 Apple 2017年5月,苹果收购了人工智能公司Lattice Data。该公司使用人工智能推理引擎去处理非结 构化的“暗数据”,将其变成结构化信息,从而发挥更大的作用。 Google 2014年1月,收购Deepmind、收购后,DeepMind仍保持独立运营的,目标是开发能够“独 立思考”的软件。 2016年9月,收购api.ai,能够协助谷歌指导开发者持续开发优秀的自然语言界面。 2016年3月与海尔达成战略合作,共同推动智能家居发展。 Microsoft2017年6月,Element AI完成了1.02亿美元A轮融资,微软是主要投资方之一。 2017年6月,收购了以色列初创公司He
18、xadite,以便将AI支持的安全功能整合到企业版 Windows 10中。 Facebook2015年1月,收购语音指令创业公司Wit.AI,帮助Messenger创建语音输入模式。 36kr-人工智能行业研究报告(2017年) 2017.6 巨头布局 国内外巨头在AI领域的布局 1.1 行业概述 1.2 行业驱动力 1.3 巨头布局 1.4 行业市场规模 信息来源:根据公开资料整理 人工智能的技术支持层 CHAPTER II AI产业链综述 AI技术支撑层 数据标注 语音识别 语义识别 计算机视觉 12 36kr-人工智能行业研究报告(2017年) 2017.6 正如报告开头所述,人工智能
19、是指使用机器代替人类 实现认知、识别、分析、决策等功能,是一门综合了 计算机科学、生理学、哲学的交叉学科。完整的人工 智能产业链可以分为技术支撑层、基础应用层和方案 集成层,或者说应用场景层。 技术支撑层主要由AI芯片、传感器等硬件和算法模型 (软件)和两部分构成。其中传感器与IoT的感知层相 似,包括GPU、FPGA、NPU等在内的AI芯片负责运 算,算法模型则负责训练数据。 基础应用层的技术则是为了让机器完成对外部世界的 探测,主要由计算机视觉、语音识别等感知层和语义 识别等认知层构成,这些技术是机器能够做出分析判 断的基础。此外,在感知与认知技术之下还有数据标 注作为其底层支撑。 方案集
20、成层是集成了某种或多种基础应用技术的、面 向如工业、自动驾驶、家居、仓储物流、金融、医疗 等不同应用场景的产品或方案。 本篇报告将主要围绕AI中基础应用层和方案集成层, 即应用场景层进行分析。 人工智能产业链综述 AI产业链主要包括技术支撑层、 基础应用层和方案集成层 2.1 AI产业链综述 2.2 AI技术支撑层 13 产业链图 人工智能产业链图 2017.6 36kr-人工智能行业研究报告(2017年) 技 术 圈 计算机视觉 语义识别 语音识别 语料采集 场 景 圈 家居 金融 医疗 安防 教育 2.1 AI产业链综述 2.2 AI技术支撑层 14 36kr-人工智能行业研究报告(201
21、7年) 2017.6 语音识别是将语音转换为文本的技术,是自然语言 处理的一个分支。前台主要步骤分为信号搜集、降 噪和特征提取三步,提取的特征在后台由经过语音 大数据训练得到的语音模型对其进行解码,最终把 语音转化为文本,实现达到让机器识别和理解语音 的目的。根据公开资料显示,目前语音识别的技术 成熟度较高,已达到95%的准确度。然而,需要指 出的是,从95%到99%的准确度带来的改变才是质 的飞跃,将使人们从偶尔使用语音变到常常使用。 医疗卫宁健康 语音识别过程虽存在难点,但目 前技术已趋于成熟 语音识别技术 - 行业概述 语音识别作为一种一维时域信号,在实际操作中主 要有两个难点。首先是数
22、据的获取、清洗。语音识 别需要大量细分领域的标准化语料数据作为支撑, 尤其是各地方言的多样性更是加大了语料搜集的工 作量。据媒体消息,苹果iOS 10.3版本中Siri已支持 上海话。 第二个难点是语音特征的提取,目前主要通过具备 多层神经网络的深度学习来解决,多层的神经网络 相当于一个特征提取器,可对信号进行逐层深化的 特征描述,最终从部分到整体,从笼统到具象,做 到最大程度地还原信号原始特征。 语音数据库训练语音模型 语音信号前端识别降噪特征提取 数据挖掘 信号处理 统计建模 模 型 匹 配 识 别 结 果 图示:语音识别技术架构 2.1 AI产业链综述 2.2 AI技术支撑层 数据标注
23、语音识别 语义识别 计算机视觉 15 36kr-人工智能行业研究报告(2017年) 2017.6 医疗卫宁健康 语音识别虽市场庞大但已出现领 航者,留给创业公司的机会不多 语音识别技术 - 行业概述 据Research and Markets研究报告显示,全球智能 语音市场将持续显著增长,预计到2020年,全球语 音市场规模预计将达191.7亿美元。根据Capvision 报告显示,从语音行业市场份额角度来看,全球范 围内,由Nuance领跑,国内则是科大讯飞占据主导 地位。 Nuance 31.60% 谷歌 28.40% 苹果 15.40% 微软 8.10% 科大讯飞 4.50% IBM 4
24、.10% 其他 8.00% 全球智能语音企业市场份额 科大讯飞 44.20% 百度 27.80% 苹果 6.90% Nuance 3.00% 小i机器人 2.70% 捷通华声 2.20% 海天瑞声 2.00% 中科信利 1.60% 其他 9.60% 中国智能语音企业市场份额 来源:Capvision,36氪研究院 2.1 AI产业链综述 2.2 AI技术支撑层 数据标注 语音识别 语义识别 计算机视觉 16 36kr-人工智能行业研究报告(2017年) 2017.6 科大讯飞创办于1999年,主要从事智能语音及语言 技术、人工智能技术研究,软件及芯片产品的开发, 而应用集成则由下游的开发商或客
25、户自己完成。根 据公开资料显示,科大讯飞是目前我国少数掌握核 心技术的语音领域企业之一,已于2008年5月在深 圳证券交易所挂牌上市。 医疗卫宁健康 科大讯飞专注于To B的语音识别 技术,目前已领跑中文语音市场 语音识别企业案例- 科大讯飞 科大讯飞拥有六大核心技术,分别是语音识别、语 音合、自然语言处理、语音评测、声纹识别和手写 识别。其中更重要的是其同时拥有语音合成和语音 识别,能够把“听”和“说”组合起来。此外科大 讯飞还提出讯飞超脑计划,瞄准语音理解力市场。 图示:科大讯飞核心技术简介 来源:科大讯飞官网,36氪研究院 技术说明 语音识别技术让计算机能够“听懂”人类的语音,将语音中包
26、含的文字信息“提取”出来。 语音合成技术让机器将文字信息转化为声音信息,即让机器像人一样开口说话。 自然语言处理技术 基础研究 对自然语言内在规律的研究,主要包括词典编撰、分词断句、词性分析、语言 模型、语法分析、语义分析、语用分析等。 应用研究 面向不同的应用,研发相关的自然语言处理技术,主要包括拼音输入法、信息 检索、信息抽取、自动摘要、机器翻译、语音合成、语音识别、文本匹配等。 语音评测技术又称计算机辅助语言学习,机器自动对用户发音进行评分、检错并矫正。 声纹识别技术 通过语音信号提取相关特征,进而识别出说话人身份等,广泛应用于信息安全、 电话银行、智能门禁以及娱乐增值等领域。 手写识别
27、技术让计算机能够“认识”用户在手写设备上书写的文字信息。 1来源于科大讯飞官网 硬件研发软件研发语音方案研发集合方案后的产品制作 面向C端软件研发C端用户使用端用户使用 讯飞负责开发引 擎、语音合成和 语音识别芯片 图示:科大讯飞在语音生态链中所处的环节 2.1 AI产业链综述 2.2 AI技术支撑层 数据标注 语音识别 语义识别 计算机视觉 17 36kr-人工智能行业研究报告(2017年) 2017.6 科大讯飞以讯飞超脑、AIUI 为内核,积极打造基于 讯飞开放平台的AI 生态,面对不同场景,推出覆盖 全行业的语音产品及服务,深耕智慧教育、智慧城 市、智慧汽车、智慧医疗以及智慧家居五个行
28、业, 全方位挖掘G 端、B 端及C 端客户。 医疗卫宁健康 随着人工智能热度高涨,科大讯 飞等企业技术得以规模性落地 语音识别企业案例- 科大讯飞 5.6 7.8 12.5 17.8 25.0 33.2 1.3 1.8 2.8 3.8 4.3 4.8 0 10 20 30 40 2001420152016 科大讯飞2011-2016年营业总收入净利润 图示:科大讯飞主要客户举例 随着全球范围内人工智能热度的高涨,语 音识别作为其中重要的技术应用层落地项 目也愈加多元化。科大讯飞在智慧教育、 智慧城市、智能家居、智能汽车、机器人 等领域规模化的应用,促进了其营收近几 年内持
29、续稳定走高,尤其是在教育行业, 科大讯飞构建了智慧考试、智慧校园、智 慧课堂、智慧学习等一体化的智慧教育产 品体系,2017年智慧课堂产品有望成为其 在教育行业收入和毛利的重要增长点。 2.1 AI产业链综述 2.2 AI技术支撑层 数据标注 语音识别 语义识别 计算机视觉 18 从世界范围来看,Nuance是全球最大的独立语音识 别公司之一。Nuance于1994年成立于美国麻省伯 灵顿,并于2000年4月在纳斯达克上市。Nuance曾 为苹果、三星提供语音支持服务,在语音识别领域 一度处于垄断地位,后随深度算法的普及,各巨头 逐渐开始自主研发语音识别技术,差距逐渐缩小。 但直到今天,其发布
30、的Dragon Drive(声龙驾 驶)互联汽车语音和内容平台,仍为众多知名 车企提供着车载语音技术支持,如梅赛德斯-奔驰、 戴姆勒、宝马、丰田、雷克萨斯、荣威等汽车品牌。 此外,还有重点布局家居领域的语音企业云知声。 云知声于2012年6月创办于北京,目前融资轮次为 B+,是智能语音领域新锐玩家。据官方数据显示, 云知声目前已覆盖了476个城市,覆盖用户超过1.8 亿,代表客户有网易易信、锤子手机、乐视超级电 视等。 智能设备 互联家居 跨平台信息娱乐 个性化内容 情景感知 车辆传感器信息 用户档案 行为偏好 驾驶历史 声纹验证 图示:声龙驾驶平台 Dragon Drive 个性化 情景化
31、无缝连接 物联网 智能化 汽车级 自然语言理解 情景化推理 大数据 持续学习 混合解决方案 (本地嵌入及云端服务) 为卓越性能而设计 无缝连接 稳健可靠 Nuance领衔全球市场,云知声 重点布局家居领域 语音识别企业案例- Nuance云知 声 36kr-人工智能行业研究报告(2017年) 2017.6 2.1 AI产业链综述 2.2 AI技术支撑层 数据标注 语音识别 语义识别 计算机视觉 19 应用系统 基础资源 语义识别是自然语言处理(NLP)技术的重要组成部分 。NLP在实际应用中最大的困难还是语义的复杂性 ,此外,深度学习算法也不是语义识别领域的最优 算法。但随着整个AI行业发展进
32、程加速,将为NLP 带来长足的进步。 语义识别是人工智能的重要分支之一,解决的是“ 听得懂”的问题。其最大的作用是改变人机交互模 式,将人机交互由最原始的鼠标、键盘交互转变为 语音对话的方式。此外,我们认为目前的语义识别 行业还未出现绝对垄断者,新进入的创业公司仍具 备一定机会。 鼠标键盘交互 Page PC时代 触摸交互 App 移动时代 语音交互 API IoT时代 人机交互的发展 智能交互对话聊天深度问答机器翻译机器人 知识挖掘 词典语料网页日志知识库 基本方法 规则方法统计与机器学习方法 基础架构 /平台 图示:NLP通用架构示意图 形态分析组块分析语义表示对话理解句子生成 分词/词性
33、主干分析语义计算观点提取摘要生成 专名识别储存分析逻辑推理情感分析篇章生成 用户行为 预测 用户建模 词法 语言分析 文 本 理 解 句法语义篇章 语音生成 解决“听得懂”的语义识别领域 中,新进入者仍具有一定机会 语义识别技术 - 行业概述 36kr-人工智能行业研究报告(2017年) 2017.6 2.1 AI产业链综述 2.2 AI技术支撑层 数据标注 语音识别 语义识别 计算机视觉 20 我们认为,基于语音识别和语义识别的智能语音交 互技术在车载场景中存在刚需,也会成为最先爆发 的领域之一。并且,随着车联网的纵深化发展,相 关硬件趋于免费,依靠语音交互天然流量入口,做 个性化增值服务将
34、是未来车载领域的主要盈利点。 图示:语音交互各场景主要玩家 智能家居智能车载虚拟助理无人驾驶 机器人 智能客服 从1996年至今,国内至今仍在运营的人工智能公司接 近400家1。从下图可看出,自然语言处理(NLP)无 论在创业热度、获投数量还是获投金额都处于细分领 域的前三。据 Global Market Insights数据,预计到 2024年市场规模达到110亿美元。 96 92 77 38 26 15 10 0 20 40 60 80 100 120 人工智能主要细分领域公司数量 单位:/个 58 53 48 22 18 12 8 0 20 40 60 80 人工智能主要细分领域获投数量
35、 单位:个 28 20 16 8 7 6 0 20 40 60 80 人工智能主要细分领域获投金额 单位:亿元人民币 来源:36氪研究院 语义识别技术拥有多样性的应用 领域以及行业参与者 语义识别技术 - 行业概述 1数据来自36氪研究院 36kr-人工智能行业研究报告(2017年) 2017.6 2.1 AI产业链综述 2.2 AI技术支撑层 数据标注 语音识别 语义识别 计算机视觉 21 36kr-人工智能行业研究报告(2017年) 2017.6 科技巨头尤其是微软早在2008年就已开始布局语义 技术领域。对于巨头来说,自主研发耗时久、投入 高,同时效果也是未知的,直接收购是多数巨头选 择
36、的最快方式。 医疗卫宁健康 科技巨头乐衷于收购,小而美的 企业更偏好细分场景 语义识别技术 - 行业概述 公司语义识别领域布局 微软2008年,收购语义搜索公司Powerset,开始步入智能语音交互领域 2014年,微软推出全球首款语音助手Cortana 2016年6月,收购语义分析公司Wand Labs,以提升Cortana智能语音体验 2017年1月,收购了Maluuba,强化了Cortana语义和文本理解能力 苹果2010年,收购Siri语音助手;2014年4月,收购Novauris;2015年10月,收购VocallQ 百度2017年2月,收购渡鸦科技,渡鸦团队并入度秘事业部 关于语义
37、识别领域的创业公司,国内代表企业有出 门智能360、出门问问、三角兽、蓦然认知等。其中, 三角兽的智能语音交互功能已被应用在Rokid、锤子 手机、威马汽车等产品上。此外,由于自然语境和 细分行业语境下,同一名词可能具备不同含义,因 此除了行业通用型的语义识别公司之外,还存在一 些深耕细分场景的公司,例如律师行业国外有基于 IBM Watson的ROSS,国内有无讼、法律谷等。 来源:公开资料收集 2.1 AI产业链综述 2.2 AI技术支撑层 数据标注 语音识别 语义识别 计算机视觉 22 36kr-人工智能行业研究报告(2017年) 2017.6 计算机视觉(computer vision
38、,简称CV)是指用 计算机来模拟人的视觉系统,实现人的视觉功能, 以适应、理解外界环境和控制自身运动。主要解决 的是物体识别、物体形状和方位确认以及物体运动 判断这三个问题。计算机视觉识别系统通常需要三 个过程:目标检测、目标识别、行为识别,分别解 决了“去背景”、“是什么”、“干什么”的问题。 医疗卫宁健康 计算机视觉主要研究如何使机器 具备“看”的能力 计算机视觉 - 行业概述 计算机视觉在技术流程上,首先要得到实时数据, 此步骤可通过一系列传感器获取,少部分数据可直 接在具备MEMS功能的传感器端完成处理,大部分 数据会继续传输至大脑平台,大脑由运算单元和算 法构成,在此处进行运算并给出
39、决策支持。 目标检测 图像预处理 图像分割 目标识别行为识别 模型建立 行为预断 特征提取 目标分类 判断匹配 摄像头类 单目摄像头 双目摄像头 TOF摄像头 雷达类 激光雷达 红外雷达 毫米波雷达 图像获取 图像传感器 产生数据 运算单元 硬件云端 CPU GPU NPU TPU 云计算 雾计算 流计算 结果输出 决策支持 算法开源平台 CNN RNN GNN Google Facebook IBM 百度 图示:计算机视觉技术流程 2.1 AI产业链综述 2.2 AI技术支撑层 数据标注 语音识别 语义识别 计算机视觉 23 36kr-人工智能行业研究报告(2017年) 2017.6 计算机
40、视觉应用场景可分为两大类:图像识别和人 脸识别,每类又可继续划分为动、静共四个类别, 基本覆盖了目前计算机视觉的各项应用场景。其中 动态人脸识别技术是目前创业热度最高的细分领域, 尤其是金融和安防场景,是其重点布局场景。 医疗卫宁健康 动态人脸识别是最热领域,金融 和安防是最热场景 计算机视觉 - 行业概述 国内,计算机视觉领域的企业最早出现在1997年, 2014年出现创业高潮,企业平均年龄在3.9岁1。下 表格为该领域目前存续的具备代表性的创业公司。 公司名称成立时间融资信息核心业务合作企业未来发展预期 商汤科技2014 2017年4月,获赛领资 本战略投资6000万美 元投资 人脸识别
41、华为、小米、英伟达、 京东、银联、科大讯飞 等 继续深入金融、商 业、安防、互联网 +等领域 旷视科技2011 2016年12月,获鸿海 集团、建银国际C轮1 亿美元投资 人脸识别 蚂蚁金服、万科、美图 秀秀、世纪佳缘等 或将进军机器人视 觉技术领域 格林深瞳2013 2014年6月,获红杉资 本A轮数千万美元投资 人脸识别 北京新天地、中国农业 银行等 或将进军无人驾驶 行业 依图科技2012 2017年5月,获高瓴资 本,云锋基金等C轮3.8 亿人民币 人脸识别、 车辆识别 招商银行、浦发银行、 贵州省/福建省交通厅、 江苏省/厦门市公安厅等 做强金融和安防领 域的人像和车辆识 别技术 触
42、景无限2010 2017年3月,获清控银 杏、正和岛A+轮5000 万人民币投资 计算机视觉 图像识别人脸识别 动态静态动态静态 辅助驾驶 鉴黄/暴 工业视觉 监控分析 以图搜图 商品识别 医疗影像诊断 文字识别 金融/安防 物业物业/社保社保 金融 教育 人像美颜/娱乐 聚类分析 安防 图像编辑 1数据来源于36氪研究院 2.1 AI产业链综述 2.2 AI技术支撑层 数据标注 语音识别 语义识别 计算机视觉 24 36kr-人工智能行业研究报告(2017年) 2017.6 计算机视觉作为一种人工智能的基础技术应用,使 用场景多样,市场潜力巨大。其中人脸识别领域在 2016年已接近百亿规模,
43、中国市场在全球范围扮演 着十分重要的角色。 医疗卫宁健康 各细分领域成熟度相差大,其中 人脸识别未来几年市场潜力巨大 计算机视觉 - 行业概述 0 50 100 150 200 250 300 350 400 450 500 20017E2018E2019E2020E 人脸识别市场规模(亿元人民币) 中国全球 来源:Capvision,36氪研究院 由此可见,计算机视觉各细分领域的成熟度目前相 差较大。人脸识别、指纹识别等所在的生物特征识 别领域相对来说技术成熟度、工业化程度较高。在 物体和场景识别方面,由于识别的物体种类繁杂, 表现形态多样,技术成熟度较低。 对于计算机
44、视觉而言,其主要瓶颈在于受图片质量、 光照环境的影响,现有图像识别技术较难解决图像 残缺、光线过爆、过暗的图像。此外,受制于被标 记数据的体量和数量,若无大量、优质的细分应用 场景数据,该特定应用场景的算法迭代很难实现突 破。 2.1 AI产业链综述 2.2 AI技术支撑层 数据标注 语音识别 语义识别 计算机视觉 25 36kr-人工智能行业研究报告(2017年) 2017.6 商汤科技创办于2014年11月,位于北京,2017年4 月完成了赛领资本领投的战略投资6000万美元。商 汤科技专注于核心算法开发,通过视觉技术赋予计 算机视觉感知和认知的能力,业务覆盖金融、商业、 安防、互联网+等
45、行业,意图为企业提供低门槛的计 算机视觉技术,打造“商汤驱动”的人工智能商业 生态。 医疗卫宁健康 专注计算机视觉算法研发,推动 视觉技术融入各行各业 计算机视觉企业案例 商汤科技 商汤科技的核心能力在于其能够自主开发原创深度 学习模型,其自有的高性能算法库相对行业内开源 平台库,较大程度提高了算法效率,带来2-5倍的性 能提升1。性能的提升直接导致的是极大地降低了计 算机视觉硬件门槛,例如一般情况下双目、深度摄 像头才具备视频处理能力,但利用商汤科技的算法 模型,单目摄像头也具备此能力。此外,商汤科技 自身构建了具备200块GPU链接能力的DeepLink超 算平台,过去耗时1个月的运算,现
46、在只需5-6个小 时即可完成。硬件门槛降低+计算能力提升,使得大 部分企业快速接入计算机视觉技术成为现实。 智慧金融 个人远程身份 认证解决方案 纸质票据电子 化解决方案 智慧商业 刷脸门禁考勤 系统 智能场地化迎 宾机、广告机 智慧安防 智能人群分析 解决方案 智能人脸布控 解决方案 互联网+ 人脸美颜 视频美化 以图搜图 人物相册分类 图示:商汤科技业务一览 1数据来自于商汤科技官网 2.1 AI产业链综述 2.2 AI技术支撑层 数据标注 语音识别 语义识别 计算机视觉 26 36kr-人工智能行业研究报告(2017年) 2017.6 作为算法层企业,商汤科技通过与京东、小米、新 浪微博
47、等应用层级公司合作,使得自己的算法可以 很好地融合多类细分领域的特点,快速移植复制到 各行各业。除此之外,商汤还在技术层与多家企业 合作,例如,商汤科技与科大讯飞合作研发具备人 脸+语音双重识别的产品;与英伟达合作研发适用于 深度学习的GPU芯片,该芯片可实时处理双路视频, 为智慧视频提供支持。 医疗卫宁健康 以开放的心态,打造“商汤驱动 ”的人工智能商业生态 计算机视觉企业案例 商汤科技 商汤科技诞生于香港中文大学的多媒体实验室,团 队成员主要由两部分构成,其一是来自MIT、斯坦福、 香港大学、清华大学等高校及其实验室的科研人员; 其二是来自谷歌、百度、微软、阿里巴巴等产业界 的商业人员。商
48、汤科技意图将实验室最新成果与商 业变现之间的时空差距缩到最低限度。 2017年4月, 商汤科技宣布完成了新一轮的战略融资,将进一步 加速商业化布局。 智慧金融 其他 互联网+ 智慧商业智慧安防 图示:商汤科技客户实例 2.1 AI产业链综述 2.2 AI技术支撑层 数据标注 语音识别 语义识别 计算机视觉 27 36kr-人工智能行业研究报告(2017年) 2017.6 除商汤科技这类依靠算法作为计算机视觉解决方案 的流派之外,还存在触景无限这类专注于前端嵌入 式硬件并搭载软件的打法。触景无限成立于2010年, 提供嵌入式智能感知平台视觉卡,并于2017年 3月完成A+轮5000万元人民币融资
49、。 触景无限视觉卡基于英伟达、英特尔等嵌入式芯片, 融合了人脸识别、物体识别、双目测距、GPS、TOF、 IMU等多种传感器、数据处理平台和压缩算法模型, 提供的嵌入式智能感知平台,具备体积小、功耗低、 实时图像处理、处理能力高、多目摄像头支持、通 用API接口等特点。例如基于深度学习的人脸识别技 术运行在视觉卡上能达到每帧100ms的速度(分辨 率为1080P时的检测+识别速度),在1:1人证比对 的情况下识别率大于99%,在1:50000的情况下识别 率大于90%。通过该视觉卡,信息处理可以直接在 前端完成,帮助前端硬件完成“感”与“知”的融 合。 在具体产品方面,截止2017年6月,触景无限视觉 卡已完成两代视觉卡的研发,其中一代V10X系列已 于2016年底实现量产,二代V20X系列亦于日前发布。 相较于一代,二代基于Intel-Movidius芯片研发, 芯片体积更小(一元硬币大小),功耗更低(低至2 瓦),处理速度更强(约1Tflops)。两代视觉卡产 品均可用于安防、无人机、机器人、智能家居、智 能汽车辅助驾驶等领域。