上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

2017年人工智能工业应用痛点及解决思路.pdf

编号:92735 PDF 25页 2.12MB 下载积分:VIP专享
下载报告请您先登录!

2017年人工智能工业应用痛点及解决思路.pdf

1、2017年 8月5日人工智能工业应用痛点及解决思路SAMPLE TEXTSAMPLE TEXTSAMPLE TEXTADD YOUR TEXT HERE YOU NEED,ADD YOUR TEXT HERE YOU NEED,ADD YOUR TEXT HERE YOU NEED.可扩展的机器学习系统可扩展的机器学习系统人工智能的兴盛是数据量变大、机器性能提升、并行计算发展的结果Scalable ML System Scalable ML System Scalable SystemScalable System数据处理的吞吐随着集群、机器数的增加而增加智能水平/体验的壁垒、随着业务/数据的

2、增长而增加什么是机器学习的可扩展性Scalable?工业大数据需要高工业大数据需要高VCVC维模型维模型VC维(Vapnik-Chervonenkis Dimension)又称VC理论;VC维反映了函数集的学习能力,VC维越大则模型或函数越复杂,学习能力就越强;模型一定要与待解决的问题相匹配,如果模型过于简单,而问题本身的复杂度很高,就无法得到预期的精度可扩展的机器学习系统可扩展的机器学习系统机器学习数据特征模型机器学习数据特征模型工业追求极高的VC维度如何沿着模型走?如何沿着模型走?学术界主导(ICML,NIPS,ICLR)非线性的三把宝剑:Kernel,Boosting,Neural Ne

3、twork 模型大部分单机可加载 解决数据分布式问题,以及降低系统overhead工业界针对应用定制模型 基于思考或者观测得到的假设 加入新的模型、结构,以加入更多参数 典型案例:伽利略如何沿着模型走?如何沿着模型走?工业界主导(KDD,WWW)模型相对简单粗暴 分布式,工程挑战大 高效并行并保证快速收敛 工业界中一般针对应用定制特征 为什么有那么多特征,怎么产生这些特征 如何理解这些特征 人工智能爱因斯坦没有免费的午餐定理:不存在万能模型没有免费的午餐定理:不存在万能模型“We show that all algorithms that search for an extremum of a

4、 cost function perform exactly the same,when averaged over all possible cost functions.In particular,if algorithm A outperforms algorithm B on some cost functions,then loosely speaking there must exist exactly as many other functions where B outperforms A”-by Wolpert and Macready(1995)in No Free Lun

5、ch Theorem所有的机器学习模型都是一个偏置更多的模型假设更少的数据更简单的模型假设更多的数据支持与特征刻画工业界机器学习中并没有免费的午餐,要做出对业务问题合适的选择工业界机器学习中并没有免费的午餐,要做出对业务问题合适的选择然然AIAI还远未普及还远未普及与与HadoopHadoop相比相比工业界应用机器学习的难题工业界应用机器学习的难题工业界应用机器学习的难题工业界应用机器学习的难题需要AI应用平台 Tenserflow,Mxnet,Caffe等工具日趋丰富 但是,足够了么?为什么人工智能还没有真的大规模应用到每个企业 Hadoop为什么用的人多?先驱知识要求太多 能做AI的还是研

6、究/应用机器学习科学家 核心机器学习算法平台只降低了一部分门槛 更大的应用基础:降门槛 算法效果如何解决特征工程如何解决特征工程特征工程在工业界是巨大的难关 什么是特征工程?现在的平台已经足够了吗?需要对机器学习与业务都非常理解 不同的算法,要使用不同的特征工程达到同一个目标以新闻推荐为例 一阶特征:每个用户直接喜欢什么 二阶特征:用户的扩展兴趣(喜欢大数据的人,可能对机器学习也感兴趣)不同模型如何添加?如何解决特征工程如何解决特征工程特征工程在工业界是巨大的难关 需要对机器学习与业务都非常理解 不同的算法,要使用不同的特征工程达到同一个目标如何解决特征工程如何解决特征工程特征工程是非常大的难

7、题 需要对机器学习与业务都非常理解 不同的算法,同样的特征,获得效果不同如何进行自动的特征工程 隐式特征组合(NN,FM)半显式显示特征组合(GBDT)显式特征组合(特征叉乘)隐式特征组合隐式特征组合主要特点 对连续值特征天然友好 最大的成功:语音图像 高级离散变量处理相对更复杂 隐式组合,基本无可解释性对离散特征需要Large Scale Embedding Embedding NN FM,FNN,PNN DeepFM对离散特征需要Large Scale Embedding Embedding NN FM,FNN,PNN DeepFM 第四范式DSN隐式特征组合隐式特征组合半隐式特征组合半隐

8、式特征组合主要是森林类算法 为什么是“半隐式”看起来可以解释,实际上并不可解释 看起来在做特征组合,实际上是层次贪心的副产物主要特点 理解容易,相对鲁棒,效果优秀 Off-the-shelf 离散特征非常难解,无现有方案 第四范式HE-TreeNet,GBM解决大规模离散特征的树模型研发基于Embedding,Ensembling,Stacking的系列树算法显式特征组合:问题显式特征组合:问题主要基于贪心与搜索 正则化 Beam Search,MCTS 遗传算法,模拟退火问题特别的难 围棋的状态空间 31919;而个特征,选个特征,限制最大阶组合,状态空间为C=2 难以组合连续值特征?显式特

9、征组合优势可解释性:提供深度业务洞察可叠加性:增强所有机器学习算法显式特征组合:现状显式特征组合:现状State-of-art Online Boosting Feature Selection:单特征Weak Learner基于Adaboost的选择 Online Regularization:基于Lasso对梯度、权重截断现有算法的问题 并非为n选m个k阶以下特征设计 多为副产物,对信息损失的比较大 二阶组合为主,基本无法高阶特征组合显式特征组合:显式特征组合:FeatureGO扫描二维码扫描二维码第四范式第四范式先知先知FeatureGoFeatureGo,GBM,DSNGBM,DSN触

10、触手可得!手可得!第四范式FeatureGO算法 基于MCTS,对特征组合状态进行估计 调优的搜索剪枝技术 利用LFC算法解决连续值特征组合问题 组合特征可高达6阶算法背后的优化算法背后的优化BoostingFully/Partially Corrective LearningCross Parameter-server Sharing(CPS)计算能力也是人工智能的一部分 计算能力是新的性感,智能同样来自于计算 Google立出了榜样 在第四范式,架构、工程优化与算法并重如何解决调参如何解决调参基于搜索的调参 Grid Search Random Search SMBO如何做的更快更好 CPS Dynamic GraphAutoMLAutoML:AIAI forfor Everyone Everyone 自动拼表:Domestic Knowledge Graph 模型可解释:Twice Learning 自动线上优化:强化学习.THANKS

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(2017年人工智能工业应用痛点及解决思路.pdf)为本站 (云闲) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部