上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

阿里智能助理在电商领域的架构构建与实践(1)(36页).pdf

编号:91456 PDF 36页 4.76MB 下载积分:VIP专享
下载报告请您先登录!

阿里智能助理在电商领域的架构构建与实践(1)(36页).pdf

1、-在电商领域的架构构建与实践-陈海青(海青)-阿里集团客户体验事业群-智能创新中心基于机器学习的阿里智能助理一、阿里小蜜平台介绍二、智能人机交互构建技术实践三、挑战与未来目 录content一、阿里小蜜平台介绍二、智能人机交互构建技术实践三、挑战与未来目 录content背景1从传统搜索到问答,带来拟人化体验的提升2带来行业模式的变化,应用领域成本的降低3人工智能的热点领域之一,未来的入口级领域,各大公司竞争激烈基于阿里海量消费数据,结合线上、线下的生活场景需求,以智能+人工的模式提供智能导购、服务、助理的业务体验电商领域的平台化开放商家开放-千牛平台企业开放-钉钉平台电商领域的私人助理实践-

2、阿里小蜜阿里小蜜图片大小统一店小蜜企业钉小蜜阿里小蜜及平台输出展示阿里小蜜整体结构体系路由规则意图识别客户模型图像识别语音识别文本模型多轮交互推荐预测多模交互多终端多场景客服领域客服领域客服规则导购领域导购人工导购规则助手领域助手人工助手规则阿里小蜜千牛店小蜜钉钉企业小蜜阿里云服务导购物流聊天其他智能路由图像识别多轮交互语音识别文本模型用户模型多模交互推荐预测知识图谱数据回流多维度数据分析数据挖掘/离线模型机器学习训练输出平台服务层技术层数据层阿里小蜜平台一、阿里小蜜平台介绍二、智能人机交互构建技术实践三、挑战与未来目 录content语音识别(ASR)自然语言理解(NLU)智能人机交互的基本

3、技术流程对话管理(DM)文本转语音(TTS)自然语言生成(NLG)语音输入文本语义表示语义表示文本语音输出上下文上下文智能人机交互分层策略语义意图面向目标非面向目标问答型任务型语聊型明确意图隐式意图语义意图识别:目标和非目标任务的细分意图的明确与推理匹配面向3类业务划分并建立技术体系:问答型:“密码忘记怎么办?”任务型:“我想订一张明天从北京到杭州的机票”语聊型:“我心情不好”语义意图结合传统机器学习算法以及深度学习算法的语义意图识别方法语义意图识别的基本技术流程Query+Context分词词性标注以及NER意图识别分类对话管理系统意图语义表示意图属性抽取上下文模型领域数据模型意图识别分类多

4、分类模型(有监督的分类算法,依据具体场景进行选型BayesKnn最大熵):适用于相对简单场景且分类数稳定领域二分类模型(按照意图领域做成多个二分类模型 SVM):适用于领域分类相对独立,并且经常需要新增修改的场景,能做到相互独立传统机器学习深度学习深度学习多分类模型(CNNDNNLSTM):适用于较大数据量积累场景结合用户行为特征的深度学习意图预测模型:由于文本缺失、不明确或者不完整的情况下,增加用户行为特征进行意图分类预测深度学习模型意图数据积累初步建模 保证相关性用户问句和知识点标题的相似度用户问句和历史问句的相似度保证相关性保证多样性预留位置展示 保证多样性随机展示(均匀采样)按历史的知

5、识点使用频次来推荐结合用户行为特征的深度学习意图预测模型用户点击数据用户行为序列用户相关特征Query+Context深度学习模型深度学习模型意图识别方案采用阿里云飞天一部大规模机器学习平台PAI进行模型训练和在线预测PAI-Machine Learning Platform四种主流的问答匹配技术基于模板式匹配(Rule-Based)基于检索的模型(Retrieval model)基于统计机器翻译模型(SMT)基于深度学习模型(Deep Learning)1234分策略模块技术选型根据不同分策略模块分别进行技术选型:问答型:基于知识图谱+传统检索模型的方式任务型:slots filling语聊

6、型:传统检索模型+Deep Learning方式问答型领域技术构建基于知识图谱+传统检索模型的方式语义挖掘语 义 挖 掘同义语义挖掘词和短语挖掘文本相似同义语义挖掘、相似词挖掘、构造模式(pattern)相似词挖掘主要是选取标签中的业务词作为种子,例如:通过Word2Vec扩展相近词汇,用于词语的归一化同义语义挖掘旨在挖掘同义问法Pattern构造潜在语义分析聚类种子词获取深度挖掘模式匹配知识图谱构建美妆时尚上下文语义算法组件在线语料百科数据社区问答淘宝问答开放数据客服聊天词条数据垂直网站商品标题问答结构化标题答案来源标签答案类型相关问题信息抽取问答挖掘表示理解检索实体分析句子成分上下文挖掘新

7、词发现词关系挖掘同义相关上下文词库结构化标题答案来源标签相关词条相关问题行业词库问答服务开放服务主题过滤类目标题关键词情感评价数据清洗分布式索引图数据库存储语料平台优化提升问答语料爬虫抓取dump爬虫抓取dumpIopen组件通过多数据源完成实体和结构化短句的挖掘与积累,并最终生成知识图谱或可用语料构建完成的知识图谱示例基于实体、核心语义、动作和知识点的关系知识图谱构建的图计算模型优点图状结构支持实体间的上下文与推理把核心知识的维护带给业务的成本降低到最小,不需要维护复杂相似问法,通过技术挖掘生成可扩展图结构;精确匹配率相比之前的机器人匹配模型提升10%+,提升用户体验缺点模型构建初期会损失一

8、定的覆盖率为保证精准度会提升检索模型的阀值,目前检索模型的匹配量占到全局匹配的5%-10%提问处理模块:1.文本预处理(指代消解)2.分词处理(中、英、俄)3.Bi-Gram纠错搜索召唤模块:1.基于open search的检索召回答案处理模块:1.答案内容组装渲染2.问答日志记录计算模块:1.相似度计算2.情感分析3.文本属性识别索引模块:1.语料索引构建结构化知识库权重训练模块提问回答检索计算模型(Retrieval Model)任务型领域技术构建slots filling任务型技术方案机票构建领域意图树(如右图)通过slots filling的方式进行不断判断、填充、转移和完结购买出发地

9、到达地时间任务型技术方案输入:Query中slot属性的抽取输出:对话系统匹配响应结果处理过程:获取意图树的属性进行填充填槽之后判断意图树中填写状态根据设定的状态结果进行返回领域数据输入对话系统Slots Filling上下文模型输出语聊型领域技术构建传统检索模型+Deep Learning方式Seq2Seq模型语聊型技术方案Rerank Generation离线数据结果分策略技术构建体系语义意图面向目标非面向目标问答型任务型语聊型明确意图隐式意图一、阿里小蜜平台介绍二、智能人机交互构建技术实践三、挑战与未来目 录content挑战与未来目前智能人机交互机器人的智能程度还比较低,还有很长一段路要走在工业领域由于涉及的领域以及复杂度情况很多,需要进行不断的细分并通过不同的方案来解决挑战未来在技术领域知识体系的不断构建完善,以及Deep Learning更好的结合与发展是未来一段时间的方向随着学术和工业领域的不断紧密结合,未来人机交互会在更多的场景被应用,并且会进一步提升

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(阿里智能助理在电商领域的架构构建与实践(1)(36页).pdf)为本站 (云闲) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部