《顺丰 庄思待-智能语音技术在顺丰呼叫中心的应用实践.pdf》由会员分享,可在线阅读,更多相关《顺丰 庄思待-智能语音技术在顺丰呼叫中心的应用实践.pdf(21页珍藏版)》请在三个皮匠报告上搜索。
1、智能语音技术在顺丰呼叫中心的应用实践智能语音技术在顺丰呼叫中心的应用实践庄思待庄思待 语音语言应用架构负责人语音语言应用架构负责人个人简介个人简介 1317年百度在线 17 顺丰科技在人工智能应用、云原生、大数据等领域有多年的实践落地经验目前在顺丰负责语音质检系统、问答系统、智能搜索、智能呼叫等语音语言类AI应用的系统架构和研发目录目录 顺丰呼叫中心的智能语音应用 语音合成在外呼中的应用 语音识别的主要应用场景和方案 展望顺丰呼叫中心的智能语音应用顺丰呼叫中心的智能语音应用智能语音的行业应用顺丰呼叫中心的智能语音应用顺丰呼叫中心的智能语音应用呼叫中心的场景应用全景图目录目录 顺丰呼叫中心的智能
2、语音应用 语音合成在外呼中的应用 语音识别的主要应用场景和方案 展望语音合成在外呼中的应用语音合成在外呼中的应用TTS拼接合成:运算量低 /不连贯,人工介入成本高参数合成:语音连接平稳质量高 /对声码器依赖高端到端:对语言学知识要求低 /运算量大,实时性低语音合成在外呼中的应用语音合成在外呼中的应用当前方案基于深度学习的语音合成 将输入的文本经过前端处理,得到文字对应的音素ids序列 声学模型,将音素ids序列转换成语音的特征,例如:mel谱 声码器,将语音的特征mel谱转换成语音数据流。语音合成在外呼中的应用语音合成在外呼中的应用TTS引擎结合实际语音合成效果,声学模型选取 Fastspee
3、ch2,声码器选取HiFigan语音合成在外呼中的应用语音合成在外呼中的应用在测方案目录目录 顺丰呼叫中心的智能语音应用 语音合成在外呼中的应用 语音识别的主要应用场景和方案 展望语音识别的主要应用场景和方案语音识别的主要应用场景和方案ASR流式语音识别流式语音识别非流式语音识别非流式语音识别可用数据history数据少量future数据全部history+future数据模型精度低高数据输入N秒/次,如N=0.5一次性输入完整数据结果获取实时输出解码完成一次性输出运行效率指标最后一次送入数据到获得最终结果的时延RTF(受时长影响波动)语音识别的主要应用场景和方案语音识别的主要应用场景和方案非
4、流式ASR在质检的应用语音识别的主要应用场景和方案语音识别的主要应用场景和方案质检系统架构语音识别的主要应用场景和方案语音识别的主要应用场景和方案流式ASR在智能应答系统的应用 端点检测VAD(Voice Activitity Detection):nnVAD 流式ASR(Automatic Speech Recognition):CTC,Attention语音识别的主要应用场景和方案语音识别的主要应用场景和方案流式ASR的接入语音识别的主要应用场景和方案语音识别的主要应用场景和方案流式ASR的接入语音识别的主要应用场景和方案语音识别的主要应用场景和方案接入电话系统语音识别的主要应用场景和方案
5、语音识别的主要应用场景和方案ASR/TTS接入及高可用展望展望 在离线融合,更充分的使用算力资源 LLM 赋能了解更多技术实践案例了解更多技术实践案例麦思博(msup)有限公司是一家面向技术型企业的培训咨询机构,携手2000余位中外客座导师,服务于技术团队的能力提升、软件工程效能和产品创新迭代,超过3000余家企业续约学习,是科技领域占有率第1的客座导师品牌,msup以整合全球领先经验实践为己任,为中国产业快速发展提供智库。高可用架构主要关注互联网架构及高可用、可扩展及高性能领域的知识传播。订阅用户覆盖主流互联网及软件领域系统架构技术从业人员。高可用架构系列社群是一个社区组织,其精神是“分享+交流”,提倡社区的人人参与,同时从社区获得高质量的内容。