《AIIA:中国声纹识别产业发展白皮书2.0(39页).pdf》由会员分享,可在线阅读,更多相关《AIIA:中国声纹识别产业发展白皮书2.0(39页).pdf(36页珍藏版)》请在三个皮匠报告上搜索。
1、目前,声纹识别标准已完成基本定义,2008年3月由工业和信息化部发布自动声纹识别(说话人识别)技术规范SJ/T 11380-2008是中国颁布的首个涉及声纹识别的标准;2010年12月由公安部发布安防生物特征识别应用术语。此后,声纹识别的标准主要聚焦于推动行业应用,2014年8月公安部发布安防声纹确认应用算法技术要求和测试方法是中国首次就声纹识别的行业应用技术要求和安全等级制订标准;2018年10月中国人民银行发布移动金融基于声纹识别的安全应用技术规范JR/T 0164-2018是我国金融行业生物识别的首个技术标准。2018年5月25日,信息技术 移动设备生物特征识别 第5部分:声纹、信息技术
2、 生物特征数据交换格式 第13部分:声纹数据两项应用类标准由全国信息技术标准化技术委员会予以立项,进入标准起草阶段,这两项标准主要规范了数据交换中的格式要求,及在互联网金融等重点领域的应用要求。由于深度学习是基于数据驱动的模型,需要庞大的数据,这些数据最好是真实场景的数据,以及对数据的精确标注。声纹识别训练库的建立,至少要保证性别比例分布为50%5%,包含有不同年龄段、不同地域、不同口音、不同职业。同时,测试样本应该涵盖文本内容是否相关、采集设备、传输信道、环境噪音、录音回放、声音模仿、时间跨度、采样时长、健康状况和情感因素等影响声纹识别性能的主要因素。因此,在声纹识别标准化的发展中,声纹数据采集的技术要求、声纹数据质量评价标准、声纹数据建库要求等数据建设标准也至关重要。 在电话信道环境下,通信网络产生的电话录音,经预处理子系统(如转码、角色分离、降噪)处理后将其传入系统声纹数据库,将用户的声音注册到声纹库中。 在实际商业场景中,企业客户如呼叫中心等产生的实时通话的语音流经过声纹识别系统,利用算法与模型提取话音数据中说话人的声纹特征并与声纹库进行比对。从而为业务系统或呼叫中心提供声纹辨认或声纹确认服务。