1.声纹识别技术应用场景
声纹识别技术按照其所要识别的任务及应用场景主要分成两类:声纹验证(SpeakerVerification, SV)和声纹辨认(Speaker
Identification, SI)。
(1)声纹验证技术需要解决的问题是:这段话是否由这个特定的人所说。该类任务只关心某个特定的说话人,因此声纹验证技术可以看作一个二值判别的问题,只需要输出“是”或者“否”。声纹验证对应的应用主要是唤醒和安全。在一些安全领域,声纹验证能够确保操作来自被授权的用户,而非冒名顶替者。
(2)与声纹验证不同,声纹辨认需要解决的问题是:这段话是由谁所说。这里的“谁”限定在某个特定的候选说话人(Candidate
Speaker)集合之中。假如这个集合包含了M位说话人,那么声纹辨别可以看作一个M元分类问题;假如输入音频中含有来自这个集合之外的说话人,则可增加一个冒名顶替者(Imposter)的类别,那么此时声纹辨别可以看作一个M+1元分类问题。没有冒名顶替者的声纹辨别称为“闭集”声纹辨认;对应的,存在有可能有冒名顶替者的声纹辨认称为“开集”声纹辨别。
2.声纹识别优势
(1)非接触、易接受:
声纹由于其非接触性是可以用于远程领域的生物识别技术。另外蕴含声纹特征的语音获取方便、自然。在采集过程中涉及到的用户个人隐私信息较少,因此更容易被使用者接受。
(2)成本低:
语音采集装置成本低廉,使用简单,一个麦克风即可,在使用通讯设备(如电话、手机)时更无需额外的录音设备。
(3)伪造难:
声纹信息必须是活体采集,可使声纹口令动态变化而无需担心密码遗忘、丢失和窃取问题,防止录音假冒。
3.声纹识别与语音识别
与语音识别(Speech
Recognition)技术不同的是,语音识别是将语音信号识别隐射为对应的文本内容的技术,绝大多数情况下并不关心说话人的身份并需要做到对不同说话人声音的鲁棒性;声纹技术,尤其是文本无关的声纹识别技术,则相反,需要在不同的文本内容中稳健地识别出说话人的身份。声纹识别希望从信号中滤除与文本相关的信息,只保留说话人的身份信息。
以上梳理了声纹识别的应用场景、优势等,希望对你有所帮助,如果你想了解更多相关内容,敬请关注三个皮匠报告的行业知识栏目。
本文由@2200 发布于三个皮匠报告网站,未经授权禁止转载。
推荐阅读:
什么是虹膜识别技术?优缺点有哪些?
什么是手指静脉识别技术?原理及应用领域一览
什么是语音识别技术?原理是什么?应用领域介绍