上海品茶

您的当前位置: 上海品茶 > 上海品茶 > 行业知识 > 什么是语音合成?包括哪些技术?应用领域介绍

什么是语音合成?包括哪些技术?应用领域介绍

1.语音合成

语音合成(也称文语转换,Text to Speech,TTS)技术解决的主要问题是将文本信息通过一定的软、硬件转换后合成自然流畅的语音用。它是信息处理领域的一项前沿技术,涉及到计算机科学、声学、语言学、数字信号处理及心理学等多个学科,语音合成技术最早是由W.von KemPelen在1835年发明的,经他改进的机械式会说话的机器。

2.语音合成技术发展历史

随着技术的发展,语音合成技术也在不断改进,从最初的仿生学方法到如今的基于数据库制作,音质和自然度都得到巨大提升。

语音合成

3.语音合成技术介绍

(1)源-滤波器合成技术

源-滤波器合成技术是对发声器官的简单模拟,该技术认为语音由声源激励(声带)与线性声学滤波器(声道)组合形成的。源-滤波器合成技术最常用的两种技术是线性预测化inear Predictive Coding,LPC)合成与共振峰(Formant)合成。

线性预测化inear Predictive Coding,LPC)合成技术中激励参数由增益常数、浊音/清音开关信息和基音频率组成,声道参数用具体的LPC参数进行控制。通常,清音激励采用白噪声序列,合成语音的质量可通过改变浊音激励来提高。

巧振峰合成技术是把声道看作一个谐振腔,利用不同音色语音具有不同模式共振峰的特征,以巧振峰频率及其带宽为参数构成共振峰滤波器。语音合成时,将多个巧振峰滤波器组合起来模拟声道的传输特征,通过对激励声源发化的信息进行调制获得合成语音。

(2)波形编码/编辑合成技术

波形合成技术一般有两种,即波形编码合成与波形编辑合成技术。

波形编码合成技术主要通过对需要合成的语音波形直接进行存储或对语音波形的模拟信号在时间轴上按一定的速率抽样与量化处理,即进行编码压缩后进行存储,合成时重放语音库的语音或对数字信号经过解码和滤波恢复成模拟信号后输出。

波形编辑合成技术主要利用语音编码技术,在语音库中存储适当的语音片断,合成语音时,对语音波形进行解码、编辑、拼接与平滑处理后输出语音。早期的波形编码技术只能简单地回放语音库预告存储中的语音,计算机的存储能力与计算速度也无法满足语音合成对语音库规模的实际需求。因此,当时的波形编辑合成技术由于语音库技术原因合成的语音自然度不高。

(3)统计参数语音合成

统计参数语音合成(Statistical Parametric Speech Synthesis,SPS1S)技术主要凭借一套自动化的流程,对输入的语音数据进行声学训练,并通过训练得到的模型构建所需的合成系统。即,首先利用统计机器学习的技术对语料库的声学参数进行建模;其次用声码器对模型预测出的声学参数进行参数合成。

(4)基于语料库的语音合成技术

基于语料库的语音合成(Corpus-based Speech Synthesis)直接从语料库中挑选最合适的语音片段作为合成基元。由于所挑选的基元基本上无需进行参数调整,基元的原始音质和语音拼接点处不连续的现象得到很大的改善,从而达到了提高合成语音自然度的要求。

3.语音合成技术应用领域

(1)公共服务领域

主要用在智能播报、智能客服、视障服务和老年服务等场景。

(2)智能硬件领域

主要用在智能音箱、智能机器人和智能家居等场景。

(3)智慧交通领域

主要用于导航与智能车载设备等场景。

(4)长音频领域

主要用于有声阅读、广播剧和新闻资讯等场景。

(5)泛娱乐领域

主要用于有声社交、直播、二次元、影视及动画配音和游戏任务定制语音等场景。

(6)教育领域

主要用于学前教育、语音教育、素质教育、学科教育和课外辅导等场景。

语音合成

本文由@2200 发布于三个皮匠报告网站,未经授权禁止转载。

更多行业知识,敬请关注三个皮匠报告行业知识栏目。

参考报告:《头豹:从语音合成(TTS)的发展探寻智能语音行业的现状与未来(30页).pdf

本文由作者2200发布,版权归原作者所有,禁止转载。本文仅代表作者个人观点,与本网无关。本文文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

相关报告

【公司研究】贝特瑞-全球锂电负极材料龙头精选层龙头严重低估-20200728[21页].pdf
【公司研究】贝特瑞-全球锂电负极材料龙头精选层龙头严重低估-20200728[21页].pdf

研究源于数据 1 研究创造价值 全球锂电负极材料龙头全球锂电负极材料龙头,精选层龙头严重,精选层龙头严重 低估低估 方正证券研究所证券研究报告方正证券研究所证券研究报告 贝特瑞(835185) 公司研究 电气设备与新能源电气设备与新能源行业行业 公司深度报告 首席电新分析师:首席电新分析师: 申建国 执业证

【公司研究】铂力特-航空航天3D打印领先者下游市场快速放量-20200727[29页].pdf
【公司研究】铂力特-航空航天3D打印领先者下游市场快速放量-20200727[29页].pdf

敬请阅读末页的重要说明 证券证券研究报告研究报告| 公司公司深度报告深度报告 工业工业 | 军工军工 强烈推荐强烈推荐-A(首次首次) 铂力特铂力特 688333.SH 当前股价:68.3 元 2020年年07月月27日日 航空航天航空航天3D打印打印领先者领先者,下游市场快速放量下游市场快速放量 基础数

【公司研究】爱博医疗-眼科器械的创新型企业-20200728[20页].pdf
【公司研究】爱博医疗-眼科器械的创新型企业-20200728[20页].pdf

爱博医疗(688050) 证券研究报告公司研究医疗器械 1 / 20 东吴证券研究所东吴证券研究所 请务必阅读正文之后的免责声明部分请务必阅读正文之后的免责声明部分 眼眼科科器械器械的创新型企业的创新型企业 投资评级:暂无 盈利预测盈利预测与与估值估值 2019A 2020E 2021E 2022E 营业收 

【公司研究】弘亚数控-竣工回暖设备需求边际改善精装逻辑开启二次成长-20200727[23页].pdf
【公司研究】弘亚数控-竣工回暖设备需求边际改善精装逻辑开启二次成长-20200727[23页].pdf

  敬请参阅末页重要声明及评级说明 证券研究报告 弘亚数控弘亚数控(0 002833.SZ02833.SZ) 公司研究/深度报告 主要观点: 竣工回暖趋势确立,带动家具行业资本开支需求上行。精装房驱动 定制家居行业集中度下降,腰部企业增速更快,国内一线板式家具 设备商,产品具有高性价比优势。公司是国内板式家具设

【公司研究】海尔智家-从私有化方案探讨再审海尔智家(600690.SH)价值:价值明显低估静待扬帆破浪-20200728[39页].pdf
【公司研究】海尔智家-从私有化方案探讨再审海尔智家(600690.SH)价值:价值明显低估静待扬帆破浪-20200728[39页].pdf

敬请参阅最后一页特别声明 -1- 证券研究报告 2020 年 7 月 28 日 海尔智家(600690.SH) 价值明显低估,静待扬帆破浪 从私有化方案探讨再审海尔智家(600690.SH)价值 公司深度 海尔开启吸并探讨,释放治理改善信号。海尔开启吸并探讨,释放治理改善信号。根据公告,海尔智家正在初步 

【公司研究】贵州茅台-产能释放新周期量价齐升仍可期-20200728[30页].pdf
【公司研究】贵州茅台-产能释放新周期量价齐升仍可期-20200728[30页].pdf

敬请参阅末页重要声明及评级说明 证券研究报告 贵州茅台贵州茅台(600519) 公司研究/深度报告 主要观点: 摘要:摘要:20202025 年,基酒可支持茅台酒销量年复合增约 46.3%,市 场扩容和份额增长可保障以产定销。 通过涨出厂价、 调产品和渠道结构, 茅台酒均价未来有望年增 510%。假设 20

【公司研究】博汇纸业-APP加持4Q白卡加速提价脱胎换骨的旅程开始-20200727[33页].pdf
【公司研究】博汇纸业-APP加持4Q白卡加速提价脱胎换骨的旅程开始-20200727[33页].pdf

- 1 - 敬请参阅最后一页特别声明 市场价格(人民币) : 11.35 元 目标价格(人民币) :18.19 元 市场数据市场数据( (人民币人民币) ) 总股本(亿股) 13.37 已上市流通 A 股(亿股) 13.37 总市值(亿元) 151.73 年内股价最高最低(元) 11.73/9.78 沪深

【公司研究】科技行业全球SaaS云计算系列报告23:Docusign全球电子签名SaaS龙头持续成长可期-20200728[24页].pdf
【公司研究】科技行业全球SaaS云计算系列报告23:Docusign全球电子签名SaaS龙头持续成长可期-20200728[24页].pdf

证券研究报告 请务必阅读正文之后的免责条款 DocuSign:全球电子签名:全球电子签名 SaaS 龙头,持续龙头,持续 成长可期成长可期 全球 SaaS 云计算系列报告 232020.7.28 中信证券研究部中信证券研究部 核心观点核心观点 许英博许英博 科技产业首席 分析师 S4

会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部