一种语音合成的方法和装置制造方法及图纸

技术编号：12059257 阅读：151 留言：0更新日期：2015-09-17 09:22

本发明专利技术实施例提供了一种语音合成的方法和装置以及一种基频模型的训练方法和装置，其中，语音合成的方法包括：对待合成文本中的各音段进行音段模型决策，确定所述各音段对应的基线HTS基频模型；对所述待合成文本中的各音节进行音节模型决策，确定所述各音节对应的连续浊音段基频模型；依据所述各音段对应的基线HTS基频模型与所述各音节对应的连续浊音段基频模型，按照多层融合算法联合生成融合基频参数；依据所述融合基频参数以及对应的谱参数合成语音。本发明专利技术实施例能够提高音高的准确度，从而使韵律更接近真实语音。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音识别
，特别是涉及一种语音合成的方法和装置以及一种基频模型的训练方法和装置。
技术介绍
随着语音合成技术的发展，合成声音的音质、自然度、智能度都有了很大提高， HTS (HMM-based speech synthesis system，基于HMM的语音合成系统）技术目前已成为语音合成业界的核心技术，HMM(Hidden Markov Model，隐马尔可夫模型）作为一种统计分析模型，创立于20世纪70年代。80年代得到了传播和发展，成为信号处理的一个重要方向，现已成功地用于语音识别。 HTS技术可以分为两个阶段，训练阶段和合成阶段。在训练阶段，使用信号分析工具从语音中提取声学参数（谱参数和基频参数），然后以音段为粒度对声学参数建立HMM模型；在合成阶段，构造出整句的马尔可夫链，然后在其上按最大似然原则生成谱参数、基频参数和时长，再使用信号合成器重构出语音。传统的HTS在训练以及合成阶段通常以音段为语音粒度单位，即以声母或韵母作为语音粒度单位。然而，以这以种微小的语音粒度为单位进行语音合成的方法，会导致合成的韵律效果平淡、生硬，与真实语音差距较大。此外，上述决策树聚类将原本精细区分的语境类型合并为更粗略的类型集，以单一高斯模型一概而论，丢失了诸多个性细节，导致基频参数的"过平均化"，状态间参数绑定更进一步加剧"过平均化"问题，基频参数的"过平均化"导致每个字的音调刻板、缺乏变化，机器风格明显。
技术实现思路
本专利技术实施例所要解决的技术问题是提供一种语音合成的方法和装置以及一种基频模型的...

【技术保护点】
一种语音合成的方法，其特征在于，所述方法包括：对待合成文本中的各音段进行音段模型决策，确定所述各音段对应的基线HTS基频模型；对所述待合成文本中的各音节进行音节模型决策，确定所述各音节对应的连续浊音段基频模型；依据所述各音段对应的基线HTS基频模型与所述各音节对应的连续浊音段基频模型，按照多层融合算法联合生成融合基频参数；依据所述融合基频参数以及对应的谱参数合成语音。

【技术特征摘要】

【专利技术属性】
技术研发人员：王愈，李健，张连毅，武卫东，
申请(专利权)人：北京捷通华声语音技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人