语音合成装置及方法制造方法及图纸

技术编号：12805545 阅读：69 留言：0更新日期：2016-02-03 19:17

本发明专利技术公开了一种语音合成装置及方法，该装置包括：模型构建模块，用于预先根据收集的大量发音人语音数据构建语音合成模型；接收模块，用于接收用户的待合成文本；风格确定模块，用于确定合成语音风格；模型修正模块，用于根据合成语音风格对所述语音合成模型进行修正，以使修正后的语音合成模型适应所述合成语音风格；合成模块，用于利用所述修正后的语音合成模型对所述待合成文本进行语音合成，得到合成语音数据。利用本发明专利技术，可以使合成语音的风格更丰富自然，有效提高用户体验，增加娱乐性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音合成领域，具体涉及一种。
技术介绍
语音合成又称文语转换，其主要功能是将文本转换成语音，并尽可能使合成语音有较高的可懂度和自然度。随着语音合成需求的日益增加，人们对合成语音的要求越来越多样性。合成语音应该以一种能够重新产生自然重读和感情的方式传递信息，最好可以体现出较强的韵律感，合成具有独特特征风格的语音，如感情色彩较重的小说朗读风格、评书风格，及不同表现的幽默风格等非正式的合成语音风格，从而增加合成语音的多样性，满足人们的不同需求。目前，合成不同风格的语音主要做法是基于规则的方法对合成语音进行调整，比如将合成后的语音数据的基频调整为80到150之间。这种方法不能考虑到每种风格语音的细节，从而使特定风格在合成语音上不能很好的体现，造成调整后的语音自然度较低，进而降低了用户体验。
技术实现思路
本专利技术提供一种，以解决现有技术中基于规则的方法调整后的语音自然度较低的问题。为此，本专利技术提供如下技术方案：一种语音合成装置，包括：模型构建模块，用于预先根据收集的大量发音人语音数据构建语音合成模型；接收模块，用于接收用户的待合成文本；风格确定模块，用于确定合成语音风格；模型修正模块，用于根据合成语音风格对所述语音合成模型进行修正，以使修正后的语音合成模型适应所述合成语音风格；合成模块，用于利用所述修正后的语音合成模型对所述待合成文本进行语音合成，得到合成语音数据。优选地，所述风格确定模块包括以下任意一种或多种子模块：第一确定子模块，用于向用户提供可选的合成语音风格类型或风格语音数据，根 ...

【技术保护点】
一种语音合成装置，其特征在于，包括：模型构建模块，用于预先根据收集的大量发音人语音数据构建语音合成模型；接收模块，用于接收用户的待合成文本；风格确定模块，用于确定合成语音风格；模型修正模块，用于根据合成语音风格对所述语音合成模型进行修正，以使修正后的语音合成模型适应所述合成语音风格；合成模块，用于利用所述修正后的语音合成模型对所述待合成文本进行语音合成，得到合成语音数据。

【技术特征摘要】

【专利技术属性】
技术研发人员：孙见青，王影，江源，胡国平，胡郁，刘庆峰，
申请(专利权)人：科大讯飞股份有限公司，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人