一种哼唱合成方法和系统技术方案

技术编号：4043228 阅读：259 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供了一种哼唱合成方法和系统，其中的方法具体包括：接收用户输入的文本；进行文本分析，获得与所述文本对应的音节序列，以及，该音节序列中每个音节的音节名称；针对所述音节序列中每个音节，根据其音节名称及上下文环境，结合统计参数模型，规划得到相应的时长参数、基频参数和谱参数；依据用户选择的歌曲模板和所述音节序列的音节个数，对所述规划得到的时长参数、基频参数进行调整，其中，所述歌曲模板中存储有音节的时长参数和基频参数；依据调整后的时长参数，对相应音节的谱参数进行插值调整；根据所述音节序列中每个音节的时长参数、基频参数和谱参数，利用合成器得到语音数据。本发明专利技术能够输出带有歌曲节奏和旋律的语音数据。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音合成
，特别是涉及一种哼唱合成方法和系统。
技术介绍
语音合成技术，又称文语转换(TTS，Text to Speech)技术，其能将任意文字信息转化为标准流畅的语音朗读出来。目前的语音合成方法是预先录制一个语音库，然后在该语音库基础上完成一个语音合成系统。此方法合成声音的语调节奏取决于语音库，即合成出的声音像是录音人在说话。而在一些娱乐应用中，用户希望可以调节合成语音的语调节奏，比如，将短信以歌曲的语调“唱”出来。总之，需要本领域技术人员迫切解决的一个技术问题就是如何能够合成具有歌曲语调节奏的语音。
技术实现思路
本专利技术所要解决的技术问题是提供一种哼唱合成方法和系统，用于输出带有歌曲节奏和旋律的语音数据。为了解决上述问题，本专利技术公开了一种哼唱合成方法，包括接收用户输入的文本；进行文本分析，获得与所述文本对应的音节序列，以及，该音节序列中每个音节的音节名称；针对所述音节序列中每个音节，根据其音节名称及上下文环境，结合统计参数模型，规划得到相应的时长参数、基频参数和谱参数；依据用户选择的歌曲模板和所述音节序列的音节个数，对所述规划得到的时长参数、基频参数进行调整，其中，所述歌曲模板中存储有音节的时长参数和基频参数；依据调整后的时长参数，对相应音节的谱参数进行插值调整；根据所述音节序列中每个音节的时长参数、基频参数和谱参数，利用合成器得到与所述音节序列对应的语音数据。优选的，所述对时长参数、基频参数进行调整的步骤，包括获取所述音节序列的音节个数；从所述歌曲模板中提取与所述音节个数相应的时长参数和基频参数，并覆盖...

【技术保护点】
一种哼唱合成方法，其特征在于，包括：接收用户输入的文本；进行文本分析，获得与所述文本对应的音节序列，以及，该音节序列中每个音节的音节名称；针对所述音节序列中每个音节，根据其音节名称及上下文环境，结合统计参数模型，规划得到相应的时长参数、基频参数和谱参数；依据用户选择的歌曲模板和所述音节序列的音节个数，对所述规划得到的时长参数、基频参数进行调整，其中，所述歌曲模板中存储有音节的时长参数和基频参数；依据调整后的时长参数，对相应音节的谱参数进行插值调整；根据所述音节序列中每个音节的时长参数、基频参数和谱参数，利用合成器得到与所述音节序列对应的语音数据。

【技术特征摘要】

【专利技术属性】
技术研发人员：李健，张连毅，武卫东，
申请(专利权)人：北京捷通华声语音技术有限公司，
类型：发明
国别省市：11

全部详细技术资料下载我是这个专利的主人