一种可交互中文文本语音合成系统及方法技术方案

技术编号：14117253 阅读：135 留言：0更新日期：2016-12-08 00:21

本发明专利技术特别涉及一种可交互中文文本语音合成系统及方法。该可交互中文文本语音合成系统，包括文本输入模块，规则输入模块，中文朗读模块和退出系统模块，所述中文朗读模块包括发音子模块，调节语速子模块，暂停子模块和停止子模块。该可交互中文文本语音合成系统及方法，为语音合成系统预留接口，用户能够自主设定规则，按照用户的偏好进行朗读，同时系统不断的修正原始语音合成规则，完善系统自身，能够避免原始语音规则设计的缺陷，实现文本内容的在语气的转折和单词的连接上的自然和表现问句和祈使句的升降调，保证语音合成后的自然和流畅。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及智能语音合成
，特别涉及一种可交互中文文本语音合成系统及方法。
技术介绍
一个成功的语音合成系统包括文本分析、合成语音以及韵律控制模块，最终输出音质清晰、自然流畅的语音。现有的中文文本语音合成系统有很多，通过直接调用TTS（text to speech）合成语音，或者丰富语音库数据，改进语音引擎算法来提高合成语音的流畅度和朗读韵律。这类语音合成系统能够对文本中普通的单字和词组正确识别，但是，对于多音字以及一些特殊的文字组合，这个语音合成系统不能进行准确的识别，造成断句错误，韵律不和谐，导致听众对文本语义的误解，以及听力上的不适。通常在设计中文文本语音合成系统时，最基本的设计方案是将输入的文字拆解成单字或者常用的词组，在语音库中查找相对应的语音，并合成输出。这种方案实现简单，缺点也显而易见，就是读音过于机械，不带任何语调的起伏，听觉体验过差。或者使用TTS(Text-To-Speech)文字朗读引擎，它是基于COM/DCOM技术的一种将文本内容转化为语音的工具。这种技术是建立在阅读规则上的语音合成，因此在语气的转折和单词的连接上比较自然，问句和祈使句的升降调也能够表现出来。此外，它还可以由使用者自己设定男女发音、调节音量和朗读速度。但是由于中文中有很多的多音字，而多音字的使用场景和词组（如人名、地名等）并不能完全固定，在根据规则进行朗读时就会造成读音错误的问题，比如，人名“任我行（xing）”，TTS引擎并不能正确识别，只能随机选择一个读音，如hang，实际上是错误的。针对电子设备中的中文文本语音合成系统中多音字读音不准、不能根据用户需...
一种可交互中文文本语音合成系统及方法

【技术保护点】
一种可交互中文文本语音合成系统，其特征在于：包括文本输入模块，规则输入模块，中文朗读模块和退出系统模块，所述中文朗读模块包括发音子模块，调节语速子模块，暂停子模块和停止子模块；通过所述文本输入模块输入待朗读的文字，通过所述规则输入模块输入用户设定的朗读规则，通过所述中文朗读模块对输入的待朗读文字进行朗读，停止朗读和暂停朗读操作，并可通过调节语速子模块对语速进行适当调整。

【技术特征摘要】
1.一种可交互中文文本语音合成系统，其特征在于：包括文本输入模块，规则输入模块，中文朗读模块和退出系统模块，所述中文朗读模块包括发音子模块，调节语速子模块，暂停子模块和停止子模块；通过所述文本输入模块输入待朗读的文字，通过所述规则输入模块输入用户设定的朗读规则，通过所述中文朗读模块对输入的待朗读文字进行朗读，停止朗读和暂停朗读操作，并可通过调节语速子模块对语速进行适当调整。2.根据权利要求1所述的可交互中文文本语音合成方法，其特征在于包括以下步骤：（1）由用户输入待朗读的文档和用户设定的规则和关键词，设定词组对应的拼音，同时在系统中生成文档和用户语音规则库；（2）在系统中调入汉语拼音库和...

【专利技术属性】
技术研发人员：李青，
申请(专利权)人：浪潮电子信息产业股份有限公司，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人