当前位置: 首页 > 专利查询>韩松专利>正文

混合型语音合成系统技术方案

技术编号：3793409 阅读：185 留言：0更新日期：2012-04-11 18:40

针对现有计算机语音合成系统，计算机发音语音不连续，输出的语音不流畅、不自然的问题，本发明专利技术提出一种混合型语音合成系统，包括语音库、语音合成引擎，所述语音库为混合型语音库，包括综合录入的真人发音和计算机处理的非真人发音，其语音库中词语与句子为真人发音，单个字词为非真人发音。语音合成引擎通过对文本中字、词、句的判断，检索调用语音库中已经录制好的真人发音和计算机处理的非真人发音，与传统的文字到语音的自动合成技术对比，本发明专利技术合成语音质量高，语音连续，输出的语音流畅、自然，特别适合无线平台的语音合成，如智能手机，手持电子设备平台，导航系统，以及公共场合的广播系统等。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种语音合成系统，尤其是一种混合型语音合成系统。
技术介绍
语音合成是计算机
中的一个分支，主要功能是把一个给定的输入文本，通过计算机程序，自动转化为语音数据，随后可由输出设备如扬声器或耳机等输出。不同的自然语音的语音合成方法一般各不相同。混合型语音合成系统是语音合成系统的一类，它包括一个合成引擎和一个预先录入的语音数据库，合成引擎通过计算机软件查找语音数据库中匹配的读音把文本转化为语音。但是，通过这种系统计算机所发出的语音不连续，输出的语音不流畅、不自然。
技术实现思路
为解决上述技术问题，本专利技术提出一种混合型语音合成系统，包括语音库、语音合成引擎，所述语音库为混合型语音库，包括综合录入的真人发音和计算机处理的非真人发音，其语音库中词语与句子为真人发音，单个字词为非真人发音。所述混合型语音库制作过程包括以下步骤A.对语音数据进行统计，分析单个字、词或句子可能出现的所有发音，这一步骤必须具备完备性，即所收集和统计的数据必须覆盖一种自然语言的全部；B.对字、词、句子的可能发音进行录音，根据适用的目标应用程序的要求，进行有损或无损压缩，编译成二进制文件，另外创建索引信息，应用计算机程序根据一个字、词或句子查找到语音的二进制文件；C.搜集语言的材料库，分析字词句发音的例外情况，对于例外情况，建立规则集，所述规则集对于给定的字词以及所处的上下文信息，准确地给出最佳的发音；D.把语音库，规则集压缩创建索引，生成混合型语音库。所述语音合成引擎核心功能是把输入的文本转换为语音，转换过程包括以下步骤A.对输入的自然语音文本进...

【技术保护点】
一种混合型语音合成系统，包括语音库、语音合成引擎，其特征在于：所述语音库为混合型语音库，包括综合录入的真人发音和计算机处理的非真人发音，其语音库中词语与句子为真人发音，单个字词为非真人发音。

【技术特征摘要】

【专利技术属性】
技术研发人员：韩松，
申请(专利权)人：韩松，
类型：发明
国别省市：32[中国|江苏]

全部详细技术资料下载我是这个专利的主人