一种快速合成TTS语音的方法及装置制造方法及图纸

技术编号：20548100 阅读：58 留言：0更新日期：2019-03-09 20:42

本发明专利技术公开一种快速合成TTS语音的方法，包括如下步骤：获取应答文本信息；根据应答文本信息确定融合策略；根据确定的融合策略生成TTS语音。本发明专利技术还公开了一种快速合成TTS语音的装置。根据本发明专利技术公开的方法和装置可以实现减少智能语音设备与用户的语音交互时间，从而提高语音交互的功能，并且在设备配置较低的硬件条件下，也可以提供给客户完美的语音交互体验。

全部详细技术资料下载

【技术实现步骤摘要】
一种快速合成TTS语音的方法及装置
本专利技术涉及语音交互
，特别是一种快速合成TTS语音的方法及装置。
技术介绍
随着语音交互技术的不断发展，语音交互的应用越来越多，现有技术中语音交互技术的实现原理如下：用户说话发出语音指令，设备识别语音指令，对该语音指令进行语义理解，根据语义输出需要应答该条语音指令的文字信息，将文字信息转换为TTS语音播放出来，从而实现智能语音设备与用户间的语音交互，这样可以达到所问即可答，即实现人机流畅沟通。但在这种语音交互场景中，TTS合成速度是影响用户体验重要的一步。特别是在现有技术中，可搭载语音技术的硬件配置参差不齐，这就导致需要语音交互功能能够适配各种高配置或低配置的机型，对于低配置的机型，在语音交互过程中往往会导致TTS合成的速度较慢，影响用户的语音交互体验。
技术实现思路
为了解决上述问题，专利技术人构思从TTS合成过程出发，通过融合策略来进行TTS合成处理，以提高语音的响应速度。根据本专利技术的第一个方面，提供了一种快速合成TTS语音的方法，包括如下步骤：获取应答文本信息；根据应答文本信息确定融合策略；根据确定的融合策略生成TTS语音。根据本专利技术的第二个方面，提供了一种快速合成TTS语音的装置，包括：应答信息获取模块，用于获取应答文本信息；策略确定模块，用于根据应答文本信息确定融合策略；语音输出模块，用于根据确定的融合策略生成TTS语音。根据本专利技术的第三个方面，提供了一种电子设备，其包括：至少一个处理器，以及与至少一个处理器通信连接的存储器，其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器...

【技术保护点】
1.快速合成TTS语音的方法，其特征在于，包括如下步骤：获取应答文本信息；根据应答文本信息确定融合策略；根据确定的融合策略生成TTS语音。

【技术特征摘要】
1.快速合成TTS语音的方法，其特征在于，包括如下步骤：获取应答文本信息；根据应答文本信息确定融合策略；根据确定的融合策略生成TTS语音。2.根据权利要求1所述的方法，其特征在于，其中，所述融合策略包括高频策略、本地合成策略和云端合成策略，所述方法还包括配置高频语音库，所述高频语音库包括语料和对应的语音；所述根据应答文本信息确定融合策略包括将应答文本信息与语料进行匹配，在匹配成功时将融合策略确定为高频策略；当匹配失败时，获取网络状态进行判断，根据网络状态将融合策略确定为本地合成策略或云端合成策略。3.根据权利要求2所述的方法，其中，当融合策略确定为高频策略时，根据确定的融合策略生成TTS语音包括获取与当前应答文本信息匹配的语料对应的语音，将获取的对应的语音作为TTS语音输出；当融合策略确定为本地合成策略时，根据确定的融合策略生成TTS语音包括通过本地合成引擎将应答文本信息合成为TTS语音；当融合策略确定为云端合成策略时，根据确定的融合策略生成TTS语音包括将应答文本信息输出至云端合成引擎，并获取云端合成引擎返回的语音信息；对返回的语音信息进行解码，生成TTS语音。4.根据权利要求2或3所述的方法，其特征在于，在根据本地合成策略或云端合成策略生成TTS语音后，还包括判断当前生成的TTS语音是否为高频语音，当确定为高频语音时，将当前TTS语音及其对应的应答文本信息存储至所述高频语音库。5.快速合成TTS语音的装置，其特征在于，包括：应答信息获取模块，用于获取应答文本信息；策略确定模块，用于根据...

【专利技术属性】
技术研发人员：林婷，郭志煌，
申请(专利权)人：苏州思必驰信息科技有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人