一种快速合成TTS语音的方法及装置制造方法及图纸

技术编号:20548100 阅读:55 留言:0更新日期:2019-03-09 20:42
本发明专利技术公开一种快速合成TTS语音的方法,包括如下步骤:获取应答文本信息;根据应答文本信息确定融合策略;根据确定的融合策略生成TTS语音。本发明专利技术还公开了一种快速合成TTS语音的装置。根据本发明专利技术公开的方法和装置可以实现减少智能语音设备与用户的语音交互时间,从而提高语音交互的功能,并且在设备配置较低的硬件条件下,也可以提供给客户完美的语音交互体验。

【技术实现步骤摘要】
一种快速合成TTS语音的方法及装置
本专利技术涉及语音交互
,特别是一种快速合成TTS语音的方法及装置。
技术介绍
随着语音交互技术的不断发展,语音交互的应用越来越多,现有技术中语音交互技术的实现原理如下:用户说话发出语音指令,设备识别语音指令,对该语音指令进行语义理解,根据语义输出需要应答该条语音指令的文字信息,将文字信息转换为TTS语音播放出来,从而实现智能语音设备与用户间的语音交互,这样可以达到所问即可答,即实现人机流畅沟通。但在这种语音交互场景中,TTS合成速度是影响用户体验重要的一步。特别是在现有技术中,可搭载语音技术的硬件配置参差不齐,这就导致需要语音交互功能能够适配各种高配置或低配置的机型,对于低配置的机型,在语音交互过程中往往会导致TTS合成的速度较慢,影响用户的语音交互体验。
技术实现思路
为了解决上述问题,专利技术人构思从TTS合成过程出发,通过融合策略来进行TTS合成处理,以提高语音的响应速度。根据本专利技术的第一个方面,提供了一种快速合成TTS语音的方法,包括如下步骤:获取应答文本信息;根据应答文本信息确定融合策略;根据确定的融合策略生成TTS语音。根据本专利技术的第二个方面,提供了一种快速合成TTS语音的装置,包括:应答信息获取模块,用于获取应答文本信息;策略确定模块,用于根据应答文本信息确定融合策略;语音输出模块,用于根据确定的融合策略生成TTS语音。根据本专利技术的第三个方面,提供了一种电子设备,其包括:至少一个处理器,以及与至少一个处理器通信连接的存储器,其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述方法的步骤。根据本专利技术的第四个方面,提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述方法的步骤。本专利技术提供的装置和方法通过融合策略来进行TTS合成处理,而融合策略是基于应答文本信息来确定的,因而能够基于应答信息进行灵活的语音合成处理,可以实现减少智能语音设备与用户的语音交互时间,从而提高语音交互的功能。并且,基于本专利技术提供的装置和方法,在设备配置较低的硬件条件下,也可以提供给客户完美的语音交互体验。附图说明图1为本专利技术一实施方式的快速合成TTS语音的方法流程图;图2为本专利技术一实施方式的快速合成TTS语音的装置原理框图;图3为本专利技术又一实施方式的快速合成TTS语音的装置原理框图;图4为本专利技术一实施方式的电子设备框图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。本专利技术可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、元件、数据结构等等。也可以在分布式计算环境中实践本专利技术,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。在本专利技术中,“模块”、“装置”、“系统”等指应用于计算机的相关实体,如硬件、硬件和软件的组合、软件或执行中的软件等。详细地说,例如,元件可以、但不限于是运行于处理器的过程、处理器、对象、可执行元件、执行线程、程序和/或计算机。还有,运行于服务器上的应用程序或脚本程序、服务器都可以是元件。一个或多个元件可在执行的过程和/或线程中,并且元件可以在一台计算机上本地化和/或分布在两台或多台计算机之间,并可以由各种计算机可读介质运行。元件还可以根据具有一个或多个数据包的信号,例如,来自一个与本地系统、分布式系统中另一元件交互的,和/或在因特网的网络通过信号与其它系统交互的数据的信号通过本地和/或远程过程来进行通信。最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”,不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。本专利技术实施例的快速合成TTS语音的方法可以应用于任何配置了语音功能的终端设备,例如,智能手机、平板电脑、智能家居等终端设备,本专利技术对此不作限制。从而能够使得用户在使用这些终端设备的过程中获得更及时准确的响应,提升用户体验。下面结合附图对本专利技术作进一步详细的说明。图1示意性地显示了根据本专利技术的一种实施方式的快速合成TTS语音的方法流程图。如图1所示,本实施例包括如下步骤:步骤S101:获取应答文本信息。应答文本信息为需要应答的文字信息,示例性地,可以是在语音识别过程中根据语义输出的应答文本内容。获取的方式可以根据其应用场景参照现有技术实现,例如当是在语音交互过程中时,可以根据语音识别结果从数据库中获取预先配置的应答文本信息,也可以是提供应答文本信息的调用接口,直接从调用接口接收输入进来的应答文本信息。步骤S102:根据应答文本信息确定融合策略,其中,融合策略包括高频策略、本地合成策略和云端合成策略。示例性地,首先配置高频语音库,高频语音库内包括有使用频率高的语料和其对应的语音,其中,进行高频语音库的配置时,可以根据经验来确定使用频率高的语料及其对应的语音,例如对于车载设备而言,听歌的语音指令比较常用,那么应答的语音“即将播放音乐”就可以设置成高频语音,配置在高频语音库中,语料配置为“即将播放音乐”,音频文件为对该语料的播放音频。在进行配置时,将语音存储为音频文件的形式,同时生成一个语料和音频文件名称或ID一一对应的映射列表。在获取到应答文本信息后,将应答文本信息与高频语音库的语料进行匹配,在匹配成功时,说明与之对应的音频内容已经在高频语音库中存储了,即确定该应答文本信息为高频使用的文本信息,则将融合策略确定为高频策略。当匹配失败时,说明当前应答文本信息尚未在高频语音库中存储,则获取网络状态进行判断,根据网络状态将融合策略确定为本地合成策略或云端合成策略。具体地,若网络状态为未连接,则将其确定为本地合成策略。若网络状态为已连接,则将其确定为云端合成策略。步骤S103:根据确定的融合策略生成TTS语音。根据步骤S102确定了融合策略后,将根据确定的融合策略生成其对应的TTS语音,从而达到快速响应的效果。具体地,可以实现为如下几种情况:第一种情况,当融合策略确定为高频策略时,根据确定的融合策略生成TTS语音实现为:通过查询高频语音库内存储的语料与其对应的语音,获取与当前应答文本信息匹配的语料对应的语音(通过获取匹配的语料对应的音频文件),直接将获取的对应的语音作为TTS语音输出(播放相应的音频文件),这样可以达到瞬时本文档来自技高网...

【技术保护点】
1.快速合成TTS语音的方法,其特征在于,包括如下步骤:获取应答文本信息;根据应答文本信息确定融合策略;根据确定的融合策略生成TTS语音。

【技术特征摘要】
1.快速合成TTS语音的方法,其特征在于,包括如下步骤:获取应答文本信息;根据应答文本信息确定融合策略;根据确定的融合策略生成TTS语音。2.根据权利要求1所述的方法,其特征在于,其中,所述融合策略包括高频策略、本地合成策略和云端合成策略,所述方法还包括配置高频语音库,所述高频语音库包括语料和对应的语音;所述根据应答文本信息确定融合策略包括将应答文本信息与语料进行匹配,在匹配成功时将融合策略确定为高频策略;当匹配失败时,获取网络状态进行判断,根据网络状态将融合策略确定为本地合成策略或云端合成策略。3.根据权利要求2所述的方法,其中,当融合策略确定为高频策略时,根据确定的融合策略生成TTS语音包括获取与当前应答文本信息匹配的语料对应的语音,将获取的对应的语音作为TTS语音输出;当融合策略确定为本地合成策略时,根据确定的融合策略生成TTS语音包括通过本地合成引擎将应答文本信息合成为TTS语音;当融合策略确定为云端合成策略时,根据确定的融合策略生成TTS语音包括将应答文本信息输出至云端合成引擎,并获取云端合成引擎返回的语音信息;对返回的语音信息进行解码,生成TTS语音。4.根据权利要求2或3所述的方法,其特征在于,在根据本地合成策略或云端合成策略生成TTS语音后,还包括判断当前生成的TTS语音是否为高频语音,当确定为高频语音时,将当前TTS语音及其对应的应答文本信息存储至所述高频语音库。5.快速合成TTS语音的装置,其特征在于,包括:应答信息获取模块,用于获取应答文本信息;策略确定模块,用于根据...

【专利技术属性】
技术研发人员:林婷郭志煌
申请(专利权)人:苏州思必驰信息科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1