一种语音合成方法、语音合成装置及智能设备制造方法及图纸

技术编号:27747158 阅读:13 留言:0更新日期:2021-03-19 13:42
本申请公开了一种语音合成方法、装置、智能设备及计算机可读存储介质。其中,该方法包括:基于预设的分词算法对输入文本进行分词处理,获得中文词语列表及英文单词列表;确定中文词语列表中的每个中文词语所分别对应的拼音;基于预设的单词前缀词典查找英文单词列表中的每个英文单词所分别对应的音素;若存在目标英文单词,则将目标英文单词输入至字素到音素模型,得到字素到音素模型输出的目标英文单词所对应的音素;根据各个中文词语的拼音及各个英文单词的音素,进行输入文本的语音合成。通过本申请方案,可提升智能设备在面对中英文混合文本时的语音合成效果。

【技术实现步骤摘要】
一种语音合成方法、语音合成装置及智能设备
本申请属于人工智能
,尤其涉及一种语音合成方法、语音合成装置及智能设备。
技术介绍
在进行语音合成时,智能设备搭载的语音合成系统会先对所要进行语音合成的文本进行分析,其分析的目的是使计算机能从这些文本中认识文字,进而知道要发什么音及怎么发音,并将发音的方式告诉智能设备;除此之外,语音合成系统还会让智能设备知道文本中哪些是词,哪些是短语或句子,使得智能设备可获知在发音时应该进行怎样的停顿,以获得更流畅的语音表达。然而,当前的语音合成系统仅能基于单一语种的文本进行语音合成,在基于中英文混合文本的语音合成方面表现较差。
技术实现思路
本申请提供了一种语音合成方法、语音合成装置、智能设备及计算机可读存储介质,可提升智能设备在面对中英文混合文本时的语音合成效果。第一方面,本申请提供了一种语音合成方法,包括:基于预设的分词算法,对输入文本进行分词处理,获得中文词语列表及英文单词列表,其中,上述中文词语列表包括组成上述输入文本的各个中文词语,上述英文单词列表包括组成上述输入文本的各个英文单词;确定上述中文词语列表中的每个中文词语所分别对应的拼音;基于预设的单词前缀词典查找上述英文单词列表中的每个英文单词所分别对应的音素,其中,上述单词前缀词典配置有至少一个英文单词及对应的音素;若存在目标英文单词,则将上述目标英文单词输入至字素到音素模型,得到上述字素到音素模型输出的上述目标英文单词所对应的音素;根据上述中文词语列表中的每个中文词语所分别对应的拼音,以及上述英文单词列表中的每个英文单词所分别对应的音素,进行上述输入文本的语音合成。第二方面,本申请提供了一种语音合成装置,包括:文本分词单元,用于基于预设的分词算法,对输入文本进行分词处理,获得中文词语列表及英文单词列表,其中,上述中文词语列表包括组成上述输入文本的各个中文词语,上述英文单词列表包括组成上述输入文本的各个英文单词;拼音确定单元,用于确定上述中文词语列表中的每个中文词语所分别对应的拼音;第一音素确定单元,用于基于预设的单词前缀词典查找上述英文单词列表中的每个英文单词所分别对应的音素,其中,上述单词前缀词典配置有至少一个英文单词及对应的音素;第二音素确定单元,用于若存在目标英文单词,则将上述目标英文单词输入至字素到音素模型,得到上述字素到音素模型输出的上述目标英文单词所对应的音素;语音合成单元,用于根据上述中文词语列表中的每个中文词语所分别对应的拼音,以及上述英文单词列表中的每个英文单词所分别对应的音素,进行上述输入文本的语音合成。第三方面,本申请提供了一种智能设备,上述智能设备包括存储器、处理器以及存储在上述存储器中并可在上述处理器上运行的计算机程序,上述处理器执行上述计算机程序时实现如上述第一方面的方法的步骤。第四方面,本申请提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现如上述第一方面的方法的步骤。第五方面,本申请提供了一种计算机程序产品,上述计算机程序产品包括计算机程序,上述计算机程序被一个或多个处理器执行时实现如上述第一方面的方法的步骤。本申请与现有技术相比存在的有益效果是:在面对中英文混合的输入文本时,先对输入文本进行分词,得到中文词语列表及英文单词列表,其中,上述中文词语列表包括组成上述输入文本的各个中文词语,上述英文单词列表包括组成上述输入文本的各个英文单词,然后对中文词语列表及英文单词列表分开进行处理,具体为:对于中文词语列表来说,直接确定其中每个中文词语所分别对应的拼音;对于英文单词列表来说,可通过单词前缀词典查找每个英文单词所分别对应的音素,还可将目标英文单词输入至字素到音素模型,得到该字素到音素模型输出的该目标英文单词所对应的音素,最后可根据输入文本中各个中文词语的拼音及各个英文单词的音素,进行语音合成。由上述过程可知,本方案针对输入文本中的属于英文的词及属于中文的词分开进行处理;并且,本方案还通过字素到音素模型来进一步保障英文单词的语音合成,可大大提升智能设备在面对中英文混合文本时的语音合成效果。可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的语音合成方法的实现流程示意图;图2是本申请实施例提供的语音合成方法中,有向无环图的示例图;图3是本申请实施例提供的语音合成装置的结构框图;图4是本申请实施例提供的智能设备的结构示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。为了说明本申请所提出的技术方案,下面通过具体实施例来进行说明。下面对本申请实施例提供的一种语音合成方法进行描述。请参阅图1,该语音合成方法包括:步骤101,基于预设的分词算法,对输入文本进行分词处理,获得中文词语列表及英文单词列表。在本申请实施例中,在输入文本中存在英文及中文的场景下,可对输入文本进行分词处理,得到中文词语列表及英文单词列表,其中,中文词语列表包括组成输入文本的各个中文词语,英文单词列表包括组成输入文本的各个英文单词。也即,对于中英文混合文本来说,会以词语来作为划分中文文本的最小单元,以单词来作为划分英文文本的最小单元。具体地,可通过jieba分词来对存在英文及中文的输入文本进行分词,其工作原理简述如下:jieba分词可先对中英文混合的输入文本进行初步分析,将该输入文本中的各个英文单词分割出来,以完成对英文的分词;然后,对剔除了英文单词的输入文本切分,也即基于标点符号将语句从输入文本中剥离出来,组成各个语句所对应的语句数组;接着,再以语句为单位进行进一步处理,也即对各个语句数组进行进一步处理。具体地,针对每个语句数组,其进一步处理的过程包括:基于该语句数组构造有向无环图,然后进行最大概率路径计算,并基于该最大概率路径所对应的切分方式获得该语句数组所对应的切分结果;最终,可得到组成各个语句的若干个中文词语,以完成对中文的分词。举例来说,输入文本为“编程的第一课是学习helloworld”;jieba分词在处理该输入文本时,首先分割出该输入文本的英文单词,也即“hello”及“world”;然后,由于该输入文本仅包含一句话,因而不需要进行语句切分,该剔除了英文单词的内本文档来自技高网...

【技术保护点】
1.一种语音合成方法,其特征在于,包括:/n基于预设的分词算法,对输入文本进行分词处理,获得中文词语列表及英文单词列表,其中,所述中文词语列表包括组成所述输入文本的各个中文词语,所述英文单词列表包括组成所述输入文本的各个英文单词;/n确定所述中文词语列表中的每个中文词语所分别对应的拼音;/n基于预设的单词前缀词典查找所述英文单词列表中的每个英文单词所分别对应的音素,其中,所述单词前缀词典配置有至少一个英文单词及对应的音素;/n若存在目标英文单词,则将所述目标英文单词输入至字素到音素模型,得到所述字素到音素模型输出的所述目标英文单词所对应的音素;/n根据所述中文词语列表中的每个中文词语所分别对应的拼音,以及所述英文单词列表中的每个英文单词所分别对应的音素,进行所述输入文本的语音合成。/n

【技术特征摘要】
1.一种语音合成方法,其特征在于,包括:
基于预设的分词算法,对输入文本进行分词处理,获得中文词语列表及英文单词列表,其中,所述中文词语列表包括组成所述输入文本的各个中文词语,所述英文单词列表包括组成所述输入文本的各个英文单词;
确定所述中文词语列表中的每个中文词语所分别对应的拼音;
基于预设的单词前缀词典查找所述英文单词列表中的每个英文单词所分别对应的音素,其中,所述单词前缀词典配置有至少一个英文单词及对应的音素;
若存在目标英文单词,则将所述目标英文单词输入至字素到音素模型,得到所述字素到音素模型输出的所述目标英文单词所对应的音素;
根据所述中文词语列表中的每个中文词语所分别对应的拼音,以及所述英文单词列表中的每个英文单词所分别对应的音素,进行所述输入文本的语音合成。


2.如权利要求1所述的语音合成方法,其特征在于,在所述根据所述中文词语列表中的每个中文词语所分别对应的拼音,以及所述英文单词列表中的每个英文单词所分别对应的音素,进行所述输入文本的语音合成之后,所述语音合成方法还包括:
若接收到用户基于所述目标英文单词所输入的用户语音,则将所述用户语音转换为音素;
将所述目标英文单词所对应的音素更新为所述用户语音转换所得的音素。


3.如权利要求2所述的语音合成方法,其特征在于,在所述将所述目标英文单词所对应的音素更新为所述用户语音转换所得的音素之后,所述语音合成方法还包括:
将所述目标英文单词以及更新后的所述目标英文单词所对应的音素添加到所述单词前缀词典中,以实现所述单词前缀词典的更新。


4.如权利要求1所述的语音合成方法,其特征在于,在所述基于预设的分词算法,对输入文本进行分词处理,获得中文词语列表及英文单词列表之后,所述语音合成方法还包括:
基于所述输入文本对所述中文词语列表中的每个中文词语进行词性标注,获得每个中文词语的词性;
相应地,所述确定所述中文词语列表中的每个中文词语所分别对应的拼音,包括:
基于所述中文词语列表中的每个中文词语的词性,确定每个中文词语所分别对应的拼音。


5.如权利要求1所述的语音合成方法,其特征在于,在所述基于预设的分词算法,对输入文本进行分词处理,获得中文词语列表及英文单词列表之前,所述语音合成方法还包括:
检测所述输入文本是否同时存在中文及英文;
若所述输入文本同时存在中文及英文,则加载所述单词前缀词典及所述字...

【专利技术属性】
技术研发人员:钱程浩
申请(专利权)人:深圳市优必选科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1