一种文本转换为语音的方法、装置、存储介质和设备制造方法及图纸

技术编号:29493869 阅读:57 留言:0更新日期:2021-07-30 19:06
本发明专利技术公开一种文本转换为语音的方法,包括:对文本进行情感特征识别,得到所述文本中每个词的多级情感特征向量;对所述文本进行内容特征识别,得到所述文本中每个词的多级内容特征向量;所述文本为第一文本或第二文本,所述第二文本为对所述第一文本进行口语化转换得到的;根据每个词的多级情感特征向量和多级内容特征向量对每个词进行转换得到对应的语音。

【技术实现步骤摘要】
一种文本转换为语音的方法、装置、存储介质和设备
本专利技术涉及语音处理技术,尤其涉及一种文本转换为语音的方法、装置、存储介质和设备。
技术介绍
目前,将文本转换为语音时,只是基于文本内容进行简单的语音合成,生成的语音音调生硬、语句不连贯、没有感情、不自然,给用户带来的视听体验不好,在将短文、小说等转换为有声资源时,此种不好视听体验将会更加的明显。而如何基于AI技术将文本转换为媲美真人声音的语音是一个亟待解决的问题。
技术实现思路
本公开提供一种文本转换为语音的方法、装置、存储介质和设备,以至少解决现有技术中存在的以上技术问题。本公开第一方面提供一种文本转换为语音的方法,包括:对文本进行情感特征识别,得到所述文本中每个词的多级情感特征向量;对所述文本进行内容特征识别,得到所述文本中每个词的多级内容特征向量;所述文本为第一文本或第二文本,所述第二文本为对所述第一文本进行口语化转换得到的;根据每个词的多级情感特征向量和多级内容特征向量对每个词进行转换得到对应的语音。其中,所述对第一文本进行口语化转换,包括:利用口语化识别模型对所述第一文本中的每个句子进行识别,得到每个句子对应的口语化转换概率;使用口语化转换模型,对所述第一文本中口语化转换概率满足阈值的句子一一进行转换,得到所述第二文本。其中,所述使用口语化转换模型,对所述第一文本中口语化转换概率满足阈值的句子一一进行转换,包括:利用用户的类型对应的口语化转换模型,对所述句子一一进行转换。其中,该方法还包括:获取用户语音;提取用户语音的梅尔频率倒谱系数MFCC特征和身份特征向量i-vector;基于所述MFCC特征和所述i-vector,利用语音识别模型对用户语音进行识别,确定用户的类型。其中,所述每个词的多级情感特征向量包括:词的情感特征向量、词所属句子的情感特征向量、词所属段落的情感特征向量;所述对于所述文本进行情感特征识别,得到所述文本中每个词的多级情感特征向量,包括:根据词的词向量、词在所属句子的位置向量以及词所属句子在段落中的位置向量,使用词级别的情感识别模型对词进行识别,得到词的情感特征向量;根据句子中包含的每个词的情感特征向量,使用句子级别的情感识别模型对句子进行识别,得到词所属句子的情感特征向量;根据段落中包含的每个句子的情感特征向量,使用段落级别的情感识别模型对段落进行识别,得到词所属段落的情感特征向量。其中,所述每个词的多级内容特征向量包括:词的内容特征向量、词所属句子的内容特征向量、词所属段落的内容特征向量;对所述文本进行内容特征识别,得到所述文本中每个词的多级内容特征向量,包括:根据词的词向量、词在所属句子的位置向量以及词所属句子在段落中的位置向量,使用词级别的内容识别模型对词进行识别,得到词的内容特征向量;根据句子中包含的每个词的内容特征向量,使用句子级别的内容识别模型对句子进行识别,得到词所属句子的内容特征向量;根据段落中包含的每个句子的内容特征向量,使用段落级别的内容识别模型对段落进行识别,得到词所属段落的内容特征向量。其中,所述根据每个词的多级情感特征向量和多级内容特征向量对每个词进行转换得到语音,包括:根据词的情感特征向量、词所属句子的情感特征向量、词所属段落的情感特征向量、词的内容特征向量、词所属句子的内容特征向量和词所属段落的内容特征向量,使用语音转换模型对词进行转换得到词对应的语音。本公开另一方面提供一种文本转换为语音的装置,包括:情感识别模块,用于对文本进行情感特征识别,得到所述文本中每个词的多级情感特征向量;内容识别模块,用于对所述文本进行内容特征识别,得到所述文本中每个词的多级内容特征向量;所述文本为第一文本或第二文本,所述第二文本为对所述第一文本进行口语化转换得到的;语音合成模块,用于根据每个词的多级情感特征向量和多级内容特征向量对每个词进行转换得到对应的语音。本专利技术再一方面提供一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行所述的文本转换为语音的方法。本专利技术还一方面提供一种设备,包括:处理器、用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现所述的文本转换为语音的方法。在本专利技术中,分别对文本进行情感特征和内容特征的识别,基于识别得到的多级情感特征向量和多级内容特征向量进行转换得到的语音更加接近人声,同时,对文本进行口语化转换,基于较口语化的第二文本进行转换得到的语音更加接近于人声,提高了文本转换为人声的真实度。附图说明图1示出了一实施例所示的文本转换为语音的方法流程图;图2示出了一实施例所示的口语化转换流程示意图;图3示出了一实施例所示的情感特征识别的过程示意图;图4示出了一实施例所示的内容特征识别的过程示意图;图5示出了一实施例所示的文本转换为语音的装置结构示意图。具体实施方式为使本专利技术的目的、特征、优点能够更加的明显和易懂,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而非全部实施例。基于本专利技术中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。为了提高文本转为人声的真实度,本公开示例提供了一种文本转换为语音的方法,如图1所示,该方法包括:步骤101,对文本进行情感特征识别,得到所述文本中每个词的多级情感特征向量。步骤102,对所述文本进行内容特征识别,得到所述文本中每个词的多级内容特征向量。步骤103,根据每个词的多级情感特征向量和多级内容特征向量对每个词进行转换得到对应的语音。在该示例中,分别对文本进行情感特征和内容特征的识别,基于识别得到的多级情感特征向量和多级内容特征向量进行转换得到的语音更加接近人声。步骤101和步骤102中的文本可为第一文本或第二文本,第二文本为对第一文本进行口语化转换得到的,即第一文本的内容较书面化,第二文本的内容较口语化。基于较口语化的第二文本进行转换得到的语音更加接近于人声。需要指出的是,步骤101的情感特征识别和步骤102的内容特征需基于同一份文本,即同时基于第一文本进行,或者同时基于第二文本进行。若基于第二文本进行语音的转换,那么需先获取第一文本,然后,对第一文本进行口语化转换得到第二文本,如图2所示为本公开一示例提供的口语化转换过程,包括:步骤201,利用口语化识别模型对所述第一文本中的每个句子进行识别,得到每个句子对应的口语化转换概率。首先,可先进行口语化识别模型的训练,训练数据由书面化文本和口语化文本组成,文本以句子为单位,书面化文本中每个句子本文档来自技高网...

【技术保护点】
1.一种文本转换为语音的方法,包括:/n对文本进行情感特征识别,得到所述文本中每个词的多级情感特征向量;/n对所述文本进行内容特征识别,得到所述文本中每个词的多级内容特征向量;/n所述文本为第一文本或第二文本,所述第二文本为对所述第一文本进行口语化转换得到的;/n根据每个词的多级情感特征向量和多级内容特征向量对每个词进行转换得到对应的语音。/n

【技术特征摘要】
1.一种文本转换为语音的方法,包括:
对文本进行情感特征识别,得到所述文本中每个词的多级情感特征向量;
对所述文本进行内容特征识别,得到所述文本中每个词的多级内容特征向量;
所述文本为第一文本或第二文本,所述第二文本为对所述第一文本进行口语化转换得到的;
根据每个词的多级情感特征向量和多级内容特征向量对每个词进行转换得到对应的语音。


2.根据权利要求1所述的方法,所述对第一文本进行口语化转换,包括:
利用口语化识别模型对所述第一文本中的每个句子进行识别,得到每个句子对应的口语化转换概率;
使用口语化转换模型,对所述第一文本中口语化转换概率满足阈值的句子一一进行转换,得到所述第二文本。


3.根据权利要求2所述的方法,所述使用口语化转换模型,对所述第一文本中口语化转换概率满足阈值的句子一一进行转换,包括:
利用用户的类型对应的口语化转换模型,对所述句子一一进行转换。


4.根据权利要求3所述的方法,该方法还包括:
获取用户语音;
提取用户语音的梅尔频率倒谱系数MFCC特征和身份特征向量i-vector;
基于所述MFCC特征和所述i-vector,利用语音识别模型对用户语音进行识别,确定用户的类型。


5.根据权利要求1所述的方法,所述每个词的多级情感特征向量包括:词的情感特征向量、词所属句子的情感特征向量、词所属段落的情感特征向量;
所述对于所述文本进行情感特征识别,得到所述文本中每个词的多级情感特征向量,包括:
根据词的词向量、词在所属句子的位置向量以及词所属句子在段落中的位置向量,使用词级别的情感识别模型对词进行识别,得到词的情感特征向量;
根据句子中包含的每个词的情感特征向量,使用句子级别的情感识别模型对句子进行识别,得到词所属句子的情感特征向量;
根据段落中包含的每个句子的情感特征向量,使用段落级别的情感识别模型对段落进行识别,得到词所属段落的情感特征向量。

【专利技术属性】
技术研发人员:刘俊帅赵泽清李飞
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1