文本处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:28872535 阅读:13 留言:0更新日期:2021-06-15 23:05
本发明专利技术公开了一种文本处理方法、装置、电子设备及存储介质,属于文本转语音技术领域。该方法包括:获取待处理文本,所述待处理文本包含有第一单位符号;确定所述第一单位符号的第一位置信息,所述第一位置信息用于指示所述第一单位符号在所述待处理文本中的位置;确定所述待处理文本中各个字符对应的编码,得到第一编码序列;基于所述第一编码序列、所述第一位置信息和预先训练的拼音预测模型,确定所述第一单位符号对应的拼音。这样,可以基于预先训练的拼音预测模型,直接得到待处理文本中第一单位符号的拼音,无需人为干涉,从而提高了获取第一单位符号拼音的效率,使得文本处理的效率也有所提升。

【技术实现步骤摘要】
文本处理方法、装置、电子设备及存储介质
本专利技术属于文本转语音
,具体涉及一种文本处理方法、装置、电子设备及存储介质。
技术介绍
在文本转语音(TextToSpeech,简称TTS)应用中,一般需要预先对输入TTS模型的文本做归一化表示,即将文本转化为对应的拼音表示。但针对包含有单位符号的文本,常常在不同语境下,单位符号所表示的含义不同,拼音也不尽相同。例如,文本“网速太慢了,只有20K”中的单位符号K的拼音为“kei”,而文本“实验温度200K时,呈现液态”中的单位符号K的拼音为“kai1erwen”等。因而,现有的文本处理方式,通常需要人为确定文本中单位符号对应的正确拼音,导致文本转化为拼音的效率低。
技术实现思路
本专利技术实施例的目的是提供一种文本处理方法、装置、电子设备及存储介质,能够解决现有的文本处理方式,需要人为确定文本中单位符号对应的正确拼音,导致文本转化为拼音的效率低的问题。为了解决上述技术问题,本专利技术是这样实现的:第一方面,本专利技术实施例提供了一种文本处理方法,所述方法包括:获取待处理文本,所述待处理文本包含有第一单位符号;确定所述第一单位符号的第一位置信息,所述第一位置信息用于指示所述第一单位符号在所述待处理文本中的位置;确定所述待处理文本中各个字符对应的编码,得到第一编码序列;基于所述第一编码序列、所述第一位置信息和预先训练的拼音预测模型,确定所述第一单位符号对应的拼音。第二方面,本专利技术实施例提供了一种文本处理装置,所述装置包括:第一获取模块,用于获取待处理文本,所述待处理文本包含有第一单位符号;第一确定模块,用于确定所述第一单位符号的第一位置信息,所述第一位置信息用于指示所述第一单位符号在所述待处理文本中的位置;第二确定模块,用于确定所述待处理文本中各个字符对应的编码,得到第一编码序列;第三确定模块,用于基于所述第一编码序列、所述第一位置信息和预先训练的拼音预测模型,确定所述第一单位符号对应的拼音。第三方面,本专利技术实施例提供了一种电子设备,所述电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。第四方面,本专利技术实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。在本专利技术实施例中,通过获取待处理文本,所述待处理文本包含有第一单位符号;确定所述第一单位符号的第一位置信息,所述第一位置信息用于指示所述第一单位符号在所述待处理文本中的位置;确定所述待处理文本中各个字符对应的编码,得到第一编码序列;基于所述第一编码序列、所述第一位置信息和预先训练的拼音预测模型,确定所述第一单位符号对应的拼音。这样,可以基于预先训练的拼音预测模型,直接得到待处理文本中第一单位符号的拼音,无需人为干涉,从而提高了获取第一单位符号拼音的效率,使得文本处理的效率也有所提升。附图说明图1是本专利技术实施例提供的文本处理方法的流程图;图2是本专利技术实施例提供的拼音预测模型的结构示意图;图3是本专利技术实施例提供的训练拼音预测模型的流程图;图4是本专利技术实施例提供的第一编码序列的转换示意图;图5是本专利技术实施例提供的使用拼音预测模型进行拼音预测的流程图;图6是本专利技术实施提供的文本处理装置的结构图之一;图7是本专利技术实施提供的文本处理装置的结构图之二。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。下面结合附图,通过具体的实施例及其应用场景对本专利技术实施例提供的文本处理方法进行详细地说明。本专利技术实施例提供一种文本处理方法。参见图1,图1是本专利技术实施例提供的文本处理方法的流程图,如图1所示,该文本处理方法包括以下步骤:步骤101、获取待处理文本,待处理文本包含有第一单位符号。在本实施例中,上述第一单位符号可以是当前国际单位制中的单位符号,如长度单位米(对应的单位符号为m)、质量单位千克(对应的单位符号为kg)、时间单位秒(对应的单位符号为s)、电流单位安培(对应的单位符号为A)和频率单位赫兹(对应的单位符号为Hz)等等,也可以是未来衍生出的新的单位符号,还可以是某些文本的简写或者口语表述,如千(对应的单位符号为k)、万(对应的单位符号为w)等,亦可以是标准单位符号的变型表述,如国际单位制中的质量单位千克kg对应的变型表述如KG、Kg、kG等,本专利技术不做具体限定。上述待处理文本可以是指需要输入至TTS模型进行文字转拼音的整个文本,也可以是指该整个文本中包含有第一单位符号的部分文本,如包含第一单位符号和第一单位符号的预设数量的上下文的部分文本。例如,假设输入至TTS模型的文本共有100个字符,可以将这100个字符作为待处理文本,也可以将这100个字符中包含有单位符号的10个字符作为待处理文本。需要说明的是,该待处理文本中包含有至少一个第一单位符号。例如,待处理文本可以为“这台机床加工速度达到25m/s,大大超出我们的预期”,其中,“m/s”为该待处理文本中的第一单位符号。步骤102、确定第一单位符号的第一位置信息,第一位置信息用于指示第一单位符号在待处理文本中的位置。该步骤中,可以根据第一单位符号在待处理文本中位置,确定第一位置信息。具体地,可以基于待处理文本,按照从前往后的顺序进行计数,确定第一单位符号对应第几个字符,从而确定出第一位置信息;也可以基于待处理文本,按照从后往前的顺序进行计数,确定第一单位符号对应第几个字符,从而确定出第一位置信息,当然,还可以从待处理文本的某一中间位置如第一单位符号对应位置,开始往前或者往后计数,从而确定出第一位置信息。例如,假设待处理文本为“他月入12k。”,则按照从前往后的顺序进行计算,第一单位符号“k”是对应该待处理文本的第5个字符,则可以得到第一位置信息p=4(从0开始计数)。步骤103、确定待处理文本中各个字符对应的编码,得到第一编码序列。在本实施例中,可以预先设置各个字符与编码的映射关系,通过该映射关系确定待处理文本中各个本文档来自技高网...

【技术保护点】
1.一种文本处理方法,其特征在于,所述方法包括:/n获取待处理文本,所述待处理文本包含有第一单位符号;/n确定所述第一单位符号的第一位置信息,所述第一位置信息用于指示所述第一单位符号在所述待处理文本中的位置;/n确定所述待处理文本中各个字符对应的编码,得到第一编码序列;/n基于所述第一编码序列、所述第一位置信息和预先训练的拼音预测模型,确定所述第一单位符号对应的拼音。/n

【技术特征摘要】
1.一种文本处理方法,其特征在于,所述方法包括:
获取待处理文本,所述待处理文本包含有第一单位符号;
确定所述第一单位符号的第一位置信息,所述第一位置信息用于指示所述第一单位符号在所述待处理文本中的位置;
确定所述待处理文本中各个字符对应的编码,得到第一编码序列;
基于所述第一编码序列、所述第一位置信息和预先训练的拼音预测模型,确定所述第一单位符号对应的拼音。


2.根据权利要求1所述的方法,其特征在于,所述基于所述第一编码序列、所述第一位置信息和预先训练的拼音预测模型,确定所述第一单位符号对应的拼音,包括:
将所述第一编码序列和所述第一位置信息输入至所述拼音预测模型,得到预测结果,其中,所述预测结果为概率序列,所述概率序列为概率值组成的序列,所述概率序列中的概率值的数量与预设拼音集合中的拼音的数量相同;所述概率序列中的概率值用于指示所述预设拼音集合中各拼音分别为所述第一单位符号的拼音的概率;
根据所述概率序列中的概率值,确定所述第一单位符号对应的拼音。


3.根据权利要求2所述的方法,其特征在于,所述根据所述概率序列中的概率值,确定所述第一单位符号对应的拼音,包括:
确定所述概率序列中最大概率值对应的目标编码;
根据所述预设拼音集合中各个拼音与编码之间的映射关系,确定所述目标编码对应的拼音;
将所述目标编码对应的拼音,确定为所述第一单位符号的拼音。


4.根据权利要求2所述的方法,其特征在于,所述拼音预测模型包括嵌入层、双向循环神经网络层、注意力层、全连接层和分类器层;
所述将所述第一编码序列和所述第一位置信息输入至所述拼音预测模型,得到预测结果,包括:
将所述第一编码序列输入至所述嵌入层,得到第一中间序列,并将所述第一位置信息输入至所述嵌入层,得到第一中间向量;
将所述第一中间序列输入至所述双向循环神经网络层,得到第二中间序列;
将所述第二中间序列和所述第一中间向量输入至所述注意力层,得到第二中间向量;
将所述第二中间向量输入至所述全连接层,得到第三中间向量;
将所述第三中间向量输入至所述分类器层,得到所述预测结果。


5.根据权利要求1至4中任一项所述的方法,其特征在于,所述确定所述待处理文本中各个字符对应的编码,得到第一编码序列,包括:
根据预设的字符和编码之间的映射关系,确定所述待处理文本中各字符对应的编码,得到第一编码序列。


6.根据权利要求1至4中任一项所述的方法,其特征在...

【专利技术属性】
技术研发人员:乔宏利王洪斌蒋宁吴海英何朋
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1