文本处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号：28872535 阅读：33 留言：0更新日期：2021-06-15 23:05

本发明专利技术公开了一种文本处理方法、装置、电子设备及存储介质，属于文本转语音技术领域。该方法包括：获取待处理文本，所述待处理文本包含有第一单位符号；确定所述第一单位符号的第一位置信息，所述第一位置信息用于指示所述第一单位符号在所述待处理文本中的位置；确定所述待处理文本中各个字符对应的编码，得到第一编码序列；基于所述第一编码序列、所述第一位置信息和预先训练的拼音预测模型，确定所述第一单位符号对应的拼音。这样，可以基于预先训练的拼音预测模型，直接得到待处理文本中第一单位符号的拼音，无需人为干涉，从而提高了获取第一单位符号拼音的效率，使得文本处理的效率也有所提升。

全部详细技术资料下载

【技术实现步骤摘要】
文本处理方法、装置、电子设备及存储介质
本专利技术属于文本转语音
，具体涉及一种文本处理方法、装置、电子设备及存储介质。
技术介绍
在文本转语音(TextToSpeech，简称TTS)应用中，一般需要预先对输入TTS模型的文本做归一化表示，即将文本转化为对应的拼音表示。但针对包含有单位符号的文本，常常在不同语境下，单位符号所表示的含义不同，拼音也不尽相同。例如，文本“网速太慢了，只有20K”中的单位符号K的拼音为“kei”，而文本“实验温度200K时，呈现液态”中的单位符号K的拼音为“kai1erwen”等。因而，现有的文本处理方式，通常需要人为确定文本中单位符号对应的正确拼音，导致文本转化为拼音的效率低。
技术实现思路
本专利技术实施例的目的是提供一种文本处理方法、装置、电子设备及存储介质，能够解决现有的文本处理方式，需要人为确定文本中单位符号对应的正确拼音，导致文本转化为拼音的效率低的问题。为了解决上述技术问题，本专利技术是这样实现的：第一方面，本专利技术实施例提供了一种文本处理方法，所述方法包括：获取待处理文本，所述待处理文本包含有第一单位符号；确定所述第一单位符号的第一位置信息，所述第一位置信息用于指示所述第一单位符号在所述待处理文本中的位置；确定所述待处理文本中各个字符对应的编码，得到第一编码序列；基于所述第一编码序列、所述第一位置信息和预先训练的拼音预测模型，确定所述第一单位符号对应的拼音。第二方面，本专利技术实施例提供了一...

【技术保护点】
1.一种文本处理方法，其特征在于，所述方法包括：/n获取待处理文本，所述待处理文本包含有第一单位符号；/n确定所述第一单位符号的第一位置信息，所述第一位置信息用于指示所述第一单位符号在所述待处理文本中的位置；/n确定所述待处理文本中各个字符对应的编码，得到第一编码序列；/n基于所述第一编码序列、所述第一位置信息和预先训练的拼音预测模型，确定所述第一单位符号对应的拼音。/n

【技术特征摘要】
1.一种文本处理方法，其特征在于，所述方法包括：
获取待处理文本，所述待处理文本包含有第一单位符号；
确定所述第一单位符号的第一位置信息，所述第一位置信息用于指示所述第一单位符号在所述待处理文本中的位置；
确定所述待处理文本中各个字符对应的编码，得到第一编码序列；
基于所述第一编码序列、所述第一位置信息和预先训练的拼音预测模型，确定所述第一单位符号对应的拼音。

2.根据权利要求1所述的方法，其特征在于，所述基于所述第一编码序列、所述第一位置信息和预先训练的拼音预测模型，确定所述第一单位符号对应的拼音，包括：
将所述第一编码序列和所述第一位置信息输入至所述拼音预测模型，得到预测结果，其中，所述预测结果为概率序列，所述概率序列为概率值组成的序列，所述概率序列中的概率值的数量与预设拼音集合中的拼音的数量相同；所述概率序列中的概率值用于指示所述预设拼音集合中各拼音分别为所述第一单位符号的拼音的概率；
根据所述概率序列中的概率值，确定所述第一单位符号对应的拼音。

3.根据权利要求2所述的方法，其特征在于，所述根据所述概率序列中的概率值，确定所述第一单位符号对应的拼音，包括：
确定所述概率序列中最大概率值对应的目标编码；
根据所述预设拼音集合中各个拼音与编码之间的映射关系，确定所述目标编码对应的拼音；
将所述目标编码对应的拼音，确定为所述第一单位符号的拼音。

4.根据权利要求2所述的方法，其特征在于，所述拼音预测模型包括嵌入层、双向循环神经网络层、注意力层、全连接层和分类器层；
所述将所述第一编码序列和所述第一位置信息输入至所述拼音预测模型，得到预测结果，包括：
将所述第一编码序列输入至所述嵌入层，得到第一中间序列，并将所述第一位置信息输入至所述嵌入层，得到第一中间向量；
将所述第一中间序列输入至所述双向循环神经网络层，得到第二中间序列；
将所述第二中间序列和所述第一中间向量输入至所述注意力层，得到第二中间向量；
将所述第二中间向量输入至所述全连接层，得到第三中间向量；
将所述第三中间向量输入至所述分类器层，得到所述预测结果。

5.根据权利要求1至4中任一项所述的方法，其特征在于，所述确定所述待处理文本中各个字符对应的编码，得到第一编码序列，包括：
根据预设的字符和编码之间的映射关系，确定所述待处理文本中各字符对应的编码，得到第一编码序列。

6.根据权利要求1至4中任一项所述的方法，其特征在...

【专利技术属性】
技术研发人员：乔宏利，王洪斌，蒋宁，吴海英，何朋，
申请(专利权)人：马上消费金融股份有限公司，
类型：发明
国别省市：重庆;50

全部详细技术资料下载我是这个专利的主人