一种文本处理方法及装置制造方法及图纸

技术编号:31225014 阅读:14 留言:0更新日期:2021-12-08 09:28
本申请提供了一种文本处理方法及装置。在本申请中,由于用户是基于电子设备输出的引导文本而向电子设备输入语音的,因此,电子设备输出的引导文本的内容与用户在电子设备上输入的语音的内容是有内在逻辑关联以及内在内容关联的,因此,可以基于第一拼音、第二拼音以及引导文本对识别文本进行纠错,以使纠错后的识别文本可以为用户所要表达内容对应的文本,之后可以基于纠错后的识别文本确定识别用户的意图,并根据该咨询意图给用户相应的回复,从而使得电子设备之后向用户输出的回复的内容与用户实际想要的对话内容相符合,进而就可以解决用户的问题,以提高用户体验。以提高用户体验。以提高用户体验。

【技术实现步骤摘要】
一种文本处理方法及装置


[0001]本申请涉及计算机
,特别是涉及一种文本处理方法及装置。

技术介绍

[0002]用户在享用网络上的一些服务时,有时候会遇到一些问题需要咨询,随着技术的飞速发展,越来越多的网络平台使用自动客服系统来解答用户的咨询。
[0003]其中,用户可以通过语音向自动客服系统提问,自动客服系统将用户的语音转换为文本,然后基于该文本确定识别用户的意图,并根据该咨询意图给用户相应的回复,以解决用户的问题。
[0004]然而,专利技术人发现,上述方式中,将用户的语音转换为文本的准确率较低,进而导致识别出的用户的咨询意图的准确度较低,进而无法准确解决用户的问题。

技术实现思路

[0005]为了提高交互效率,进而提高用户体验,本申请示出了一种文本处理方法及装置。
[0006]第一方面,本申请示出了一种文本处理方法,应用于电子设备,所述方法包括:
[0007]接收用户输入的语音;
[0008]获取所述语音的识别文本和引导文本;
[0009]获取所述识别文本的第一拼音以及获取所述引导文本的第二拼音;
[0010]基于所述第一拼音、所述第二拼音以及所述引导文本,对所述识别文本进行纠错。
[0011]在一个可选的实现方式中,所述获取所述识别文本的第一拼音,包括:
[0012]将所述识别文本拆分为多个识别文本块,分别获取每一个识别文本块的识别拼音;
[0013]所述获取所述引导文本的第二拼音,包括:
[0014]将所述引导文本拆分为多个引导文本块,分别获取每一个引导文本块的引导拼音。
[0015]在一个可选的实现方式中,所述基于所述第一拼音、所述第二拼音以及所述引导文本,对所述识别文本进行纠错,包括:
[0016]对于每一个识别文本块的识别拼音,获取所述识别文本块的识别拼音分别与各个引导文本块的引导拼音之间的差异程度;
[0017]在最小的差异程度大于预设阈值的情况下,依照差异程度由低至高的顺序选择预设数量个差异程度对应的引导文本块;
[0018]使用选择的引导文本块分别替换所述识别文本中的所述识别文本块,得到多个替换后的识别文本;
[0019]获取每一个替换后的识别文本的困惑度;
[0020]选择困惑度最小的替换后的识别文本作为识别文本的纠错版本。
[0021]在一个可选的实现方式中,所述获取所述识别文本块的识别拼音分别与各个引导
文本块的引导拼音之间的差异程度,包括:
[0022]对于每一个引导文本块的引导拼音,获取所述识别文本块的识别拼音的声母与所述引导文本块的引导拼音的声母之间的第一差异;
[0023]获取所述识别文本块的识别拼音的韵母与所述引导文本块的引导拼音的韵母之间的第二差异;
[0024]获取所述识别文本块的识别拼音的声调与所述引导文本块的引导拼音的声调之间的第三差异;
[0025]获取所述识别文本块的识别拼音与所述引导文本块的引导拼音之间的编辑距离;
[0026]根据所述第一差异、所述第二差异、所述第三差异以及所述编辑距离获取所述差异程度。
[0027]在一个可选的实现方式中,所述获取所述识别文本块的识别拼音的声母与所述引导文本块的引导拼音的声母之间的第一差异,包括:
[0028]获取所述识别文本块的识别拼音中的各个声母的第一向量以及所述引导文本块的引导拼音中的各个声母的第二向量;
[0029]计算所述第一向量与所述第二向量之间的余弦距离,并作为所述第一差异。
[0030]在一个可选的实现方式中,所述获取所述识别文本块的识别拼音中的各个声母的第一向量以及所述引导文本块的引导拼音中的各个声母的第二向量,包括:
[0031]在语音差异确定模型的网络参数中提取所述第一向量和所述第二向量;
[0032]其中,所述语音差异确定模型是基于多个样本数据集对待训练模型训练,直至待训练模型中的网络参数收敛后得到的,每一个样本数据集中包括两个样本词汇各自的拼音以及包括两个样本词汇的拼音之间的标注差异。
[0033]在一个可选的实现方式中,所述获取所述识别文本块的识别拼音的韵母与所述引导文本块的引导拼音的韵母之间的第二差异,包括:
[0034]获取所述识别文本块的识别拼音中的各个韵母的第三向量以及所述引导文本块的引导拼音中的各个韵母的第四向量;
[0035]计算所述第三向量与所述第四向量之间的余弦距离,并作为所述第二差异。
[0036]在一个可选的实现方式中,所述获取所述识别文本块的识别拼音中的各个韵母的第三向量以及所述引导文本块的引导拼音中的各个韵母的第四向量,包括:
[0037]在语音差异确定模型的网络参数中提取所述第三向量和所述第四向量;
[0038]其中,所述语音差异确定模型是基于多个样本数据集对待训练模型训练,直至待训练模型中的网络参数收敛后得到的,每一个样本数据集中包括两个样本词汇各自的拼音以及包括两个样本词汇的拼音之间的标注差异。
[0039]在一个可选的实现方式中,所述获取所述识别文本块的识别拼音的声调与所述引导文本块的引导拼音的声调之间的第三差异,包括:
[0040]获取所述识别文本块的识别拼音中的各个声调的第五向量以及所述引导文本块的引导拼音中的各个声调的第六向量;
[0041]计算所述第五向量与所述第六向量之间的余弦距离,并作为所述第三差异。
[0042]在一个可选的实现方式中,所述获取所述识别文本块的识别拼音中的各个声调的第五向量以及所述引导文本块的引导拼音中的各个声调的第六向量,包括:
[0043]在语音差异确定模型的网络参数中提取所述第五向量和所述第六向量;
[0044]其中,所述语音差异确定模型是基于多个样本数据集对待训练模型训练,直至待训练模型中的网络参数收敛后得到的,每一个样本数据集中包括两个样本词汇各自的拼音以及包括两个样本词汇的拼音之间的标注差异。
[0045]在一个可选的实现方式中,所述待训练模型包括:统计机器学习模型以及深度学习模型;
[0046]所述统计机器学习模型包括:logistic回归分析模型、贝叶斯模型以及线性回归模型;
[0047]所述深度学习模型包括:卷积神经网络CNN,循环神经网络RNN以及深度信念网络DBN。
[0048]第二方面,本申请示出了一种文本处理装置,应用于电子设备,所述装置包括:
[0049]接收模块,用于接收用户输入的语音;
[0050]第一获取模块,用于获取所述语音的识别文本和引导文本;
[0051]第二获取模块,用于获取所述识别文本的第一拼音,以及,第三获取模块,用于获取所述引导文本的第二拼音;
[0052]纠错模块,用于基于所述第一拼音、所述第二拼音以及所述引导文本,对所述识别文本进行纠错。
[0053]在一个可选的实现方式中,所述第二获取模块包括:...

【技术保护点】

【技术特征摘要】
1.一种文本处理方法,其特征在于,应用于电子设备,所述方法包括:接收用户输入的语音;获取所述语音的识别文本和引导文本;获取所述识别文本的第一拼音以及获取所述引导文本的第二拼音;基于所述第一拼音、所述第二拼音以及所述引导文本,对所述识别文本进行纠错。2.根据权利要求1所述的方法,其特征在于,所述获取所述识别文本的第一拼音,包括:将所述识别文本拆分为多个识别文本块,分别获取每一个识别文本块的识别拼音;所述获取所述引导文本的第二拼音,包括:将所述引导文本拆分为多个引导文本块,分别获取每一个引导文本块的引导拼音。3.根据权利要求2所述的方法,其特征在于,所述基于所述第一拼音、所述第二拼音以及所述引导文本,对所述识别文本进行纠错,包括:对于每一个识别文本块的识别拼音,获取所述识别文本块的识别拼音分别与各个引导文本块的引导拼音之间的差异程度;在最小的差异程度大于预设阈值的情况下,依照差异程度由低至高的顺序选择预设数量个差异程度对应的引导文本块;使用选择的引导文本块分别替换所述识别文本中的所述识别文本块,得到多个替换后的识别文本;获取每一个替换后的识别文本的困惑度;选择困惑度最小的替换后的识别文本作为识别文本的纠错版本。4.根据权利要求3所述的方法,其特征在于,所述获取所述识别文本块的识别拼音分别与各个引导文本块的引导拼音之间的差异程度,包括:对于每一个引导文本块的引导拼音,获取所述识别文本块的识别拼音的声母与所述引导文本块的引导拼音的声母之间的第一差异;获取所述识别文本块的识别拼音的韵母与所述引导文本块的引导拼音的韵母之间的第二差异;获取所述识别文本块的识别拼音的声调与所述引导文本块的引导拼音的声调之间的第三差异;获取所述识别文本块的识别拼音与所述引导文本块的引导拼音之间的编辑距离;根据所述第一差异、所述第二差异、所述第三差异以及所述编辑距离获取所述差异程度。5.根据权利要求4所述的方法,其特征在于,所述获取所述识别文本块的识别拼音的声母与所述引导文本块的引导拼音的声母之间的第一差异,包括:获取所述识别文本块的识别拼音中的各个声母的第一向量以及所述引导文本块的引导拼音中的各个声母的第二向量;计算所述第一向量与所述第二向量之间的余弦距离,并作为所述第一差异。6.根据权利要求5所述的方法,其特征在于,所述获取所述识别文本块的识别拼音中的各个声母的第一向量以及所述引导文本块的引导拼音中的各个声母的第二向量,包括:在语音差异确定模型的网络参数中提取所述第一向量和所述第二向量;
其中,所述语音差异确定模型是基于多个样本数据集对待训练模型训练,直至待训练模型中的网络参数收敛后得到的,每一个样本数据集中包括两个样本词汇各自的拼音以及包括两个样本词汇的拼音之间的标注差异。7.根据权利要求4所述的方法,其特征在于,所述获取所述识别文本块的识别拼音的韵母与所述引导文本块的引导拼音的韵母之间的第二差异,包括:获取所述识别文本块的识别拼音中的各个韵母的第三向量以及所述引导文本块的引导拼音中的各个韵母的第四向量;计算所述第三向量与所述第四向量之间的余弦距离,并作为所述第二差异。8.根据权利要求7所述的方法,其特征在于,所述获取所述识别文本块的识别拼音中的各个韵母的第三向量以及所述引导文本块的引导拼音中的各个韵母的第四向量,包括:在语音差异确定模型的网络参数中提取所述第三向量和所述第四向量;其中,所述语音差异确定模型是基于多个样本数据集对待训练模型训练,直至待训练模型中的网络参数收敛后得到的,每一个样本数据集中包括两个样本词汇各自的拼音以及包括两个样本词汇的拼音之间的标注差异。9.根据权利要求4所述的方法,其特征在于,所述获取所述识别文本块的识别拼音的声调与所述引导文本块的引导拼音的声调之间的第三差异,包括:获取所述识别文本块的识别拼音中的各个声调的第五向量以及所述引导文本块的引导拼音中的各个声调的第六向量;计算所述第五向量与所述第六向量之间的余弦距离,并作为所述第三差异。10.根据权利要求9所述的方法,其特征在于,所述获取所述识别文本块的识别拼音中的各个声调的第五向量以及所述引导文本块的引导拼音中的各个声调的第六向量,包括:在语音差异确定模型的网络参数中提取所述第五向量和所述第六向量;其中,所述语音差异确定模型是基于多个样本数据集对待训练模型训练,直至待训练模型中的网络参数收敛后得到的,每一个样本数据集中包括两个样本词汇各自的拼音以及包括两个样本词汇的拼音之间的标注差异。11.根据权利要求6、8或10所述的方法,其特征在于,所述待训练模型包括:统计机器学习模型以及深度学习模型;所述统计机器学习模型包括:logistic回归分析模型、贝叶斯模型以及线性回归模型;所述深度学习模型包括:卷积神经网络CNN,循环神经网络RNN以及深度信念网络DBN。12.一种文本处理装置,其特征在于,应用于电子设备,所述装置包括:接收模块,用于接收用户输入的语音;第一获取模块,用于获取...

【专利技术属性】
技术研发人员:李杨付彬孙健唐呈光赵学敏
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1