插值系数确定方法、模型构建方法、识别方法及电子设备技术

技术编号:30907108 阅读:14 留言:0更新日期:2021-11-22 23:52
本申请实施例提供一种插值系数确定方法、模型构建方法、识别方法及电子设备,所述方法包括:获取输入的第一语言模型以及第二语言模型;获取插值模型,并将所述第一语言模型、所述第二语言模型以及多个第一插值系数输入到所述插值模型中,获得多个第一插值模型;获得多个所述第一插值模型的困惑度;基于多个所述第一插值系数以及多个所述第一插值模型的困惑度,确定出符合条件的目标困惑度,并将所述目标困惑度对应的插值模型的插值系数作为目标插值系数。插值系数。插值系数。

【技术实现步骤摘要】
插值系数确定方法、模型构建方法、识别方法及电子设备


[0001]本申请涉及语音识别
,特别涉及一种插值系数确定方法、模型构建方法、识别方法及电子设备。

技术介绍

[0002]在语音识别
中,语言模型是其中重要的一个环节,目前较为广泛使用的是n元语言模型,如Ngram语言模型等。目前技术,在构建专用领域的n元语言模型过程中,采用专用语言文本进行模型训练得到专用语言模型,采用通用语言文本进行模型训练得到通用语言模型,然后利用该通用语言模型与该专用语言模型进行插值处理,以构建语言模型。
[0003]然而,目前技术中,通用语言模型与专用语言模型的插值系数常为固定值,或根据人工经验预估或调节等,缺乏自适应机制,使得构建语言模型在专用领域的困惑度较高,性能较差,从而导致语音识别准确率较低。另外,由于通用语言模型的训练文本仅包含了通用语言文本,而利用该通用语言模型与专用语言模型进行插值的方法属于线性插值,使得在插值处理过程中,该通用语言模型对专用语言模型的概率影响较大,导致构建语言模型在专用领域的适用性较低。
[0004]此外,理论上来讲,n元语言模型中阶数n的取值越大,语言模型的困惑度越低,有利于提高语音识别的准确率,然而阶数n的取值越大,语言模型的训练时间和大小均会成好几倍甚至十几倍的增长,不利于实际产品落地。然而,目前技术中,通用语言模型与专用语言模型常采用相同阶数的n元语言模型(如均为3grams语言模型等),在保证实际产品落地的情况下,将导致语言模型的困惑度较高,使得语音识别的准确率下降。r/>
技术实现思路

[0005]本申请提供了一种插值系数确定方法、模型构建方法、识别方法及电子设备,能够对插值模型的插值系数进行调节,确定出目标插值系数,有利于降低语言模型的困惑度,提高语言模型的性能,从而提高语音识别的准确率。
[0006]第一方面,本申请提供了一种插值系数确定方法,包括:
[0007]获取输入的第一语言模型以及第二语言模型;
[0008]获取插值模型,并将所述第一语言模型、所述第二语言模型以及多个第一插值系数输入到所述插值模型中,获得多个第一插值模型;
[0009]获得多个所述第一插值模型的困惑度;
[0010]基于多个所述第一插值系数以及多个所述第一插值模型的困惑度,确定出符合条件的目标困惑度,并将所述目标困惑度对应的插值模型的插值系数作为目标插值系数。
[0011]其中一种可能的实现方式中,所述基于多个所述第一插值系数以及多个所述第一插值模型的困惑度,确定出符合条件的目标困惑度,并将所述目标困惑度对应的插值模型的插值系数作为目标插值系数,包括:
[0012]根据多个所述第一插值模型的困惑度大小,从多个所述第一插值模型中,选取到
第一目标模型和第二目标模型,其中,所述第一目标模型的第一插值系数与所述第二目标模型的第一插值系数相邻,所述第一目标模型用于表示困惑度最小的所述第一插值模型,所述第二目标模型用于表示与所述第一目标模型的困惑度差值最小的所述第一插值模型;
[0013]基于所述第一目标模型的第一插值系数、所述第二目标模型的第一插值系数以及所述第一目标模型的困惑度,确定符合条件的目标困惑度,并将所述目标困惑度对应的插值模型的插值系数作为目标插值系数。
[0014]其中一种可能的实现方式中,所述基于所述第一目标模型的第一插值系数、所述第二目标模型的第一插值系数以及所述第一目标模型的困惑度,确定符合条件的目标困惑度,并将所述目标困惑度对应的插值模型的插值系数作为目标插值系数,包括:
[0015]在所述第一目标模型的第一插值系数与所述第二目标模型的第一插值系数的范围内,选取到第二插值系数;
[0016]将所述第一语言模型、所述第二语言模型以及所述第二插值系数输入到所述插值模型中,得到第二插值模型;
[0017]对所述第二插值模型的困惑度与所述第一目标模型的困惑度进行比较,根据比较结果,确定出符合条件的目标困惑度,并将所述目标困惑度对应的插值模型的插值系数作为目标插值系数。
[0018]其中一种可能的实现方式中,所述对所述第二插值模型的困惑度与所述第一目标模型的困惑度进行比较,根据比较结果,确定出符合条件的目标困惑度,并将所述目标困惑度对应的插值模型的插值系数作为目标插值系数,包括:
[0019]若所述第二插值模型的困惑度大于或等于所述第一目标模型的困惑度,则所述第一目标模型的困惑度为符合条件的目标困惑度,所述第一目标模型的第一插值系数为目标插值系数;
[0020]若所述第二插值模型的困惑度小于所述第一目标模型的困惑度,且所述第二插值模型的困惑度与所述第一目标模型的困惑度的差值小于或等于预设阈值,则所述第二插值模型的困惑度为符合条件的目标困惑度,所述第二插值模型的第二插值系数为目标插值系数;
[0021]若所述第二插值模型的困惑度小于所述第一目标模型的困惑度,且所述第二插值模型的困惑度与所述第一目标模型的困惑度的差值大于所述预设阈值,则基于所述第一目标模型的第一插值系数、所述第二插值模型的第二插值系数以及所述第二插值模型的困惑度,确定符合条件的目标困惑度,并将所述目标困惑度对应的插值模型的插值系数作为目标插值系数。
[0022]其中一种可能的实现方式中,所述基于所述第一目标模型的第一插值系数、所述第二插值模型的第二插值系数以及所述第二插值模型的困惑度,确定符合条件的目标困惑度,并将所述目标困惑度对应的插值模型的插值系数作为目标插值系数,包括:
[0023]在所述第一目标模型的第一插值系数与所述第二插值模型的第二插值系数的范围内,选取到第三插值系数;
[0024]将所述第一语言模型、所述第二语言模型以及所述第三插值系数输入到所述插值模型中,得到第三插值模型;
[0025]对所述第二插值模型的困惑度与所述第三插值模型的困惑度进行比较,根据比较
结果,确定符合条件的目标困惑度,并将所述目标困惑度对应的插值模型的插值系数作为目标插值系数。
[0026]其中一种可能的实现方式中,所述获取输入的第一语言模型以及第二语言模型,包括:
[0027]获取输入的专用语言文本以及通用语言文本;
[0028]利用所述专用语言文本进行模型训练,得到第一语言模型;
[0029]利用所述专用语言文本以及所述通用语言文本进行模型训练,得到第二语言模型。
[0030]其中一种可能的实现方式中,所述第一语言模型的阶数大于所述第二语言模型的阶数。
[0031]第二方面,本申请提供一种模型构建方法,包括:
[0032]输入第一语言模型以及第二语言模型;
[0033]将所述第一语言模型、所述第二语言模型以及目标插值系数输入插值模型中,得到目标语言模型,所述目标插值系数由第一方面所述方法得到。
[0034]第三方面,本申请提供一种识别方法,包括:
[0035]获取待识别语音对应的语言文本;
[00本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种插值系数确定方法,其特征在于,包括:获取输入的第一语言模型以及第二语言模型;获取插值模型,并将所述第一语言模型、所述第二语言模型以及多个第一插值系数输入到所述插值模型中,获得多个第一插值模型;获得多个所述第一插值模型的困惑度;基于多个所述第一插值系数以及多个所述第一插值模型的困惑度,确定出符合条件的目标困惑度,并将所述目标困惑度对应的插值模型的插值系数作为目标插值系数。2.根据权利要求1所述的方法,其特征在于,所述基于多个所述第一插值系数以及多个所述第一插值模型的困惑度,确定出符合条件的目标困惑度,并将所述目标困惑度对应的插值模型的插值系数作为目标插值系数,包括:根据多个所述第一插值模型的困惑度大小,从多个所述第一插值模型中,选取到第一目标模型和第二目标模型,其中,所述第一目标模型的第一插值系数与所述第二目标模型的第一插值系数相邻,所述第一目标模型用于表示困惑度最小的所述第一插值模型,所述第二目标模型用于表示与所述第一目标模型的困惑度差值最小的所述第一插值模型;基于所述第一目标模型的第一插值系数、所述第二目标模型的第一插值系数以及所述第一目标模型的困惑度,确定符合条件的目标困惑度,并将所述目标困惑度对应的插值模型的插值系数作为目标插值系数。3.根据权利要求2所述的方法,其特征在于,所述基于所述第一目标模型的第一插值系数、所述第二目标模型的第一插值系数以及所述第一目标模型的困惑度,确定符合条件的目标困惑度,并将所述目标困惑度对应的插值模型的插值系数作为目标插值系数,包括:在所述第一目标模型的第一插值系数与所述第二目标模型的第一插值系数的范围内,选取到第二插值系数;将所述第一语言模型、所述第二语言模型以及所述第二插值系数输入到所述插值模型中,得到第二插值模型;对所述第二插值模型的困惑度与所述第一目标模型的困惑度进行比较,根据比较结果,确定出符合条件的目标困惑度,并将所述目标困惑度对应的插值模型的插值系数作为目标插值系数。4.根据权利要求3所述的方法,其特征在于,所述对所述第二插值模型的困惑度与所述第一目标模型的困惑度进行比较,根据比较结果,确定出符合条件的目标困惑度,并将所述目标困惑度对应的插值模型的插值系数作为目标插值系数,包括:若所述第二插值模型的困惑度大于或等于所述第一目标模型的困惑度,则所述第一目标模型的困惑度为符合条件的目标困惑度,所述第一目标模型的第一插值系数为目标插值系数;若所述第二插值模型的困惑度小于所述第一目标模型的困惑度,且所述第二插值模型的困惑度与所述第一目标模型的困惑度的差值小于或等于预设阈值,则所述第二插值模型的困惑度为符合条件的目标困惑度,所述第二插值模型的第二插值系数为目标插值系数;若所述第二插值模型的困惑度小于所述第一目标模型的困惑度,且所述第二插值模型的困惑度与所述第一目标模型的困惑度的差值大于所述预设阈值,则基于所述第一目标模型的第一插值系数、所述第二插值模型的第二插值系数以及所述第二插值模型的困惑度,
确定符合条件的目标困惑度,并将所述目标困惑度对应的插值模型的插值系数作为目标插值系数。5.根据权利要求4所述的方法,其特征...

【专利技术属性】
技术研发人员:许伟亮
申请(专利权)人:广东优碧胜科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1