语音识别结果的纠错方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37478679 阅读:14 留言:0更新日期:2023-05-07 09:19
本发明专利技术提供一种语音识别结果的纠错方法、装置、电子设备及存储介质,该方法包括:获取待识别语音对应的初始识别结果;确定所述待识别语音对应的目标场景;基于所述目标场景对应的第一目标词库,对所述初始识别结果进行纠错,得到目标识别结果;所述第一目标词库为基于所述目标场景下的至少一个第一文本确定的。本发明专利技术提供的语音识别结果的纠错方法、装置、电子设备及存储介质可以提高语音识别结果的准确性。性。性。

【技术实现步骤摘要】
语音识别结果的纠错方法、装置、电子设备及存储介质


[0001]本专利技术涉及语音识别
,尤其涉及一种语音识别结果的纠错方法、装置、电子设备及存储介质。

技术介绍

[0002]语音识别技术,也被称为自动语音识别(Automatic Speech Recognition,ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。
[0003]然而,在现有的语音识别技术中,在一些特殊场景下,其并不能准确识别出用户发出的语音,例如:对于一些同音或者谐音的用户的语音。具体地,比如在用户说“月月,回家吃饭了”时,语音识别引擎可能会将其中的“月月”识别成“悦悦”或者“岳岳”。由此可见,现有的语音识别结果的准确性依然较低。

技术实现思路

[0004]本专利技术提供一种语音识别结果的纠错方法、装置、电子设备及存储介质,用以解决现有技术中的语音识别结果的准确性较低的缺陷,实现了提高语音识别结果准确性的目的。
[0005]本专利技术提供一种语音识别结果的纠错方法,包括:
[0006]获取待识别语音对应的初始识别结果;
[0007]确定所述待识别语音对应的目标场景;
[0008]基于所述目标场景对应的第一目标词库,对所述初始识别结果进行纠错,得到目标识别结果;所述第一目标词库为基于所述目标场景下的至少一个第一文本确定的。
[0009]根据本专利技术提供的一种语音识别结果的纠错方法,所述第一目标词库中包括基于所述第一文本确定的目标词语和目标组合词,所述目标组合词包括所述目标词语、以及所述目标词语的前一个词语和/或后一个词语;
[0010]所述基于所述目标场景对应的第一目标词库,对所述初始识别结果进行纠错,得到目标识别结果,包括:
[0011]对所述初始识别结果进行拆词处理,得到至少一个分词;
[0012]针对每个分词,获取所述分词对应的第一组合词,所述第一组合词中包括所述分词、以及所述分词的前一个分词和/或后一个分词;
[0013]基于所述目标词语、所述目标组合词和所述第一组合词,对所述分词进行纠错,得到所述目标识别结果。
[0014]根据本专利技术提供的一种语音识别结果的纠错方法,所述第一组合词中包括所述分词、以及所述分词的前一个分词和后一个分词,所述目标组合词包括所述目标词语、以及所述目标词语的前一个词语和后一个词语;
[0015]所述基于所述目标词语、所述目标组合词和所述第一组合词,对所述分词进行纠
错,包括:
[0016]在所述第一目标词库中,查找与所述第一组合词的长度相同的第一目标组合词;
[0017]从所述第一目标组合词中,查找前一个词语与所述第一组合词中的所述前一个分词相同、且后一个词语与所述第一组合词中的所述后一个分词相同的第二目标组合词;
[0018]在查找到所述第二目标组合词的情况下,查找所述第二目标组合词中,目标词语与所述第一组合词的所述分词发音相同的第三目标组合词;
[0019]在查找到所述第三目标组合词的情况下,基于所述第三目标组合词对所述分词进行纠错。
[0020]根据本专利技术提供的一种语音识别结果的纠错方法,语音识别结果的纠错方法,所述基于所述第三目标组合词对所述分词进行纠错,包括:
[0021]在所述第三目标组合词的数量为一个的情况下,采用所述第三目标组合词中的目标词语替换所述分词;
[0022]在所述第三目标组合词的数量为至少两个的情况下,采用至少两个第三目标组合词中词频最大的第三目标组合词的目标词语替换所述分词,所述词频用于表征在所述目标场景下所述第三目标组合词的出现次数;
[0023]在各所述第三目标组合词对应的词频相同的情况下,采用至少两个第三目标组合词中时间戳最大的第三目标组合词的目标词语替换所述分词,所述时间戳用于表征在所述目标场景下所述第三目标组合词的出现时刻。
[0024]根据本专利技术提供的一种语音识别结果的纠错方法,所述方法还包括:
[0025]在对所述第一组合词对应的分词纠错失败的情况下,在所述第一目标词库中,查找与所述分词的长度相同且发音相同的第一目标词语;
[0026]若存在一个所述第一目标词语,则采用所述第一目标词语替换所述分词;
[0027]若存在至少两个所述第一目标词语,则采用至少两个第一目标词语中词频最大的第一目标词语替换所述分词,所述词频用于表征在所述目标场景下所述第一目标词语的出现次数;
[0028]在各所述第一目标词语对应的词频相同的情况下,采用至少两个第一目标词语中时间戳最大的第一目标词语替换所述分词,所述时间戳用于表征在所述目标场景下所述第一目标词语的出现时刻。
[0029]根据本专利技术提供的一种语音识别结果的纠错方法,所述方法还包括:
[0030]在所述第一目标词库中不存在所述第一目标词语的情况下,在第二目标词库中查找所述第一目标词语,所述第二目标词库为基于通用场景下的至少一个第二文本确定的。
[0031]根据本专利技术提供的一种语音识别结果的纠错方法,所述方法还包括:
[0032]在所述第二目标词库中不存在所述第一目标词语的情况下,查找所述第二目标组合词中,目标词语与所述第一组合词的所述分词模糊音匹配的第四目标组合词;
[0033]在查找到所述第四目标组合词,且所述第四目标组合词的数量为一个的情况下,采用所述第四目标组合词中的目标词语替换所述分词;
[0034]在查找到所述第四目标组合词,且所述第四目标组合词的数量为至少两个的情况下,采用至少两个第四目标组合词中,词频大于预设值且时间戳小于预设时刻的第四目标组合词的目标词语替换所述分词。
[0035]根据本专利技术提供的一种语音识别结果的纠错方法,所述方法还包括:
[0036]获取所述目标场景下的至少一个第一文本;
[0037]对各所述第一文本进行拆词处理,得到至少两个目标词语;
[0038]针对每个目标词语,将所述目标词语、以及所述目标词语的前一个词语和/或后一个词语进行组合,得到目标组合词;
[0039]基于所述目标词语和所述目标组合词,确定所述第一目标词库。
[0040]根据本专利技术提供的一种语音识别结果的纠错方法,所述方法还包括:
[0041]在接收到用户输入的对所述目标识别结果中的目标分词进行修改的修改指令的情况下,确定修改后的词语与所述目标分词的发音或者模糊音是否相同;
[0042]在确定所述修改后的词语与所述目标分词的发音或者模糊音相同的情况下,减小所述第一目标词库中与目标分词相同的第二目标词语的词频和包括所述第二目标词语的第五目标组合词的词频。
[0043]本专利技术还提供一种语音识别结果的纠错装置,包括:
[0044]获取模块,用于获取待识别语音对应的初始识别结果;
[0045]确定模块,用于确定所述待识别语音对应的目标场景;
[0046]纠错模块,用于基于所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音识别结果的纠错方法,其特征在于,包括:获取待识别语音对应的初始识别结果;确定所述待识别语音对应的目标场景;基于所述目标场景对应的第一目标词库,对所述初始识别结果进行纠错,得到目标识别结果;所述第一目标词库为基于所述目标场景下的至少一个第一文本确定的。2.根据权利要求1所述的语音识别结果的纠错方法,其特征在于,所述第一目标词库中包括基于所述第一文本确定的目标词语和目标组合词,所述目标组合词包括所述目标词语、以及所述目标词语的前一个词语和/或后一个词语;所述基于所述目标场景对应的第一目标词库,对所述初始识别结果进行纠错,得到目标识别结果,包括:对所述初始识别结果进行拆词处理,得到至少一个分词;针对每个分词,获取所述分词对应的第一组合词,所述第一组合词中包括所述分词、以及所述分词的前一个分词和/或后一个分词;基于所述目标词语、所述目标组合词和所述第一组合词,对所述分词进行纠错,得到所述目标识别结果。3.根据权利要求2所述的语音识别结果的纠错方法,其特征在于,所述第一组合词中包括所述分词、以及所述分词的前一个分词和后一个分词,所述目标组合词包括所述目标词语、以及所述目标词语的前一个词语和后一个词语;所述基于所述目标词语、所述目标组合词和所述第一组合词,对所述分词进行纠错,包括:在所述第一目标词库中,查找与所述第一组合词的长度相同的第一目标组合词;从所述第一目标组合词中,查找前一个词语与所述第一组合词中的所述前一个分词相同、且后一个词语与所述第一组合词中的所述后一个分词相同的第二目标组合词;在查找到所述第二目标组合词的情况下,查找所述第二目标组合词中,目标词语与所述第一组合词的所述分词发音相同的第三目标组合词;在查找到所述第三目标组合词的情况下,基于所述第三目标组合词对所述分词进行纠错。4.根据权利要求3所述的语音识别结果的纠错方法,其特征在于,所述基于所述第三目标组合词对所述分词进行纠错,包括:在所述第三目标组合词的数量为一个的情况下,采用所述第三目标组合词中的目标词语替换所述分词;在所述第三目标组合词的数量为至少两个的情况下,采用至少两个第三目标组合词中词频最大的第三目标组合词的目标词语替换所述分词,所述词频用于表征在所述目标场景下所述第三目标组合词的出现次数;在各所述第三目标组合词对应的词频相同的情况下,采用至少两个第三目标组合词中时间戳最大的第三目标组合词的目标词语替换所述分词,所述时间戳用于表征在所述目标场景下所述第三目标组合词的出现时刻。5.根据权利要求3所述的语音识别结果的纠错方法,其特征在于,所述方法还包括:在对所述第一组合词对应的分词纠错失败的情况下,在所述第一目标词库中,查找与
所述分词的长度相同且发音相同的第一目标词语;若存在一个所述第一目标词语,则采用所述第一目标词语替换所述分词;若存在至少两个所述第一目标词语,则采用至少两个第一目标词语中词频最大的第一目标词语替换所述分词,所述词频用于表征在所述目标场景下所述第一目标词语的出现次数;在各所述第一目标词语对应的词频相同的情况下,采用至少两个第一目标词语中时间戳最大的第一目标词语替换所述分...

【专利技术属性】
技术研发人员:崔阿鹏童勇勇余飞
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1