一种语音识别候选结果的排序方法及装置制造方法及图纸

技术编号:25599047 阅读:22 留言:0更新日期:2020-09-11 23:56
本申请实施例公开了一种语音识别候选结果的排序方法及装置,该方法包括:获取语音识别的候选结果信息;将识别得到的候选结果信息进行两两组合,生成至少一个候选组合;识别候选组合的共同错误单词;将候选组合中的每个候选结果信息包括的共同错误单词替换为标志词,将共同错误单词的单词信息替换为标志单词信息,得到每个候选结果信息对应的替换候选结果,得到待分类组合;利用预先训练得到的二分类模型,得到每个待分类组合中两条替换候选结果的优劣度;根据各个待分类组合中两条替换候选结果的优劣度,对候选结果信息进行排序。通过得到每两条替换候选结果的优劣度,可以确定各条替换候选结果信息之间的优劣度排序,得到准确的语音识别结果。

【技术实现步骤摘要】
一种语音识别候选结果的排序方法及装置
本申请涉及语音识别
,具体涉及一种语音识别候选结果的排序方法及装置。
技术介绍
目前,在语音识别的过程中,首先进行语音信息的转化,得到语音信息对应的多个候选结果信息,再对得到的多个候选结果信息进行排序,最终通过排序结果中最优的候选结果信息得到语音识别结果。但是,现有的对于候选结果信息的排序方法存在着排序结果不准确的问题,使得通过排序结果得到的最优的候选结果信息并不准确,导致语音识别结果与语音信息存在着较大的偏差。
技术实现思路
有鉴于此,本申请实施例提供一种语音识别候选结果的排序方法及装置,能够对候选结果信息进行较为准确的排序,通过排序结果得到较为准确的语音识别结果。为解决上述问题,本申请实施例提供的技术方案如下:一种语音识别候选结果的排序方法,所述方法还包括:获取语音识别的候选结果信息,每个所述候选结果信息包括识别文本单词序列以及所述识别文本单词序列中各个单词的单词信息;将识别得到的候选结果信息进行两两组合,生成至少一个候选组合;识别所述候选组合的共同错误单词,所述共同错误单词为该候选组合包括的两个候选结果信息共同具有的且位置相同的错误单词;将所述候选组合中的每个候选结果信息包括的共同错误单词替换为标志词,将所述共同错误单词的单词信息替换为标志单词信息,得到每个候选结果信息对应的替换候选结果,得到待分类组合;利用预先训练得到的二分类模型,得到每个所述待分类组合中两条替换候选结果的优劣度;<br>根据各个所述待分类组合中两条替换候选结果的优劣度,对所述候选结果信息进行排序。在一种可能的实现方式中,所述识别所述候选组合的共同错误单词,包括:获取所述候选组合中两条候选结果信息包括的各个单词的出现概率值;将所述候选结果信息中出现概率值低于阈值的单词确定为错误单词,并确定出每个所述错误单词在对应的候选结果信息中出现的位置;将所述候选组合中两条候选结果信息分别包括的错误单词以及各错误单词在对应的候选结果信息中出现的位置进行比对,识别出位于相同位置的相同错误单词作为所述候选组合对应的共同错误单词。在一种可能的实现方式中,所述利用预先训练得到的二分类模型,得到每个所述待分类组合中两条替换候选结果的优劣度,包括:获取目标替换候选结果中所述识别文本单词序列对应的第一特征向量,所述目标替换候选结果分别为所述待分类组合中的每条替换候选结果;获取所述目标替换候选结果中各个单词的单词信息对应的第二特征向量;将所述第一特征向量与所述第二特征向量进行拼接,生成所述目标替换候选结果的特征表示;将所述待分类组合中两条替换候选结果的特征表示输入预先训练得到的二分类模型,得到每个所述待分类组合中两条替换候选结果的优劣度。在一种可能的实现方式中,所述单词信息包括声学模型得分、语音模型得分、时长、置信度中的一个或多个;所述获取所述目标替换候选结果中各个单词的单词信息对应的第二特征向量,包括:将所述目标替换候选结果中各个单词的单词信息输入全连接网络,得到所述目标替换候选结果中各个单词的特征向量;将所述目标替换候选结果中各个单词的特征向量进行拼接,生成所述目标替换候选结果中各个单词的单词信息对应的第二特征向量。在一种可能的实现方式中,所述将所述待分类组合中两条替换候选结果的特征表示输入预先训练得到的二分类模型,得到每个所述待分类组合中两条替换候选结果的优劣度,包括:将所述待分类组合中两条替换候选结果的特征表示输入转换器模型的编码器部分,得到所述转换器模型的编码器部分输出的第一个隐层向量;将所述第一个隐层向量输入预先训练得到的二分类模型,得到每个所述待分类组合中两条替换候选结果的优劣度。在一种可能的实现方式中,所述二分类模型的训练过程包括:获取语音样本信息以及所述语音样本信息对应的标准识别文本;对所述语音样本信息进行语音识别得到所述语音样本信息对应的训练候选结果信息,所述训练候选结果信息包括训练识别文本单词序列以及所述训练识别文本单词序列中各个单词的单词信息;将所述训练候选结果信息中与所述标准识别文本相似度最高的确定为标准训练候选结果信息;将所述标准训练候选结果信息与其他所述训练候选结果信息分别组合,生成至少一个待训练组合;利用所述待训练组合以及所述待训练组合中标准训练候选结果信息优于训练候选结果信息的标签,训练得到二分类模型。在一种可能的实现方式中,所述利用所述待训练组合以及所述待训练组合中标准训练候选结果信息优于训练候选结果信息的标签,训练得到二分类模型,包括:获取目标训练候选结果信息中所述识别文本单词序列对应的第三特征向量,所述目标训练候选结果信息分别为所述待训练组合中的标准训练候选结果信息与训练候选结果信息;获取所述目标训练候选结果信息中各个单词的单词信息对应的第四特征向量;将所述第三特征向量与所述第四特征向量进行拼接,生成所述目标训练候选结果信息的特征表示;利用所述待训练组合中标准训练候选结果信息的特征表示、所述待训练组合中训练候选结果信息的特征表示以及所述待训练组合中标准训练候选结果信息优于训练候选结果信息的标签,训练得到二分类模型。一种语音识别候选结果的排序装置,所述装置包括:获取单元,用于获取语音识别的候选结果信息,每个所述候选结果信息包括识别文本单词序列以及所述识别文本单词序列中各个单词的单词信息;组合单元,用于将识别得到的候选结果信息进行两两组合,生成至少一个候选组合;识别单元,用于识别所述候选组合的共同错误单词,所述共同错误单词为该候选组合包括的两个候选结果信息共同具有的且位置相同的错误单词;替换单元,用于将所述候选组合中的每个候选结果信息包括的共同错误单词替换为标志词,将所述共同错误单词的单词信息替换为标志单词信息,得到每个候选结果信息对应的替换候选结果,得到待分类组合;优劣度获取单元,用于利用预先训练得到的二分类模型,得到每个所述待分类组合中两条替换候选结果的优劣度;排序单元,用于根据各个所述待分类组合中两条替换候选结果的优劣度,对所述候选结果信息进行排序。在一种可能的实现方式中,所述识别单元,包括:概率值获取子单元,用于获取所述候选组合中两条候选结果信息包括的各个单词的出现概率值;确定子单元,用于将所述候选结果信息中出现概率值低于阈值的单词确定为错误单词,并确定出每个所述错误单词在对应的候选结果信息中出现的位置;识别子单元,用于将所述候选组合中两条候选结果信息分别包括的错误单词以及各错误单词在对应的候选结果信息中出现的位置进行比对,识别出位于在相同位置的相同错误单词作为所述候选组合对应的共同错误单词。在一种可能的实现方式中,所述优劣度获取单元,包括:第一获取子单元,用于获取目标替换候选结果中所述识别文本单词序列对应的第一特征向量本文档来自技高网...

【技术保护点】
1.一种语音识别候选结果的排序方法,其特征在于,所述方法还包括:/n获取语音识别的候选结果信息,每个所述候选结果信息包括识别文本单词序列以及所述识别文本单词序列中各个单词的单词信息;/n将识别得到的候选结果信息进行两两组合,生成至少一个候选组合;/n识别所述候选组合的共同错误单词,所述共同错误单词为该候选组合包括的两个候选结果信息共同具有的且位置相同的错误单词;/n将所述候选组合中的每个候选结果信息包括的共同错误单词替换为标志词,将所述共同错误单词的单词信息替换为标志单词信息,得到每个候选结果信息对应的替换候选结果,得到待分类组合;/n利用预先训练得到的二分类模型,得到每个所述待分类组合中两条替换候选结果的优劣度;/n根据各个所述待分类组合中两条替换候选结果的优劣度,对所述候选结果信息进行排序。/n

【技术特征摘要】
1.一种语音识别候选结果的排序方法,其特征在于,所述方法还包括:
获取语音识别的候选结果信息,每个所述候选结果信息包括识别文本单词序列以及所述识别文本单词序列中各个单词的单词信息;
将识别得到的候选结果信息进行两两组合,生成至少一个候选组合;
识别所述候选组合的共同错误单词,所述共同错误单词为该候选组合包括的两个候选结果信息共同具有的且位置相同的错误单词;
将所述候选组合中的每个候选结果信息包括的共同错误单词替换为标志词,将所述共同错误单词的单词信息替换为标志单词信息,得到每个候选结果信息对应的替换候选结果,得到待分类组合;
利用预先训练得到的二分类模型,得到每个所述待分类组合中两条替换候选结果的优劣度;
根据各个所述待分类组合中两条替换候选结果的优劣度,对所述候选结果信息进行排序。


2.根据权利要求1所述的方法,其特征在于,所述识别所述候选组合的共同错误单词,包括:
获取所述候选组合中两条候选结果信息包括的各个单词的出现概率值;
将所述候选结果信息中出现概率值低于阈值的单词确定为错误单词,并确定出每个所述错误单词在对应的候选结果信息中出现的位置;
将所述候选组合中两条候选结果信息分别包括的错误单词以及各错误单词在对应的候选结果信息中出现的位置进行比对,识别出位于相同位置的相同错误单词作为所述候选组合对应的共同错误单词。


3.根据权利要求1或2所述的方法,其特征在于,所述利用预先训练得到的二分类模型,得到每个所述待分类组合中两条替换候选结果的优劣度,包括:
获取目标替换候选结果中所述识别文本单词序列对应的第一特征向量,所述目标替换候选结果分别为所述待分类组合中的每条替换候选结果;
获取所述目标替换候选结果中各个单词的单词信息对应的第二特征向量;
将所述第一特征向量与所述第二特征向量进行拼接,生成所述目标替换候选结果的特征表示;
将所述待分类组合中两条替换候选结果的特征表示输入预先训练得到的二分类模型,得到每个所述待分类组合中两条替换候选结果的优劣度。


4.根据权利要求3所述的方法,其特征在于,所述单词信息包括声学模型得分、语音模型得分、时长、置信度中的一个或多个;
所述获取所述目标替换候选结果中各个单词的单词信息对应的第二特征向量,包括:
将所述目标替换候选结果中各个单词的单词信息输入全连接网络,得到所述目标替换候选结果中各个单词的特征向量;
将所述目标替换候选结果中各个单词的特征向量进行拼接,生成所述目标替换候选结果中各个单词的单词信息对应的第二特征向量。


5.根据权利要求3所述的方法,其特征在于,所述将所述待分类组合中两条替换候选结果的特征表示输入预先训练得到的二分类模型,得到每个所述待分类组合中两条替换候选结果的优劣度,包括:
将所述待分类组合中两条替换候选结果的特征表示输入转换器模型的编码器部分,得到所述转换器模型的编码器部分输出的第一个隐层向量;
将所述第一个隐层向量输入预先训练得到的二分类模型,得到每个所述待分类组合中两条替换候选结果的优劣度。


6.根据权利要求1所述的方法,其特征在于,所述二分类模型的训练过程包括:
获取语音样本信息以及所述语音样本信息对应的标准识别文本;
对所述语音样本信息进行语音识别得到所述语音样本信息对应的训练候选结果信息,所述训练候选结果信息包括训练识别文本...

【专利技术属性】
技术研发人员:乔鹏程赵超陈伟
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1