【技术实现步骤摘要】
一种语音识别候选结果的排序方法及装置
本申请涉及语音识别
,具体涉及一种语音识别候选结果的排序方法及装置。
技术介绍
目前,在语音识别的过程中,首先进行语音信息的转化,得到语音信息对应的多个候选结果信息,再对得到的多个候选结果信息进行排序,最终通过排序结果中最优的候选结果信息得到语音识别结果。但是,现有的对于候选结果信息的排序方法存在着排序结果不准确的问题,使得通过排序结果得到的最优的候选结果信息并不准确,导致语音识别结果与语音信息存在着较大的偏差。
技术实现思路
有鉴于此,本申请实施例提供一种语音识别候选结果的排序方法及装置,能够对候选结果信息进行较为准确的排序,通过排序结果得到较为准确的语音识别结果。为解决上述问题,本申请实施例提供的技术方案如下:一种语音识别候选结果的排序方法,所述方法还包括:获取语音识别的候选结果信息,每个所述候选结果信息包括识别文本单词序列以及所述识别文本单词序列中各个单词的单词信息;将识别得到的候选结果信息进行两两组合,生成至少一个候选组合;识别所述候选组合的共同错误单词,所述共同错误单词为该候选组合包括的两个候选结果信息共同具有的且位置相同的错误单词;将所述候选组合中的每个候选结果信息包括的共同错误单词替换为标志词,将所述共同错误单词的单词信息替换为标志单词信息,得到每个候选结果信息对应的替换候选结果,得到待分类组合;利用预先训练得到的二分类模型,得到每个所述待分类组合中两条替换候选结果的优劣度;< ...
【技术保护点】
1.一种语音识别候选结果的排序方法,其特征在于,所述方法还包括:/n获取语音识别的候选结果信息,每个所述候选结果信息包括识别文本单词序列以及所述识别文本单词序列中各个单词的单词信息;/n将识别得到的候选结果信息进行两两组合,生成至少一个候选组合;/n识别所述候选组合的共同错误单词,所述共同错误单词为该候选组合包括的两个候选结果信息共同具有的且位置相同的错误单词;/n将所述候选组合中的每个候选结果信息包括的共同错误单词替换为标志词,将所述共同错误单词的单词信息替换为标志单词信息,得到每个候选结果信息对应的替换候选结果,得到待分类组合;/n利用预先训练得到的二分类模型,得到每个所述待分类组合中两条替换候选结果的优劣度;/n根据各个所述待分类组合中两条替换候选结果的优劣度,对所述候选结果信息进行排序。/n
【技术特征摘要】
1.一种语音识别候选结果的排序方法,其特征在于,所述方法还包括:
获取语音识别的候选结果信息,每个所述候选结果信息包括识别文本单词序列以及所述识别文本单词序列中各个单词的单词信息;
将识别得到的候选结果信息进行两两组合,生成至少一个候选组合;
识别所述候选组合的共同错误单词,所述共同错误单词为该候选组合包括的两个候选结果信息共同具有的且位置相同的错误单词;
将所述候选组合中的每个候选结果信息包括的共同错误单词替换为标志词,将所述共同错误单词的单词信息替换为标志单词信息,得到每个候选结果信息对应的替换候选结果,得到待分类组合;
利用预先训练得到的二分类模型,得到每个所述待分类组合中两条替换候选结果的优劣度;
根据各个所述待分类组合中两条替换候选结果的优劣度,对所述候选结果信息进行排序。
2.根据权利要求1所述的方法,其特征在于,所述识别所述候选组合的共同错误单词,包括:
获取所述候选组合中两条候选结果信息包括的各个单词的出现概率值;
将所述候选结果信息中出现概率值低于阈值的单词确定为错误单词,并确定出每个所述错误单词在对应的候选结果信息中出现的位置;
将所述候选组合中两条候选结果信息分别包括的错误单词以及各错误单词在对应的候选结果信息中出现的位置进行比对,识别出位于相同位置的相同错误单词作为所述候选组合对应的共同错误单词。
3.根据权利要求1或2所述的方法,其特征在于,所述利用预先训练得到的二分类模型,得到每个所述待分类组合中两条替换候选结果的优劣度,包括:
获取目标替换候选结果中所述识别文本单词序列对应的第一特征向量,所述目标替换候选结果分别为所述待分类组合中的每条替换候选结果;
获取所述目标替换候选结果中各个单词的单词信息对应的第二特征向量;
将所述第一特征向量与所述第二特征向量进行拼接,生成所述目标替换候选结果的特征表示;
将所述待分类组合中两条替换候选结果的特征表示输入预先训练得到的二分类模型,得到每个所述待分类组合中两条替换候选结果的优劣度。
4.根据权利要求3所述的方法,其特征在于,所述单词信息包括声学模型得分、语音模型得分、时长、置信度中的一个或多个;
所述获取所述目标替换候选结果中各个单词的单词信息对应的第二特征向量,包括:
将所述目标替换候选结果中各个单词的单词信息输入全连接网络,得到所述目标替换候选结果中各个单词的特征向量;
将所述目标替换候选结果中各个单词的特征向量进行拼接,生成所述目标替换候选结果中各个单词的单词信息对应的第二特征向量。
5.根据权利要求3所述的方法,其特征在于,所述将所述待分类组合中两条替换候选结果的特征表示输入预先训练得到的二分类模型,得到每个所述待分类组合中两条替换候选结果的优劣度,包括:
将所述待分类组合中两条替换候选结果的特征表示输入转换器模型的编码器部分,得到所述转换器模型的编码器部分输出的第一个隐层向量;
将所述第一个隐层向量输入预先训练得到的二分类模型,得到每个所述待分类组合中两条替换候选结果的优劣度。
6.根据权利要求1所述的方法,其特征在于,所述二分类模型的训练过程包括:
获取语音样本信息以及所述语音样本信息对应的标准识别文本;
对所述语音样本信息进行语音识别得到所述语音样本信息对应的训练候选结果信息,所述训练候选结果信息包括训练识别文本...
【专利技术属性】
技术研发人员:乔鹏程,赵超,陈伟,
申请(专利权)人:北京搜狗科技发展有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。