The present invention provides a method and apparatus for determining target text recognition, the method includes: identifying text and text recognition to be determined, which identifies at least two candidate text recognition to speech recognition data in the corresponding text, identifying at least two candidate for the same recognition of the text, text recognition is to be determined at least two candidate text recognition is not the same part; calculating to determine similarity between the text and the target text corresponding position recognition text contrast of the target text and contrast, the default candidate identification text library text sentence structure of the same, and the target text includes identifying text comparison; then the similarity in corresponding to the maximum value to be determined to identify text and identify candidate identification text recognition text, text configuration for target recognition is realized; The target recognition text is further filtered from candidate identification text, which improves the accuracy of target recognition text.
【技术实现步骤摘要】
确定目标识别文本的方法及装置
本申请涉及语音识别技术,尤其涉及一种确定目标识别文本的方法及装置。
技术介绍
随着语音控制技术的发展,目前越来越多的智能设备具备语音识别功能,示例的,具备语音控制功能的智能电视、智能冰箱、智能空调等和具备语音输入功能的智能手机智能电脑等。目前的语音识别主要包含语音预处理、声学模型解码、发音词典解析、语言模型解码等过程,其中,语音预处理是将收到的语音信号进行简单的处理,得到语音的特征文件等;声学模型解码的输入是语音的特征文件,通过声学模型解码获取概率最高的音素文件;进而,通过查询发音词典,将音素信息转为成可能的文字组合,再通过语言模型的上下文关联信息,从文字组合中获取概率较高的文字组合信息作为候选识别结果。由于语言模型中语料来源较为广泛,候选识别结果无法保证识别结果的准确性,因此需要通过一些方法从中甄别出准确的识别结果。但是,现有技术中并没有合适的甄选方法。申请内容本申请提供一种确定目标识别文本的方法及装置,用于在待识别语音数据的候选识别结果中甄选出准确的识别结果。本申请第一方面提供一种从至少两个候选识别文本中确定目标识别文本的方法,包括:确定待识别语音数据对应的至少两个候选识别文本中的确定识别文本和待确定识别文本,其中,所述确定识别文本为至少两个所述候选识别文本中相同的部分,所述待确定识别文本为至少两个所述候选识别文本中不相同的部分;计算所述待确定识别文本与目标对比文本的对应位置的文本之间的相似度,其中,所述目标对比文本为预设文本库中与所述候选识别文本的句型结构一致的文本,且所述目标对比文本包括所述确定识别文本;将所述相似度中 ...
【技术保护点】
一种从至少两个候选识别文本中确定目标识别文本的方法,其特征在于,包括:确定待识别语音数据对应的至少两个候选识别文本中的确定识别文本和待确定识别文本,其中,所述确定识别文本为至少两个所述候选识别文本中相同的部分,所述待确定识别文本为至少两个所述候选识别文本中不相同的部分;计算所述待确定识别文本与目标对比文本的对应位置的文本之间的相似度,其中,所述目标对比文本为预设文本库中与所述候选识别文本的句型结构一致的文本,且所述目标对比文本包括所述确定识别文本;将所述相似度中的最大值对应的所述待确定识别文本与所述确定识别文本组成的所述候选识别文本,配置为目标识别文本。
【技术特征摘要】
1.一种从至少两个候选识别文本中确定目标识别文本的方法,其特征在于,包括:确定待识别语音数据对应的至少两个候选识别文本中的确定识别文本和待确定识别文本,其中,所述确定识别文本为至少两个所述候选识别文本中相同的部分,所述待确定识别文本为至少两个所述候选识别文本中不相同的部分;计算所述待确定识别文本与目标对比文本的对应位置的文本之间的相似度,其中,所述目标对比文本为预设文本库中与所述候选识别文本的句型结构一致的文本,且所述目标对比文本包括所述确定识别文本;将所述相似度中的最大值对应的所述待确定识别文本与所述确定识别文本组成的所述候选识别文本,配置为目标识别文本。2.根据权利要求1所述的方法,其特征在于,所述确定待识别语音数据对应的至少两个候选识别文本中的确定识别文本和待确定识别文本之前,所述方法还包括:确定所述待识别语音数据对应的多个语音识别文本中的最大概率值和第二大概率值;当所述最大概率值和所述第二大概率值之间的差值小于预设的概率阈值时,从所述多个语音识别文本中确定至少两个候选识别文本。3.根据权利要求1或2所述的方法,其特征在于,所述从所述多个语音识别文本中确定至少两个候选识别文本,包括:获取所述多个语音识别文本中概率值与所述最大概率值的差值小于预设的概率阈值的第一语音识别文本;将所述第一语音识别文本和所述最大概率值对应的语音识别文本确定为所述至少两个候选识别文本。4.根据权利要求1所述的方法,其特征在于,所述计算所述待确定识别文本与目标对比文本的对应位置的文本之间的相似度,具体为:采用预设词向量模型,确定所述待确定识别文本与所述目标对比文本的对应位置的文本之间的语义相似度,其中,所述预设词向量模型用于通过词向量距离标识词汇间的语义相似度。5.根据权利要求4所述的方法,其特征在于,所述采用预设词向量模型,确定所述待确定识别文本与所述目标对比文本中对应位置的文本之间的语义相似度,具体为:当所述待确定识别文本包括至少两个词汇,采用所述预设词向量模型,分别确定所述待确定识别文本中各个词汇与目标对比文本中对应位置的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。