确定目标识别文本的方法及装置制造方法及图纸

技术编号：15507929 阅读：196 留言：0更新日期：2017-06-04 02:25

本申请提供一种确定目标识别文本的方法及装置，该方法包括：确定待识别语音数据对应的至少两个候选识别文本中的确定识别文本和待确定识别文本，其中，确定识别文本为至少两个候选识别文本中相同的部分，待确定识别文本为至少两个候选识别文本中不相同的部分；计算待确定识别文本与目标对比文本的对应位置的文本之间的相似度，目标对比文本为预设文本库中与候选识别文本的句型结构一致的文本，且目标对比文本包括确定识别文本；进而将相似度中的最大值对应的待确定识别文本与确定识别文本组成的候选识别文本，配置为目标识别文本；实现了从候选识别文本中进一步筛选目标识别文本，提高了目标识别文本的准确性。

Method and device for determining target identification text

The present invention provides a method and apparatus for determining target text recognition, the method includes: identifying text and text recognition to be determined, which identifies at least two candidate text recognition to speech recognition data in the corresponding text, identifying at least two candidate for the same recognition of the text, text recognition is to be determined at least two candidate text recognition is not the same part; calculating to determine similarity between the text and the target text corresponding position recognition text contrast of the target text and contrast, the default candidate identification text library text sentence structure of the same, and the target text includes identifying text comparison; then the similarity in corresponding to the maximum value to be determined to identify text and identify candidate identification text recognition text, text configuration for target recognition is realized; The target recognition text is further filtered from candidate identification text, which improves the accuracy of target recognition text.

全部详细技术资料下载

【技术实现步骤摘要】
确定目标识别文本的方法及装置
本申请涉及语音识别技术，尤其涉及一种确定目标识别文本的方法及装置。
技术介绍
随着语音控制技术的发展，目前越来越多的智能设备具备语音识别功能，示例的，具备语音控制功能的智能电视、智能冰箱、智能空调等和具备语音输入功能的智能手机智能电脑等。目前的语音识别主要包含语音预处理、声学模型解码、发音词典解析、语言模型解码等过程，其中，语音预处理是将收到的语音信号进行简单的处理，得到语音的特征文件等；声学模型解码的输入是语音的特征文件，通过声学模型解码获取概率最高的音素文件；进而，通过查询发音词典，将音素信息转为成可能的文字组合，再通过语言模型的上下文关联信息，从文字组合中获取概率较高的文字组合信息作为候选识别结果。由于语言模型中语料来源较为广泛，候选识别结果无法保证识别结果的准确性，因此需要通过一些方法从中甄别出准确的识别结果。但是，现有技术中并没有合适的甄选方法。申请内容本申请提供一种确定目标识别文本的方法及装置，用于在待识别语音数据的候选识别结果中甄选出准确的识别结果。本申请第一方面提供一种从至少两个候选识别文本中确定目标识别文本的方法，包括：确定待识别语音数据对应的至少两个候选识别文本中的确定识别文本和待确定识别文本，其中，所述确定识别文本为至少两个所述候选识别文本中相同的部分，所述待确定识别文本为至少两个所述候选识别文本中不相同的部分；计算所述待确定识别文本与目标对比文本的对应位置的文本之间的相似度，其中，所述目标对比文本为预设文本库中与所述候选识别文本的句型结构一致的文本，且所述目标对比文本包括所述确定识别文本；将所述相似度中...
确定目标识别文本的方法及装置

【技术保护点】
一种从至少两个候选识别文本中确定目标识别文本的方法，其特征在于，包括：确定待识别语音数据对应的至少两个候选识别文本中的确定识别文本和待确定识别文本，其中，所述确定识别文本为至少两个所述候选识别文本中相同的部分，所述待确定识别文本为至少两个所述候选识别文本中不相同的部分；计算所述待确定识别文本与目标对比文本的对应位置的文本之间的相似度，其中，所述目标对比文本为预设文本库中与所述候选识别文本的句型结构一致的文本，且所述目标对比文本包括所述确定识别文本；将所述相似度中的最大值对应的所述待确定识别文本与所述确定识别文本组成的所述候选识别文本，配置为目标识别文本。

【技术特征摘要】
1.一种从至少两个候选识别文本中确定目标识别文本的方法，其特征在于，包括：确定待识别语音数据对应的至少两个候选识别文本中的确定识别文本和待确定识别文本，其中，所述确定识别文本为至少两个所述候选识别文本中相同的部分，所述待确定识别文本为至少两个所述候选识别文本中不相同的部分；计算所述待确定识别文本与目标对比文本的对应位置的文本之间的相似度，其中，所述目标对比文本为预设文本库中与所述候选识别文本的句型结构一致的文本，且所述目标对比文本包括所述确定识别文本；将所述相似度中的最大值对应的所述待确定识别文本与所述确定识别文本组成的所述候选识别文本，配置为目标识别文本。2.根据权利要求1所述的方法，其特征在于，所述确定待识别语音数据对应的至少两个候选识别文本中的确定识别文本和待确定识别文本之前，所述方法还包括：确定所述待识别语音数据对应的多个语音识别文本中的最大概率值和第二大概率值；当所述最大概率值和所述第二大概率值之间的差值小于预设的概率阈值时，从所述多个语音识别文本中确定至少两个候选识别文本。3.根据权利要求1或2所述的方法，其特征在于，所述从所述多个语音识别文本中确定至少两个候选识别文本，包括：获取所述多个语音识别文本中概率值与所述最大概率值的差值小于预设的概率阈值的第一语音识别文本；将所述第一语音识别文本和所述最大概率值对应的语音识别文本确定为所述至少两个候选识别文本。4.根据权利要求1所述的方法，其特征在于，所述计算所述待确定识别文本与目标对比文本的对应位置的文本之间的相似度，具体为：采用预设词向量模型，确定所述待确定识别文本与所述目标对比文本的对应位置的文本之间的语义相似度，其中，所述预设词向量模型用于通过词向量距离标识词汇间的语义相似度。5.根据权利要求4所述的方法，其特征在于，所述采用预设词向量模型，确定所述待确定识别文本与所述目标对比文本中对应位置的文本之间的语义相似度，具体为：当所述待确定识别文本包括至少两个词汇，采用所述预设词向量模型，分别确定所述待确定识别文本中各个词汇与目标对比文本中对应位置的...

【专利技术属性】
技术研发人员：陈仲帅，马宏，
申请(专利权)人：海信集团有限公司，
类型：发明
国别省市：山东,37

全部详细技术资料下载我是这个专利的主人