本申请提供了一种语音识别的后处理方法、装置和计算机设备,识别系统首先获取语音识别模型输出的序列矩阵,以及预设的候选词列表,其中,候选词列表包含多个候选词。识别系统根据各个候选词各自在序列矩阵的候选词路径之和,分别计算得到各个候选词对应的候选词得分。最后,控制系统根据各个候选词各自对应的候选词得分以及候选词长度,筛选得到语音识别的最终结果。本申请通过在预设的候选词列表的基础上,对序列矩阵进行筛选,从而减少了候选词路径的搜索规模,提高了搜索速度。并在筛选语音识别的最终结果时,综合了各个候选词的候选词得分以及候选词长度,从而规避了识别结果偏向于候选词长度较短的不足,有效提高了语音识别的准确率。识别的准确率。识别的准确率。
【技术实现步骤摘要】
语音识别的后处理方法、装置和计算机设备
[0001]本申请涉及语音识别
,特别涉及一种语音识别的后处理方法、装置和计算机设备。
技术介绍
[0002]唤醒词、命令词识别属于语音识别领域,广泛应用于智能家居、智能终端等场景。现有唤醒词、命令词模型在应用时,实时检测用户的语音,当检测到特定词汇时,即做出反馈。语音识别一般的后处理方式为:在语音识别模型输出的解码空间(比如CTC方式为神经网络输出的音素概率矩阵,大小是序列长度*音素类数的矩阵)搜索最优路径,该最优路径即为最终的识别结果。
[0003]在解码空间搜索最优路径时,其基本原理为概率值相乘从而得到路径的得分,这种处理方式就决定了命令词长度短的候选词的路径,相比命令词长的候选词的路径,在相同条件下,可获得更高的分值(比如命令词“你好”“你好,XX”,则“你好”会获得更高的分值从而被判定为最终识别结果),从而有可能出现命令词误识别,严重影响了语音识别的准确度。
技术实现思路
[0004]本申请的主要目的为提供一种语音识别的后处理方法、装置和计算机设备,旨在解决现有语音识别的准确度不高的弊端。
[0005]为实现上述目的,本申请提供了一种语音识别的后处理方法,包括:获取语音识别模型输出的序列矩阵,以及预设的候选词列表,所述候选词列表包含多个候选词;根据各所述候选词各自在所述序列矩阵的候选词路径之和,分别计算得到各所述候选词对应的候选词得分;根据各所述候选词各自对应的候选词得分以及候选词长度,筛选得到语音识别的最终结果。
[0006]本申请还提供了一种语音识别的后处理装置,包括:获取模块,用于获取语音识别模型输出的序列矩阵,以及预设的候选词列表,所述候选词列表包含多个候选词;计算模块,用于根据各所述候选词各自在所述序列矩阵的候选词路径之和,分别计算得到各所述候选词对应的候选词得分;筛选模块,用于根据各所述候选词各自对应的候选词得分以及候选词长度,筛选得到语音识别的最终结果。
[0007]本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
[0008]本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程
序被处理器执行时实现上述任一项所述的方法的步骤。
[0009]本申请中提供的一种语音识别的后处理方法、装置和计算机设备,识别系统首先获取语音识别模型输出的序列矩阵,以及预设的候选词列表,其中,候选词列表包含多个候选词。识别系统根据各个候选词各自在序列矩阵的候选词路径之和,分别计算得到各个候选词对应的候选词得分。最后,控制系统根据各个候选词各自对应的候选词得分以及候选词长度,筛选得到语音识别的最终结果。本申请通过在预设的候选词列表的基础上,对序列矩阵进行筛选,从而减少了候选词路径的搜索规模,提高了搜索速度。并在筛选语音识别的最终结果时,综合了各个候选词的候选词得分以及候选词长度,从而规避了识别结果偏向于候选词长度较短的不足,有效提高了语音识别的准确率。
附图说明
[0010]图1是本申请一实施例中语音识别的后处理方法的步骤示意图;图2是本申请一实施例中语音识别的后处理装置的整体结构框图;图3是本申请一实施例的计算机设备的结构示意框图。
[0011]本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0012]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0013]参照图1,本申请一实施例中提供了一种语音识别的后处理方法,包括:S1:获取语音识别模型输出的序列矩阵,以及预设的候选词列表,所述候选词列表包含多个候选词;S2:根据各所述候选词各自在所述序列矩阵的候选词路径之和,分别计算得到各所述候选词对应的候选词得分;S3:根据各所述候选词各自对应的候选词得分以及候选词长度,筛选得到语音识别的最终结果。
[0014]本实施例中,用户将语音数据输入语音识别模型,语音识别模型对语音数据进行相应处理后,输出该语音数据对应的序列矩阵(以ctc(Connectionist Temporal Classification)方式为例,语音识别模型输出的序列矩阵为音素概率矩阵,大小是序列长度*音素类数的矩阵)。识别系统对语音识别模型输出的序列矩阵进行后处理,从而识别得到最终结果。具体地,识别系统调取预设的候选词列表,该候选词列表包含厂家预设或用户自定义的多个候选词(比如语音系统应用于空调机,其预设的候选词总共有4个:“打开空调”、“关闭空调”、“升高温度”、“降低温度”,则这4个候选词组成候选词列表)。识别系统首先剔除序列矩阵轴的无效列,然后在剔除无效列后的序列矩阵的基础上,分别获取各个候选词在序列矩阵上映射的所有候选词路径的得分总和,从而得到各个候选词对应的候选词得分。识别系统首先通过剔除无效列,减少了序列矩阵的规模;然后基于预设的候选词列表在序列矩阵上进行得分计算,相较于现有技术中需要遍历整个序列矩阵、从而计算序列矩阵上所有路径的得分,能够进一步减少路径搜索的规模,从而大幅度提高了搜索速度。在得
到各个候选词对应的候选词得分后,识别系统将各个候选词按照各自对应的候选词得分进行降序排列,形成候选词得分列表。然后按照候选词得分列表的排序依次遍历各个候选词,根据预设规则对各个候选词的候选词得分以及候选词长度进行处理,在两个候选词的候选词长度不同时,对候选词长度较长的候选词得分(或者候选词长度较短的候选词得分)进行修正,规避候选词长度对候选词得分的影响,最后进行得分比较筛选得到语音识别的最终结果。
[0015]本实施例中,识别系统通过在预设的候选词列表的基础上,对序列矩阵进行筛选,从而减少了候选词路径的搜索规模,提高了搜索速度。并在筛选语音识别的最终结果时,综合了各个候选词的候选词得分以及候选词长度,从而规避了识别结果偏向于候选词长度较短的不足,有效提高了语音识别的准确率。
[0016]进一步的,所述根据各所述候选词各自在所述序列矩阵的候选词路径之和,分别计算得到各所述候选词对应的候选词得分的步骤,包括:S201:从所述序列矩阵中剔除无效列,并根据剔除所述无效列后的序列矩阵获取各所述候选词各自对应的所有候选词路径的得分总和,所述无效列表征所述序列矩阵中有效信息达不到预设要求的列;S202:获取各所述候选词对应的有效长度,并将所述得分总和除以所述有效长度,得到各所述候选词对应的候选词得分。
[0017]优选的,所述获取各所述候选词对应的有效长度的步骤,单个所述候选词的有效长度的获取步骤为:S2021:调取窗口长度,并计算所述窗口长度与所述候选词对应的得分总和之间的差值,得到所述候选词的有效长度,所述窗口长度与所述语音识别模型的输入语音数据相关联。
[0018]本实施例中,识别系统从序列矩阵中识别出所有bl本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种语音识别的后处理方法,其特征在于,包括:获取语音识别模型输出的序列矩阵,以及预设的候选词列表,所述候选词列表包含多个候选词;根据各所述候选词各自在所述序列矩阵的候选词路径之和,分别计算得到各所述候选词对应的候选词得分;根据各所述候选词各自对应的候选词得分以及候选词长度,筛选得到语音识别的最终结果。2.根据权利要求1所述的语音识别的后处理方法,其特征在于,所述根据各所述候选词各自在所述序列矩阵的候选词路径之和,分别计算得到各所述候选词对应的候选词得分的步骤,包括:从所述序列矩阵中剔除无效列,并根据剔除所述无效列后的序列矩阵获取各所述候选词各自对应的所有候选词路径的得分总和,所述无效列表征所述序列矩阵中有效信息达不到预设要求的列;获取各所述候选词对应的有效长度,并将所述得分总和除以所述有效长度,得到各所述候选词对应的候选词得分。3.根据权利要求2所述的语音识别的后处理方法,其特征在于,所述从所述序列矩阵中剔除无效列的步骤,包括:识别所述序列矩阵中blank对应的分数值是否大于第一阈值;若所述序列矩阵中blank对应的分数值大于第一阈值,则将所述blank所在的列判定为所述无效列。4.根据权利要求2所述的语音识别的后处理方法,其特征在于,所述获取各所述候选词对应的有效长度的步骤,单个所述候选词的有效长度的获取步骤为:调取窗口长度,并计算所述窗口长度与所述候选词对应的得分总和之间的差值,得到所述候选词的有效长度,所述窗口长度与所述语音识别模型的输入语音数据相关联。5.根据权利要求1所述的语音识别的后处理方法,其特征在于,所述根据各所述候选词各自对应的候选词得分以及候选词长度,筛选得到语音识别的最终结果的步骤,包括:将各所述候选词按照各自对应的候选词得分从大到小进行排序,形成候选词得分列表,并将各所述候选词的候选词长度对应标注在所述候选词得分列表上;依次遍历所述候选词得分列表中的各所述候选词,判断排序第一的候选词对应的第一候选词得分是否大于第二阈值;若所述排序第一的候选词对应的第一候选词得分大于第二阈值,则判断排序第二的候选词对应的第二候选词得分是否大于所述第二阈值;若排序第二的候选词对应的第二候选...
【专利技术属性】
技术研发人员:李杰,王广新,杨汉丹,
申请(专利权)人:深圳市友杰智新科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。