【技术实现步骤摘要】
本专利技术涉及语音
,尤其涉及一种语音识别方法和装置。
技术介绍
语音技术可以为人们提供非常方便的用户体验,尤其是在移动端和可穿戴设备上。目前语音识别技术主要是通过线上服务进行识别,但是如果在没有网络或者网络不稳定情况下,在线服务便不能够满足需求,并且传统的离线语音识别系统识别不具有拒识效果。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种语音识别方法,该方法具有很好的拒识效果。本专利技术的另一个目的在于提出一种语音识别装置。为达到上述目的,本专利技术第一方面实施例提出的语音识别方法,包括:获取待识别的语音信号的特征;根据所述特征在构图生成的搜索空间内进行路径搜索,输出解码结果;根据所述解码结果判断是否需要拒识;如果需要拒识,则确定语音识别结果是拒识,如果不需要拒识,则根据所述解码结果获取语音识别结果。本专利技术第一方面实施例提出的语音识别方法,通过判断是否需要拒识,在需要时进行拒识处理,可以具有较好的拒识效果,同时由于存在拒识情况,可以提高识别精度。为达到上述目的,本专利技术第二方面实施例提出的语音识别装置,包括:获取模块,用于获取待识别的语音信号的特征;解码模块,用于根据所述特征在构图生成的搜索空间内进行路径搜索,输出解码结果;判断模块,用于根据所述解码结果判断是否需要拒识;确定模块,用于如果需 ...
【技术保护点】
一种语音识别方法,其特征在于,包括:获取待识别的语音信号的特征;根据所述特征在构图生成的搜索空间内进行路径搜索,输出解码结果;根据所述解码结果判断是否需要拒识;如果需要拒识,则确定语音识别结果是拒识,如果不需要拒识,则根据所述解码结果获取语音识别结果。
【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:
获取待识别的语音信号的特征;
根据所述特征在构图生成的搜索空间内进行路径搜索,输出解码结果;
根据所述解码结果判断是否需要拒识;
如果需要拒识,则确定语音识别结果是拒识,如果不需要拒识,则根据所
述解码结果获取语音识别结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述解码结果判
断是否需要拒识,包括:
根据所述解码结果,统计垃圾词和反模型的数量、非意图对象的数量、
关键词的数量和句子长度,并获取每个关键词的置信度;
如果所述垃圾词和反模型的数量大于0,则判断出需要拒识;或者,
确定非意图对象的数量和关键词的数量之和与句子长度的比值,如果
所述比值小于预设比值,则判断出需要拒识;或者,
如果关键词的置信度小于预设置信度值,则判断出需要拒识。
3.根据权利要求1所述的方法,其特征在于,还包括:
获取开发者编辑的内容;
确定所述内容中的意图对象和非意图对象,并获取所述意图对象和非意图
对象对应的反模型和垃圾词模型;
根据所述开发者编辑的内容、所述反模型和垃圾词模型,构图生成搜索空
间。
4.根据权利要求3所述的方法,其特征在于,还包括:
获取语言模型,并在构图生成搜索空间时,在所述搜索空间的静音状态后
加入所述语言模型。
5.根据权利要求3或4所述的方法,其特征在于,还包括:
在所述搜索空间的路径结尾处加入预设标识,以便在路径搜索包含所述预
设标识时,即时输出解码结果。
6.根据权利要求1所述的方法,其特征在于,所述获取待识别的语音信
号的特征,包括:
获取待识别的语音信号;
对所述语音信号进行前端信号处理,所述前端信号处理包括:低频去噪,
和/或,信号增强;
对前端信号处理后的语音信号进行VAD;
对VAD检测出的语音信号进行特征提取,获取所述语音信号的特征。
7.根据权利要求1所述的方法,其特征在于,还包括:
在获取语音识别结果后,重置语音识别的场景。
8.一种语音识别装置,其特征在于,包括:...
【专利技术属性】
技术研发人员:袁斌,彭守业,徐杨飞,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。