本发明专利技术公开了一种语音识别方法及装置,其中,该方法包括:获取并识别语音信息;判断该语音信息与预先提取的预定用户的声音特征是否相符;在判断结果为是的情况下,确定该语音信息为该预定用户的语音信息,解决了相关技术中语音识别受其他声音影响导致误识别率高的问题,降低了误识别率。
【技术实现步骤摘要】
本专利技术涉及通信领域,具体而言,涉及一种语音识别方法及装置。
技术介绍
随着苹果siri的发布,智能语音应用进入了爆发式的发展,对于语音应用来说,语音识别的成功率是衡量语音应用的一个重要指标,目前语音识别都是获取到声音的输入,然后根据输入的声音来进行相应的识别,然而目前的语音应用都无法区分出是用户说话的声音,还是周围的环境噪声,或者是其他人的声音,这就导致了一个问题,在安静的环境下,语音应用的识别成功率都很高,而一旦在实际的使用场景中,一旦周围有突发的环境噪音,或者其他人的人声都会触发语音应用开始识别,导致语音应用误触发,从而出现识别成功率大幅下降的情况。目前的语音识别都有一个置信度的概念,即将用户说话的录音与引擎预置的经过大数据量培训后的标准数据进行匹配,置信度越高代表越正确。而语音应用就是根据自己的情况确定一个置信度作为标准,超过这个标准认为识别正确,低于这个标准认为识别不正确。由于语音应用是通过置信度的方式来判断识别成功或者失败的,置信度阈值设置低,识别容易,用户的命令不需要说的很标准,声音也不需要很响亮,就可以得到识别结果,但是也更容易将周围噪音当成用户声音进行识别,从而导致了误识别的发生,降低了识别率;置信度阈值设置高,识别精准,受噪音影响小,但是用户命令需要说的很标准,同时声音响亮,才能识别成功,很多时候用户明明已经说的很清楚,但是仍然没有通过置信度阈值,导致识别失败。置信度的方式是没有办法区分是否是用户自己说出的命令还是其他的人声,在实际的使用场景中,比如在驾驶环境中,在其他人说话的情况下,也很容易会导致语音应用开始误识别,出现识别率降低的情况。针对相关技术中语音识别受其他声音影响导致误识别率高的问题,还未提出有效的解决方案。
技术实现思路
本专利技术提供了一种语音识别方法及装置,以至少解决相关技术中语音识别受其他声音影响导致误识别率高的问题。根据本专利技术的一个方面,提供了一种语音识别方法,包括:获取并识别语音信息;判断所述语音信息与预先提取的预定用户的声音特征是否相符;在判断结果为是的情况下,确定所述语音信息为所述预定用户的语音信息。进一步地,在确定所述语音信息为所述预定用户的语音信息之后,所述方法还包括:判断所述语音信息的置信度是否超过预设阈值;在判断结果为是的情况下,确定所述语音信息为所述预定用户下达的指令;在判断结果为否的情况下,丢弃所述语音信息。进一步地,在确定所述语音信息为所述预定用户下达的指令之后,所述方法还包括:执行所述语音信息对应的指令。进一步地,在判断所述语音信息与预先提取的预定用户的声音特征是否相符之前,所述方法还包括:通过重复获取相同的录音提取所述录音的声音特征;保存提取的所述声音特征。进一步地,在保存提取的所述声音特征之前,所述方法还包括:确定所述声音特征的置信度超过预设阈值。根据本专利技术的另一方面,还提供了一种语音识别装置,包括:获取模块,用于获取并识别语音信息;第一判断模块,用于判断所述语音信息与预先提取的预定用户的声音特征是否相符;第一确定模块,用于在判断结果为是的情况下,确定所述语音信息为所述预定用户的语音信息。进一步地,所述装置还包括:第二判断模块,用于判断所述语音信息的置信度是否超过预设阈值;第二确定模块,用于在判断结果为是的情况下,确定所述语音信息为所述预定用户下达的指令;丢弃模块,用于在判断结果为否的情况下,丢弃所述语音信息。进一步地,所述装置还包括:执行模块,用于执行所述语音信息对应的指令。进一步地,所述装置还包括:重复获取模块,用于通过重复获取相同的录音提取所述录音的声音特征;保存模块,用于保存提取的所述声音特征。进一步地,所述装置还包括:第三确定模块,用于确定所述声音特征的置信度超过预设阈值。通过本专利技术,采用获取并识别语音信息;判断所述语音信息与预先提取的预定用户的声音特征是否相符;在判断结果为是的情况下,确定所述语音信息为所述预定用户的语音信息,解决了相关技术中语音识别受其他声音影响导致误识别率高的问题,降低了误识别率。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的语音识别方法的流程图;图2是根据本专利技术实施例的语音识别装置的框图;图3是根据本专利技术优选实施例的语音识别装置的框图一;图4是根据本专利技术实施例的提取声音特征的示意图;图5是根据本专利技术实施例的语音识别的示意图。具体实施方式下文中将参考附图并结合实施例来详细说明本专利技术。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。本专利技术实施例提供了一种语音识别方法,图1是根据本专利技术实施例的语音识别方法的流程图,如图1所示,包括:步骤S102,获取并识别语音信息;步骤S104,判断该语音信息与预先提取的预定用户的声音特征是否相符;步骤S106,在判断结果为是的情况下,确定该语音信息为该预定用户的语音信息。通过上述步骤,获取并识别语音信息;判断该语音信息与预先提取的预定用户的声音特征是否相符;在判断结果为是的情况下,确定该语音信息为该预定用户的语音信息,解决了相关技术中语音识别受其他声音影响导致误识别率高的问题,降低了误识别率。在确定该语音信息为该预定用户的语音信息之后,判断该语音信息的置信度是否超过预设阈值;在判断结果为是的情况下,确定该语音信息为该预定用户下达的指令;在判断结果为否的情况下,丢弃该语音信息。在确定该语音信息为该预定用户下达的指令之后,执行该语音信息对应的指令,例如根据指令触发某应用。在判断该语音信息与预先提取的预定用户的声音特征是否相符之前,通过重复获取相同的录音提取该录音的声音特征;保存提取的该声音特征。在保存提取的该声音特征之前,确定该声音特征的置信度超过预设阈值。本专利技术实施例还提供了一种语音识别装置,图2是根据本专利技术实施例的语音识别装置的框图,如图2所示,包括:获取模块22,用于获取并识别语音信息;第一判断模块24,用于判断该语音信息与预先提取的预定用户的声音特征是否相符;第一确定模块26,用于在判断结果为是的情况下,确定该语音信息为该预定用户的语音信息。图3是根据本专利技术优选实施例的语音识别装置的框图一,如图3所示,该装置还包括:第二判断模块32,用于判断该语音信息的置信度是否超过预设阈值;第二确定模块34,用于在判断结果为是的情况下,确定该语音信息为该预定用户下达的指令;丢弃模块36,用于在判断结果为否的情况下,丢弃该语音信息。进一步地,该装置还包括:执行模块,用于执行该语音信息对应的指令。进一步地,该装置还包括:重复获取模块,用于通过重复获取相同的录音提取该录音的声音特征;保存模块,用于保存提取的该声音特征。进一步地,该装置还包括:第三确定模块,用于确定该声音特征的置信度超过预设阈值。针对相关技术中存在的上述问题,下面结合具体的可选实施例进行进一步说明,下述可选实施例结合了上述可选实施例及其可选实施方式。本专利技术实施例包含的有以下几个部分,声纹提取模块,声纹特征库,声纹辨别模块,语音识别模块,控制模块和录音管理模块,其功能由上述的获取模块22,第一判断模块24,第一确定模块26,第二判断模块32,本文档来自技高网...
【技术保护点】
一种语音识别方法,其特征在于,包括:获取并识别语音信息;判断所述语音信息与预先提取的预定用户的声音特征是否相符;在判断结果为是的情况下,确定所述语音信息为所述预定用户的语音信息。
【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:获取并识别语音信息;判断所述语音信息与预先提取的预定用户的声音特征是否相符;在判断结果为是的情况下,确定所述语音信息为所述预定用户的语音信息。2.根据权利要求1所述的方法,其特征在于,在确定所述语音信息为所述预定用户的语音信息之后,所述方法还包括:判断所述语音信息的置信度是否超过预设阈值;在判断结果为是的情况下,确定所述语音信息为所述预定用户下达的指令;在判断结果为否的情况下,丢弃所述语音信息。3.根据权利要求2所述的方法,其特征在于,在确定所述语音信息为所述预定用户下达的指令之后,所述方法还包括:执行所述语音信息对应的指令。4.根据权利要求1所述的方法,其特征在于,在判断所述语音信息与预先提取的预定用户的声音特征是否相符之前,所述方法还包括:通过重复获取相同的录音提取所述录音的声音特征;保存提取的所述声音特征。5.根据权利要求4所述的方法,其特征在于,在保存提取的所述声音特征之前,所述方法还包括:确定所述声音特征的置信度超...
【专利技术属性】
技术研发人员:曾一庭,
申请(专利权)人:中兴通讯股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。