一种智能饮水机的语音识别降噪方法技术

技术编号:29839398 阅读:20 留言:0更新日期:2021-08-27 14:29
本发明专利技术提供了一种智能饮水机的语音识别降噪方法,包括:根据语音采集指令进行声音采集,获得控制语音;勘测智能饮水机所处环境信息,获得环境信息;针对环境信息进行识别分析,得到环境信息识别结果;根据环境信息识别结果对控制语音进行分析确定噪声信息;在控制语音中根据噪声信息进行噪声抑制,得到目标控制语音。本发明专利技术提出的一种智能饮水机的语音识别降噪方法,针对采集的控制语音中环境声音进行降噪,获得目标控制语音,从而使得在对控制语音识别时只针对目标控制语音进行识别,进而避免智能饮水机在进行人机交互时出现控制混乱。

【技术实现步骤摘要】
一种智能饮水机的语音识别降噪方法
本专利技术涉及语音处理
,特别涉及一种智能饮水机的语音识别降噪方法。
技术介绍
随着智能手机的普及,人工智能的发展,智能化成为各行各业的发展方向,智能终端尤其是智能家居设备的普及,不仅提升了生活品质,人机交互也更加方便。饮水机的客户端软件在设计时结合当下人工智能背景,实现了人机交互,形成智能饮水机,不仅方便了用户操作,而且还优化了用户饮水。但是,在目前的智能饮水机实现人机交互的技术方案中,在采集控制语音时,会将环境中的声音一同采集进来,使得对控制语音进行识别时将环境声音也一并进行识别,从而导致识别结果会出现除目标控制语音以外的声音识别结果,导致智能饮水机在进行人机交互时出现控制混乱,因此,本专利技术提出一种智能饮水机的语音识别降噪方法,针对采集的控制语音中环境声音进行降噪,获得目标控制语音,从而使得在对控制语音识别时只针对目标控制语音进行识别,进而避免智能饮水机在进行人机交互时出现控制混乱。
技术实现思路
本专利技术的目的在于提供一种智能饮水机的语音识别降噪方法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种智能饮水机的语音识别降噪方法,包括:根据语音采集指令进行声音采集,获得控制语音;勘测智能饮水机所处环境信息,获得环境信息;针对所述环境信息进行识别分析,得到环境信息识别结果;根据所述环境信息识别结果对所述控制语音进行分析确定噪声信息;在所述控制语音中根据噪声信息进行噪声抑制,得到目标控制语音。进一步地,所述语音采集指令包括:通过声音采集音控词触发语音采集指令和通过操作动作触发语音采集指令。进一步地,所述勘测智能饮水机所处环境信息是通过针对所述智能饮水机所处环境进行图像采集得到环境信息,所述环境信息是视频的形式。进一步地,针对所述环境信息进行识别分析,得到环境信息识别结果,包括:确定进行声音采集在所述视频中对应的采集时间;根据所述采集时间在所述环境信息中将与所述采集时间对应的图像获取出来,得到控制语音采集环境图像;针对所述控制语音采集环境图像进行识别,获得环境信息识别结果。进一步地,针对所述控制语音采集环境图像进行识别时,基于控制语音采集环境图像的图像画面结合控制语音采集环境图像的图像声音进行识别,包括:在所述控制语音采集环境图像中,针对图像画面进行识别,将所述图像画面中的人或物识别来,获得图像画面信息;根据所述图像画面信息结合所述图像声音依次分析所述图像画面中的人或物是否为所述图像声音中的声音声源;如果所述图像画面中的人或物是所述图像声音中的声音声源,则将所述图像画面中的人或物对应的图像画面信息与图像声音对应匹配后共同构成环境识别结果。进一步地,根据所述环境信息识别结果对所述控制语音进行分析确定噪声信息时,在所述控制语音中依次对所述环境信息识别结果中的图像声音进行辨析,分辨所述图像声音在所述控制语音中是否出现,将所述控制语音中出现的图像声音在所述环境信息识别结果中确定出来,得到声音信息。进一步地,在所述控制语音中依次对所述环境信息识别结果中的图像声音进行辨析时通过声音的三要素属性进行分辨,所述声音的三要素属性包括:声音的响度、声音的音调和声音的音色,依次根据所述声音的响度、声音的音调和声音的音色在所述控制语音中分辨是否出现相符合的声音,分别获得声音响度分辨结果、声音音调分辨结果和声音音色分辨结果,综合所述声音响度分辨结果、声音音调分辨结果和声音音色分辨结果得到所述图像声音在所述控制语音中是否出现的分辨结果。进一步地,在所述控制语音中根据噪声信息进行噪声抑制,包括:对所述控制语音进行分割处理;将所述控制语音按照特定帧长进行语音帧分割,获得多个第一子语音,并针对所述第一分割子语音进行频率分析,按照预设频带进行划分,得到多个第二子语音;针对所述控制语音进行噪声抑制;确定所述第二子语音的频带功率,并根据所述频带功率确定所述第二子语音是否包含噪声,将包含噪声的第二子语音筛选出来;对包含噪声的第二子语音进行预估,并获得预估信号;根据所述预估信号确定所述包含噪声的第二子语音关于抑制噪声的频带分割信息,通过所述频带分割信息对所述包含噪声的第二子语音进行噪声抑制,从而获得无噪声的第二子语音;根据所述无噪声的第二子语音以及不包含噪声的第二子语音得到目标控制语音。进一步地,根据所述采集时间在所述环境信息中将与所述采集时间对应的图像获取出来的过程中,包括:将所述采集时间进行时间映射;G(m)=F(M)其中,G(m)表示所述采集时间的起始时刻在所述环境信息中视频的时间轴上的对应时刻,F表示所述采集时间与所述环境信息中视频的时间轴之间的映射关系,M表示所述采集时间的起始时刻;根据下述公式确定在所述环境信息中获取的控制语音采集环境图像;W={Di|i∈((0,T]-(0,G(m)))∩((0,T]-(F(M+t),T))}上述公式中,W表示控制语音采集环境图像,Di表示所述环境信息中视频的时间轴上i时刻的视频帧图像,i表示视频帧图像Di在所述环境信息中视频的时间轴上的对应时刻,t表示所述控制语音的长度,(0,T]表示所述环境信息中视频时间轴的时刻区间集合,T表示所述环境信息中视频的总时长。进一步地,在针对所述控制语音进行噪声抑制的过程中,所述对包含噪声的第二子语音进行预估,并获得预估信号,包括:确定包含噪声的第二子语音的频率信号序列,将所述包含噪声的第二子语音记为X(n);通过下述公式对所述包含噪声的第二子语音进行预估;上述公式中,Y(w)表示预估信号序列,L表示包含噪声的第二子语音的长度,a表示所述包含噪声的第二子语音起始时刻,b表示所述包含噪声的第二子语音末尾时刻,R表示预估次数,f(n)表示所述包含噪声的第二子语音中时刻与频率之间的拟合关系函数,e表示常数,i表示虚数,KA(n)表示第A次预估时所述包含噪声的第二子语音的窗函数,R表示预估总次数。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。附图说明附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:图1为本专利技术所述的语音分离方法步骤示意图;图2为本专利技术所述的语音分离方法中步骤三的步骤示意图;图3为本专利技术所述的语音分离方法中步骤三的S303的具体示意图;图4为本专利技术所述的语音分离方法中步骤五的步骤示意图。具体实施方式以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用本文档来自技高网...

【技术保护点】
1.一种智能饮水机的语音识别降噪方法,其特征在于,包括:/n根据语音采集指令进行声音采集,获得控制语音;/n勘测智能饮水机所处环境信息,获得环境信息;/n针对所述环境信息进行识别分析,得到环境信息识别结果;/n根据所述环境信息识别结果对所述控制语音进行分析确定噪声信息;/n在所述控制语音中根据噪声信息进行噪声抑制,得到目标控制语音。/n

【技术特征摘要】
1.一种智能饮水机的语音识别降噪方法,其特征在于,包括:
根据语音采集指令进行声音采集,获得控制语音;
勘测智能饮水机所处环境信息,获得环境信息;
针对所述环境信息进行识别分析,得到环境信息识别结果;
根据所述环境信息识别结果对所述控制语音进行分析确定噪声信息;
在所述控制语音中根据噪声信息进行噪声抑制,得到目标控制语音。


2.根据权利要求1所述的语音识别降噪方法,其特征在于,所述语音采集指令包括:通过声音采集音控词触发语音采集指令和通过操作动作触发语音采集指令。


3.根据权利要求1所述的语音识别降噪方法,其特征在于,所述勘测智能饮水机所处环境信息是通过针对所述智能饮水机所处环境进行图像采集得到环境信息,所述环境信息是视频的形式。


4.根据权利要求3所述的语音识别降噪方法,其特征在于,针对所述环境信息进行识别分析,得到环境信息识别结果,包括:
确定进行声音采集在所述视频中对应的采集时间;
根据所述采集时间在所述环境信息中将与所述采集时间对应的图像获取出来,得到控制语音采集环境图像;
针对所述控制语音采集环境图像进行识别,获得环境信息识别结果。


5.根据权利要求4所述的语音识别降噪方法,其特征在于,针对所述控制语音采集环境图像进行识别时,基于控制语音采集环境图像的图像画面结合控制语音采集环境图像的图像声音进行识别,包括:
在所述控制语音采集环境图像中,针对图像画面进行识别,将所述图像画面中的人或物识别来,获得图像画面信息;
根据所述图像画面信息结合所述图像声音依次分析所述图像画面中的人或物是否为所述图像声音中的声音声源;
如果所述图像画面中的人或物是所述图像声音中的声音声源,则将所述图像画面中的人或物对应的图像画面信息与图像声音对应匹配后共同构成环境识别结果。


6.根据权利要求1所述的语音识别降噪方法,其特征在于,根据所述环境信息识别结果对所述控制语音进行分析确定噪声信息时,在所述控制语音中依次对所述环境信息识别结果中的图像声音进行辨析,分辨所述图像声音在所述控制语音中是否出现,将所述控制语音中出现的图像声音在所述环境信息识别结果中确定出来,得到噪声信息。


7.根据权利要求6所述的语音识别降噪方法,其特征在于,在所述控制语音中依次对所述环境信息识别结果中的图像声音进行辨析时通过声音的三要素属性进行分辨,所述声音的三要素属性包括:声音的响度、声音的音调和声音的音色,依次根据所述声音的响度、声音的音调和声音的音色在所述控制语音中分辨是否出现相符合的声音,分别获得声音响度分辨结果、声音音调分辨结果和声音音色分辨结果,综合所述声音响度分辨结果...

【专利技术属性】
技术研发人员:陈芒
申请(专利权)人:深圳市传声智能科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1