语音识别方法、语音识别装置和电子设备制造方法及图纸

技术编号:22078657 阅读:28 留言:0更新日期:2019-09-12 15:09
本公开提供了一种语音识别方法,包括:利用位置传感器获取声源位置信息;利用麦克风阵列定向获取一个或多个与所述声源位置信息对应的位置发出的一个或多个声音信号;基于所述一个或多个声音信号,确定目标声音信号;以及,基于所述目标声音信号进行语音识别,得到语音识别结果。本公开还提供了一种语音识别装置和电子设备。

Speech Recognition Method, Speech Recognition Device and Electronic Equipment

【技术实现步骤摘要】
语音识别方法、语音识别装置和电子设备
本公开涉及一种语音识别方法、语音识别装置和电子设备。
技术介绍
语音识别(SpeechRecognition)技术的目标是以计算机自动将人类的语音内容转换为相应的文字,近年来,随着人工智能(AI)和深度学习领域的不断发展,语音识别的探索也获得了巨大的进步。现有技术中,电子设备通常通过麦克风阵列进行声音信号的获取,再对获取到的声音信号进行语音识别。当处于高噪声、人多、嘈杂的环境中时,该方法所获取到的声音信号包含大量噪声,导致语音识别结果不准确。
技术实现思路
本公开的一个方面提供了一种语音识别方法,包括:利用位置传感器获取声源位置信息;利用麦克风阵列定向获取一个或多个与所述声源位置信息对应的位置发出的一个或多个声音信号;基于所述一个或多个声音信号,确定目标声音信号;以及,基于所述目标声音信号进行语音识别,得到语音识别结果。可选地,上述位置传感器为雷达传感器。所述利用位置传感器获取声源位置信息包括:利用所述雷达传感器在预定区域范围内扫描;基于所述雷达传感器的回波信号识别所述预定区域范围内存在的人体;以及,获取所识别的每个人体的头部位置信息。可选地,上述基于所述雷达传感器的回波信号识别所述预定区域范围内存在的人体包括:根据回波信号的多普勒效应识别所述预定区域范围内存在的人体。上述获取所识别的每个人体的头部位置信息包括:对于所识别的任一人体,将与该人体对应的第一回波信号的强度分布特征输入至头部识别模型,经由所述头部识别模型确定与该人体的头部对应的第二回波信号;以及,将所述第二回波信号的反射位置信息作为该人体的头部位置信息,其中,所述头部识别模型是以多个与人体头部对应的第二回波信号的强度分布特征作为样本数据经过训练得到的。可选地,上述位置传感器为飞行时间传感器。上述利用位置传感器获取声源位置信息包括:利用所述飞行时间传感器获取预定区域范围内的深度信息;以及,基于所述深度信息确定所述预定区域范围内存在的每个人体的头部位置信息。可选地,上述利用麦克风阵列定向获取一个或多个与所述声源位置信息对应的位置发出的一个或多个声音信号包括:对于任一声源位置信息,利用所述麦克风阵列基于波束赋形定向接收与该声源位置信息对应的位置发出的声音信号。可选地,当获取到多个声源位置信息时,在所述利用麦克风阵列定向获取一个或多个与所述声源位置信息对应的位置发出的一个或多个声音信号之前,所述方法还包括:基于预设规则从所述多个声源位置信息中确定一个目标声源位置信息;所述利用麦克风阵列定向获取一个或多个与所述声源位置信息对应的位置发出的一个或多个声音信号包括:利用所述麦克风阵列定向获取与所述目标声源位置信息对应的位置发出的声音信号。可选地,当获取到多个声源位置信息时,所述利用麦克风阵列定向获取一个或多个与所述声源位置信息对应的位置发出的一个或多个声音信号包括:利用所述麦克风阵列分别定向获取与所述多个声源位置信息中的每个声源位置信息对应的位置发出的声音信号。上述基于所述一个或多个声音信号,确定目标声音信号包括:对于每个声音信号,提取该声音信号的声纹特征;以及,将所述该声音信号的声纹特征与预设声纹特征进行比对,如果一致,确定该声音信号是目标声音信号,如果不一致,确定该声音信息不是目标声音信号。本公开的另一方面提供了一种语音识别装置,包括:第一获取模块、第二获取模块、第一确定模块、以及语音识别模块。第一获取模块用于利用位置传感器获取声源位置信息。第二获取模块用于利用麦克风阵列定向获取一个或多个与所述声源位置信息对应的位置发出的一个或多个声音信号。第一确定模块用于基于所述一个或多个声音信号,确定目标声音信号。以及,语音识别模块用于基于所述目标声音信号进行语音识别,得到语音识别结果。可选地,位置传感器为雷达传感器。第一获取模块包括:扫描子模块用于利用所述雷达传感器在预定区域范围内扫描。识别子模块用于基于所述雷达传感器的回波信号识别所述预定区域范围内存在的人体。以及,第一获取子模块用于获取所识别的每个人体的头部位置信息。本公开的另一方面提供了一种电子设备,位置传感器、麦克风阵列、存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时用于实现如上所述的方法。本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。附图说明为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中:图1示意性示出了根据本公开实施例的语音识别方法、装置和电子设备的应用场景;图2示意性示出了根据本公开实施例的语音识别方法的流程图;图3A示意性示出了根据本公开实施例的电子设备的示意图;图3B示意性示出了根据本公开实施例的电子设备的语音识别方法的流程图;图3C示意性示出了根据本公开另一实施例的电子设备的语音识别方法的流程图;图4示意性示出了根据本公开实施例的语音识别装置的框图;图5示意性示出了根据本公开另一实施例的语音识别装置的框图;以及图6示意性示出了根据本公开的实施例的电子设备的框图。具体实施方式以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采本文档来自技高网...

【技术保护点】
1.一种语音识别方法,包括:利用位置传感器获取声源位置信息;利用麦克风阵列定向获取一个或多个与所述声源位置信息对应的位置发出的一个或多个声音信号;基于所述一个或多个声音信号,确定目标声音信号;以及基于所述目标声音信号进行语音识别,得到语音识别结果。

【技术特征摘要】
1.一种语音识别方法,包括:利用位置传感器获取声源位置信息;利用麦克风阵列定向获取一个或多个与所述声源位置信息对应的位置发出的一个或多个声音信号;基于所述一个或多个声音信号,确定目标声音信号;以及基于所述目标声音信号进行语音识别,得到语音识别结果。2.根据权利要求1所述的方法,其中:所述位置传感器为雷达传感器;所述利用位置传感器获取声源位置信息包括:利用所述雷达传感器在预定区域范围内扫描;基于所述雷达传感器的回波信号识别所述预定区域范围内存在的人体;以及获取所识别的每个人体的头部位置信息。3.根据权利要求2所述的方法,其中:所述基于所述雷达传感器的回波信号识别所述预定区域范围内存在的人体包括:根据回波信号的多普勒效应识别所述预定区域范围内存在的人体;所述获取所识别的每个人体的头部位置信息包括:对于所识别的任一人体,将与该人体对应的第一回波信号的强度分布特征输入至头部识别模型,经由所述头部识别模型确定与该人体的头部对应的第二回波信号;以及将所述第二回波信号的反射位置信息作为该人体的头部位置信息,其中,所述头部识别模型是以多个与人体头部对应的第二回波信号的强度分布特征作为样本数据经过训练得到的。4.根据权利要求1所述的方法,其中:所述位置传感器为飞行时间传感器;所述利用位置传感器获取声源位置信息包括:利用所述飞行时间传感器获取预定区域范围内的深度信息;以及基于所述深度信息确定所述预定区域范围内存在的每个人体的头部位置信息。5.根据权利要求1所述的方法,其中,所述利用麦克风阵列定向获取一个或多个与所述声源位置信息对应的位置发出的一个或多个声音信号包括:对于任一声源位置信息,利用所述麦克风阵列基于波束赋形定向接收与该声源位置信息对应的位置发出的声音信号。6.根据权利要求1所述的方法,其中:当获取到多个声源位置信息时,在所述利用麦克风阵列定向获取一个或多个与所述声源位置信息对应的位置发出的一个或多个声音信号之前,所述方法还包括:基于预设规则从所述多...

【专利技术属性】
技术研发人员:杨大业宋建华
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1