一种基于降噪耳机的声音识别方法、装置和电子设备制造方法及图纸

技术编号：42337306 阅读：14 留言：0更新日期：2024-08-14 16:13

本申请提供了一种基于降噪耳机的声音识别方法、装置和电子设备，其中，该方法包括：将获取到的内耳音频数据按照预设时间间隔切分为多个内耳数据帧，将获取到的外耳音频数据按照预设时间间隔切分为多个与内耳数据帧同步的外耳数据帧；通过声音识别神经网络对内耳数据帧和外耳数据帧进行处理，确定声源位置信息；通过声音识别神经网络对声源位置信息进行分析，确定主体声音概率和其他无关事件概率。通过本申请实施例提供的一种基于降噪耳机的声音识别方法、装置和电子设备，获取到声源相对于降噪耳机内部麦克风和外部麦克风的位置信息，通过声音识别神经网络分析两者的位置差异来得到主体声音概率和其他无关事件概率，准确度较高。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及音频处理，具体而言，涉及一种基于降噪耳机的声音识别方法、装置和电子设备。

技术介绍

1、目前，已经有基于可穿戴设备的咳嗽检测技术出现，但这些咳嗽检测技术普遍缺乏对主体咳嗽进行辨识的能力，即难以对用户自身咳嗽与环境中其他人的咳嗽进行区分，导致检测主体咳嗽的准确率较低。

技术实现思路

1、为解决上述问题，本申请实施例的目的在于提供一种基于降噪耳机的声音识别方法、装置和电子设备。

2、第一方面，本申请实施例提供了一种基于降噪耳机的声音识别方法，其特征在于，包括：

3、将获取到的内耳音频数据按照预设时间间隔切分为多个内耳数据帧，将获取到的外耳音频数据按照所述预设时间间隔切分为多个与所述内耳数据帧同步的外耳数据帧；

4、通过声音识别神经网络对所述内耳数据帧和所述外耳数据帧进行处理，确定声源位置信息；其中，所述声源位置信息包括声源离降噪耳机内部麦克风的距离、声源离降噪耳机外部麦克风的距离；

5、通过所述声音识别神经网络对所述声源位置信息进行分析，确定主体声音概率和他人声音概率；

6、其中，所述内耳音频数据是通过降噪耳机内部麦克风采集的；所述外耳音频数据是通过降噪耳机外部麦克风采集的。

7、第二方面，本申请实施例还提供了一种基于降噪耳机的声音识别装置，其特征在于，包括：

8、音频数据切分模块，用于将获取到的内耳音频数据按照预设时间间隔切分为多个内耳数据帧，将获取到的外耳音频数据按照所述预设时间间隔切分为

9、音频数据帧处理模块，用于通过声音识别神经网络对所述内耳数据帧和所述外耳数据帧进行处理，确定声源位置信息；其中，所述声源位置信息包括声源离降噪耳机内部麦克风的距离、声源离降噪耳机外部麦克风的距离；

10、概率确定模块，用于通过所述声音识别神经网络对所述声源位置信息进行分析，确定主体声音概率和他人声音概率；

11、其中，所述内耳音频数据是通过降噪耳机内部麦克风采集的；所述外耳音频数据是通过降噪耳机外部麦克风采集的。

12、第三方面，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器运行时执行上述第一方面提到的基于降噪耳机的声音识别方法。

13、第四方面，本申请实施例还提供了一种电子设备，其特征在于，所述电子设备包括有存储器，处理器以及一个或者一个以上的程序，其中所述一个或者一个以上程序存储于所述存储器中，且经配置以由所述处理器执行上述第一方面提到的基于降噪耳机的声音识别方法。

14、本申请实施例上述第一方面至第四方面提供的方案中，通过声音识别神经网络对内耳数据帧和外耳数据帧进行处理，确定声源位置信息；通过所述声音识别神经网络对所述声源位置信息进行分析，确定主体声音概率和他人声音概率。与相关技术中只能确定声音，但不能区分是用户主体声音还是他人声音相比，在通过声音识别神经网络对内耳数据帧和外耳数据帧分别进行处理时，可以获取到声源相对于降噪耳机内部麦克风的位置信息和声源相对于降噪耳机内部麦克风的位置信息，通过声音识别神经网络分析两者的位置差异来得到主体声音概率和他人声音概率，检测主体声音的准确率较高。

15、为使本申请的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

本文档来自技高网...

【技术保护点】

1.一种基于降噪耳机的声音识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述通过声音识别神经网络对所述内耳数据帧和所述外耳数据帧进行处理，确定声源位置信息，包括：

3.根据权利要求1所述的方法，其特征在于，还包括：

4.根据权利要求3所述的方法，其特征在于，在所述运动数据包括加速度计数据和陀螺仪数据的情况下，所述将获取到的运动数据按照所述预设时间间隔切分为多个运动数据帧，包括：

5.一种基于降噪耳机的声音识别装置，其特征在于，包括：

6.根据权利要求5所述的装置，其特征在于，所述音频数据帧处理模块，具体用于：

7.根据权利要求5所述的装置，其特征在于，还包括：

8.根据权利要求7所述的装置，其特征在于，在所述运动数据包括加速度计数据和陀螺仪数据的情况下，所述运动数据切分单元，具体用于：

9.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器运行时执行上述权利要求1-4任一项所述的方法的步骤。

10.

...

【技术特征摘要】

1.一种基于降噪耳机的声音识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述通过声音识别神经网络对所述内耳数据帧和所述外耳数据帧进行处理，确定声源位置信息，包括：

3.根据权利要求1所述的方法，其特征在于，还包括：

5.一种基于降噪耳机的声音识别装置，其特征在于，包括：

6.根据权利要求5所述的装置，其特征在于，所述音频数据帧处理模块，具体用...

【专利技术属性】
技术研发人员：王运涛，张奚宇星，史元春，
申请(专利权)人：清华大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人