基于声学传感器阵列声源精准定位方法技术

技术编号：44820246 阅读：5 留言：0更新日期：2025-03-28 20:09

本发明专利技术公开了基于声学传感器阵列声源精准定位方法，包括以下步骤，步骤一，输入音频片段，通过声学传感器对音频片段进行捕捉，步骤二，制作音频图像，制作出输入的音频的波形图像，步骤三，获取特征波形，对波形图像进行切分，以截取发生变化的声音波形，步骤四，波形分析，对截取后的波形图像以及输入的音频片段进行分析，获得音频中包含的特征信息，步骤五，特性信息分析，对步骤四中获得的信息特征进行分析。在本方案实施的时候，通过对音频片段中的特征进行分析，锚定特征值，再通过特征值来对阵列声源进行分析，可以实现对特征值快速准确地定位，进而减小了对比范围，加快了对比判断的速度，而且还能增加结果的准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机，具体涉及基于声学传感器阵列声源精准定位方法。

技术介绍

1、在对音频文件进行处理时，有时候音频文件过于庞大，在一些场景中，人们为了确定某段声音是否属于阵列声源(整个音频文件)中的一部分时，现有技术中一般采用如下的方法：

2、通过人工的方式，人工在对音频片段试听后，再对阵列音频进行试听，以确定音频片段是否属于阵列音频文件中，以及在音频文件的具体位置，而这会浪费大量的时间，

3、通过如申请号如cn201911399043.0一种音频片段的检测方法及相关设备中公开的技术方案的方法，但其在实施的时候，准确度较低。

4、基于上述内容，本申请提出了基于声学传感器阵列声源精准定位方法。

技术实现思路

1、为此，本专利技术提供基于声学传感器阵列声源精准定位方法，以解决如何快速准确的判断出音频片段在阵列声源中的位置。

2、为了实现上述目的，本专利技术提供如下技术方案：

3、根据本专利技术的第一方面，基于声学传感器阵列声源精准定位方法，包括以下步骤，

4、步骤一，输入音频片段，通过声学传感器对音频片段进行捕捉，

5、步骤二，制作音频图像，制作出输入的音频的波形图像，

6、步骤三，获取特征波形，对波形图像进行切分，以截取发生变化的声音波形，

7、步骤四，波形分析，对截取后的波形图像以及输入的音频片段进行分析，获得音频中包含的特征信息，

8、步骤五，特性信息分析，对

9、步骤六，若阵列声源中没有与之对应的音频片段，则直接对输入的音频片段进行输出，若阵列声源中包含输入的音频片段，则在对输入的音频片段进行输出时，导出音频片段位于阵列声源中的位置，

10、步骤七，输出结果。

11、优选地，在制作音频图像时，根据音频分贝对音频图像进行制作，具体制作方法如下：

12、建立二维坐标系，横轴为时间，纵轴为分贝，根据音频片段中分贝随时间的变化，得到波形图像，标记该音频片段中分贝最高的多个音频时间段，记为音频段。

13、优选地，在步骤三中，根据已经标记的音频段，自特征波形起始点，到特征波形的结束点，对特征波形进行切分。

14、优选地，在对波形进行分析时分为内容特征信息分析以及时间特征分析，

15、内容特征信息分析为，根据切分下来的波形图像，对音频内容进行分析，判断音频内容的类型，对音频进行分类，而后再对分类后音频的内容进行分析解读，而确定切分下来的波形中的内容特征信息；

16、时间特征信息分析为，对输入的音频片段进行分析，判断输入的音频片段中是否包含有时间特征信息，若包含有时间特征信息，则根据时间特征信息判断输入的音频文件在阵列声源中的位置，若不包含时间特征信息，则不再对时间特征信息进行分析。

17、优选地，当内容信息特征为语音对话时，则有

18、对语音对话内容进行提取，若出现地名和/或人名和/或事情时，判断包含地名和/或人名和/或事情的语境，以确定输入的音频片段的时间点位于地名和/或人名和/或事情出现之前、当下还是之后，得到内容结论一，

19、对阵列声源进行处理，按照出现地名和/或人名和/或事情的之前或当下或之后进行分割，

20、根据内容结论一，将输入的音频片段与分割后的阵列声源进行对比，以确定输入的音频片段位于阵列声源中的准确位置。

21、优选地，当内容信息特征为无语音对话时，则有

22、对切分的波形中内容特征进行提取，判断提取的内容为动物音或是物体音或是自然音，得到内容结论二，

23、对阵列声源进行处理，按照动物音或是物体音或是自然音出现的时间点，对阵列声源进行分割，

24、根据内容结论二，将输入的音频片段与分割后的阵列声源进行对比，以确定输入的音频片段位于阵列声源中的准确位置。

25、优选地，当内容信息特征既包含语音对话信息，也包含有动物音和/或物体音和/或自然音时，则有

26、对切分的波形中内容特征进行提取，判断提取的内容为动物音和/或物体音和/或自然音和/或地名和/或人名和/或事情，得到内容结论三，

27、对阵列声源进行处理，按照动物音或是物体音或是自然音和/或地名和/或人名和/或事情出现的时间点，对阵列声源进行分割，

28、根据内容结论三，将输入的音频片段与分割后的阵列声源进行对比，以确定输入的音频片段位于阵列声源中的准确位置。

29、优选地，在对时间特征信息分析时，将输入的音频片段进行分析，判断输入的音频片段中是否包含直接时间信息和/或间接时间信息，

30、当包含直接时间特征信息时，则按照直接时间信息对阵列声源进行分割，并与输入的音频片段进行对比，以确定输入的音频片段位于阵列声源中的准确位置，

31、当包含间接时间特征信息时，先对间接时间特征信息进行分析，以将其转变为直接时间特征信息，再按照直接时间特征信息对输入的音频片段与阵列声源进行对比。

32、本专利技术具有如下优点：

33、在本方案实施的时候，通过对音频片段中的特征进行分析，锚定特征值，再通过特征值来对阵列声源进行分析，可以实现对特征值快速准确地定位，进而减小了对比范围，加快了对比判断的速度，而且还能增加结果的准确性。

本文档来自技高网...

【技术保护点】

1.基于声学传感器阵列声源精准定位方法，其特征在于，包括以下步骤，

2.根据权利要求1所述的基于声学传感器阵列声源精准定位方法，其特征在于，在制作音频图像时，根据音频分贝对音频图像进行制作，具体制作方法如下：

3.根据权利要求2所述的基于声学传感器阵列声源精准定位方法，其特征在于，在步骤三中，根据已经标记的音频段，自特征波形起始点，到特征波形的结束点，对特征波形进行切分。

4.根据权利要求1所述的基于声学传感器阵列声源精准定位方法，其特征在于，在步骤四中，对波形进行分析时分为内容特征信息分析以及时间特征分析；

5.根据权利要求4所述的基于声学传感器阵列声源精准定位方法，其特征在于，当内容信息特征为语音对话时，则有

6.根据权利要求4所述的基于声学传感器阵列声源精准定位方法，其特征在于，当内容信息特征为无语音对话时，则有

7.根据权利要求4所述的基于声学传感器阵列声源精准定位方法，其特征在于，当内容信息特征既包含语音对话信息，也包含有动物音和/或物体音和/或自然音时，则有

8.根据权利要求5或6或7

...

【技术特征摘要】

1.基于声学传感器阵列声源精准定位方法，其特征在于，包括以下步骤，

5.根据权利要求...

【专利技术属性】
技术研发人员：史博林，
申请(专利权)人：北京怀芯声学技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人