System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于声学传感器阵列声源精准定位方法技术_技高网

基于声学传感器阵列声源精准定位方法技术

技术编号:44820246 阅读:5 留言:0更新日期:2025-03-28 20:09
本发明专利技术公开了基于声学传感器阵列声源精准定位方法,包括以下步骤,步骤一,输入音频片段,通过声学传感器对音频片段进行捕捉,步骤二,制作音频图像,制作出输入的音频的波形图像,步骤三,获取特征波形,对波形图像进行切分,以截取发生变化的声音波形,步骤四,波形分析,对截取后的波形图像以及输入的音频片段进行分析,获得音频中包含的特征信息,步骤五,特性信息分析,对步骤四中获得的信息特征进行分析。在本方案实施的时候,通过对音频片段中的特征进行分析,锚定特征值,再通过特征值来对阵列声源进行分析,可以实现对特征值快速准确地定位,进而减小了对比范围,加快了对比判断的速度,而且还能增加结果的准确性。

【技术实现步骤摘要】

本专利技术涉及计算机,具体涉及基于声学传感器阵列声源精准定位方法


技术介绍

1、在对音频文件进行处理时,有时候音频文件过于庞大,在一些场景中,人们为了确定某段声音是否属于阵列声源(整个音频文件)中的一部分时,现有技术中一般采用如下的方法:

2、通过人工的方式,人工在对音频片段试听后,再对阵列音频进行试听,以确定音频片段是否属于阵列音频文件中,以及在音频文件的具体位置,而这会浪费大量的时间,

3、通过如申请号如cn201911399043.0一种音频片段的检测方法及相关设备中公开的技术方案的方法,但其在实施的时候,准确度较低。

4、基于上述内容,本申请提出了基于声学传感器阵列声源精准定位方法。


技术实现思路

1、为此,本专利技术提供基于声学传感器阵列声源精准定位方法,以解决如何快速准确的判断出音频片段在阵列声源中的位置。

2、为了实现上述目的,本专利技术提供如下技术方案:

3、根据本专利技术的第一方面,基于声学传感器阵列声源精准定位方法,包括以下步骤,

4、步骤一,输入音频片段,通过声学传感器对音频片段进行捕捉,

5、步骤二,制作音频图像,制作出输入的音频的波形图像,

6、步骤三,获取特征波形,对波形图像进行切分,以截取发生变化的声音波形,

7、步骤四,波形分析,对截取后的波形图像以及输入的音频片段进行分析,获得音频中包含的特征信息,

8、步骤五,特性信息分析,对步骤四中获得的信息特征进行分析,并将获取到的特征信息与阵列声源进行对比,

9、步骤六,若阵列声源中没有与之对应的音频片段,则直接对输入的音频片段进行输出,若阵列声源中包含输入的音频片段,则在对输入的音频片段进行输出时,导出音频片段位于阵列声源中的位置,

10、步骤七,输出结果。

11、优选地,在制作音频图像时,根据音频分贝对音频图像进行制作,具体制作方法如下:

12、建立二维坐标系,横轴为时间,纵轴为分贝,根据音频片段中分贝随时间的变化,得到波形图像,标记该音频片段中分贝最高的多个音频时间段,记为音频段。

13、优选地,在步骤三中,根据已经标记的音频段,自特征波形起始点,到特征波形的结束点,对特征波形进行切分。

14、优选地,在对波形进行分析时分为内容特征信息分析以及时间特征分析,

15、内容特征信息分析为,根据切分下来的波形图像,对音频内容进行分析,判断音频内容的类型,对音频进行分类,而后再对分类后音频的内容进行分析解读,而确定切分下来的波形中的内容特征信息;

16、时间特征信息分析为,对输入的音频片段进行分析,判断输入的音频片段中是否包含有时间特征信息,若包含有时间特征信息,则根据时间特征信息判断输入的音频文件在阵列声源中的位置,若不包含时间特征信息,则不再对时间特征信息进行分析。

17、优选地,当内容信息特征为语音对话时,则有

18、对语音对话内容进行提取,若出现地名和/或人名和/或事情时,判断包含地名和/或人名和/或事情的语境,以确定输入的音频片段的时间点位于地名和/或人名和/或事情出现之前、当下还是之后,得到内容结论一,

19、对阵列声源进行处理,按照出现地名和/或人名和/或事情的之前或当下或之后进行分割,

20、根据内容结论一,将输入的音频片段与分割后的阵列声源进行对比,以确定输入的音频片段位于阵列声源中的准确位置。

21、优选地,当内容信息特征为无语音对话时,则有

22、对切分的波形中内容特征进行提取,判断提取的内容为动物音或是物体音或是自然音,得到内容结论二,

23、对阵列声源进行处理,按照动物音或是物体音或是自然音出现的时间点,对阵列声源进行分割,

24、根据内容结论二,将输入的音频片段与分割后的阵列声源进行对比,以确定输入的音频片段位于阵列声源中的准确位置。

25、优选地,当内容信息特征既包含语音对话信息,也包含有动物音和/或物体音和/或自然音时,则有

26、对切分的波形中内容特征进行提取,判断提取的内容为动物音和/或物体音和/或自然音和/或地名和/或人名和/或事情,得到内容结论三,

27、对阵列声源进行处理,按照动物音或是物体音或是自然音和/或地名和/或人名和/或事情出现的时间点,对阵列声源进行分割,

28、根据内容结论三,将输入的音频片段与分割后的阵列声源进行对比,以确定输入的音频片段位于阵列声源中的准确位置。

29、优选地,在对时间特征信息分析时,将输入的音频片段进行分析,判断输入的音频片段中是否包含直接时间信息和/或间接时间信息,

30、当包含直接时间特征信息时,则按照直接时间信息对阵列声源进行分割,并与输入的音频片段进行对比,以确定输入的音频片段位于阵列声源中的准确位置,

31、当包含间接时间特征信息时,先对间接时间特征信息进行分析,以将其转变为直接时间特征信息,再按照直接时间特征信息对输入的音频片段与阵列声源进行对比。

32、本专利技术具有如下优点:

33、在本方案实施的时候,通过对音频片段中的特征进行分析,锚定特征值,再通过特征值来对阵列声源进行分析,可以实现对特征值快速准确地定位,进而减小了对比范围,加快了对比判断的速度,而且还能增加结果的准确性。

本文档来自技高网...

【技术保护点】

1.基于声学传感器阵列声源精准定位方法,其特征在于,包括以下步骤,

2.根据权利要求1所述的基于声学传感器阵列声源精准定位方法,其特征在于,在制作音频图像时,根据音频分贝对音频图像进行制作,具体制作方法如下:

3.根据权利要求2所述的基于声学传感器阵列声源精准定位方法,其特征在于,在步骤三中,根据已经标记的音频段,自特征波形起始点,到特征波形的结束点,对特征波形进行切分。

4.根据权利要求1所述的基于声学传感器阵列声源精准定位方法,其特征在于,在步骤四中,对波形进行分析时分为内容特征信息分析以及时间特征分析;

5.根据权利要求4所述的基于声学传感器阵列声源精准定位方法,其特征在于,当内容信息特征为语音对话时,则有

6.根据权利要求4所述的基于声学传感器阵列声源精准定位方法,其特征在于,当内容信息特征为无语音对话时,则有

7.根据权利要求4所述的基于声学传感器阵列声源精准定位方法,其特征在于,当内容信息特征既包含语音对话信息,也包含有动物音和/或物体音和/或自然音时,则有

8.根据权利要求5或6或7所述的基于声学传感器阵列声源精准定位方法,其特征在于,在对时间特征信息分析时,将输入的音频片段进行分析,判断输入的音频片段中是否包含直接时间信息和/或间接时间信息,

...

【技术特征摘要】

1.基于声学传感器阵列声源精准定位方法,其特征在于,包括以下步骤,

2.根据权利要求1所述的基于声学传感器阵列声源精准定位方法,其特征在于,在制作音频图像时,根据音频分贝对音频图像进行制作,具体制作方法如下:

3.根据权利要求2所述的基于声学传感器阵列声源精准定位方法,其特征在于,在步骤三中,根据已经标记的音频段,自特征波形起始点,到特征波形的结束点,对特征波形进行切分。

4.根据权利要求1所述的基于声学传感器阵列声源精准定位方法,其特征在于,在步骤四中,对波形进行分析时分为内容特征信息分析以及时间特征分析;

5.根据权利要求...

【专利技术属性】
技术研发人员:史博林
申请(专利权)人:北京怀芯声学技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1