System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机,具体涉及基于声学传感器阵列声源精准定位方法。
技术介绍
1、在对音频文件进行处理时,有时候音频文件过于庞大,在一些场景中,人们为了确定某段声音是否属于阵列声源(整个音频文件)中的一部分时,现有技术中一般采用如下的方法:
2、通过人工的方式,人工在对音频片段试听后,再对阵列音频进行试听,以确定音频片段是否属于阵列音频文件中,以及在音频文件的具体位置,而这会浪费大量的时间,
3、通过如申请号如cn201911399043.0一种音频片段的检测方法及相关设备中公开的技术方案的方法,但其在实施的时候,准确度较低。
4、基于上述内容,本申请提出了基于声学传感器阵列声源精准定位方法。
技术实现思路
1、为此,本专利技术提供基于声学传感器阵列声源精准定位方法,以解决如何快速准确的判断出音频片段在阵列声源中的位置。
2、为了实现上述目的,本专利技术提供如下技术方案:
3、根据本专利技术的第一方面,基于声学传感器阵列声源精准定位方法,包括以下步骤,
4、步骤一,输入音频片段,通过声学传感器对音频片段进行捕捉,
5、步骤二,制作音频图像,制作出输入的音频的波形图像,
6、步骤三,获取特征波形,对波形图像进行切分,以截取发生变化的声音波形,
7、步骤四,波形分析,对截取后的波形图像以及输入的音频片段进行分析,获得音频中包含的特征信息,
8、步骤五,特性信息分析,对
9、步骤六,若阵列声源中没有与之对应的音频片段,则直接对输入的音频片段进行输出,若阵列声源中包含输入的音频片段,则在对输入的音频片段进行输出时,导出音频片段位于阵列声源中的位置,
10、步骤七,输出结果。
11、优选地,在制作音频图像时,根据音频分贝对音频图像进行制作,具体制作方法如下:
12、建立二维坐标系,横轴为时间,纵轴为分贝,根据音频片段中分贝随时间的变化,得到波形图像,标记该音频片段中分贝最高的多个音频时间段,记为音频段。
13、优选地,在步骤三中,根据已经标记的音频段,自特征波形起始点,到特征波形的结束点,对特征波形进行切分。
14、优选地,在对波形进行分析时分为内容特征信息分析以及时间特征分析,
15、内容特征信息分析为,根据切分下来的波形图像,对音频内容进行分析,判断音频内容的类型,对音频进行分类,而后再对分类后音频的内容进行分析解读,而确定切分下来的波形中的内容特征信息;
16、时间特征信息分析为,对输入的音频片段进行分析,判断输入的音频片段中是否包含有时间特征信息,若包含有时间特征信息,则根据时间特征信息判断输入的音频文件在阵列声源中的位置,若不包含时间特征信息,则不再对时间特征信息进行分析。
17、优选地,当内容信息特征为语音对话时,则有
18、对语音对话内容进行提取,若出现地名和/或人名和/或事情时,判断包含地名和/或人名和/或事情的语境,以确定输入的音频片段的时间点位于地名和/或人名和/或事情出现之前、当下还是之后,得到内容结论一,
19、对阵列声源进行处理,按照出现地名和/或人名和/或事情的之前或当下或之后进行分割,
20、根据内容结论一,将输入的音频片段与分割后的阵列声源进行对比,以确定输入的音频片段位于阵列声源中的准确位置。
21、优选地,当内容信息特征为无语音对话时,则有
22、对切分的波形中内容特征进行提取,判断提取的内容为动物音或是物体音或是自然音,得到内容结论二,
23、对阵列声源进行处理,按照动物音或是物体音或是自然音出现的时间点,对阵列声源进行分割,
24、根据内容结论二,将输入的音频片段与分割后的阵列声源进行对比,以确定输入的音频片段位于阵列声源中的准确位置。
25、优选地,当内容信息特征既包含语音对话信息,也包含有动物音和/或物体音和/或自然音时,则有
26、对切分的波形中内容特征进行提取,判断提取的内容为动物音和/或物体音和/或自然音和/或地名和/或人名和/或事情,得到内容结论三,
27、对阵列声源进行处理,按照动物音或是物体音或是自然音和/或地名和/或人名和/或事情出现的时间点,对阵列声源进行分割,
28、根据内容结论三,将输入的音频片段与分割后的阵列声源进行对比,以确定输入的音频片段位于阵列声源中的准确位置。
29、优选地,在对时间特征信息分析时,将输入的音频片段进行分析,判断输入的音频片段中是否包含直接时间信息和/或间接时间信息,
30、当包含直接时间特征信息时,则按照直接时间信息对阵列声源进行分割,并与输入的音频片段进行对比,以确定输入的音频片段位于阵列声源中的准确位置,
31、当包含间接时间特征信息时,先对间接时间特征信息进行分析,以将其转变为直接时间特征信息,再按照直接时间特征信息对输入的音频片段与阵列声源进行对比。
32、本专利技术具有如下优点:
33、在本方案实施的时候,通过对音频片段中的特征进行分析,锚定特征值,再通过特征值来对阵列声源进行分析,可以实现对特征值快速准确地定位,进而减小了对比范围,加快了对比判断的速度,而且还能增加结果的准确性。
本文档来自技高网...【技术保护点】
1.基于声学传感器阵列声源精准定位方法,其特征在于,包括以下步骤,
2.根据权利要求1所述的基于声学传感器阵列声源精准定位方法,其特征在于,在制作音频图像时,根据音频分贝对音频图像进行制作,具体制作方法如下:
3.根据权利要求2所述的基于声学传感器阵列声源精准定位方法,其特征在于,在步骤三中,根据已经标记的音频段,自特征波形起始点,到特征波形的结束点,对特征波形进行切分。
4.根据权利要求1所述的基于声学传感器阵列声源精准定位方法,其特征在于,在步骤四中,对波形进行分析时分为内容特征信息分析以及时间特征分析;
5.根据权利要求4所述的基于声学传感器阵列声源精准定位方法,其特征在于,当内容信息特征为语音对话时,则有
6.根据权利要求4所述的基于声学传感器阵列声源精准定位方法,其特征在于,当内容信息特征为无语音对话时,则有
7.根据权利要求4所述的基于声学传感器阵列声源精准定位方法,其特征在于,当内容信息特征既包含语音对话信息,也包含有动物音和/或物体音和/或自然音时,则有
8.根据权利要求5或6或7
...【技术特征摘要】
1.基于声学传感器阵列声源精准定位方法,其特征在于,包括以下步骤,
2.根据权利要求1所述的基于声学传感器阵列声源精准定位方法,其特征在于,在制作音频图像时,根据音频分贝对音频图像进行制作,具体制作方法如下:
3.根据权利要求2所述的基于声学传感器阵列声源精准定位方法,其特征在于,在步骤三中,根据已经标记的音频段,自特征波形起始点,到特征波形的结束点,对特征波形进行切分。
4.根据权利要求1所述的基于声学传感器阵列声源精准定位方法,其特征在于,在步骤四中,对波形进行分析时分为内容特征信息分析以及时间特征分析;
5.根据权利要求...
【专利技术属性】
技术研发人员:史博林,
申请(专利权)人:北京怀芯声学技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。