System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种野外复杂环境下鸟类鸣声识别中数据增强优化方法技术_技高网

一种野外复杂环境下鸟类鸣声识别中数据增强优化方法技术

技术编号:41747631 阅读:7 留言:0更新日期:2024-06-21 21:33
本申请涉及语音处理技术领域,具体涉及一种野外复杂环境下鸟类鸣声识别中数据增强优化方法,该方法包括:采集鸟鸣音频序列和各类环境音频序列,并对当前季节周期采集的周围视频影像的音频数据进行模态分解提取各类环境模态音频序列;计算环境模态音频序列中各音频数据的环境音起伏变化指数;基于各音频数据与其他音频数据的环境音起伏变化指数之间的相关关系,确定各音频数据的环境音起伏连续指数;基于此得到各音频数据的时频起伏连续指数,结合鸟鸣音频序列获取当前季节周期的语音合成音频,通过训练完成的神经网络识别鸟类鸣声。本申请可实现对野外复杂环境下鸟类鸣声的数据增强,提高识别准确性。

【技术实现步骤摘要】

本申请涉及语音处理,具体涉及一种野外复杂环境下鸟类鸣声识别中数据增强优化方法


技术介绍

1、随着对湿地环境保护意识的增强,人们越来越意识到湿地野生动物的重要性,尤其是湿地鸟类。湿地鸟类的栖息状态的好坏,反映了湿地环境保护的有效性,湿地鸟类的栖息状态越好,说明人们对湿地环境的保护越有效,越适合湿地野生动物的生存。

2、目前,为了分析湿地鸟类的栖息状态,大多是在复杂环境下对鸟类鸣声进行识别,通过对野外鸟类鸣声进行特征提取,以求准确地分析鸟类的栖息状态。但是,由于野外环境中会存在各种干扰源,比如风声、水流声、交通噪声以及其他动物的叫声等,这些环境干扰噪声会影响对鸟类鸣叫声音的识别,导致鸟类鸣声识别的准确性较低。

3、现有技术往往通过训练识别神经网络模型来对野外复杂环境下的鸟类鸣声进行识别,然而由于野外复杂环境的多变性,直接将采集得到的野外环境音频作为训练集对识别神经网络模型进行训练,使得训练的识别神经网络模型的准确性较低,导致野外复杂环境下鸟类鸣声识别的准确率较低。因此,当前如何获取训练集对识别神经网络模型神经训练,以求提高识别神经网络模型的准确性,成为了亟待解决的问题之一。


技术实现思路

1、为了解决上述技术问题,本申请提供一种野外复杂环境下鸟类鸣声识别中数据增强优化方法,以解决现有的问题。

2、本申请的一种野外复杂环境下鸟类鸣声识别中数据增强优化方法采用如下技术方案:

3、本申请一个实施例提供了一种野外复杂环境下鸟类鸣声识别中数据增强优化方法,该方法包括以下步骤:

4、采集鸟类鸣声音频数据和野外复杂环境中的环境音频数据,得到鸟鸣音频序列和各类环境音频序列,并对当前季节周期采集的周围视频影像的音频数据进行模态分解提取各类环境模态音频序列;

5、对于各类环境模态音频序列以及环境音频序列中的每个音频数据,基于各音频数据的时域特征分布及音频数据差异情况,确定环境模态音频序列中各音频数据的环境音起伏变化指数;

6、基于各音频数据与其他音频数据的环境音起伏变化指数之间的相关关系,确定各音频数据的环境音起伏连续指数;

7、基于所述环境音起伏连续指数并结合各音频数据的频域特征确定各音频数据的时频起伏连续指数;

8、将各环境模态音频序列中所有音频数据的所述时频起伏连续指数构建各环境模态时频特征序列,相应的,获取每个环境音频序列对应的环境音频时频特征序列;

9、对环境模态时频特征序列与环境音频时频特征序列进行匹配,结合鸟鸣音频序列获取当前季节周期的语音合成音频,以训练神经网络模型;通过训练完成的神经网络识别鸟类鸣声。

10、优选的,所述环境音起伏变化指数的确定过程为:

11、以各音频数据为中心,将前后相邻多个音频数据组成各音频数据的局部音频子序列;

12、通过阈值分割对局部音频子序列中的音频数据进行划分,局部音频子序列中大于阈值的所有音频数据组成高幅值音频序列,反之,组成低幅值音频序列;

13、基于高幅值音频序列与低幅值音频序列内音频数据的差异确定各音频数据的环境音急促性特征指数;

14、将各音频数据的高幅值音频序列与低幅值音频序列的方差进行加权求和,得到各音频数据的起伏性变化增益系数;

15、基于起伏性变化增益系数与环境音急促性特征指数确定环境音起伏变化指数。

16、优选的,所述环境音急促性特征指数,对应计算公式为:

17、

18、式中,为环境模态音频序列中第i个音频数据的环境音急促性特征指数,和分别为第i个音频数据的高幅值音频序列、低幅值音频序列内的音频数据数目,为以自然常数为底数的指数函数,和分别为第i个音频数据的高幅值音频序列内第j个音频数据和低幅值音频序列内第s个音频数据,和分别为第i个音频数据的高幅值音频序列内第j个音频数据在局部音频子序列中的位置和低幅值音频序列内第s个音频数据在局部音频子序列中的位置,为欧氏距离。

19、优选的,所述环境音起伏变化指数为所述起伏性变化增益系数与环境音急促性特征指数的相乘的归一化值。

20、优选的,所述环境音起伏连续指数的确定过程为:

21、将与各音频数据之间欧氏距离最近的若干个音频数据的环境音起伏性变化指数,组成各音频数据的音频起伏特征序列;

22、基于各音频数据与相邻音频数据的音频起伏特征序列之间的距离关系,确定各音频数据的音频起伏相异指数;

23、基于所述环境音急促性特征指数与所述音频起伏相异指数确定环境音起伏连续指数。

24、优选的,所述音频起伏相异指数的确定过程为:

25、计算各音频数据与其所在序列中相邻前一音频数据以及相邻后一音频的音频起伏特征序列之间的dtw距离,相应的,计算与相邻后一音频数据的音频起伏特征序列之间的dtw距离,两个dtw距离的均值作为各音频数据的音频起伏相异指数。

26、优选的,所述环境音起伏连续指数为所述环境音急促性特征指数与所述音频起伏相异指数的比值。

27、优选的,所述时频起伏连续指数的确定过程为:

28、对每个音频数据的局部音频子序列进行频域变换,获取局部音频子序列内单侧的所有频率以及每个频率对应的频域能量;

29、将每个音频数据局部音频子序列的单侧所有频率对应的频域能量按照频率升序组成每个音频数据的环境音频谱衰减序列;

30、基于音频数据的环境音频谱衰减序列内各频域能量差异确定各音频数据的频域起伏连续性指数;

31、所述时频起伏连续指数为环境音起伏连续指数与频域起伏连续指数的平均值。

32、优选的,所述频域起伏连续性指数的确定过程为:

33、计算各音频数据的环境音频衰减序列中相邻频域能量之间差值的绝对值,获取所述绝对值与预设数值之和的倒数;

34、将环境音频衰减序列中所有相邻频域能量计算得到的所述倒数的均值,作为各音频数据的起伏连续性指数。

35、优选的,所述当前季节周期的语音合成音频的获取过程为:

36、采用匹配算法获取与每个环境模态时频特征序列匹配成功的环境音频时频特征序列;

37、将匹配成功的环境音频时频特征序列所对应的环境音频序列,以及鸟鸣音频序列分别作为基音同步叠加算法的输入,输出当前季节周期的语音合成音频。

38、本申请至少具有如下有益效果:

39、本申请基于对时域上环境音的急促特征以及起伏增益特征的分析,利用环境音急促性特征指数和起伏性变化增益系数构建环境音起伏性变化指数,本专利技术基于环境音的急促特征,并结合起伏增益特征,使得环境音时域上的起伏性特征更加准确;而后基于对环境音的起伏连续性的分析,利用环境音起伏性变化指数构建环境音起伏连续指数,使得不同环境音的特征的对比性更大,提高了后续匹配的精度;而后结合环境音的频域特征,利用环境音起伏连续指数并结合频域起伏连本文档来自技高网...

【技术保护点】

1.一种野外复杂环境下鸟类鸣声识别中数据增强优化方法,其特征在于,该方法包括以下步骤:

2.如权利要求1所述的一种野外复杂环境下鸟类鸣声识别中数据增强优化方法,其特征在于,所述环境音起伏变化指数的确定过程为:

3.如权利要求2所述的一种野外复杂环境下鸟类鸣声识别中数据增强优化方法,其特征在于,所述环境音急促性特征指数,对应计算公式为:

4.如权利要求3所述的一种野外复杂环境下鸟类鸣声识别中数据增强优化方法,其特征在于,所述环境音起伏变化指数为所述起伏性变化增益系数与环境音急促性特征指数的相乘的归一化值。

5.如权利要求3所述的一种野外复杂环境下鸟类鸣声识别中数据增强优化方法,其特征在于,所述环境音起伏连续指数的确定过程为:

6.如权利要求5所述的一种野外复杂环境下鸟类鸣声识别中数据增强优化方法,其特征在于,所述音频起伏相异指数的确定过程为:

7.如权利要求5所述的一种野外复杂环境下鸟类鸣声识别中数据增强优化方法,其特征在于,所述环境音起伏连续指数为所述环境音急促性特征指数与所述音频起伏相异指数的比值。

8.如权利要求2所述的一种野外复杂环境下鸟类鸣声识别中数据增强优化方法,其特征在于,所述时频起伏连续指数的确定过程为:

9.如权利要求8所述的一种野外复杂环境下鸟类鸣声识别中数据增强优化方法,其特征在于,所述频域起伏连续性指数的确定过程为:

10.如权利要求1所述的一种野外复杂环境下鸟类鸣声识别中数据增强优化方法,其特征在于,所述当前季节周期的语音合成音频的获取过程为:

...

【技术特征摘要】

1.一种野外复杂环境下鸟类鸣声识别中数据增强优化方法,其特征在于,该方法包括以下步骤:

2.如权利要求1所述的一种野外复杂环境下鸟类鸣声识别中数据增强优化方法,其特征在于,所述环境音起伏变化指数的确定过程为:

3.如权利要求2所述的一种野外复杂环境下鸟类鸣声识别中数据增强优化方法,其特征在于,所述环境音急促性特征指数,对应计算公式为:

4.如权利要求3所述的一种野外复杂环境下鸟类鸣声识别中数据增强优化方法,其特征在于,所述环境音起伏变化指数为所述起伏性变化增益系数与环境音急促性特征指数的相乘的归一化值。

5.如权利要求3所述的一种野外复杂环境下鸟类鸣声识别中数据增强优化方法,其特征在于,所述环境音起伏连续指数的确定过程为:

6.如...

【专利技术属性】
技术研发人员:高树会宋佳男许红瑞杨兆宇
申请(专利权)人:百鸟数据科技北京有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1