一种基于多任务学习的音频事件检测方法及系统技术方案

技术编号：31826871 阅读：18 留言：0更新日期：2022-01-12 12:55

本发明专利技术提供了一种基于多任务学习的音频事件检测方法及系统，该方法包括基于待检测音频片段的特征矩阵，采用训练好的音频事件检测模型，得到待检测音频片段中的音频事件；所述音频事件检测模型训练的过程包括：根据音频片段中的每个音频帧，得到音频片段中所有帧在音频事件检测输出层的输出值与在音频事件类型个数分类输出层的输出值，基于在音频事件检测输出层的输出值求得交叉熵和，基于在音频事件类型个数分类输出层的输出值求得差值平方和；采用交叉熵和与差值平方和构造损失函数，训练音频事件检测模型，得到训练好的音频事件检测模型。本发明专利技术可以显著提高音频事件检测准确率；在同等检测性能下，大幅度减少模型参数的数量，提高运算效率。提高运算效率。提高运算效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多任务学习的音频事件检测方法及系统

[0001]本专利技术属于音频事件检测相关
，尤其涉及一种基于多任务学习的音频事件检测方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息，不必然构成在先技术。
[0003]音频事件检测是指检测音频流中存在的音频事件的类型和起止时间。音频事件检测具有广阔的应用前景，可以用于音频安全监控、生物声学研究、城市声音分析等，因此，音频事件检测的研究得到学术界广泛重视。音频流中不同类型的音频事件往往在时间上互相交叠，且音频流中经常掺杂有各种噪声，这为音频事件的准确检测带来极大的困难和挑战。
[0004]近年来，有研究提出采用多任务学习的方式提高音频事件检测的准确率，即，为音频事件检测任务添加一个辅助任务，通过搭建模型同时完成两个任务，通过辅助任务来辅助提高音频事件检测准确率。有的研究为音频事件检测任务添加了音频场景识别这一辅助任务，但是音频场景识别辅助任务需要额外标注音频文档的场景标签，增加了人工标注工作量。

技术实现思路

[0005]本专利技术为了解决上述辅助任务需要额外标注，增加了人工标注工作量的问题，提供了一种基于多任务学习的音频事件检测方法及系统，该方法通过为音频事件检测任务添加音频事件类型个数分类辅助任务，在一个模型中同时实现音频事件检测和音频事件类型个数分类，以提高音频事件检测准确率，同时，在提高准确率的基础上不额外增加人工标注工作量。
[0006]为了实现上述目的，本专利技术采用如下技术...

【技术保护点】

【技术特征摘要】
1.一种基于多任务学习的音频事件检测方法，其特征在于，包括：基于待检测音频片段的特征矩阵，采用训练好的音频事件检测模型，得到待检测音频片段中的音频事件；所述音频事件检测模型训练的过程包括：根据音频片段中的每个音频帧，得到音频片段中所有帧在音频事件检测输出层的输出值与在音频事件类型个数分类输出层的输出值，基于在音频事件检测输出层的输出值求得交叉熵和，基于在音频事件类型个数分类输出层的输出值求得差值平方和；采用交叉熵和与差值平方和构造损失函数，训练音频事件检测模型，得到训练好的音频事件检测模型。2.根据权利要求1所述的基于多任务学习的音频事件检测方法，其特征在于，在所述求得交叉熵和与差值平方和之前包括：获取音频片段，提取每个音频片段的特征矩阵，为音频片段内每个音频帧添加音频事件标签和音频事件类型个数标签，构建音频特征训练集。3.根据权利要求2所述的基于多任务学习的音频事件检测方法，其特征在于，所述提取每个音频片段的特征矩阵的过程包括：对音频片段进行分帧处理，提取每帧的音频特征，每个音频片段内所有帧的音频特征构成该音频片段的特征矩阵。4.根据权利要求2所述的基于多任务学习的音频事件检测方法，其特征在于，所述为音频片段内每个音频帧添加音频事件标签和音频事件类型个数标签的过程包括：假设训练集中共有m个不同类型的音频事件，则音频事件标签为m维向量，向量中的元素取值为0或1，如果音频帧中包含了某个类型的音频事件，则该类型音频事件所对应的标签向量位置处的元素值为1，否则为0；为音频片段内每个音频帧添加音频事件类型个数标签，音频事件类型个数通过统计音频事件标签中元素1的个数得到。5.根据权利要求1所述的基于多任务学习的音频事件检测方法，其特征在于，所述得到音频片段中所有帧在音频事件检测输出层的输出值，基于该输出值求得交叉熵和的过程包括：根据音频片段中的每个音频帧，计算每个音频帧在音频事件检测输出层的输出值，用该输出值和音频帧的音频事件标签求取交叉熵，将音频片段内所有帧的交叉熵求和得到交叉熵和。6.根据权利要求1所述的基于多任务学习的音频事件检测方法...

【专利技术属性】
技术研发人员：冷严，刘祯，路安芹，李登旺，孙建德，王荣燕，
申请(专利权)人：山东师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人