面向数字音频删除和插入篡改操作自动检测方法及系统技术方案

技术编号：35932964 阅读：29 留言：0更新日期：2022-12-14 10:19

本发明专利技术属于数字音频信号篡改检测技术领域，公开了一种面向数字音频删除和插入篡改操作自动检测方法及系统，利用训练好的电网频率的通用背景模型，提取每个数字音频信号的电网频率频谱特征超矢量；将所提取的电网频率频谱特征超矢量输入由注意力机制和残差网络构成的深度表示学习网络进行浅层特征的学习；将训练好的浅层特征输入到分类网络中，判断是否经过删除或插入的篡改。本发明专利技术采用提取电网频率频谱特征超矢量，并建立深度神经网络训练所提取的特征；本发明专利技术不仅实现了篡改检测的自动化，还将深度神经网络很好的应用于篡改检测，并且取得很好的效果。本发明专利技术具有更高的准确率和较好的鲁棒性。和较好的鲁棒性。和较好的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
面向数字音频删除和插入篡改操作自动检测方法及系统

[0001]本专利技术属于数字音频信号篡改检测
，尤其涉及一种面向数字音频删除和插入篡改操作自动检测方法及系统。

技术介绍

[0002]目前，随着互联网信息技术的迅速发展，智能移动设备逐渐普及，数字多媒体数据(如音频、图像、文本等)已成为主要的信息载体。数字音频文件录制和存储的成本也变得越来越低，同时从互联网上获取数字音频文件也越来越便利，人们对于收集和分享数字音频文件的诉求日益高涨。与此同时，各种音频编辑软件也纷纷涌现，使得对音频信号的编辑变得更加容易。因此，对音频记录的有效保护和认证的需求日益增加，特别是在录音可能涉及数字权利管理和执法案件的情况下。可能在互联网上或法庭上产生大量具有真实感的虚假信息，从而影响社会稳定和公共安全。因此，音频取证对于验证音频信息的真实性、可靠性、完整性和来源变得越来越重要。
[0003]利用电网频率用于篡改检测，被法学界大量引用。从法医的角度来看，电网频率信号经常被嵌入窃听设备的音频记录中，与行为良好的特性相关联的高可用性使它成为一个有吸引力的特性。这也是它广泛应用的原因。在较长的一段时间中，一个地区的电网频率波动是稳定且独特的。电网频率中的非周期波动对连接到的所有设备都有相同的影响。电网频率信号通常会出现在由电网供电的设备中，电网信号同样是一种众所周知的标准信号。例如，电网频率的标准值为50Hz或60Hz，取决于所在的地区。欧洲国家、澳大利亚，以及亚洲和非洲的大多数国家使用50Hz。北美和中美洲国家使用60Hz。需要注...

【技术保护点】

【技术特征摘要】
1.一种面向数字音频删除和插入篡改操作自动检测方法，其特征在于，包括：利用训练好的电网频率的通用背景模型，提取每个数字音频信号的电网频率频谱特征超矢量；将所提取的电网频率频谱特征超矢量输入由注意力机制和残差网络构成的深度表示学习网络进行浅层特征的学习；将训练好的浅层特征输入到分类网络中，判断是否经过删除或插入的篡改。2.如权利要求1所述面向数字音频删除和插入篡改操作自动检测方法，其特征在于，利用带通滤波器对原始数字音频信号进行预处理，提取待测信号的电网频率成分；提取相位特征和拟合特征参数，并构建电网频率的通用背景模型；训练数据集数字音频信号对所得到的通用背景模型通过自适应更新电网频率的通用背景模型参数，根据目标数据库构造数字音频信号的电网频率频谱特征超矢量的特征矩阵；将得到的电网频率频谱特征超矢量输入到深度神经网络进行浅层特征的表示学习，得到浅层特征即电网频率频谱特征超矢量；将训练好的浅层特征输入预先构建的篡改检测分类网络，通过sigmod函数区分原始语音和篡改语音，得到篡改检测结果。3.如权利要求2所述面向数字音频删除和插入篡改操作自动检测方法，其特征在于，所述利用带通滤波器对原始数字音频信号进行预处理，提取待测信号的电网频率成分，提取相位特征和拟合特征参数包括：利用10000阶的线性相位FIR滤波器对原始数字音频信号f[n]进行带通滤波，得到待测信号中的电网频率成分F
ENFC
[n]；基于DFT0和DFT1变换得到相位波动特征F1和F2，基于Hilbert变换得到瞬时频率特征F3；使用Sum of Sines和Gaussian表达式分别进行拟合相位曲线和频率曲线，将相位特征和拟合特征参数进行组合得到特征向量。4.如权利要求2所述面向数字音频删除和插入篡改操作自动检测方法，其特征在于，所述构建电网频率的通用背景模型包括：(1)确定高斯混合模型：其中，f表示一个由相位特征和拟合特征参数组成的N维特征向量f＝{f1,f2,
…
,f
N
}；φ
j
,j＝1,
…
L表示混合权重；σ
j
表示协方差矩阵；μ
j
表示均值向量；(2)采用EM算法进行混合高斯模型的参数估计：(2.1)确定合适的θ和z极大化对数似然函数：其中，x＝(x1,x2,x3,
…
,x
m
)表示语音特征向量，m表示相互独立的语音特征向量的数量；λ表示数字音频信号模型，θ表示已知模型参数，z
i
,z
i
∈(z1,z2,z3,
…
,z
i
)表示与特征向量x
i
对应的隐藏变量，令p(x
i
,z
i
|θ)最大；(2.2)计算θ和z的值：基于Q(z)为已知样本和模型参数下的隐变量z的分布，确定在固定参数θ后Q
i
(z
i
)的选择问题，建立了L(θ,Z)的下界即通过调整θ最大化所述下界，对似然函数最大化获得新的模型参数，返回代入(2.1)中，通过不断迭代获得更加准确的GMM参数，得到一个好的电网频率的通用背景模型。5.如权利要求2所述面向数字音频删除和插入篡改操作自动检测方法，其特征在于，所述训练数据集数字音频信号对所得到的通用背景模型通过自适应更新其均值参数包括：计算第j个特征向量f
j
属于UBM中第i个联合高斯分量p
i
(f)的概率：利用计算得到的P(i|f
j
)，分别计算未篡改的目...

【专利技术属性】
技术研发人员：曾春艳，孔帅，王志锋，万相奎，李坤，赵宇豪，
申请(专利权)人：湖北工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人