System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种采用双维度图注意力的伪造语音检测方法技术_技高网

一种采用双维度图注意力的伪造语音检测方法技术

技术编号:45059104 阅读:3 留言:0更新日期:2025-04-22 17:42
本发明专利技术涉及一种采用双维度图注意力的伪造语音检测方法,对原始语音进行预加重处理,提取每一帧的线性频率倒谱系数特征;根据线性频率倒谱系数特征并使用BP算法对真实语音和伪造语音进行GMM建模,采用期望最大化算法对训练数据进行迭代运算,直至收敛,统计语音帧数并分别计算每帧语音特征在各个高斯分量的LGP,再减去常数项并进行标准化处理;本发明专利技术通过采用双向细分法(BP)对高斯混合模型进行建模,使相邻高斯分量的均值向量差异较小,不仅使二维卷积能够有效地捕捉高斯分量之间的依赖关系,为图注意力模块提供更明确、更紧密的特征关系,增强注意力机制对全局特征的表征能力,该方法从局部到全局优化特征空间结构,提升伪造语音检测的性能。

【技术实现步骤摘要】

本专利技术涉及一种采用双维度图注意力的伪造语音检测方法,属于造语音检测。


技术介绍

1、伪造语音检测技术用于判断待测语音的真实性,以防止恶意攻击,在自动说话人验证(automatic speaker verification,asv)和司法检验等领域具有重要的应用价值。现有方法通过提取伪造语音在高斯混合模型(gaussian mixture model,gmm)分量上的对数高斯概率(log-gaussian probability,lgp)作为特征进行检测。然而,这样的方法仅在时间维度上进行一维卷积,未能充分挖掘高斯分量之间的关系。

2、本专利技术使用双向细分法(bidirectional partitioning,bp)对gmm进行建模,使得相邻高斯分量的均值向量差异较小,通过二维卷积处理捕捉高斯分量之间的依赖关系,并引入图注意力模块,聚合时间维度和高斯分量维度的信息,提高伪造语音检测的准确率。


技术实现思路

1、为了克服现有伪造语音检测方法仅在时间维度上进行一维卷积,未能充分挖掘高斯分量之间的关系的不足,本专利技术提供了一种采用双维度图注意力的伪造语音检测方法,能够更深入地捕捉高斯分量维度和时间维度之间的关联信息,使模型能够更全面地分析输入数据的结构特点,从而提升模型的判决能力。

2、一种采用双维度图注意力的伪造语音检测方法,包括以下步骤:

3、步骤一:先对原始语音进行预加重处理,增强高频部分波形的细节,然后进行加窗分帧,提取每一帧的线性频率倒谱系数(linear frequency cepstrum coefficients,lfcc)特征;

4、步骤二:根据lfcc特征并使用bp算法分别对真实语音和伪造语音进行gmm建模,采用期望最大化(expectation maximization,em)算法对训练数据进行迭代运算,直至收敛,统计语音帧数并分别计算每帧语音特征在各个高斯分量的lgp,再减去常数项并进行标准化处理;

5、步骤三:将lgp特征矩阵输入到六个残差块模块,每个残差块由两个二维卷积层、一个selu激活函数和批量归一化层组成,分别在前四个残差块的末尾添加2×2的最大池化层,降低复杂度并提高泛化能力;

6、步骤四:将残差块生成的深层特征分别输入时间注意力模块和高斯分量注意力模块,得到相同维度但数量不同的图节点,两个注意力模块均包含图注意力网络(graphattention network,gat)和图池化模块(graph pooling module,gpm),后将两个网络分别得到的图节点拼接,输入高斯分量-时间联合图注意力模块,得到最终的图节点;

7、步骤五:对伪造语音和真实语音的输入特征lgp以并行方式处理,将双方节点展平并拼接为全连接层的输入,生成真/伪两个类别的置信度,通过softmax函数将置信度转化为概率,使用加权交叉熵损失函数(weighted cross entropy,wce)计算实际标签与预测标签之间的误差,最小化损失以优化模型的分类性能,提高对语音真伪判决的准确性。

8、与现有技术相比,本专利技术的有益效果在于:

9、本专利技术在高斯分量和时间维度的深层特征分别经过独立的图注意力模块处理后,通过拼接操作将两者特征融合,并进一步通过高斯分量-时间联合图注意力模块进行联合特征提取。此联合特征提取方式能够更深入地捕捉高斯分量维度和时间维度之间的关联信息,使模型能够更全面地分析输入数据的结构特点,从而提升模型的判决能力。

10、本专利技术通过采用双向细分法(bp)对高斯混合模型进行建模,使相邻高斯分量的均值向量差异较小。此策略不仅使二维卷积能够更有效地捕捉高斯分量之间的依赖关系,同时也为图注意力模块提供了更明确、更紧密的特征关系,大幅增强了注意力机制对全局特征的表征能力。该方法从局部到全局优化了特征空间结构,极大地提升了伪造语音检测的性能。

11、本专利技术通过分别建立真实语音和伪造语音的高斯混合模型(gmm),提取各自的特征,并以并行方式输入到具有相同结构但参数不同的模型中。在全连接层对真实和伪造语音的特征进行融合,充分利用了两者之间的关系,进一步提高了模型对语音真/伪判别的准确率。

本文档来自技高网...

【技术保护点】

1.一种采用双维度图注意力的伪造语音检测方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种采用双维度图注意力的伪造语音检测方法,其特征在于:所述步骤一中预加重处理与提取线性频率倒谱系数特征具体包括:

3.根据权利要求1所述的一种采用双维度图注意力的伪造语音检测方法,其特征在于:所述步骤二中GMM建模与LGP特征提取具体包括:

4.根据权利要求1所述的一种采用双维度图注意力的伪造语音检测方法,其特征在于:所述步骤四具体包括:

5.根据权利要求4所述的一种采用双维度图注意力的伪造语音检测方法,其特征在于:所述步骤四中图注意力网络具体包括:

6.根据权利要求4所述的一种采用双维度图注意力的伪造语音检测方法,其特征在于:所述步骤四中图池化模块具体包括:

【技术特征摘要】

1.一种采用双维度图注意力的伪造语音检测方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种采用双维度图注意力的伪造语音检测方法,其特征在于:所述步骤一中预加重处理与提取线性频率倒谱系数特征具体包括:

3.根据权利要求1所述的一种采用双维度图注意力的伪造语音检测方法,其特征在于:所述步骤二中gmm建模与lgp特征提取具体包括:...

【专利技术属性】
技术研发人员:简志华梁承涵蔡逸闫铎文谈林涛杨曼
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1