一种基于声学遮蔽的伪音色对抗AI语音克隆的麦克风制造技术

技术编号：44824227 阅读：7 留言：0更新日期：2025-03-28 20:14

本申请属于音频设备设计技术领域，涉及一种基于声学遮蔽的伪音色对抗AI语音克隆的麦克风，该麦克风包括：音频采集模块，用于实时采集环境音频信号；模数转换器，用于将环境音频信号转换为数字信号；特征提取模块，用于对数字信号进行频域转换，提取频谱特征和音调特征；声学遮蔽计算模块，用于计算环境音频信号的掩蔽阈值，并根据掩蔽阈值确定环境音频信号中对人耳不可闻的频段；伪音色生成模块，用于基于提取的音调特征生成伪音色；合成模块，用于将生成的伪音色替换环境音频信号的对应频段，形成合成音频；音频输出模块，用于将所述合成音频对外输出。本申请能够在音频录制的过程中实时生成伪音色，确保用户在音频录制时始终受到保护。

全部详细技术资料下载

【技术实现步骤摘要】

本申请属于音频设备设计，特别涉及一种基于声学遮蔽的伪音色对抗ai语音克隆的麦克风。

技术介绍

1、随着人工智能(ai)技术的进步，语音克隆技术近年来得到了迅速发展。语音克隆技术利用深度学习算法，通过对大量语音数据进行训练，可以生成与特定人物声音高度相似的克隆语音。该技术在语音交互、虚拟助理、娱乐和教育等领域具有广泛的应用前景。然而，语音克隆技术的滥用也带来了隐私安全和身份伪造等风险问题。例如，恶意使用者可以通过克隆他人声音来进行电信诈骗、虚假信息传播，甚至在司法领域影响证据的真实性。因此，如何防止ai模型克隆敏感音频信息成为一个亟待解决的技术难题。

2、目前市面上已有一些针对语音克隆的防御技术和产品，主要包括噪声添加法、声音水印法以及基于特征扰动的对抗方法。

3、噪声添加法通过在原音频中添加背景噪声或对抗噪声，使得ai语音克隆模型难以精确识别音频的特征。对抗噪声一般通过生成对抗网络(gan)生成，可以在不明显影响人耳听觉的前提下干扰ai模型。然而，噪声添加方法往往需要在音频中引入较高强度的噪声才能达到理想的防御效果，这会导致音质显著下降，影响用户体验。另外，在用户实时录音或通话时，该技术无法及时提供保护，导致用户的语音隐私在关键时刻无法得到保障。

4、声音水印技术通过在音频中嵌入不可感知的水印特征，用于后续检测音频是否被克隆。水印通常通过高频率或低频率的微小变化嵌入到音频中，仅在合成音频中可以被检测到。然而，声音水印的检测依赖于音频的完整性，一旦音频被压缩或格式转换，水印易受损，从而影响其检测

5、基于特征扰动的对抗方法是指通过对音频特征进行扰动，使ai模型在生成克隆语音时无法正确还原特征。这种方法通过对音频信号的特定频段进行干扰，如调制基频或谐波特性，使得克隆生成的语音失真。然而，由于此类方法需要频繁调整干扰特征，难以适应不同的语音克隆算法，防御效果不稳定。

6、以上方式通常需要较高的专业知识和技术支持。用户需要进行复杂的设置和调试，以确保防御系统的有效运行。这对于普通用户来说，难度较高，容易造成技术障碍，限制了防御技术的广泛应用。

技术实现思路

1、为了解决上述问题，本申请提供了一种基于声学遮蔽的伪音色对抗ai语音克隆的麦克风，以实现在音频录制的过程中对音频进行防ai语音克隆保护。

2、本申请提供的基于声学遮蔽的伪音色对抗ai语音克隆的麦克风，主要包括：

3、音频采集模块，用于实时采集环境音频信号；

4、模数转换器，用于将环境音频信号转换为数字信号；

5、特征提取模块，用于对数字信号进行频域转换，提取频谱特征和音调特征；

6、声学遮蔽计算模块，用于计算环境音频信号的掩蔽阈值，并根据掩蔽阈值确定环境音频信号中对人耳不可闻的频段；

7、伪音色生成模块，用于基于提取的音调特征对备份的环境音频信号中对人耳不可闻的频段进行调制，生成伪音色；

8、合成模块，用于将生成的伪音色替换环境音频信号的对应频段，形成合成音频；

9、音频输出模块，用于将所述合成音频对外输出。

10、优选的是，所述音频采集模块具有编程接口，用于接收设定的采样率及采样时长。

11、优选的是，所述声学遮蔽计算模块包括：

12、各频段掩蔽阈值计算单元，用于将频谱划分为多个频段，确定每个频段的掩蔽阈值；

13、频段索引获取单元，用于获取功率低于掩蔽阈值的频段索引。

14、优选的是，所述麦克风还包括：

15、放大器，用于增强所采集的环境音频信号的强度。

16、优选的是，所述麦克风还包括：

17、数字信号处理模块，用于对合成音频进行均衡及压缩处理。

18、优选的是，在所述伪音色生成模块中，对所述音调特征进行相位和幅度的调整，所述音调特征至少包括基频、共振峰及谐波。

19、本申请能够在音频录制的过程中实时生成伪音色，确保用户在音频录制时始终受到保护，本申请通过声学遮蔽和伪音色生成，能够有效干扰ai模型的识别，同时保持高质量的音频输出，提升用户满意度。

本文档来自技高网...

【技术保护点】

1.一种基于声学遮蔽的伪音色对抗AI语音克隆的麦克风，其特征在于，包括：

2.如权利要求1所述的基于声学遮蔽的伪音色对抗AI语音克隆的麦克风，其特征在于，所述音频采集模块具有编程接口，用于接收设定的采样率及采样时长。

3.如权利要求1所述的基于声学遮蔽的伪音色对抗AI语音克隆的麦克风，其特征在于，所述声学遮蔽计算模块包括：

4.如权利要求1所述的基于声学遮蔽的伪音色对抗AI语音克隆的麦克风，其特征在于，所述麦克风还包括：

5.如权利要求1所述的基于声学遮蔽的伪音色对抗AI语音克隆的麦克风，其特征在于，所述麦克风还包括：

6.如权利要求1所述的基于声学遮蔽的伪音色对抗AI语音克隆的麦克风，其特征在于，在所述伪音色生成模块中，对所述音调特征进行相位和幅度的调整，所述音调特征至少包括基频、共振峰及谐波。

【技术特征摘要】

1.一种基于声学遮蔽的伪音色对抗ai语音克隆的麦克风，其特征在于，包括：

2.如权利要求1所述的基于声学遮蔽的伪音色对抗ai语音克隆的麦克风，其特征在于，所述音频采集模块具有编程接口，用于接收设定的采样率及采样时长。

3.如权利要求1所述的基于声学遮蔽的伪音色对抗ai语音克隆的麦克风，其特征在于，所述声学遮蔽计算模块包括：

4.如权利要求1所述的...

【专利技术属性】
技术研发人员：侯文杰，王忠，费磬远，
申请(专利权)人：兰州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人