The invention discloses an identity information hiding method for voice communication, which is carried out in the following steps: first, modeling the voice source; second, generating the voice dictionary; third, using the identity information hiding algorithm to convert the user's voice into the voice of the most different voice source from the user. By building N speakers'voice database and extracting the way of storing feature parameters, the drawbacks of traditional voice conversion methods which need to establish different conversion functions for different speakers are solved. In the invention, for different users, only a small amount of voice data is needed to select the conversion function according to the similarity, and the identity information hiding can be realized without training the conversion function again, which is convenient for users to use.
【技术实现步骤摘要】
面向语音通信的身份信息隐藏方法
本专利技术属于信息安全
,具体涉及一种面向语音通信的身份信息隐藏方法。
技术介绍
说话人身份隐藏技术是指保持语言语义信息不变的情况下,改变说话人的个性特征,达到隐藏说话人身份的目的,在保密通信领域具有非常重要的应用。目前,在说话人身份隐藏技术中,常用的方法是通过改变语音的基频,达到变声的效果,但是这种方法语音的听觉质量较差。此外还有一种是通过语音转换技术,实现基频和声道谱同时转换,合成具有更高质量的语音,但是这种方式,需要获取大量源、目标说话人的对称语音数据(即语义内容相同的语音),建立语音的转换函数,不同的说话人需要建立不同的转换函数。在使用过程中,用户需要录制较多的语音数据,费时费力,在实际应用中使用不方便。
技术实现思路
针对现有技术存在的上述问题,本专利技术提出了一种面向语音通信的身份信息隐藏方法,其通过建立预训练的语音转换函数库,可以便捷、实时地进行说话人身份隐藏。为达到上述技术目的,本专利技术采取如下技术方案:一种面向语音通信的身份信息隐藏方法,其按如下步骤进行:一、说话人即语音源建模具体的,利用GMM对每个说话人即语音源的语音特征参数空间进行建模,它是用多个高斯分布的概率密度的组合来描述特征矢量在概率空间的分布状况,每个人对应一个GMM,即其中,x为d维特征矢量;ωm为混合权重,且满足为d维高斯函数,表示GMM模型的第m个高斯分量;μm表示该高斯分量的均值矢量;∑m表示协方差矩阵。整个高斯混合模型(GMM)由各混合分量的均值矢量、协方差矩阵以及混合权重来描述,用λ来表示该模型,有:λ={ωm,μm,∑m},m ...
【技术保护点】
1.一种面向语音通信的身份信息隐藏方法,其特征是按如下步骤进行:一、语音源建模;二、生成语音字典;三、采用身份信息隐藏算法将用户的语音转换成了与该用户差异最大的语音源的声音。
【技术特征摘要】
1.一种面向语音通信的身份信息隐藏方法,其特征是按如下步骤进行:一、语音源建模;二、生成语音字典;三、采用身份信息隐藏算法将用户的语音转换成了与该用户差异最大的语音源的声音。2.如权利要求1所述面向语音通信的身份信息隐藏方法,其特征是:步骤一具体如下:利用GMM对每个说话人即语音源的语音特征参数空间进行建模,每个人对应一个GMM,即其中,x为d维特征矢量;ωm为混合权重,且满足Pm(x;μm,∑m)为d维高斯函数,表示GMM模型的第m个高斯分量;μm表示该高斯分量的均值矢量;∑m表示协方差矩阵;整个高斯混合模型用λ来表示:λ={ωm,μm,∑m},m=1,2,...,M(3)模型参数λ是通过期望最大算法求得,假设语音特征参数空间是长度为T的矢量序列X={xt,t=1,2,...,T},则有:通过上述算法求解GMM模型参数,为每一说话人构建一个GMM模型。3.如权利要求2所述面向语音通信的身份信息隐藏方法,其特征是:步骤二具体的如下:对语音库中的N个说话人,分别通过STRAIGHT模型进行信号建模,提取每帧语音的声道谱和基频,并从声道谱中求出梅尔倒谱系数;声道谱参数用于生成语音字典和进行特征参数的转换,MCC参数用于动态时间规整和说话人特征参数空间的GMM建模;用DTW对N个说话人的MCC矢量序列进行时间对齐,再根据这些时间对齐信息,将N个说话人的声道谱特征参数矢量序列进行相应的时间对齐,然后在每个对齐的声道谱特征参数矢量序列的相同位置上随机抽取L个特征参数矢量;每一说话人分别用各自随机抽取的L个的声道谱特征参数矢量构成的字典,获得N个对称的字典,即{An,n=1,2,L,N};同时对每一说话人的基音频率进行统计分析,得到均值μ和方差σ。4.如权利要求3所述面向语音通信的身份信息隐藏方法,其特征是:步骤三具体如下:(1)建立包含N个说话人的语音库;(2)分别为每个说话人的特征参数矢量空间建立GMM模型,求得...
【专利技术属性】
技术研发人员:简志华,张石磊,
申请(专利权)人:杭州电子科技大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。