多格式音频感知哈希认证的特征值提取及认证方法技术

技术编号:10512482 阅读:204 留言:0更新日期:2014-10-08 13:38
多格式音频感知哈希认证的特征值提取及认证方法,主要解决现有音频认证算法认证音频格式单一、认证算法不通用、认证效率低的问题;本发明专利技术基于双树复小波变换(DT-CWT)原理,首先对预处理后的音频信号进行全局双数复小波变换(DT-CWT),提取音频信号的实小波系数;接着对实小波系数进行二次差分、分帧,计算帧系数自然对数下的和值,作为音频信号的特征向量;最后对特征向量进行哈希构造,生成感知哈希摘要序列,通过哈希匹配实现了对音频内容的快速认证。

【技术实现步骤摘要】
多格式音频感知哈希认证的特征值提取及认证方法
本专利技术属于多媒体信息安全领域,具体涉及一种基于双树复小波变换(DualTreeComplexWaveletTransform,DT-CWT)的多格式音频感知哈希认证的特征值提取及认证方法。
技术介绍
音频多媒体通信是多媒体通信技术的重要组成部分,音频信息往往包含一些敏感内容和重要信息。然而,无线以及网络等通信信道的开放性和多媒体专业软件的广泛使用使得音频多媒体信息的内容真实性难以得到保证,不真实的信息内容越来越难以被证伪。因此,为保证音频多媒体信息的可靠通信和内容安全,有必要对音频内容真实性和完整性进行验证。音频感知哈希(AudioPerceptualHashing)认证技术通过验证多媒体信息的内容完整性及真实性来保护多媒体信息,它可以检测出接收到的音频数据在传送过程中有没有经过第三方的恶意编辑和篡改,使得多媒体音频信息服务更加安全可靠,能较好地实现对音频、宽带音频等信号的检索和内容完整性认证。目前,音频感知哈希的研究尚在起步阶段,音频内容认证的研究相对较少,应用在音频通信终端实时认证的设计更是少之又少。音频感知哈希认证技术的关键步骤是感知特征值提取,它是以人类感知模型为基础,分析提取音频多媒体对象对于各种内容保持操作的不变量。感知特征值是音频信号的数字摘要表达形式,代表音频信号的数据,因而所提取特征值的水平严重影响音频感知哈希的认证。Chen等人(见文献ChenN,WanW.RobustSpeechHashFunction[J].ETRIjournal,2010,32(2):345-347)提出基于频率声道模型参数的算法;Jiao等人(见文献JiaoY,LiM,LiQ,etal.Key-dependentcompresseddomainaudiohashing[C].IntelligentSystemsDesignandApplications,2008.ISDA'08.EighthInternationalConferenceon.IEEE,2008,3:29-32.)对压缩域音频信号的MDCT系数做处理;Gaikwad等人(见文献Gaikwad.S.,Gawali,B.,Yannawar,P.,etal.FeatureextractionusingfusionMFCCforcontinuousmarathispeechrecognition[C].IndiaConference(INDICON),2011AnnualIEEE,16-18Dec.2011,1-5.)提取音频信号的梅尔倒谱频率系数作为特征集;Lotia等人(见文献LotiaP,KhanDMR.SignificanceofComplementarySpectralFeaturesforSpeakerRecognition[J].IJRCCT,2013,2(8):579-588.)应用线性预测对音频信号进行分析。这些感知哈希摘要提取算法都具有一定区分性和鲁棒性,但认证效率偏低,不能满足移动通信终端音频通信的实时性要求。Huang等人(见文献HuangY,ZhangQ,YuanZ.PerceptualSpeechHashingAuthenticationAlgorithmBasedonLinearPredictionAnalysis[J].TELKOMNIKAIndonesianJournalofElectricalEngineering,2014,12(4):3214-3223.)提出E+LPC算法,该算法认证效率高,能满足移动通信终端音频通信的实时性要求,但鲁棒性较弱。不仅如此,上述所有音频认证算法只是针对单一音频格式,不具有通用性,且不能实现小范围篡改检测。DT-CWT保持了传统的离散小波变换的时频局部化分析能力,克服了离散小波变换的缺陷,是一种高计算效率的小波变换形式。音频信号经过DT-CWT所获得小波系数受音频格式影响较小,在提高时-频分辨率的同时,其互补性和完整性也使原始信号的信息得到完整保留。因此,音频信号的特征信息可由小波系数完整表达,从而有效而又正确地表现语音波形及其频谱的性质。
技术实现思路
本专利技术的目的解决现有音频认证算法认证音频格式单一、认证算法不通用、认证效率低的问题。本专利技术是多格式音频感知哈希认证的特征值提取及认证方法,其步骤为:(1)对音频信号S进行预加重处理;(2)对预加重后的信号进行3级双树复小波变换(DT-CWT)分解,得到树A的实小波系数和树B的复小波系数,提取树A的实小波系数RA;(3)对实小波系数RA进行二阶差分,获得差分信号;(4)对差分信号进行不重叠分帧,帧长为2.5ms;(5)计算帧系数自然对数下特征值序列的和值E其中,是第j帧第i个小波系数,M是实小波系数的分帧总帧数,N是帧长度;(6)生成音频信号特征向量H,其中,是特征值序列E的中值;(7)对向量H进行量化处理,生成感知哈希序列h;(8)哈希匹配:按上述(1)~(7)的步骤先从原始音频信号中提取出哈希特征向量,将其转换为感知哈希认证序列h,用同样的方法计算待测音频信号感知哈希认证序列h',再将两者进行匹配,匹配结果与阈值相比较;两段感知内容相同音频信号的比特误码率(BER)值小于匹配阈值,认证通过;相反,感知不同语音的BER应大于匹配阈值,则认证不通过。本专利技术具有以下优点:(1)本专利技术对WAV、MP3、FLAC、OGG和M4A五种不同格式的音频信号具有通用性,解决了音频信号认证算法的格式单一、算法不具有通用性的问题;(2)本专利技术对音频信号进行全局DT-CWT,大大降低了算法计算复杂度。且特征值的获取只有加法运算,进一步提高了算法的运行效率,能够满足移动通信终端实时认证要求;(3)本专利技术对音频信号进行了二次差分,提高了音频信号的抗噪声性能和感知特征值的鲁棒性;(4)本专利技术哈希构造过程简单,感知哈希摘要性强,故认证效率高,并可实现小范围篡改检测。本专利技术可应用于不同格式音频信号,高效地实现音频通信通话过程中的内容认证、说话人认证和检索,并可实现小范围篡改检测,具有实际应用价值。附图说明图1为本专利技术的流程图,图2为双树复小波分解示意图,图3为不同音频库BER均值曲线图,图4为WAV格式音频库的FAR-FRR曲线图,图5为MP3格式音频库的FAR-FRR曲线图,图6为FLAC格式音频库的FAR-FRR曲线图,图7为OGG格式音频库的FAR-FRR曲线图,图8为M4A格式音频库的FAR-FRR曲线图,图9为五种不同格式音频文件所组成的音频库的FAR-FRR曲线图,图10为WAV格式音频库的BER正态分布曲线图,图11为MP3格式音频库的BER正态分布曲线图,图12为FLAC格式音频库的BER正态分布曲线图,图13为OGG格式音频库的BER正态分布曲线图,图14为M4A格式音频库的BER正态分布曲线图,图15为五种不同格式音频文件所组成的音频库的BER正态分布曲线图,图16为FAR曲线的理论分析和实验结果。具体实施方案实现本专利技术目的的技术思路是:首先对音频信号进行预加重处理,并对处理后的音频信号进行全局双数复小波变换(DT-CWT),获得音频信号的实小波系数;然后对实小波系数进行二次差分、分帧,本文档来自技高网
...
多格式音频感知哈希认证的特征值提取及认证方法

【技术保护点】
多格式音频感知哈希认证的特征值提取及认证方法,其步骤为:(1)对音频信号S进行预加重处理;(2)对预加重后的信号进行3级DT‑CWT,提取树A的实小波系数RA;(3)对实小波系数RA进行二阶差分,获得差分信号;(4)对差分信号进行不重叠分帧,帧长为2.5ms;(5)计算帧系数自然对数下的和值E其中,是第j帧第i个小波系数,M是实小波系数的分帧总帧数,N是帧长度;(6)生成音频信号特征向量H,;其中,是序列的中值;(7)对向量H进行量化处理,生成感知哈希序列h;(8)哈希匹配:按上述步骤先从原始音频信号中提取出哈希特征向量,将其转换为感知哈希认证序列h,用同样的方法计算待测音频信号感知哈希认证序列h',再将两者进行匹配,匹配结果与阈值相比较;两段感知内容相同音频信号的BER值小于匹配阈值,认证通过;相反,感知不同语音的BER应大于匹配阈值,则认证不通过。

【技术特征摘要】
1.多格式音频感知哈希认证的特征值提取及认证方法,其步骤为:(1)对音频信号S进行预加重处理;(2)对预加重后的信号进行3级双树复小波变换(DT-CWT)分解,得到树A的实小波系数和树B的复小波系数,提取树A的实小波系数RA;(3)对实小波系数RA进行二阶差分,获得差分信号;(4)对差分信号进行不重叠分帧,帧长为2.5ms;(5)计算帧系数自然对数下特征值序列的和值E其中,是第j帧第i个小波系数,M是实小波系数的分帧总帧数,N是帧长度;(6)生成音频信号特征向量H,其中,是特征值序列E的中值;(7)对向量H进行量化处理,生成感知哈希序列h;(8)哈希匹配:按上述(1)~(7)的步骤先从原始音频信号中提取出哈希特征向量,将其转换为感知哈希认证序列h,用同样的方法计算待测音频信号感知哈希认证序列h',再将两者进行匹配,匹配结果与阈值相比较;两段感知内容相同音频信号的比特误码率(BER)值小于匹配阈值,认证通过;相反,感知不同语音的BER应大于匹配阈值,则认证不通过。2.根据权利要求1所述的多格式音频感知哈希认证的特征值提取及认证方法,其特征在于DT-CWT的步骤为:(1)音频信号S进行预加重处理,获得信号Sh;(2)信号Sh经过Q-Shift双树滤波器,进行3级DT-CWT,得到树A的实小波系数和树B的复小波系数;其中,DT-CWT采用(13,19)-Tap和(14,14)-Tap奇/偶滤波器组;ψ(Sh)=ψr(Sh)+jψi(Sh);(3)提取树A的实小波系数ψr(Sh),记作RA。3.根据权利要求1所述的多格式音频感知哈希认证的特征值提取及认证方法,其特征在于,权利要求1中步骤(4)的分帧和步骤(5)帧特征值计算按如下步骤进行:(1)确定实小波系数的分帧总帧数M和帧长度N;实小波系数RA经过二次差分、加窗分帧处理后,得到的第j帧的信号为Aj(m),w(m)为窗函数,则Aj(m)满足:Aj(m)=w(m)Aj(m+k)...

【专利技术属性】
技术研发人员:张秋余省鹏飞黄羿博杨仲平任占伟余爽
申请(专利权)人:兰州理工大学
类型:发明
国别省市:甘肃;62

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1