一种基于字典分类的音频匹配追踪装置及其追踪方法制造方法及图纸

技术编号:15331962 阅读:113 留言:0更新日期:2017-05-16 15:07
本发明专利技术公开了一种基于字典分类的音频匹配追踪装置,包括信号分解单元和信号重构单元,信号分解单元包括字典建立模块、信号分类模块、权值比较模块、残差计算模块和阈值控制模块,信号重构单元包括重构系数提取模块和信号合成模块。本发明专利技术还公布了该追踪装置的追踪方法。本发明专利技术通过对信号进行分类,对不同类型的信号采取不同的稀疏字典进行MP算法,减少了无关遍历次数,降低了计算复杂度;在分类预处理过程中,通过计算原始信号的能量分布区间判断其适应的稀疏字典;本方法缩小了所需字典的维度,提高了编码速率,使用效果好。

Audio matching tracking device based on dictionary classification and tracking method thereof

The invention discloses a dictionary based audio classification, tracking device, including signal decomposition and signal reconstruction unit unit signal decomposition unit includes a dictionary establishing module, signal classification module, a comparison module, residual weight calculation module and threshold control module, signal reconstruction unit includes a reconstruction coefficient extraction module and signal synthesis module. The invention also discloses a tracking method of the tracking device. The present invention is to classify the signal, adopt different sparse dictionary MP algorithm for different types of signals, reducing the independent traversal times, reduces the computational complexity; in the classification process by calculating the energy of the original signal distribution interval judgment the adaptive sparse dictionary approach reduces the required; this dictionary dimensions, improves the encoding rate, good use effect.

【技术实现步骤摘要】
一种基于字典分类的音频匹配追踪装置及其追踪方法
本专利技术涉及音频编码领域,具体是一种基于字典分类的音频匹配追踪装置。
技术介绍
稀疏表示一般指用尽量少的基函数来准确地表示原始信号,从而抓住信号的主要特征,进而从本质上降低信号处理成本。匹配追踪(MP:Matchingpursuit)作为使用较广的稀疏表示算法之一,其基本思路是在迭代过程中依次从过完备字典中选择最优原子,使得信号的逼近更为优化。由于MP算法用来表示信号的过完备字典基可以自适应根据信号本身的特点来灵活地选取;并且其在原子选择过程中采取的是一种重复迭代逼近的贪婪算法,保证了最终得到的原子系数个数较少,MP算法被广泛应用于信号分析的各个领域,如图像处理、生物医学信号处理、音频处理等。随着人们对流媒体质量要求的提高以及移动终端用户数量的不断增加,音视频编码效率的要求也日渐提高。传统匹配追踪算法因其计算复杂度较高,不适应于实时处理。目前已提出多种快速匹配追踪算法,但大都涉及耗时的优化,或是牺牲稀疏表示效率为补偿,计算速度也难以满足大规模问题的需要。
技术实现思路
本专利技术的目的在于提供一种基于字典分类的音频匹配追踪装置,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种基于字典分类的音频匹配追踪装置,包括信号分解单元和信号重构单元,信号分解单元包括字典建立模块、信号分类模块、权值比较模块、残差计算模块和阈值控制模块,信号重构单元包括重构系数提取模块和信号合成模块。所述基于字典分类的音频匹配追踪装置的追踪方法,包括信号分解方法和信号重构方法;所述信号分解方法的具体步骤如下:步骤一,根据不同处理信号类型选择对应的稀疏字典;步骤二,判断待处理信号的类型,根据其类型选择与之相适应的稀疏字典,对原始信号进行分类预处理,计算其与步骤一中所建立的稀疏字典的匹配度;步骤三,将步骤二中得出的稀疏字典记为D,为求各字典中各原子在待处理信号上的权重系数,将稀疏字典中的原子依次与待处理信号做内积,计算内积绝对值的最大值;步骤四,由步骤三可得待处理信号在字典中最大原子处的分量,则此次迭代后信号残差为信号与该分量的矢量差值,同时在稀疏系数矢量中记录更新的稀疏系数;步骤五,匹配追踪算法处理信号是通过累计迭代,将原始信号表示成权重与对应原子相乘的叠加与残差之和,当信号残差减少至一定值时可以终止迭代,该一定值可由迭代次数和信噪比共同决定;所述信号重构方法的具体步骤如下:步骤一,从稀疏系数码流中提取重构信号要使用到的原子权重、原子标号和所用字典类型标号;步骤二,根据字典类型标号确定编码时采用稀疏字典类型,将步骤一中所得原子权重与其对应稀疏字典中的原子做乘积,并依次累加,得输出信号为此次匹配追踪算法最终对原始信号的拟合信号。作为本专利技术进一步的方案:信号分解方法中步骤二计算待处理信号与步骤一中所建立的稀疏字典的匹配度的具体计算步骤如下:计算待处理信号对应的频域值,将待处理信号的时域值与频域值分别归一化后划分成j个长度为a的小段(a≤N/2),再计算各小段的能量值,a个连续样本的能量值可近似计算式如下:分别计算时频域能量的和的两倍,并比较其大小,作为本专利技术进一步的方案:信号分解方法中步骤三所述的内积绝对值最大值的计算公式为:iopt∈[1,M]为字典中原子标号,为各原子与S的内积值,为字典中原子在S上的最大权重系数。作为本专利技术进一步的方案:信号分解方法中步骤五中所述的信噪比简化计算公式为:S为稀疏表示处理前的原始信号幅度值,S′为此次稀疏表示恢复后的信号幅度值。与现有技术相比,本专利技术的有益效果是:本专利技术通过对信号进行分类,对不同类型的信号采取不同的稀疏字典进行MP算法,减少了无关遍历次数,降低了计算复杂度;在分类预处理过程中,通过计算原始信号的能量分布区间判断其适应的稀疏字典;本方法缩小了所需字典的维度,提高了编码速率,使用效果好。附图说明图1为基于字典分类的音频匹配追踪装置中信号分解方法的流程图。图2为基于字典分类的音频匹配追踪装置中信号重构方法的流程图。图3为基于字典分类的音频匹配追踪装置中信号分解单元的结构示意图。图4为基于字典分类的音频匹配追踪装置中信号重构单元的结构示意图。其中:101-字典建立模块,102-信号分类模块,103-权值比较模块,104-残差计算模块,105-阈值控制模块,201-重构系数提取模块,202-信号合成模块。具体实施方式下面结合具体实施方式对本专利的技术方案作进一步详细地说明。请参阅图1-4,一种基于字典分类的音频匹配追踪装置,包括信号分解单元和信号重构单元,信号分解单元包括字典建立模块101、信号分类模块102、权值比较模块103、残差计算模块104和阈值控制模块105,信号重构单元包括重构系数提取模块201和信号合成模块202。字典建立模块101用于构建适用于不同类型信号的稀疏字典。例如对于语音处理系统,选择具有语音特性的字典;对于瞬变信号处理系统,选择相对瞬态的字典;而对于一些特征并不明显或者是同时需要处理多种类型信号的系统而言,则选择普适性较强的字典。信号分类模块102用于判断待处理信号的类型,根据其类型选择与之相适应的稀疏字典,对原始信号进行分类预处理,计算其与字典建立模块中所建立的稀疏字典的匹配度。具体计算步骤如下:首先计算待处理信号对应的频域值,将待处理信号的时域值与频域值分别归一化后划分成一定个数的定长小段,再计算各小段的能量值;由于信号的幅度平方之和与信号幅度之和存在类正比关系,同时计算信号幅度之和的计算量远远小于计算信号的幅度平方之和,因此以信号幅度之和来近似。再分别计算时频域能量的和,并比较其大小,能量和越大,信号能量分布越密集。假设时域能量的和大于频域能量的和,选择时域能量较为集中的Gabor字典,反之,选择频域能量较为集中的余弦字典,记录稀疏字典类型。权值比较模块103用于求各原子在待处理信号上的权重系数,从信号分类模块102中得出的稀疏字典,将稀疏字典中的原子依次与待处理信号做内积,计算内积绝对值的最大值。残差计算模块104用于计算待处理信号与权值比较模块中所得原子方向分量的残差值,由于原子方向分量等于权值绝对值的最大值与该原子的乘积,该残差值等于信号与原子方向分量的矢量差值,同时将更新的稀疏系数记录在稀疏系数矢量中,原子标号对应于稀疏系数矢量中该稀疏系数所在位置,该位置的值为原子权重。阈值控制模块105用于利用控制信噪比(SNR)阈值与迭代次数共同监督循环匹配的精度,匹配追踪算法处理信号是通过累计迭代,将原始信号表示成权重与对应原子相乘的叠加与残差之和,当信号残差减少至一定值时可以终止迭代,该一定值可由迭代次数、信噪比(SNR)共同决定,当达到目标SNR或者预设迭代次数时终止循环迭代,输出稀疏系数矢量,反之重复预处理模块至残差计算模块直至满足终止条件,由于信号的幅度平方之和与信号幅度之和存在类正比关系,同时计算信号幅度之和的计算量远远小于计算信号的幅度平方之和,因此信噪比可近似计算为原始信号与残差信号幅度绝对值的比值的对数。重构系数提取模块201用于提取稀疏系数码流中重构信号要使用到的原子权重(稀疏系数)、原子标号(对应于稀疏系数矢量中该稀疏系数所在位置)和所用字典类型标号。信号合成模块202本文档来自技高网...
一种基于字典分类的音频匹配追踪装置及其追踪方法

【技术保护点】
一种基于字典分类的音频匹配追踪装置,其特征在于,包括信号分解单元和信号重构单元,信号分解单元包括字典建立模块、信号分类模块、权值比较模块、残差计算模块和阈值控制模块,信号重构单元包括重构系数提取模块和信号合成模块。

【技术特征摘要】
1.一种基于字典分类的音频匹配追踪装置,其特征在于,包括信号分解单元和信号重构单元,信号分解单元包括字典建立模块、信号分类模块、权值比较模块、残差计算模块和阈值控制模块,信号重构单元包括重构系数提取模块和信号合成模块。2.一种如权利要求1所述的基于字典分类的音频匹配追踪装置的追踪方法,其特征在于,包括信号分解方法和信号重构方法;所述信号分解方法的具体步骤如下:步骤一,根据不同处理信号类型选择对应的稀疏字典;步骤二,判断待处理信号的类型,根据其类型选择与之相适应的稀疏字典,对原始信号进行分类预处理,计算其与步骤一中所建立的稀疏字典的匹配度;步骤三,将步骤二中得出的稀疏字典记为D,为求各字典中各原子在待处理信号上的权重系数,将稀疏字典中的原子依次与待处理信号做内积,计算内积绝对值的最大值;步骤四,由步骤三可得待处理信号在字典中最大原子处的分量,则此次迭代后信号残差为信号与该分量的矢量差值,同时在稀疏系数矢量中记录更新的稀疏系数;步骤五,匹配追踪算法处理信号是通过累计迭代,将原始信号表示成权重与对应原子相乘的叠加与残差之和,当信号残差减少至一定值时可以终止迭代,该一定值可由迭代次数和信噪比共同决定;所述信号重构方法的具体步骤如下:步骤一,从稀...

【专利技术属性】
技术研发人员:胡瑞敏姜林胡霞王晓晨江游
申请(专利权)人:武汉大学深圳研究院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1