一种无需重新排序的4点WFTA处理器和方法技术

技术编号:8323401 阅读:161 留言:0更新日期:2013-02-14 00:39
本发明专利技术涉及一种无需重新排序的4点WFTA处理器,其特征在于,所述处理器主要由输入矩阵I、可变对角矩阵A、输出矩阵O和复数乘法器M1~M3四部分组成。输入矩阵I通过复数乘法器M1与输入向量v相乘得到向量p,可变对角矩阵A通过复数乘法器M2与向量p相乘得到向量q,输出矩阵O通过复数乘法器M3与向量q相乘得到输出向量V。本发明专利技术去除了N点变址同序素因子算法中4点WFTA涉及的重新排序操作,简化了控制逻辑,提高了运算速度,节约了存储器消耗,降低了硬件成本。

【技术实现步骤摘要】

本专利技术涉及数字信号处理领域,特别涉及一种无需重新排序的小点数Winograd快速傅里叶变换算法(Winograd Fourier Transform Algorithm, WFTA)的实现方法。
技术介绍
随着无线通信业务的不断增长,可利用的频谱资源日益紧张。为了提高频谱利用率和通信质量,现代无线通信系统广泛采用对频率选择性衰落具有较强免疫力的正交频分复用(Orthogonal Frequency Duplex Multiplexing, 0FDM)技术。OFDM 技术的核心是FFT。FFT的点数分为2的幂次和非2幂次两种。点数是2的幂次的FFT算法和实现比较成熟。相比之下,非2幂次点数的FFT更为灵活,近年来在DRM、DTMB, LTE系统中开始得到应用。因此,非2幂次点数FFT的算法和实现值得深入研究。目前,素因子算法(Prime Factor Algorithm, PFA)是最有效的非2幂次FFT,它采用嵌套多维结构,能有效降低计算复杂度。对于N点非2幂次FFT,假设N可分解为s个两两互素因子的乘积,即N=N1N^N- N点PFA的基本原理是,把一维大点数FFT映射成s维小点数FFT,第i (i=l, 2,...,s)维FFT进行N/队次Ni点小点数FFT。小点数FFT可借助于Cooley-Tukey算法、WFTA以及其它高效算法。在某些情况下,PFA需要重新排序。根据在计算过程中所处的位置,重新排序分为预扰乱和后扰乱。不考虑Ni (i = I, 2,…,S)点FFT的内部机制,如果第i维FFT无需重新排序,那么它是同址的;否则,它是变址的,重新排序是在队点序列内进行的,预扰乱和后扰乱分别在Ni点FFT之前和之后执行。类似地,不考虑每维FFT的内部机制,如果N点PFA整体上无需重新排序,那么它是同序的;否则,它是变序的,重新排序是在N点序列内进行的,·预扰乱和后扰乱分别在第一维FFT开始前和最后一维FFT结束后执行。这样,PFA理论上可分为4种变址变序、变址同序、同址同序和同址变序。目前,PFA要么是变址同序的,要么是同址变序的,不可避免地引入了重新排序操作。众所周知,重新排序意味着必须增加一级缓冲区,需要消耗较多的存储器资源,会增加硬件成本。此外,重新排序还会降低运算速度,增加控制的复杂度。与同址变序PFA相比,变址同序PFA消耗较少的存储器资源,两者重新排序的总延时完全相同,都是N个时钟周期,因此,变址同序PFA更可取。
技术实现思路
针对PFA的现有实现方案中存在的需要重新排序这一技术缺点,本专利技术提供了无需重新排序的4点WFTA处理器。当N点非2幂次FFT采用变址同序PFA实现时,如果N的某一互素因子Ni=4(i = I, 2,…,s),那么使用本专利无需对第i维FFT重新排序。为了去除第i维4点FFT的重新排序操作,需要修改常规的4点WFTA。常规的4点WFTA的对角矩阵是固定不变的,本专利技术将对角矩阵对角线上的各元素表示成角度参数Θ =2 Ji /4* < N/4>4的函数,其中,< N/4>4表示对N/4取模4操作。对于不同的N,修改的4点WFTA的对角矩阵不尽相同。对于第i维FFT,需进行N/4次无需重新排序的4点WFTA,无需重新排序,简化了控制逻辑,共节约了 N/4*4=N个时钟周期,提高了运算速度,存储器消耗减少了一半,降低了硬件成本。关于本专利技术的优点与精神可通过接下来的专利技术详述及附图得到进一步的了解。附图说明图I是常规的4点WFTA处理器的功能框图;图2是输入矩阵I的具体构成;图3是输出矩阵O的具体构成;图4是对角矩阵D对角线上的具体构成; 图5是预扰乱的4点WFTA处理器的结构示意图;图6是后扰乱的4点WFTA处理器的结构示意图;图7是无需重新排序的4点WFTA处理器的功能框图;图8是可变对角矩阵A对角线上的具体构成。具体实施例方式下面结合附图和具体实施例对本专利技术作进一步说明,但不作为对本专利技术的限定。N点序列X (η)的FFT为 Ar-IΧ{ ) = Υ^χ(η)\νν(I) ^=O其中,n,k=0, I,…,N_l,WN=e_jWN。直接计算N点FFT的乘法和加法运算量都与N的平方成正比。当N较大时,运算量很大。为了降低计算复杂度,当N不是2的幂次时,可采用嵌套多维的PFA实现N点FFT。假设N可分解为s个两两互素因子的乘积,即N=N1Nz^N-也就是说,任意两个因子Ni和Nj(i, j=l, 2,…,s,且i古j)的最大公约数是I。注意,Ni未必是素数。N点PFA的基本原理是,把一维大点数FFT映射成s维FFT,第i维FFT进行N/队次Ni点小点数FFT。小点数FFT可借助于Cooley-Tukey算法、WFTA以及其它高效算法。为了使PFA总体上是同序的,在一维FFT映射成s维FFT时,根据中国余数定理,输入索引η和输出索引k米用如下相同的映射方式Mn = (J^(N/Nl)nt)N(2) =1 Mk = (^(NfNiJkt)hr(3) i=l其中,符号〈〉N表示模N运算,H^ki=O, I,-,Ni-I0将式⑵和(3)代入式(1),整理可得Nli -I My—I N1-ImA-M = ;…Σ Σ取, …, 朽广神'朽f/iW2 C晶 (4)Μ=0 Yi2=Q W1=O其中,本文档来自技高网
...

【技术保护点】
一种无需重新排序的4点Winograd快速傅里叶变换处理器,它嵌套于s维的N点变址同序素因子算法,其中,N=N1N2…Ns,任意两个不同因子Ni和Nj互素,i=1,2,…,s,j=1,2,…,s,当某一因子Ni=4时,所述处理器可用于去除N点变址同序素因子算法第i维FFT的重新排序操作,其特征在于,所述处理器包括:复数乘法器M1~M3,它们完成矩阵与向量的乘法运算;输入矩阵I,它通过复数乘法器M1与输入向量v相乘得到向量p;可变对角矩阵A,它通过复数乘法器M2与向量p相乘得到向量q;输出矩阵O,它通过复数乘法器M3与向量q相乘得到输出向量V。

【技术特征摘要】
1.一种无需重新排序的4点Winograd快速傅里叶变换处理器,它嵌套于s维的N点变址同序素因子算法,其中,N=N1N^Ns,任意两个不同因子Ni和Nj互素,i = I, 2, ···, s,j=l, 2,…,S,当某一因子队=4时,所述处理器可用于去除N点变址同序素因子算法第i维FFT的重新排序操作,其特征在于,所述处理器包括 复数乘法器M1 M3,它们完成矩阵与向量的乘法运算; 输入矩阵I,它通过复数乘法器M1与输入向量V相乘得到向量P ; 可变对角矩阵A,它通过复数乘法器M2与向量P相乘得到向量q ; 输出矩阵0,它通过复数乘法器M3与向量q相乘得到输出向量V。2.如权利要求I所述的4点Winograd快速傅里叶变换处理器,其特征在于,所述输入 矩阵I和输出矩阵O与常规的4点Winograd快速傅里叶变换处理器相同,而对角矩阵由常规的常数矩阵修改为可变矩阵A。3.如权利要求I所述的4点Winograd快速傅里叶变换处理器,其特征在于,所述可变对角矩阵A对角线上的各元素是角度参数Θ =2 Ji /4* < N/4>4的函数,其中,< N/4>4表示对N/4取模4操作。4.一种去除N点变址同序素因子算法第i维FFT重新排序操作的4点Winograd...

【专利技术属性】
技术研发人员:张鹏蔡超时刘昌银
申请(专利权)人:苏州威士达信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1