一种基于指令级并行ILP和数据级并行DLP的FFT浮点优化方法技术

技术编号：13986941 阅读：73 留言：0更新日期：2016-11-13 04:28

本发明专利技术公开了一种基于指令级并行ILP和数据级并行DLP的FFT浮点优化方法，其特征是按如下步骤进行：1，确定迭代层数，并将其划分成三层结构；2，通过使用位反序指令等操作，完成入度层计算；3，完成入度层计算后，对即将进行的中间层计算进行分类，对奇数层与偶数层两种情况进行分别运算，并得到中间层计算结果；4，采用模拟宏间传输操作，将中间层计算结果进行调整，并完成出度层计算。本发明专利技术能解决算法中所存在的指令相干与结构限制的问题，并充分发挥运算部件负载效能，从而大幅度提高瓶颈资源的平均利用率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于向量处理机以及数字信号处理领域，具体涉及基于ILP和DLP的硬件平台上浮点版本FFT实现高效计算的方法。
技术介绍
离散傅里叶变换(Discrete Fourier Transform,DFT)在现代信号处理系统领域里应用广泛，如雷达信号处理、SAR图像处理、声呐计算、视频图像算法、频谱分析、语音识别等。傅里叶变化计算是典型的计算密集和访存密集型应用，例如N点的DFT变换的计算复杂度为O(N2)。1965年Cooley和Turkey提出一种快速傅里叶变换(Fast Fourier Transform,FFT)计算方法，可显著地减少运算量，计算复杂度由原来的O(N2)降到了O(Nlog2N)。信号处理应用通常对计算的实时性要求很高，FFT计算效率越高，信号处理的实时性就越好。指令级并行(Instruction Level Parallelism，ILP)是指处理器在同一个指令周期内发射多条并行执行的指令。数据级并行(Data Level Parallelism，DLP)是指能够在同一时刻对不同数据进行并行计算的体系结构。基于ILP与DLP的硬件平台通常都会采用VLIW与SIMD技术，使其能够进行大规模的高效的运算。由于ILP与DLP技术相结合的硬件平台较为复杂，基于其的快速傅里叶变换的研究并没有得到展开。
技术实现思路
本专利技术为克服现有技术存在的不足之处，提出一种基于ILP和DLP的FFT浮点优化方法，以期能解决算法中指令相干及结构的限制，并充分发挥运算部件负载效能，从而大幅度提高瓶颈资源的平均利用率。为了解决上述技术问题，本专利技术采用以下...

【技术保护点】
一种基于ILP和DLP的FFT浮点优化方法，其特征是按如下步骤进行：步骤1、假设所要计算的FFT输入向量的长度为M，根据所述长度M确定迭代层数为N；其中M＝2N；M、N为正整数，且N≥6；定义迭代层数N的前四层为入度层，第五层到第N‑2层为中间层；第N‑1层和第N层为出度层；步骤2、使用位反序指令，将所述FFT输入向量反序读取到寄存器中，并将入度层所对应的FFT旋转因子读入到相应的寄存器中；步骤3、对存入寄存器中的FFT输入向量和FFT旋转因子进行入度层蝶形计算，得到的入度层计算结果存入暂存空间中；步骤4、将N–4赋值给n；步骤5、判断n是否为奇数，若是，则执行步骤6，否则，执行步骤8；步骤6、从所述暂存空间中读取入度层计算结果与第N‑n+1层所对应的旋转因子并进行蝶形计算，得到第N‑n+1层计算结果覆盖存储到输入向量空间中；步骤7、将n‑1赋值给n；判断n＝2是否成立，若成立，则执行步骤10，否则，执行步骤8；步骤8、从所述暂存空间读取计算结果以及第N‑n+1层到第N‑n+5层所对应的旋转因子并进行蝶形计算，得到计算结果覆盖存储到所述暂存空间中；步骤9、将n‑4赋值给n；判断n＝2是...

【技术特征摘要】
1.一种基于ILP和DLP的FFT浮点优化方法，其特征是按如下步骤进行：步骤1、假设所要计算的FFT输入向量的长度为M，根据所述长度M确定迭代层数为N；其中M＝2N；M、N为正整数，且N≥6；定义迭代层数N的前四层为入度层，第五层到第N-2层为中间层；第N-1层和第N层为出度层；步骤2、使用位反序指令，将所述FFT输入向量反序读取到寄存器中，并将入度层所对应的FFT旋转因子读入到相应的寄存器中；步骤3、对存入寄存器中的FFT输入向量和FFT旋转因子进行入度层蝶形计算，得到的入度层计算结果存入暂存空间中；步骤4、将N–4赋值给n；步骤5、判断n是否为奇数，若是，则执行步骤6，否则，执行步骤8；步骤6、从所述暂存空间中读取入度层计算结果与第N-n+1层所对应的旋转因子并进行蝶形计算，得到第N-n+1层计算结果覆盖存储到输入向量空间中；步骤7、将n-1赋值给n；判断n＝2是否成立，若成立，则执行步骤10，否则，执行步骤8；步骤8、从所述暂存空间读取计算结果以及第N-n+1层到第N-n+5层所对应的旋转因子并进行蝶形计算，得到计算结果覆盖存储到所述暂存空间中；步骤9、将n-4赋值给n；判断n＝2是否成立，若成立，则执行步骤10...

【专利技术属性】
技术研发人员：顾乃杰，任开新，叶鸿，周文博，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人