一种加速实现Cholesky分解的嵌入式片上系统技术方案

技术编号：11766427 阅读：152 留言：0更新日期：2015-07-23 18:19

一种加速实现Cholesky分解的嵌入式片上系统，涉及一种加速实现Cholesky分解的系统。本发明专利技术为了解决目前现有的基于Cholesky分解方法实现线性方程组求解的硬件加速系统存在计算时间比较长的问题。本发明专利技术包括用于对整个计算过程的任务调度的ARM处理器模块、用于控制外部DDR存储器的数据读写的DDR控制模块、用于可编程逻辑Programmable Logic模块与ARM处理器模块之间的信息传输AXI总线模块以及用于对正定对称矩阵进行Cholesky分解的可编程逻辑Programmable Logic模块。可编程逻辑Programmable Logic模块基于Submatrix-Cholesky分解(块分解)方式实现线性方程组系数的求解存在大量的并行更新操作，可以实现数据更规律的访存，读写控制更简单，运算时间大幅缩短；本发明专利技术适用于加速实现线性方程组的求解。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种加速实现Cholesky分解的系统。
技术介绍
机器学习算法LS-SVM在嵌入式高性能计算领域得到了广泛应用，其计算过程包含线性方程组的求解，目前，关于线性方程组的求解方法有多种，乔里斯基（Cholesky)分解、高斯消元法、LU分解和共轭梯度法等，考虑算法本身特性以及在嵌入式SoC平台上的加速计算特点，需要一种计算量较小、计算复杂度较低，且含有大量并行计算的求解方法， Cholesky分解方法成为最好的选择。根据Cholesky分解线性方程组的计算次序和编程方式，可将计算过程分为Row_ Cholesky分解（行分解）、Column_Cholesky分解（列分解）和Submatrix_Cholesky(块分解）三种方式，这三种分解方式对数据的依赖性、需求量以及规律访存等存在不同，对于不同的硬件开发平台需要选择的具体的分解方式设计合理的数据通路结构。关于Cholesky 分解在嵌入式硬件平台上的加速实现方法较多，针对不同开发平台具有的不同特点，可以设计不同的加速实现系统。但是，现有的Cholesky分解系统实现线性方程组的求解还存在着计算时间比较长的问题。
技术实现思路
本专利技术为了解决目前现有的基于Cholesky分解方法实现线性方程组求解的硬件加速系统存在计算时间比较长的问题。一种加速实现Cholesky分解的嵌入式片上系统，主要包括下述模块： ARM处理器模块，用于对整个计算过程的任务调度； DDR控制模块，用于控制外部DDR存储器的数据读写；可编程逻辑ProgrammableLogic模块，...

【技术保护点】
一种加速实现Cholesky分解的嵌入式片上系统，其特征在于主要包括下述模块：ARM处理器模块，用于对整个计算过程的任务调度；DDR控制模块，用于控制外部DDR存储器的数据读写；可编程逻辑Programmable Logic模块，简称PL模块，用于从外部存储读取正定对称矩阵的值，进行Cholesky分解，得到下三角阵并将其存储在外部存储器中；AXI总线模块，用于PL模块与ARM处理器模块之间的信息传输。

【技术特征摘要】

【专利技术属性】
技术研发人员：王少军，王晓璐，马宁，刘大同，彭宇，彭喜元，
申请(专利权)人：哈尔滨工业大学，
类型：发明
国别省市：黑龙江;23

全部详细技术资料下载我是这个专利的主人