支持多MAC运算部件向量处理器的分块矩阵乘法向量化方法技术

技术编号:9143141 阅读:237 留言:0更新日期:2013-09-12 04:41
一种支持多MAC运算部件向量处理器的分块矩阵乘法向量化方法,流程为:(1)依据向量处理器的向量处理单元VPE的数量p、VPE中的MAC运算部件的数量m、向量存储器的容量s和矩阵元素的数据大小d,确定最优的子矩阵的块大小blocksize,确定乘数矩阵B的子矩阵的列数和行数以及确定被乘数矩阵A的子矩阵的行数与列数;(2)将向量存储器的容量s分为容量相等的两部分存储区域Buffer0和Buffer1,依次在Buffer0和Buffer1间以乒乓方式实现子矩阵的乘法,直到整个矩阵乘法计算完成。本发明专利技术具有实现简单、操作方便、可提高向量处理器并行性、能提高处理器运算效率等优点。

【技术实现步骤摘要】

【技术保护点】
一种支持多MAC运算部件向量处理器的分块矩阵乘法向量化方法,其特征在于,流程为:?(1)依据向量处理器的向量处理单元VPE的数量p、VPE中的MAC运算部件的数量m、向量存储器的容量s和矩阵元素的数据大小d,确定最优的子矩阵的块大小blocksize,确定乘数矩阵B的子矩阵的列数和行数以及确定被乘数矩阵A的子矩阵的行数与列数;(2)将向量存储器的容量s分为容量相等的两部分存储区域Buffer0和Buffer1,依次在Buffer0和Buffer1间以乒乓方式实现子矩阵的乘法,直到整个矩阵乘法计算完成。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘仲陈书明窦强郭阳刘衡竹田希龚国辉陈海燕彭元喜万江华刘胜陈跃跃扈啸吴家铸
申请(专利权)人:中国人民解放军国防科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1