【技术实现步骤摘要】
【技术保护点】
一种支持多MAC运算部件向量处理器的分块矩阵乘法向量化方法,其特征在于,流程为:?(1)依据向量处理器的向量处理单元VPE的数量p、VPE中的MAC运算部件的数量m、向量存储器的容量s和矩阵元素的数据大小d,确定最优的子矩阵的块大小blocksize,确定乘数矩阵B的子矩阵的列数和行数以及确定被乘数矩阵A的子矩阵的行数与列数;(2)将向量存储器的容量s分为容量相等的两部分存储区域Buffer0和Buffer1,依次在Buffer0和Buffer1间以乒乓方式实现子矩阵的乘法,直到整个矩阵乘法计算完成。
【技术特征摘要】
【专利技术属性】
技术研发人员:刘仲,陈书明,窦强,郭阳,刘衡竹,田希,龚国辉,陈海燕,彭元喜,万江华,刘胜,陈跃跃,扈啸,吴家铸,
申请(专利权)人:中国人民解放军国防科学技术大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。