System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据处理,尤其涉及一种基于稠密度感知的自适应矩阵乘法的稀疏lu分解加速方法。
技术介绍
1、随着半导体尺度的不断扩大和寄生效应的影响,在布局后的电路仿真中,需要求解的矩阵尺寸越来越大,求解线性系统最为耗时。与迭代求解方法相比,直接求解方法,即lu分解,通常表现出可靠的精度,并且不受选择合适的预条件子的影响,因此在大多数情况下被用于实际电路模拟线性解。因此,加速稀疏lu分解对于复杂大规模电路设计中晶体管级电路仿真验证具有重要意义。
2、传统的许多研究提出了稀疏lu分解的优化算法,如多波前法或超级节点法,已应用于mumps、umfpack和superlu等软件包。超节点lu分解是最成功的方法之一,它是在3级基础线性代数程序集(basic linear algebra subprograms,blas)中寻找或形成具有相似密集结构的子矩阵,从而更好地调用密集矩阵乘法以实现性能的提高。然而,电路矩阵是一类极其特殊的具有不规则非零元分布特征的稀疏矩阵,在对具有超节点的电路矩阵进行稀疏lu分解时往往难以形成超级节点。因此,像superlu这样利用超级节点的求解器在求解电路矩阵时,超级节点可能并不总是密集的,往往具有一定的稀疏性,这使得稠密矩阵乘法并不能获得最好的性能。
技术实现思路
1、本专利技术提供一种基于稠密度感知的自适应矩阵乘法的稀疏lu分解加速方法,用以解决现有技术中稀疏矩阵lu分解中矩阵乘法的计算性能难以达到最优的问题。
2、本专利技术提供一种基
3、将目标稀疏矩阵对应的多组子矩阵块输入至目标随机森林模型,得到每组子矩阵块对应的最优矩阵乘法,所述目标稀疏矩阵用于指示在电子电路仿真中描述电路特性的矩阵,所述多组子矩阵块是通过对所述目标稀疏矩阵分块后形成的若干子矩阵块进行分组得到的;
4、基于所述每组子矩阵块对应的最优矩阵乘法对所述目标稀疏矩阵进行lu分解,得到所述目标稀疏矩阵对应的l矩阵和u矩阵;
5、基于所述目标稀疏矩阵对应的l矩阵和u矩阵,进行电子电路仿真;
6、所述目标随机森林模型用于基于所述子矩阵块的矩阵特征,预测所述每组子矩阵块对应的最优矩阵乘法。
7、在一些实施例中,所述将目标稀疏矩阵的子矩阵块输入至目标随机森林模型,得到每组子矩阵块对应的最优矩阵乘法之前,所述方法还包括:
8、对稀疏矩阵乘法样本进行预处理,得到预处理后的稀疏矩阵乘法样本;
9、对所述预处理后的稀疏矩阵乘法样本进行lu分解,得到若干目标矩阵乘法样本,所述目标矩阵乘法样本包括样本标签和多个矩阵特征;
10、基于所述若干目标矩阵乘法样本,训练所述目标随机森林模型;
11、其中,所述样本标签用于指示不同矩阵乘法的计算性能的比较结果,所述矩阵特征用于指示影响矩阵乘法的计算性能的特征。
12、在一些实施例中,所述对稀疏矩阵乘法样本进行预处理,得到预处理后的稀疏矩阵乘法样本,包括:
13、对所述稀疏矩阵乘法样本进行标准化处理和样本均衡化处理,得到所述预处理后的稀疏矩阵乘法样本。
14、在一些实施例中,所述矩阵乘法包括:
15、稀疏矩阵-矩阵乘法spgemm、通用矩阵乘法gemm和稠密-稀疏矩阵乘法spmm。
16、在一些实施例中,所述矩阵特征包括矩阵相乘因子的特征,所述矩阵相乘因子的特征包括以下至少一项:矩阵行数、矩阵列数、矩阵中非零元素个数、矩阵稠密度、矩阵带宽、矩阵中每行每列非零元素的平均数或矩阵中每行每列非零元素的标准差。
17、在一些实施例中,所述将目标稀疏矩阵的子矩阵块输入至目标随机森林模型,得到每组子矩阵块对应的最优矩阵乘法之前,所述方法还包括:
18、获取目标集成电路的电路结构信息和所述目标集成电路对应的电路元件的参数信息;
19、基于所述电路结构信息和所述电路元件的参数信息,获取所述目标稀疏矩阵。
20、本专利技术还提供一种基于稠密度感知的自适应矩阵乘法的稀疏lu分解加速装置,包括:
21、预测模块,用于将目标稀疏矩阵对应的多组子矩阵块输入至目标随机森林模型,得到每组子矩阵块对应的最优矩阵乘法,所述目标稀疏矩阵用于指示在电子电路仿真中描述电路特性的矩阵,所述多组子矩阵块是通过对所述目标稀疏矩阵分块后形成的若干子矩阵块进行分组得到的;
22、运算模块,用于基于所述每组子矩阵块对应的最优矩阵乘法对所述目标稀疏矩阵进行lu分解,得到所述目标稀疏矩阵对应的l矩阵和u矩阵;
23、仿真模块,用于基于所述目标稀疏矩阵对应的l矩阵和u矩阵,进行电子电路仿真;
24、所述目标随机森林模型用于基于所述子矩阵块的矩阵特征,预测所述每组子矩阵块对应的最优矩阵乘法。
25、本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述基于稠密度感知的自适应矩阵乘法的稀疏lu分解加速方法。
26、本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述基于稠密度感知的自适应矩阵乘法的稀疏lu分解加速方法。
27、本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述基于稠密度感知的自适应矩阵乘法的稀疏lu分解加速方法。
28、本专利技术提供的基于稠密度感知的自适应矩阵乘法的稀疏lu分解加速方法,通过在电路仿真过程中,将目标稀疏矩阵对应的多组子矩阵块输入至目标随机森林模型,可以获得每组子矩阵块对应的最优矩阵乘法,实现矩阵乘法的自适应选择,使得每次矩阵乘法运算都能选择性能最优的算子,提升矩阵乘法运算的计算性能,从而降低目标稀疏矩阵lu分解的运算时间,加速目标稀疏矩阵lu分解,大幅提高lu分解性能,进而加速电子电路仿真的速度。
本文档来自技高网...【技术保护点】
1.一种基于稠密度感知的自适应矩阵乘法的稀疏LU分解加速方法,其特征在于,包括:
2.根据权利要求1所述的基于稠密度感知的自适应矩阵乘法的稀疏LU分解加速方法,其特征在于,所述将目标稀疏矩阵对应的多组子矩阵块输入至目标随机森林模型,得到每组子矩阵块对应的最优矩阵乘法之前,所述方法还包括:
3.根据权利要求2所述的基于稠密度感知的自适应矩阵乘法的稀疏LU分解加速方法,其特征在于,所述对稀疏矩阵乘法样本进行预处理,得到预处理后的稀疏矩阵乘法样本,包括:
4.根据权利要求2所述的基于稠密度感知的自适应矩阵乘法的稀疏LU分解加速方法,其特征在于,所述矩阵乘法包括:
5.根据权利要求1-4任一项所述的基于稠密度感知的自适应矩阵乘法的稀疏LU分解加速方法,其特征在于,所述矩阵特征包括矩阵相乘因子的特征,所述矩阵相乘因子的特征包括以下至少一项:矩阵行数、矩阵列数、矩阵中非零元素个数、矩阵稠密度、矩阵带宽、矩阵中每行每列非零元素的平均数或矩阵中每行每列非零元素的标准差。
6.根据权利要求1-4任一项所述的基于稠密度感知的自适应矩阵乘法的
7.一种基于稠密度感知的自适应矩阵乘法的稀疏LU分解加速装置,其特征在于,包括:
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述基于稠密度感知的自适应矩阵乘法的稀疏LU分解加速方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述基于稠密度感知的自适应矩阵乘法的稀疏LU分解加速方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述基于稠密度感知的自适应矩阵乘法的稀疏LU分解加速方法。
...【技术特征摘要】
1.一种基于稠密度感知的自适应矩阵乘法的稀疏lu分解加速方法,其特征在于,包括:
2.根据权利要求1所述的基于稠密度感知的自适应矩阵乘法的稀疏lu分解加速方法,其特征在于,所述将目标稀疏矩阵对应的多组子矩阵块输入至目标随机森林模型,得到每组子矩阵块对应的最优矩阵乘法之前,所述方法还包括:
3.根据权利要求2所述的基于稠密度感知的自适应矩阵乘法的稀疏lu分解加速方法,其特征在于,所述对稀疏矩阵乘法样本进行预处理,得到预处理后的稀疏矩阵乘法样本,包括:
4.根据权利要求2所述的基于稠密度感知的自适应矩阵乘法的稀疏lu分解加速方法,其特征在于,所述矩阵乘法包括:
5.根据权利要求1-4任一项所述的基于稠密度感知的自适应矩阵乘法的稀疏lu分解加速方法,其特征在于,所述矩阵特征包括矩阵相乘因子的特征,所述矩阵相乘因子的特征包括以下至少一项:矩阵行数、矩阵列数、矩阵中非零元素个数、矩阵稠密度、矩阵带宽、矩阵中每行每列非零元素的平均数或矩阵中每行每列非零元素的标准差。
【专利技术属性】
技术研发人员:金洲,刘伟峰,王腾程,裴浩杰,
申请(专利权)人:中国石油大学北京,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。