【技术实现步骤摘要】
201610073091
【技术保护点】
一种在包括处理器和存储器的数据处理系统中用于执行矩阵运算的方法,该方法包括:配置所述数据处理系统的所述处理器以执行输入矩阵的基于集群的矩阵重新排序;由所述处理器接收该输入矩阵,其中,该输入矩阵包括与所述矩阵中的元素相关联的节点;由所述处理器基于与聚类内部和聚类之间的其它节点之间的连接的数量,将所述节点聚类成集群;由所述处理器通过最小化所述集群的节点之间的跨集群连接的总长对集群排序,从而生成经重新排序的矩阵;由所述处理器生成识别该输入矩阵的节点在经重新排序的矩阵中的新位置的查找表;在所述数据处理系统的存储器中根据在所述经重新排序的矩阵中节点的所述新位置存储对应于所述节点的数据;以及由所述处理器至少通过将对应于所述经重新排序的矩阵中节点对应的的数据加载到所述数据处理系统的高速缓冲存储器中,基于所述经重新排序的矩阵和所述查找表执行矩阵运算,其中当执行所述矩阵运算时,对应于所述节点的数据的所述存储器根据在所述经重新排序的矩阵中节点的所述新位置最小化所述高速缓冲存储器中的高速缓存未命中。
【技术特征摘要】
2015.02.02 US 14/611,2971.一种在包括处理器和存储器的数据处理系统中用于执行矩阵运算的方法,该方法包括:配置所述数据处理系统的所述处理器以执行输入矩阵的基于集群的矩阵重新排序;由所述处理器接收该输入矩阵,其中,该输入矩阵包括与所述矩阵中的元素相关联的节点;由所述处理器基于与聚类内部和聚类之间的其它节点之间的连接的数量,将所述节点聚类成集群;由所述处理器通过最小化所述集群的节点之间的跨集群连接的总长对集群排序,从而生成经重新排序的矩阵;由所述处理器生成识别该输入矩阵的节点在经重新排序的矩阵中的新位置的查找表;在所述数据处理系统的存储器中根据在所述经重新排序的矩阵中节点的所述新位置存储对应于所述节点的数据;以及由所述处理器至少通过将对应于所述经重新排序的矩阵中节点对应的的数据加载到所述数据处理系统的高速缓冲存储器中,基于所述经重新排序的矩阵和所述查找表执行矩阵运算,其中当执行所述矩阵运算时,对应于所述节点的数据的所述存储器根据在所述经重新排序的矩阵中节点的所述新位置最小化所述高速缓冲存储器中的高速缓存未命中。2.根据权利要求1所述的方法,其中所述输入矩阵的所述节点表示以下至少之一:信息、概念或实体,并且其中,所述矩阵的所述元素表示所述节点之间的连接或关系,其中非零元素指示与所述元素相关联的所述节点之间的连接。3.根据权利要求1所述的方法,其中将节点聚类成集群进一步包
\t括:识别所述输入矩阵中节点的一个或多个团,其中节点的团仅包括彼此具有连接的节点;以及基于所述其它节点到已经在所述一个团中的节点的连接,通过将所述输入矩阵的已经不在节点的团中的其它节点分配到所述一个团中,将在所述一个或多个节点的团中的至少一个节点的团生长成节点的集群。4.根据权利要求3所述的方法,其中将节点聚集成集群进一步包括:将在所述一个或多个节点的团中的每个节点的团的大小与最小的团的大小相比较,其中,所述最小的团的大小指定了需要在团中的节点的最小数量,以用于基于所述团生长成集群;以及在所述一个或多个节点的团中只在大小满足或者超过所述最小的团的大小的节点的团上执行所述至少一个节点的团的生长。5.根据权利要求3所述的方法,其中将所述输入矩阵的其它节点分配到所述一个团中包括将在所述一个团中的所述其他节点的每一个分配到各自的团,所述其它节点到其各自的团具有最大数量的连接。6.如权利要求3的所述方法,其中生长所述至少一个节点的团包括将所述输入矩阵的其它节点分配到所述至少一个团中,直到达到最大的集群大小。7.根据权利要求6所述的方法,其中所述最大的集群大小与与所述处理器相关联的高速缓冲存储器的高速缓冲存储器的大小成比例。8.根据权利要求3所述的方法,其中对节点的聚类还包括,对于每个集群以及对于每个集群的每个节点:通过评估所述集群的所述节点来确定是否该节点到另一个集群的节点比到所述集群内的节点有更多的连接来提炼集群;以及如果该节点到其它集群的节点比到所述集群内的节点有更多的连接,将该节点迁移到所述其它集群,并且迁移所述节点不违反所述其它集群的最大群集大小的限制。9.根据权利要求1的所述的方法,其中通过最小化所述集群的节点之间的跨集群连接的总长对集群排序,从而生成经重新排序的矩阵还包括:在所述集群的每个的内部执行节点的本地排序,其中,所述在集群的每个的内部节点的本地排序包括:将所述集群的非零元素移动到更靠近所述集群的子矩阵的对角线,并且将具有到相邻集群中节点的连接的节点移动到更靠近所述集群的所述子矩阵的边界。10.根据权利要求1所述的方法,其中,所述矩阵运算是所述矩阵乘以向量以生成输出向量,并且其中所述方法进一步包括:基于该矩阵运算执行分析操作,基于所述经重新排序的矩阵和所述查找表来从所述输入矩阵中提取信息;以及输出所述分析操作的结果。11.一种装置,包括:处理器;耦合至所述处理器的高速缓冲存储器;和耦合到所述处理器的存储器,其中该存储器包括指令,当由所述处理器执行所述指令时,配置所述处理器执行:执行输入矩阵的基于集群的矩阵重新排序;接收该输入矩阵,其中,该输入矩阵包括与所述矩阵中的元素相关联的节点;基于与聚类内部和聚类之间的其它节点之间的连接的数量,将所述节点聚类成集群;通过最小化所述集群的节点之间的跨集群连接的总长对集群排序,
\t从而生成经重新排序的矩阵;生成识别该输入矩阵的节点在经重新排序的矩阵中的新位置的查找表;根据在所述经重新排序的矩阵中节点...
【专利技术属性】
技术研发人员:E·阿卡尔,R·R·伯达维卡尔,M·M·弗兰斯切尼,L·A·拉斯特拉斯蒙塔诺,R·普利,钱海峰,L·B·索雷斯,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。