【技术实现步骤摘要】
一种用于张量处理器的数据处理方法和相关设备
[0001]本申请涉及数据处理
,尤其涉及一种用于张量处理器的数据处理方法、装置、计算机设备、张量处理器及存储介质。
技术介绍
[0002]随着深度学习的不断进展,其在图像处理、模式识别以及语音识别等领域都取得了较多的成果,矩阵转置是深度学习过重中常见的一种数据数据处理方法。
[0003]相关技术中,在进行矩阵转置时,通常是按行依次读取每个数据元素,并将读取的数据元素存入矩阵转置寄存器中,之后,再以列的顺序从矩阵转置寄存器中依次读取每个数据元素来实现矩阵的转置。
[0004]在采用上述方式进行矩阵转置时,不仅需要较长的转置时长,而且在数据处理装置中设置矩阵转置寄存器也会增加数据处理装置的生成成本。
技术实现思路
[0005]本申请提供一种用于张量处理器的数据处理方法、装置、计算机设备、张量处理器及存储介质,能够提高数据的处理效率。
[0006]本申请实施例第一方面提供一种用于张量处理器的数据处理方法,所述张量处理器包括控制模块和M个执行模块,并且所述控制模块和M个执行模块连接,所述方法由所述控制模块执行,所述方法包括:
[0007]获取待处理的多个数据元素的第一存储地址,以生成包括所述第一存储地址的读取指令;
[0008]向所述执行模块发送所述读取指令,其中,所述读取指令用于供所述执行模块返回按照第一排列顺序排列的所述多个数据元素;
[0009]接收由所述执行模块返回的所述多个数据元素;
[001
【技术保护点】
【技术特征摘要】
1.一种用于张量处理器的数据处理方法,其特征在于,所述张量处理器包括控制模块和M个执行模块,并且所述控制模块和M个执行模块连接,所述方法由所述控制模块执行,所述方法包括:获取待处理的多个数据元素的第一存储地址,以生成包括所述第一存储地址的读取指令;向所述执行模块发送所述读取指令,其中,所述读取指令用于供所述执行模块返回按照第一排列顺序排列的所述多个数据元素;接收由所述执行模块返回的所述多个数据元素;确定存储所述多个数据元素的第二存储地址;向所述执行模块发送写入指令,其中,所述写入指令包括第二存储地址,以及按照第一排列顺序排列的所述多个数据元素,以供所述执行模块写入所述多个数据元素;其中,响应于所述第一存储地址指向N个所述执行模块中各一个存储单元的存储地址,则所述第二存储地址,指向一个执行模块中的N个存储单元的存储地址;或者,若所述第一存储地址指向一个执行模块中的N个存储单元的存储地址,则所述第二存储地址指向N个所述执行模块中的各一个存储单元的存储地址;其中,M和N为不小于2的整数,且N小于或等于M。2.根据权利要求1所述的方法,其特征在于,所述向执行模块发送读取指令,包括:响应于所述第一存储地址指向N个所述执行模块中各一个存储单元的存储地址,向第1个所述执行模块发送所述读取指令,其中,所述读取指令,还用于供第n个执行模块在执行所述读取指令时或执行所述读取指令之后,传输给第n+1个执行模块;其中,所述n为小于所述N的正整数;其中,接收到所述读取命令的N个执行模块的排列顺序为所述第一排列顺序。3.根据权利要求2所述的方法,其特征在于,所述向所述执行模块发送写入指令,包括:若所述第二存储地址指向一个执行模块中的N个存储单元的存储地址,向所述一个执行模块发送所述写入指令,其中,所述写入指令包括:所述N个存储单元所在的所述执行模块的存储地址以及按照所述第一排列顺序排列的所述多个数据元素。4.根据权利要求1所述的方法,其特征在于,所述向所述执行模块发送读取指令,包括:若所述第一存储地址指向一个执行模块中的N个存储单元的存储地址,向所述一个执行模块,发送所述读取指令。5.根据权利要求4所述的方法,其特征在于,所述向所述执行模块发送写入指令,包括:若所述第二存储地址指向N个所述执行模块中各一个存储单元的存储地址,向第1个所述执行模块发送写入指令;其中,所述写入指令,还用于供第n个执行模块执行所述写入指令时或在执行所述写入指令之后,传输给第n+1个所述执行模块。6.一种用于张量处理器的数据处理方法,其特征在于,所述张量处理器包括控制模块和M个执行模块,并且所述控制模块和所述M个执行模块连接,所述方法由所述执行模块执行,所述方法包括:接收读取指令,其中,所述读取指令包括:第一存储地址;根据所述第一存储地址,读取对应的数据元素;
将所述数据元素返回所述控制模块;其中,读取的所述数据元素按照第一排列顺序返回给所述控制模块后,用于供所述控制模块存储到第二存储地址;其中,若所述第一存储地址,指向N个所述执行模块中各一个存储单元的存储地址,则所述第二存储地址,指向一个执行模块中的N个存储单元的存储地址;或者,若所述第一存储地址,指向一个执行模块中的N个存储单元的存储地址,则所述第二存储地址指向N个所述执行模块中各一个存储单元的存储地址。7.根据权利要求6所述的方法,其特征在于,所述方法还包括:若所述第一存储地址指向N个所述执行模块中各一个存储单元的存储地址,且当前执行模块的序号n小于N,在执行所述读取指令时或执行所述读取指令之后,将所述读取指令传输给第n+1个执行模...
【专利技术属性】
技术研发人员:沈广冲,洪宗会,屈家丽,薛雨楠,
申请(专利权)人:北京算能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。