System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 索引张量向量化计算方法及相关产品技术_技高网

索引张量向量化计算方法及相关产品技术

技术编号:44286199 阅读:3 留言:0更新日期:2025-02-14 22:21
本申请公开了一种索引张量向量化计算方法及相关产品。该方法包括:获取第一稀疏张量的第一索引张量的长度和第二稀疏张量的第二索引张量的长度;基于所述第一索引张量的长度,从指令集中获取与所述第一索引张量对应的至少一条第一目标指令;基于所述第二索引张量的长度,从所述指令集中获取与所述第二索引张量对应的至少一条第二目标指令;执行所述至少一条第一目标指令和所述至少一条第二目标指令,以对所述第一索引张量和所述第二索引张量进行向量化计算,得到第三索引张量。本申请有利于节省计算单元的计算资源以及提高稀疏张量的拼接效率。

【技术实现步骤摘要】

本申请涉及人工智能,具体涉及一种索引张量向量化计算方法及相关产品


技术介绍

1、离散拼接(sparse concat)算子是稀疏模型中常见的算子之一,在嵌入(embedding)查表融合优化中,离散拼接(sparse concat)算子需要拼接来自上游的成百上千个稀疏张量(sparse tensor),属于离散特征转换为稠密矩阵的重要一环,影响着整个模型的推理性能。

2、sparse concat算子的主要作用是拼接一组sparse tensor,而在embedding融合查询优化中,sparse concat通常被用于在第一维度拼接不同的离散特征sparse tensor,即将不同形状的sparse tensor在批次(batchsize)方向进行拼接,以提高一次embedding查询的特征的数量。但是,对不同形状的sparse tensor进行拼接时,针对sparse tensor的索引张量,计算单元都是按位一一进行加法运算,这种方式计算单元的计算效率比较低,且浪费计算单元的计算资源。


技术实现思路

1、本申请实施例提供了一种索引张量向量化计算方法及相关产品,通过向量化计算,对稀疏张量的索引张量进行拼接,减少了运算次数,减少对硬件的计算资源的浪费,提高了拼接效率。

2、第一方面,本申请实施例提供索引张量向量化计算方法,包括:

3、获取第一稀疏张量的第一索引张量的长度和第二稀疏张量的第二索引张量的长度;

4、基于所述第一索引张量的长度,从指令集中获取与所述第一索引张量对应的至少一条第一目标指令;

5、基于所述第二索引张量的长度,从所述指令集中获取与所述第二索引张量对应的至少一条第二目标指令;

6、执行所述至少一条第一目标指令和所述至少一条第二目标指令,以对所述第一索引张量和所述第二索引张量进行向量化计算,得到第三索引张量。

7、第二方面,本申请实施例提供一种计算设备,包括:获取模块和处理模块;

8、所述获取模块,用于获取第一稀疏张量的第一索引张量和第二稀疏张量的第二索引张量;

9、所述处理模块,用于获取第一稀疏张量的第一索引张量的长度和第二稀疏张量的第二索引张量的长度;

10、基于所述第一索引张量的长度,从指令集中获取与所述第一索引张量对应的至少一条第一目标指令;

11、基于所述第二索引张量的长度,从所述指令集中获取与所述第二索引张量对应的至少一条第二目标指令;

12、执行所述至少一条第一目标指令和所述至少一条第二目标指令,以对所述第一索引张量和所述第二索引张量进行向量化计算,得到第三索引张量。

13、第三方面,本申请实施例提供一种电子设备,包括:处理器和存储器,所述处理器与存储器相连,所述存储器用于存储计算机程序,所述处理器用于执行所述存储器中存储的计算机程序,以使得所述电子设备执行如第一方面所述的方法。

14、第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序使得计算机执行如第一方面所述的方法。

15、第五方面,本申请实施例提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机可操作来使计算机执行如第一方面所述的方法。

16、实施本申请实施例,具有如下有益效果:

17、可以看出,在本申请实施例中,在对不同的稀疏张量的索引张量进行拼接时,会分别获取与每个稀疏张量的索引张量对应的指令,然后利用每个稀疏张量的索引张量对应的指令对每个稀疏张量的索引张量执行向量化计算,从而可以并行地对索引张量中的多个元素同时执行加法运算,减少了在对索引张量进行拼接过程中的加法运算的次数,进而减少了对计算单元的计算资源的需求,以及提高了对索引张量的拼接效率,从而提高了对稀疏张量的拼接效率,减少了需要利用拼接后的稀疏张量的线程的等待时间,以及提高了后续模型推理的效率。

本文档来自技高网...

【技术保护点】

1.一种索引张量向量化计算方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述第一索引张量的长度,从指令集中获取与所述第一索引张量对应的至少一条第一目标指令,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述指令集中的每条指令所处理的数据的长度,确定所述至少一条第一目标指令,包括:

4.根据权利要求1-3任一项所述的方法,其特征在于,所述基于所述至少一条第一目标指令和所述至少一条第二目标指令,分别对所述第一索引张量和所述第二索引张量进行向量化计算,得到第三索引张量,包括:

5.根据权利要求4所述的方法,其特征在于,所述对每条第一目标指令对应的第一子张量中的元素执行向量化计算,得到与每条第一目标指令对应的第二子张量,包括:

6.根据权利要求5所述的方法,其特征在于,

7.根据权利要求1-6任一项所述的方法,其特征在于,基于所述至少一条第一目标指令和所述至少一条第二目标指令,分别对所述第一索引张量和所述第二索引张量进行向量化计算,得到第三索引张量之前,所述方法还包括:>

8.根据权利要求1-7任一项所述的方法,其特征在于,

9.根据权利要求1-8任一项所述的方法,其特征在于,

10.一种计算设备,其特征在于,包括:获取模块和处理模块;

11.一种电子设备,其特征在于,包括:处理器和存储器,所述处理器与所述存储器相连,所述存储器用于存储计算机程序,所述处理器用于执行所述存储器中存储的计算机程序,以使得所述电子设备执行如权利要求1-9中任一项所述的方法。

12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1-9中任一项所述的方法。

...

【技术特征摘要】

1.一种索引张量向量化计算方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述第一索引张量的长度,从指令集中获取与所述第一索引张量对应的至少一条第一目标指令,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述指令集中的每条指令所处理的数据的长度,确定所述至少一条第一目标指令,包括:

4.根据权利要求1-3任一项所述的方法,其特征在于,所述基于所述至少一条第一目标指令和所述至少一条第二目标指令,分别对所述第一索引张量和所述第二索引张量进行向量化计算,得到第三索引张量,包括:

5.根据权利要求4所述的方法,其特征在于,所述对每条第一目标指令对应的第一子张量中的元素执行向量化计算,得到与每条第一目标指令对应的第二子张量,包括:

6.根据权利要求5所述的方法,其特征在于,

7.根据...

【专利技术属性】
技术研发人员:武晓睿
申请(专利权)人:行吟信息科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1