System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种算子切分方法、装置和算子编译系统制造方法及图纸_技高网

一种算子切分方法、装置和算子编译系统制造方法及图纸

技术编号:41912171 阅读:15 留言:0更新日期:2024-07-05 14:15
本发明专利技术实施例公开了一种算子切分方法、装置和算子编译系统。本发明专利技术实施例的方法、装置和算子编译系统通过遍历数据流图确定待切分的目标算子,然后调用属性信息接口,从而自动提取所述目标算子的属性信息,其中,所述属性信息至少包括:输入张量和输出张量的至少一个切分轴、各所述切分轴的类型。最后,基于所述属性信息,对所述目标算子进行切分。本发明专利技术实施例针对不同类型的算子,可采取相同的处理方式,即调用属性信息接口,自动提取属性信息,并根据属性信息确定算子的切分方式。降低了算子切分变换逻辑的复杂度,提高了算子切分的可扩展性。

【技术实现步骤摘要】

本专利技术涉及信息技术处理领域,具体而言,涉及一种算子切分方法、装置和算子编译系统


技术介绍

1、近几年来,随着人工智能的不断发展,行业内对于人工智能ai(art i f i c i al i nte l l i gence)芯片的算力要求也在不断提高。不同于传统通用芯片,ai芯片由于其特殊的应用场景和需求,其通常需要原生支持各种数学运算,也即算子。

2、为了提高计算速度和降低计算过程中对于全局内存的访问次数,在实际运算过程中,ai芯片通常会将较大的数据块进行切分,然后再将切分后的各数据块分别读取到缓存中进行后续计算。

3、现有技术通常采用算法模型或由人工来确定算子切分的完整标量计算逻辑,从标量计算逻辑中提取切分算子所需信息。算子的标量计算逻辑给算子增加了额外的标量计算约束,只有满足特定约束的算子才可以用这种方法,适配性差。且每新增一个算子,均需要重新确定其标量计算逻辑,处理效率较低。


技术实现思路

1、有鉴于此,本专利技术实施例提供了一种算子切分方法、装置和算子编译系统,以降低了算子切分变换逻辑的复杂度,提高了算子切分的可扩展性。

2、第一方面,提供一种算子切分方法,所述方法包括:

3、确定待切分的目标算子;

4、调用属性信息接口,获取所述目标算子的属性信息,其中,所述属性信息至少包括:输入张量和输出张量的至少一个切分轴、各所述切分轴的类型;

5、基于所述属性信息,对所述目标算子进行切分。

6、可选地,所述属性信息还包括:各所述切分轴分别与所述输入张量和输出张量的维度的对应关系。

7、可选地,所述基于所述属性信息,对所述目标算子进行切分,包括:

8、确定每个所述切分轴的切片尺寸;

9、根据各所述切分轴的类型和所述切片尺寸,确定各所述切分轴的优先级;

10、根据所述优先级以及硬件存储限制,从所述至少一个切分轴中确定目标切分轴以及确定所述目标切分轴对应的目标切分方式;

11、根据所述目标切分方式,对所述目标算子进行切分。

12、可选地,所述切分轴的类型包括并行切分轴和规约切分轴。

13、可选地,所述确定待切分的目标算子,包括:

14、响应于存在多个处理单元对当前算子进行处理,或者,所述当前算子的输入张量和输出张量所需的存储空间大于可用存储空间,将所述当前算子确定为所述目标算子。

15、第二方面,提供一种算子编译系统,用于对数据流图中的算子进行切分,所述系统包括:

16、属性信息接口,用于为算子库中的每个算子定义属性信息;所述属性信息至少包括:输入张量和输出张量的至少一个切分维度、各所述切分维度对应的切分轴的类型;

17、编译模块,用于遍历所述数据流图中的目标算子,调用所述属性信息接口,获取所述目标算子的属性信息;以及基于所述属性信息,对所述目标算子进行切分;其中,所述目标算子属于所述算子库。

18、可选地,所述系统还包括:

19、切分轴接口,用于定义切分轴的多种类型;

20、所述属性信息接口,用于根据所述切分轴接口为所述算子库中的每个算子定义属性信息。

21、第三方面,提供一种算子切分装置,所述装置包括:

22、确定模块,用于确定待切分的目标算子;

23、调用模块,用于调用属性信息接口,获取所述目标算子的属性信息,其中,所述属性信息至少包括:输入张量和输出张量的至少一个切分轴、各所述切分轴的类型;

24、切分模块,用于基于所述属性信息,对所述目标算子进行切分。

25、第四方面,提供一种电子设备,所述设备包括:

26、存储器,用于存储一条或多条计算机程序指令;

27、处理器,所述一条或多条计算机程序指令被所述处理器执行以实现如第一方面中的方法。

28、第五方面,提供一种计算机可读存储介质,其上存储计算机程序指令,所述计算机程序指令在被处理器执行时实现如第一方面中的方法。

29、本专利技术实施例的方法、装置和算子编译系统通过遍历数据流图确定待切分的目标算子,然后调用属性信息接口,从而自动提取所述目标算子的属性信息,其中,所述属性信息至少包括:输入张量和输出张量的至少一个切分轴、各所述切分轴的类型。最后,基于所述属性信息,对所述目标算子进行切分。本专利技术实施例针对不同类型的算子,可采取相同的处理方式,即调用属性信息接口,自动提取属性信息,并根据属性信息确定算子的切分方式。降低了算子切分变换逻辑的复杂度,提高了算子切分的可扩展性。

本文档来自技高网...

【技术保护点】

1.一种算子切分方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述属性信息还包括:各所述切分轴分别与所述输入张量和输出张量的维度的对应关系。

3.根据权利要求1或2所述的方法,其特征在于,所述基于所述属性信息,对所述目标算子进行切分,包括:

4.根据权利要求1-3中任一项所述的方法,其特征在于,所述切分轴的类型包括并行切分轴和规约切分轴。

5.根据权利要求1-4中任一项所述的方法,其特征在于,所述确定待切分的目标算子,包括:

6.一种算子编译系统,其特征在于,用于对数据流图中的算子进行切分,所述系统包括:

7.根据权利要求6所述的系统,其特征在于,还包括:

8.一种算子切分装置,其特征在于,所述装置包括:

9.一种电子设备,包括存储器和处理器,其特征在于,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如权利要求1-5中任一项所述的方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-5任一项所述的方法。

...

【技术特征摘要】

1.一种算子切分方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述属性信息还包括:各所述切分轴分别与所述输入张量和输出张量的维度的对应关系。

3.根据权利要求1或2所述的方法,其特征在于,所述基于所述属性信息,对所述目标算子进行切分,包括:

4.根据权利要求1-3中任一项所述的方法,其特征在于,所述切分轴的类型包括并行切分轴和规约切分轴。

5.根据权利要求1-4中任一项所述的方法,其特征在于,所述确定待切分的目标算子,包括:

6.一种算子编译系统,其特...

【专利技术属性】
技术研发人员:刘雷
申请(专利权)人:北京希姆计算科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1