System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于板卡间数据传输的方法、板卡、电子设备和存储介质技术_技高网

用于板卡间数据传输的方法、板卡、电子设备和存储介质技术

技术编号:43089549 阅读:6 留言:0更新日期:2024-10-26 09:37
本发明专利技术的实施例涉及一种用于板卡间数据传输的方法、板卡、电子设备和存储介质。该方法包括:向第一板卡发送写指令;响应于接收到写指令,由第一板卡将预定数量的数据写入第二板卡;向第一板卡发送屏障指令,以阻挡第一板卡向第二板卡发送后续指令,直至确定预定数量的数据全部写入第二板卡;由第一板卡确定预定数量的数据是否全部写入第二板卡;以及响应于第一板卡确定预定数量的数据全部写入第二板卡,由第一板卡向第二板卡发送同步信号,以指示预定数量的数据已全部同步至第二板卡。本发明专利技术的实施例能够避免第二板卡对第一板卡进行远程轮询,提高数据传输的性能,并且能够确保数据同步的准确性。

【技术实现步骤摘要】

本专利技术的实施例总体涉及数据传输领域,并且更具体地,涉及一种用于板卡间数据传输的方法、板卡、电子设备和存储介质


技术介绍

1、多卡集群,即由多板卡组成的集群,可以通过板卡间的数据交互实现诸如大模型训练等。以将第一板卡的数据传输至第二板卡以实现第一板卡和第二板卡间的数据同步为例,现有的用于板卡间数据传输的方法包括:首先,将要传输的数据写入第一板卡,待数据全部写入第一板卡后,将同步信号写入该第一板卡;以及,由第二板卡对第一板卡重复地进行远程轮询,直至第二板卡读取到同步信号,再由第二板卡从第一板卡读取写入该第一板卡的数据。

2、然而,在上述现有方案中,远程轮询路径长、延迟长、带宽利用率低,使得板卡间数据传输的性能不佳,难以保证板卡间的数据同步和保序。

3、综上,现有的用于板卡间数据传输的方法性能较差,且缺少能够保证板卡间的数据同步和保序的方法。


技术实现思路

1、针对上述问题,本专利技术提供了一种用于板卡间数据传输的方法、板卡、电子设备和存储介质,使得能够提高数据传输的性能,并且能够确保板卡间的数据保序和同步准确性。

2、根据本专利技术的第一方面,提供了一种用于板卡间数据传输的方法,包括:向第一板卡发送写指令;响应于接收到写指令,由第一板卡将预定数量的数据写入第二板卡;向第一板卡发送屏障指令,以阻挡第一板卡向第二板卡发送后续指令,直至确定预定数量的数据全部写入第二板卡;由第一板卡确定预定数量的数据是否全部写入第二板卡;以及响应于第一板卡确定预定数量的数据全部写入第二板卡,由第一板卡向第二板卡发送同步信号,以指示预定数量的数据已全部同步至第二板卡。

3、在一些实施例中,由第一板卡将预定数量的数据写入第二板卡包括:由第一板卡的至少一个计算核将写指令转换成对应的写请求,以便基于写请求统计第一板卡要写入第二板卡的数据的期望数量。

4、在一些实施例中,写请求包括:与预定数量的数据的来源有关的信息。

5、在一些实施例中,由第一板卡确定预定数量的数据是否全部写入第二板卡包括:由第一板卡的原子类型累加器接收返回自第二板卡的应答,应答包括与已经写入第二板卡的数据的数量有关的信息;基于应答,计算已经写入第二板卡的数据的数量;以及基于计算得到的已经写入第二板卡的数据的数量,确定述预定数量的数据是否全部写入第二板卡。

6、在一些实施例中,确定述预定数量的数据是否全部写入第二板卡包括:由第一板卡的至少一个计算核轮询地读取第一板卡的原子类型累加器计算得到的已经写入第二板卡的数据的数量;以及响应于已经写入第二板卡的数据的数量与要写入第二板卡的数据的期望数量相同,确定预定数量的数据全部写入第二板卡。

7、在一些实施例中,由第一板卡将预定数量的数据写入第二板卡包括:由第一板卡的至少一个计算核从第一板卡的高带宽内存中读取预定数量的数据;以及预定数量的数据经由第一板卡的片上网络和至少一个连接端口发送至第二板卡,以经由第二板卡的至少一个连接端口和第二板卡的片上网络写入第二板卡的高带宽内存中。

8、在一些实施例中,由第一板卡将预定数量的数据写入第二板卡还包括:响应于预定数量的数据中的至少部分写入第二板卡的高带宽内存中,由第二板卡的高带宽内存生成写响应,并将写响应经由第二板卡的片上网络发送至第二板卡的聚合应答单元;以及经由第二板卡的聚合应答单元,基于写响应,统计已经写入第二板卡的高带宽内存中的数据的来源和数量。

9、在一些实施例中,写响应包括与写入第二板卡的数据的来源有关的信息。在这些实施例中,统计已经写入第二板卡的高带宽内存中的数据的来源和数量包括:确定与当前写响应对应的数据的来源;确定聚合应答单元是否包括与当前写响应对应的数据的来源相同的记录条目;以及响应于聚合应答单元包括与当前写响应对应的数据的来源相同的记录条目,基于记录条目进行累加操作,以便于统计相同来源的数据的数量。

10、在一些实施例中,统计已经写入第二板卡的高带宽内存中的数据的来源和数量还包括:响应于聚合应答单元不包括与当前写响应对应的数据的来源相同的记录条目,确定聚合应答单元是否包括缓存空间;响应于聚合应答单元包括缓存空间,基于写响应生成新记录条目,以记录与当前写响应对应的数据的来源和数量;以及响应于聚合应答单元不包括缓存空间,根据最近最少使用策略,基于写响应生成新记录条目以替换已有的一条记录条目,并记录与当前写响应对应的数据的来源和数量。

11、在一些实施例中,由第二板卡的聚合应答单元向第一板卡发送应答,以便于第一板卡基于应答确定预定数量的数据是否全部写入第二板卡,其中,应答包括与已经写入第二板卡的数据的数量有关的信息。

12、根据本专利技术的第二方面,提供了一种板卡,包括:至少一个计算核,其中,至少一个计算核被配置为:接收写指令,以便于板卡基于写指令将预定数量的数据写入另一板卡;接收屏障指令,以阻挡板卡向另一板卡发送后续指令,直至确定预定数量的数据全部写入另一板卡;确定预定数量的数据是否全部写入另一板卡;以及发送同步信号,以指示预定数量的数据已全部同步至另一板卡。

13、在一些实施例中,至少一个计算核还被配置为:将接收到的写指令转换成对应的写请求,以便基于写请求统计板卡要写入另一板卡的数据的期望数量。

14、在一些实施例中,板卡还包括:原子类型累加器,其中,原子类型累加器被配置为:接收返回自另一板卡的应答,应答包括与已经写入另一板卡的数据的数量有关的信息;基于应答,计算已经写入另一板卡的数据的数量;以及基于计算得到的已经写入另一板卡的数据的数量,确定述预定数量的数据是否全部写入另一板卡。

15、在一些实施例中,至少一个计算核还被配置为:轮询地读取原子类型累加器计算得到的已经写入另一板卡的数据的数量;以及响应于已经写入另一板卡的数据的数量与要写入另一板卡的数据的期望数量相同,确定预定数量的数据全部写入另一板卡。

16、在一些实施例中,板卡还包括:高带宽内存,被配置为存储写入板卡的数据,以及基于写入板卡的数据生成写响应;以及聚合应答单元,被配置为基于由高带宽内存生成的写响应,统计已经写入板卡的数据的来源和数量。

17、在一些实施例中,聚合应答单元还被配置为:发送应答,应答包括与已经写入板卡的数据的数量有关的信息。

18、根据本专利技术的第三方面,提供了一种计算设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本专利技术的第一方面的方法。

19、根据本专利技术的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中计算机指令用于使计算机执行本专利技术的第一方面的方法。

20、根据本专利技术的第五方面,提供了一种计算机程序产品,其中计算机程序产品被有形地存储在非瞬态计算机可读介质上并且包括机器可执行指令,机器可执行指令在被执行时使机器执行本专利技术的第一方面的方本文档来自技高网...

【技术保护点】

1.一种用于板卡间数据传输的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,由所述第一板卡将预定数量的数据写入第二板卡包括:

3.根据权利要求2所述的方法,其特征在于,所述写请求包括:与所述预定数量的数据的来源有关的信息。

4.根据权利要求2所述的方法,其特征在于,由所述第一板卡确定所述预定数量的数据是否全部写入所述第二板卡包括:

5. 根据权利要求4所述的方法,其特征在于,确定所述预定数量的数据是否全部写入所述第二板卡包括:

6. 根据权利要求1或2所述的方法,其特征在于,由所述第一板卡将预定数量的数据写入第二板卡包括:

7. 根据权利要求6所述的方法,其特征在于,由所述第一板卡将预定数量的数据写入第二板卡还包括:

8.根据权利要求7所述的方法,其特征在于,所述写响应包括与写入所述第二板卡的数据的来源有关的信息,并且

9.根据权利要求8所述的方法,其特征在于,统计已经写入所述第二板卡的高带宽内存中的数据的来源和数量还包括:

10.根据权利要求7所述的方法,其特征在于,还包括:

11.一种板卡,其特征在于,包括:

12.根据权利要求11所述的板卡,其特征在于,所述至少一个计算核还被配置为:

13.根据权利要求12所述的板卡,其特征在于,还包括:原子类型累加器,其中,所述原子类型累加器被配置为:

14. 根据权利要求13所述的板卡,其特征在于,所述至少一个计算核还被配置为:

15. 根据权利要求11所述的板卡,其特征在于,还包括:

16.根据权利要求15所述的板卡,其特征在于,所述聚合应答单元还被配置为:

17. 一种电子设备,其特征在于,包括:

18.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使计算机执行权利要求1-10中任一项所述的方法。

19.一种计算机程序产品,其特征在于,所述计算机程序产品被有形地存储在非瞬态计算机可读介质上并且包括机器可执行指令,所述机器可执行指令在被执行时使机器执行根据权利要求1-10中任一项所述的方法中的步骤。

...

【技术特征摘要】

1.一种用于板卡间数据传输的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,由所述第一板卡将预定数量的数据写入第二板卡包括:

3.根据权利要求2所述的方法,其特征在于,所述写请求包括:与所述预定数量的数据的来源有关的信息。

4.根据权利要求2所述的方法,其特征在于,由所述第一板卡确定所述预定数量的数据是否全部写入所述第二板卡包括:

5. 根据权利要求4所述的方法,其特征在于,确定所述预定数量的数据是否全部写入所述第二板卡包括:

6. 根据权利要求1或2所述的方法,其特征在于,由所述第一板卡将预定数量的数据写入第二板卡包括:

7. 根据权利要求6所述的方法,其特征在于,由所述第一板卡将预定数量的数据写入第二板卡还包括:

8.根据权利要求7所述的方法,其特征在于,所述写响应包括与写入所述第二板卡的数据的来源有关的信息,并且

9.根据权利要求8所述的方法,其特征在于,统计已经写入所述第二板卡的高带宽内存中的数据的来源和数量还包括:

10...

【专利技术属性】
技术研发人员:请求不公布姓名请求不公布姓名
申请(专利权)人:北京壁仞科技开发有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1