System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 搜索方法、搜索装置、计算机设备及存储介质制造方法及图纸_技高网

搜索方法、搜索装置、计算机设备及存储介质制造方法及图纸

技术编号:43130100 阅读:0 留言:0更新日期:2024-10-29 17:37
本申请公开一种搜索方法、搜索装置、计算机设备和非易失性计算机可读存储介质。搜索方法包括根据待训练模型运行时的真实参数量和激活值,确定待训练模型的总显存占用量;根据各个并行组合参数和总显存占用量,确定各个并行组合参数对应的单卡显存占用量,多个并行组合参数由预设的多个并行参数组合而成;在多个并行组合参数中,筛选出单卡显存占用量小于当前计算机设备的单卡存储上限的多个目标并行组合参数。如此,在多个并行组合参数中筛选出符合要求的并行组合参数,能够节省后续进行最优批量大小搜索,以获取最优训练配置所需的时间,从而提高待训练模型训练的效率。

【技术实现步骤摘要】

本申请涉及计算机,更具体而言,涉及一种搜索方法、搜索装置、计算机设备及非易失性计算机可读存储介质。


技术介绍

1、随着深度网络模型种类的逐渐增多,深度网络模型的深度也从几层扩大到成百上千层。虽然深层次的网络大大提高了精确率,但也使得深度网络模型参数越来越多、训练时间越来越长。目前,要完成超大规模深度网络模型的训练,需要对分布式并行策略的多种组合方案各自进行批量大小(batch size,bs)的遍历搜索,从而找到最优的训练配置,最优配置的搜索效率较低。


技术实现思路

1、本申请实施方式提供一种搜索方法、搜索装置、计算机设备及非易失性计算机可读存储介质。

2、本专利技术实施方式提供了一种搜索方法,搜索方法包括根据待训练模型运行时的真实参数量和激活值,确定待训练模型的总显存占用量;根据各个并行组合参数和所述总显存占用量,确定各个所述并行组合参数对应的单卡显存占用量,多个所述并行组合参数由预设的多个并行参数组合而成;在多个所述并行组合参数中,筛选出所述单卡显存占用量小于当前计算机设备的单卡存储上限的多个目标并行组合参数。

3、本专利技术实施方式提供了一种搜索装置,搜索装置包括第一确定模块、第二确定模块和筛选模块。第一确定模块用于根据待训练模型运行时的真实参数量和激活值,确定待训练模型的总显存占用量;第二确定模块用于根据各个并行组合参数和所述总显存占用量,确定各个所述并行组合参数对应的单卡显存占用量,多个所述并行组合参数由预设的多个并行参数组合而成;筛选模块用于在多个所述并行组合参数中,筛选出所述单卡显存占用量小于当前计算机设备的单卡存储上限的多个目标并行组合参数。

4、本专利技术实施方式提供了一种计算机设备,计算机设备包括一个或多个处理器、存储器;及一个或多个计算机程序,其中,一个或多个所述计算机程序被存储在所述存储器中,并且被一个或多个所述处理器执行,所述计算机程序包括用于执行搜索方法的指令。搜索方法包括根据待训练模型运行时的真实参数量和激活值,确定待训练模型的总显存占用量;根据各个并行组合参数和所述总显存占用量,确定各个所述并行组合参数对应的单卡显存占用量,多个所述并行组合参数由预设的多个并行参数组合而成;在多个所述并行组合参数中,筛选出所述单卡显存占用量小于当前计算机设备的单卡存储上限的多个目标并行组合参数。

5、本专利技术实施方式提供了一种包含计算机程序的非易失性计算机可读存储介质包括计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述搜索方法的步骤。搜索方法包括根据待训练模型运行时的真实参数量和激活值,确定待训练模型的总显存占用量;根据各个并行组合参数和所述总显存占用量,确定各个所述并行组合参数对应的单卡显存占用量,多个所述并行组合参数由预设的多个并行参数组合而成;在多个所述并行组合参数中,筛选出所述单卡显存占用量小于当前计算机设备的单卡存储上限的多个目标并行组合参数。

6、本专利技术实施方式的搜索方法、搜索装置、计算机设备及非易失性计算机可读存储介质通过在待训练模型运行时,获取的待训练模型的真实参数量和激活值,能够确定待训练模型的总存储占有量,然后根据待训练模型的总存储占有量和并行组合参数,能够确定每个并行组合参数对应的单卡存储占有量,从而将多个并行组合参数对应的单卡存储占有量与计算机设备中单卡存储的上限大小进行比较,筛选出的多个并行组合参数对应的单卡存储占有量小于计算机设备中单卡存储的上限的多个并行组合参数为目标并行组合参数,相较于将多个并行组合参数不进行筛选,多个并行组合参数全部参与批量大小的遍历搜索而言,能够减少参与批量大小遍历搜索的并行组合参数,从而提高训练模型的效率。

7、本申请的实施方式的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实施方式的实践了解到。

本文档来自技高网...

【技术保护点】

1.一种搜索方法,其特征在于,包括:

2.根据权利要求1所述的搜索方法,其特征在于,还包括:

3.根据权利要求2所述的搜索方法,其特征在于,所述搜索预设样本量范围中的多个批量大小中,与各个所述目标并行组合参数对应的目标批量大小,包括:

4.根据权利要求3所述的搜索方法,其特征在于,所述根据待训练模型运行时的剩余存储量,调整所述当前搜索步长,并根据所述待搜索的批量大小重新确定所述预设样本量范围,包括:

5.根据权利要求1或2所述的搜索方法,其特征在于,还包括:

6.根据权利要求1所述的搜索方法,其特征在于,所述并行参数包括张量并行参数、流水线并行参数、零冗余优化参数和数据并行参数中至少一种,所述数据并行参数根据计算机设备的预设卡数、所述张量并行参数、和所述流水线并行参数确定。

7.根据权利要求1所述的搜索方法,其特征在于,还包括:

8.一种搜索装置,其特征在于,所述装置包括:

9.一种计算机设备,其特征在于,包括:

10.一种包含计算机程序的非易失性计算机可读存储介质,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1-7任意一项所述的搜索方法。

...

【技术特征摘要】

1.一种搜索方法,其特征在于,包括:

2.根据权利要求1所述的搜索方法,其特征在于,还包括:

3.根据权利要求2所述的搜索方法,其特征在于,所述搜索预设样本量范围中的多个批量大小中,与各个所述目标并行组合参数对应的目标批量大小,包括:

4.根据权利要求3所述的搜索方法,其特征在于,所述根据待训练模型运行时的剩余存储量,调整所述当前搜索步长,并根据所述待搜索的批量大小重新确定所述预设样本量范围,包括:

5.根据权利要求1或2所述的搜索方法,其特征在于,还包括:

6.根据权利要...

【专利技术属性】
技术研发人员:龚学健谢贵明周坤龙李彦良
申请(专利权)人:深圳市欢太科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1