System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请属于电子设备,具体涉及一种模型训练方法及其装置。
技术介绍
1、在对模型进行训练的过程中,通常会采用分布式处理的方式来对模型进行训练,比如是使用多个计算节点同时进行数据处理和模型训练,如此可提升模型的训练效率。
2、但是目前随着计算节点的增加,对模型进行训练的速度有所下降,如此降低了对模型的训练效率。
技术实现思路
1、本申请实施例的目的是提供一种模型训练方法及其装置,以提升对模型的训练效率。
2、第一方面,本申请实施例提供了一种模型训练方法,该方法应用于包括多个计算节点的第一模型,该方法包括:
3、从第一数据库中加载与第一计算节点对应的第一训练数据集的第一索引信息,其中,所述第一计算节点为所述第一模型中多个计算节点中的任一计算节点,所述第一训练数据集为待训练数据集中用于对所述第一计算节点对应的第一子模型进行训练的训练数据集,所述待训练数据集用于对第一模型进行训练,所述第一模型包括多个子模型,所述多个计算节点与所述多个子模型一一对应,每个计算节点用于对其对应的子模型进行训练,所述待训练数据集中每个待训练数据的索引信息存储在所述第一数据库中;
4、根据所述第一索引信息,加载所述第一训练数据集;
5、基于所述第一训练数据集对第一子模型进行训练,得到目标子模型,其中,所述第一子模型为所述多个子模型中与所述第一计算节点对应的子模型。
6、第二方面,本申请实施例提供了一种模型训练装置,该装置应用于包括多个计算节点的
7、第一加载模块,用于从第一数据库中加载与第一计算节点对应的第一训练数据集的第一索引信息,其中,所述第一计算节点为所述第一模型中多个计算节点中的任一计算节点,所述第一训练数据集为待训练数据集中用于对所述第一计算节点对应的第一子模型进行训练的训练数据集,所述待训练数据集用于对第一模型进行训练,所述第一模型包括多个子模型,所述多个计算节点与所述多个子模型一一对应,每个计算节点用于对其对应的子模型进行训练,所述待训练数据集中每个待训练数据的索引信息预先存储在所述第一数据库中;
8、第二加载模块,用于根据所述第一索引信息,加载所述第一训练数据集;
9、模型训练模块,用于基于所述第一训练数据集对第一子模型进行训练,得到目标子模型,其中,所述第一子模型为所述多个子模型中与所述第一计算节点对应的子模型。
10、第三方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
11、第四方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
12、第五方面,本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如第一方面所述的方法。
13、在本申请实施例中,针对多个计算节点,其分别与第一模型包括的多个子模型一一对应,每个计算节点可用于对其对应的子模型进行训练,针对多个计算节点中的每个计算节点,其可按需从第一数据库中仅加载与该计算节点对应的第一训练数据集,如此每个计算节点仅加载与其对应的训练数据集,无需加载对第一模型进行训练的所有训练数据集,提升了训练数据集的加载效率,且大大减少了计算节点内存的占用,可以有效避免计算节点内存溢出或系统崩溃的风险。此外,每个计算节点在加载与其对应的训练数据集时,先加载与其对应的训练数据集的索引信息,再根据索引信息加载训练数据集,由于加载索引信息比加载训练数据集要快很多,故本申请实施例的方案也加快了训练数据集加载的速度,进而提升了与每个计算节点对应的子模型的训练效率。
本文档来自技高网...【技术保护点】
1.一种模型训练方法,其特征在于,所述方法应用于包括多个计算节点的第一模型,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,每个计算节点均包括多个线程;所述多个线程包括第一线程和第二线程,所述从第一数据库中加载与所述第一计算节点对应的第一训练数据集的第一索引信息,包括:
3.根据权利要求2所述的方法,其特征在于,在所述基于所述第一线程从所述第一数据库中将与所述第一计算节点对应的第一训练数据集的第一索引信息加载至所述第一计算节点的索引队列中之前,所述方法还包括:
4.根据权利要求2所述的方法,其特征在于,所述第一计算节点的多个线程包括第三线程,所述根据所述第一索引信息,加载所述第一训练数据集,包括:
5.根据权利要求4所述的方法,其特征在于,所述第一计算节点的多个线程包括第四线程、第五线程和第六线程;
6.一种模型训练装置,其特征在于,所述装置应用于包括多个计算节点的第一模型,所述装置包括:
7.根据权利要求6所述的装置,其特征在于,每个计算节点均包括多个线程;所述多个线程包括第一线程和第二线程,所述
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
9.根据权利要求7所述的装置,其特征在于,所述第一计算节点的多个线程包括第三线程,所述第二加载模块具体用于:
10.根据权利要求9所述的装置,其特征在于,所述第一计算节点的多个线程包括第四线程、第五线程和第六线程;
...【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法应用于包括多个计算节点的第一模型,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,每个计算节点均包括多个线程;所述多个线程包括第一线程和第二线程,所述从第一数据库中加载与所述第一计算节点对应的第一训练数据集的第一索引信息,包括:
3.根据权利要求2所述的方法,其特征在于,在所述基于所述第一线程从所述第一数据库中将与所述第一计算节点对应的第一训练数据集的第一索引信息加载至所述第一计算节点的索引队列中之前,所述方法还包括:
4.根据权利要求2所述的方法,其特征在于,所述第一计算节点的多个线程包括第三线程,所述根据所述第一索引信息,加载所述第一训练数据集,包括:
...
【专利技术属性】
技术研发人员:王兆雄,
申请(专利权)人:维沃移动通信有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。