一种模型训练的方法及装置制造方法及图纸

技术编号:32515730 阅读:14 留言:0更新日期:2022-03-02 11:09
本说明书公开了一种模型训练的方法及装置,涉及无人驾驶领域,获取样本集,并针对该样本集中的每个训练样本,将该训练样本输入到待训练的预测模型中,得到针对该训练样本的预测结果,以及根据该训练样本的预测结果以及该训练样本的实际结果,确定该训练样本针对该预测模型的权重,作为该训练样本对应的权重,根据该训练样本对应的权重,确定该训练样本针对所述预测模型的损失值,并根据该损失值,确定该训练样本针对预测模型的调参梯度,根据该调参梯度,对预测模型中包含的参数进行调整,以完成对预测模型的训练,其中,若该训练样本对应的权重越大,该训练样本对应的调参梯度越大,从而提高训练出的预测模型的预测效果。从而提高训练出的预测模型的预测效果。从而提高训练出的预测模型的预测效果。

【技术实现步骤摘要】
一种模型训练的方法及装置


[0001]本说明书涉及无人驾驶领域,尤其涉及一种模型训练的方法及装置。

技术介绍

[0002]在无人驾驶技术中,无人驾驶设备通常需要根据周围障碍物的一段时间内的轨迹,来预测该障碍物在下一段时间内的轨迹,从而基于预测出的周围障碍物的未来的轨迹,来选取后续的行驶策略。
[0003]在现有技术中,通常需要使用到训练好的预测模型来对周围的障碍物的行驶轨迹进行预测,那么就需要大量的训练样本来进行预测模型的训练,而大量的训练样本中往往存在有对预测模型价值不那么大的训练样本,例如,训练样本中存在障碍物轨迹噪声较大的样本,大量数据冗余(如,障碍物轨迹的走向较为重复)的样本,可能会导致训练出的预测模型存在一定的不准确性。
[0004]所以,如何使得训练出的预测模型能够更准确地进行轨迹预测,则是一个亟待解决的问题。

技术实现思路

[0005]本说明书提供一种模型训练的方法及装置,以部分的解决现有技术存在的上述问题。
[0006]本说明书采用下述技术方案:
[0007]本说明书提供了一种模型训练的方法,包括:
[0008]获取样本集;
[0009]针对所述样本集中的每个训练样本,将该训练样本输入到待训练的预测模型中,得到针对该训练样本的预测结果;
[0010]根据该训练样本的预测结果以及该训练样本的实际结果,确定该训练样本针对所述预测模型的权重,作为该训练样本对应的权重;
[0011]根据该训练样本对应的权重,确定该训练样本针对所述预测模型的损失值,并根据所述损失值,确定该训练样本针对所述预测模型的调参梯度,其中,若该训练样本对应的权重越大,所述调参梯度越大;
[0012]根据所述调参梯度,对所述预测模型中包含的参数进行调整,以完成对所述预测模型的训练。
[0013]可选地,根据该训练样本的预测结果以及该训练样本的实际结果,确定该训练样本针对所述预测模型的权重,作为该训练样本对应的权重,具体包括:
[0014]确定该训练样本的预测结果与该训练样本的实际结果之间的偏差;
[0015]根据所述偏差、预设的最大偏差以及最小偏差,确定该训练样本对应的权重,其中,偏差与权重之间的关系满足:在所述最大偏差与所述最小偏差之间,存在权重的最大值,在所述最大偏差和所述最小偏差处,权重取最小值。
[0016]可选地,获取样本集,具体包括:
[0017]获取当前轮次的训练所需的样本集;
[0018]针对所述样本集中的每个训练样本,将该训练样本输入到待训练的预测模型中,得到针对该训练样本的预测结果,具体包括:
[0019]针对所述样本集中的每个训练样本,将该训练样本输入到所述当前轮次需要训练的预测模型中,得到针对该训练样本的预测结果;
[0020]根据该训练样本的预测结果以及该训练样本的实际结果,确定该训练样本针对所述预测模型的权重,作为该训练样本对应的权重,具体包括:
[0021]根据该训练样本的预测结果以及该训练样本的实际结果,确定该训练样本在所述当前轮次的训练中针对所述预测模型的权重,作为该训练样本在所述当前轮次对应的权重;
[0022]根据该训练样本在所述当前轮次对应的权重,确定该训练样本针对所述预测模型的损失值,并根据所述损失值,确定该训练样本针对所述预测模型的调参梯度,具体包括:
[0023]根据该训练样本在所述当前轮次对应的权重,确定该训练样本在所述当前轮次的训练中针对所述预测模型的损失值,并根据所述损失值,确定该训练样本在所述当前轮次的训练中针对所述预测模型的调参梯度;
[0024]根据所述调参梯度,对所述预测模型中包含的参数进行调整,具体包括:
[0025]根据所述调参梯度,在所述当前轮次对所述预测模型中包含的参数进行调整,得到调整后预测模型。
[0026]可选地,所述方法还包括:
[0027]将所述调整后预测模型,作为下一轮次中需要训练的预测模型;
[0028]根据所述样本集中包含的每个训练样本在所述当前轮次对应的权重,从所述样本集中筛选出用于在下一轮次的训练中使用的训练样本,并根据筛选出的训练样本,构建出用于在下一轮次的训练中,对得到的所述下一轮次中需要训练的预测模型进行训练的样本集。
[0029]可选地,根据该训练样本的预测结果以及该训练样本的实际结果,确定该训练样本在所述当前轮次的训练中针对所述预测模型的权重,作为该训练样本在所述当前轮次对应的权重,具体包括:
[0030]确定该训练样本的预测结果与该训练样本的实际结果之间的偏差;
[0031]根据所述偏差、确定出的所述当前轮次对应的最大偏差以及所述当前轮次对应的最小偏差,确定该训练样本在所述当前轮次对应的权重,其中,偏差与权重之间的关系满足:在所述当前轮次对应的最大偏差与所述当前轮次对应的最小偏差之间,存在权重的最大值,在所述当前轮次对应的最大偏差和所述当前轮次对应的最小偏差处,权重取最小值;
[0032]可选地,确定所述当前轮次对应的最大偏差以及所述当前轮次对应的最小偏差,具体包括:
[0033]根据所述当前轮次对应的轮次数以及上一轮次对应的最大偏差,确定所述当前轮次对应的最大偏差,以及,根据所述当前轮次对应的轮次数以及所述上一轮次对应的最小偏差,确定所述当前轮次对应的最小偏差,其中
[0034]所述上一轮次对应的最小偏差小于所述当前轮次对应的最小偏差,所述上一轮次
对应的最大偏差大于所述当前轮次对应的最大偏差。
[0035]可选地,所述预测模型用于对无人驾驶设备周围的目标物进行轨迹预测,所述训练样本包括无人驾驶设备周围的目标物的历史轨迹,所述预测结果为基于目标物的历史轨迹预测出的目标物在未来一段时间内的行进轨迹。
[0036]本说明书提供了一种模型训练的装置,包括:
[0037]获取模块,用于获取样本集;
[0038]预测模块,用于针对所述样本集中的每个训练样本,将该训练样本输入到待训练的预测模型中,得到针对该训练样本的预测结果;
[0039]权重确定模块,用于根据该训练样本的预测结果以及该训练样本的实际结果,确定该训练样本针对所述预测模型的权重,作为该训练样本对应的权重;
[0040]损失确定模块,用于根据该训练样本对应的权重,确定该训练样本针对所述预测模型的损失值,并根据所述损失值,确定该训练样本针对所述预测模型的调参梯度,其中,若该训练样本对应的权重越大,所述调参梯度越大;
[0041]训练模块,用于根据所述调参梯度,对所述预测模型中包含的参数进行调整,以完成对所述预测模型的训练。
[0042]本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述模型训练的方法。
[0043]本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练的方法,其特征在于,包括:获取样本集;针对所述样本集中的每个训练样本,将该训练样本输入到待训练的预测模型中,得到针对该训练样本的预测结果;根据该训练样本的预测结果以及该训练样本的实际结果,确定该训练样本针对所述预测模型的权重,作为该训练样本对应的权重;根据该训练样本对应的权重,确定该训练样本针对所述预测模型的损失值,并根据所述损失值,确定该训练样本针对所述预测模型的调参梯度,其中,若该训练样本对应的权重越大,所述调参梯度越大;根据所述调参梯度,对所述预测模型中包含的参数进行调整,以完成对所述预测模型的训练。2.如权利要求1所述的方法,其特征在于,根据该训练样本的预测结果以及该训练样本的实际结果,确定该训练样本针对所述预测模型的权重,作为该训练样本对应的权重,具体包括:确定该训练样本的预测结果与该训练样本的实际结果之间的偏差;根据所述偏差、预设的最大偏差以及最小偏差,确定该训练样本对应的权重,其中,偏差与权重之间的关系满足:在所述最大偏差与所述最小偏差之间,存在权重的最大值,在所述最大偏差和所述最小偏差处,权重取最小值。3.如权利要求1所述的方法,其特征在于,获取样本集,具体包括:获取当前轮次的训练所需的样本集;针对所述样本集中的每个训练样本,将该训练样本输入到待训练的预测模型中,得到针对该训练样本的预测结果,具体包括:针对所述样本集中的每个训练样本,将该训练样本输入到所述当前轮次需要训练的预测模型中,得到针对该训练样本的预测结果;根据该训练样本的预测结果以及该训练样本的实际结果,确定该训练样本针对所述预测模型的权重,作为该训练样本对应的权重,具体包括:根据该训练样本的预测结果以及该训练样本的实际结果,确定该训练样本在所述当前轮次的训练中针对所述预测模型的权重,作为该训练样本在所述当前轮次对应的权重;根据该训练样本在所述当前轮次对应的权重,确定该训练样本针对所述预测模型的损失值,并根据所述损失值,确定该训练样本针对所述预测模型的调参梯度,具体包括:根据该训练样本在所述当前轮次对应的权重,确定该训练样本在所述当前轮次的训练中针对所述预测模型的损失值,并根据所述损失值,确定该训练样本在所述当前轮次的训练中针对所述预测模型的调参梯度;根据所述调参梯度,对所述预测模型中包含的参数进行调整,具体包括:根据所述调参梯度,在所述当前轮次对所述预测模型中包含的参数进行调整,得到调整后预测模型。4.如权利要求3所述的方法,其特征在于,所述方法还包括:将所述调整后预测模型,作为下一轮次中需要训练的预测模型;根据所述样本集中包含的每个训练样本在所述当前轮次对应的权重,从所述样本集中
筛选出用于在下一轮次的训练中使用...

【专利技术属性】
技术研发人员:樊明宇徐一任冬淳夏华夏
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1