一种模型训练的方法及装置制造方法及图纸

技术编号：32515730 阅读：14 留言：0更新日期：2022-03-02 11:09

本说明书公开了一种模型训练的方法及装置，涉及无人驾驶领域，获取样本集，并针对该样本集中的每个训练样本，将该训练样本输入到待训练的预测模型中，得到针对该训练样本的预测结果，以及根据该训练样本的预测结果以及该训练样本的实际结果，确定该训练样本针对该预测模型的权重，作为该训练样本对应的权重，根据该训练样本对应的权重，确定该训练样本针对所述预测模型的损失值，并根据该损失值，确定该训练样本针对预测模型的调参梯度，根据该调参梯度，对预测模型中包含的参数进行调整，以完成对预测模型的训练，其中，若该训练样本对应的权重越大，该训练样本对应的调参梯度越大，从而提高训练出的预测模型的预测效果。从而提高训练出的预测模型的预测效果。从而提高训练出的预测模型的预测效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种模型训练的方法及装置

[0001]本说明书涉及无人驾驶领域，尤其涉及一种模型训练的方法及装置。

技术介绍

[0002]在无人驾驶技术中，无人驾驶设备通常需要根据周围障碍物的一段时间内的轨迹，来预测该障碍物在下一段时间内的轨迹，从而基于预测出的周围障碍物的未来的轨迹，来选取后续的行驶策略。
[0003]在现有技术中，通常需要使用到训练好的预测模型来对周围的障碍物的行驶轨迹进行预测，那么就需要大量的训练样本来进行预测模型的训练，而大量的训练样本中往往存在有对预测模型价值不那么大的训练样本，例如，训练样本中存在障碍物轨迹噪声较大的样本，大量数据冗余(如，障碍物轨迹的走向较为重复)的样本，可能会导致训练出的预测模型存在一定的不准确性。
[0004]所以，如何使得训练出的预测模型能够更准确地进行轨迹预测，则是一个亟待解决的问题。

技术实现思路

[0005]本说明书提供一种模型训练的方法及装置，以部分的解决现有技术存在的上述问题。
[0006]本说明书采用下述技术方案：
[0007]本说明书提供了一种模型训练的方法，包括：
[0008]获取样本集；
[0009]针对所述样本集中的每个训练样本，将该训练样本输入到待训练的预测模型中，得到针对该训练样本的预测结果；
[0010]根据该训练样本的预测结果以及该训练样本的实际结果，确定该训练样本针对所述预测模型的权重，作为该训练样本对应的权重；
[0011]根据该训练样本对应的权重，确定该训练样本针对所述...

【技术保护点】

【技术特征摘要】
1.一种模型训练的方法，其特征在于，包括：获取样本集；针对所述样本集中的每个训练样本，将该训练样本输入到待训练的预测模型中，得到针对该训练样本的预测结果；根据该训练样本的预测结果以及该训练样本的实际结果，确定该训练样本针对所述预测模型的权重，作为该训练样本对应的权重；根据该训练样本对应的权重，确定该训练样本针对所述预测模型的损失值，并根据所述损失值，确定该训练样本针对所述预测模型的调参梯度，其中，若该训练样本对应的权重越大，所述调参梯度越大；根据所述调参梯度，对所述预测模型中包含的参数进行调整，以完成对所述预测模型的训练。2.如权利要求1所述的方法，其特征在于，根据该训练样本的预测结果以及该训练样本的实际结果，确定该训练样本针对所述预测模型的权重，作为该训练样本对应的权重，具体包括：确定该训练样本的预测结果与该训练样本的实际结果之间的偏差；根据所述偏差、预设的最大偏差以及最小偏差，确定该训练样本对应的权重，其中，偏差与权重之间的关系满足：在所述最大偏差与所述最小偏差之间，存在权重的最大值，在所述最大偏差和所述最小偏差处，权重取最小值。3.如权利要求1所述的方法，其特征在于，获取样本集，具体包括：获取当前轮次的训练所需的样本集；针对所述样本集中的每个训练样本，将该训练样本输入到待训练的预测模型中，得到针对该训练样本的预测结果，具体包括：针对所述样本集中的每个训练样本，将该训练样本输入到所述当前轮次需要训练的预测模型中，得到针对该训练样本的预测结果；根据该训练样本的预测结果以及该训练样本的实际结果，确定该训练样本针对所述预测模型的权重，作为该训练样本对应的权重，具体包括：根据该训练样本的预测结果以及该训练样本的实际结果，确定该训练样本在所述当前轮次的训练中针对所述预测模型的权重，作为该训练样本在所述当前轮次对应的权重；根据该训练样本在所述当前轮次对应的权重，确定该训练样本针对所述预测模型的损失值，并根据所述损失值，确定该训练样本针对所述预测模型的调参梯度，具体包括：根据该训练样本在所述当前轮次对应的权重，确定该训练样本在所述当前轮次的训练中针对所述预测模型的损失值，并根据所述损失值，确定该训练样本在所述当前轮次的训练中针对所述预测模型的调参梯度；根据所述调参梯度，对所述预测模型中包含的参数进行调整，具体包括：根据所述调参梯度，在所述当前轮次对所述预测模型中包含的参数进行调整，得到调整后预测模型。4.如权利要求3所述的方法，其特征在于，所述方法还包括：将所述调整后预测模型，作为下一轮次中需要训练的预测模型；根据所述样本集中包含的每个训练样本在所述当前轮次对应的权重，从所述样本集中
筛选出用于在下一轮次的训练中使用...

【专利技术属性】
技术研发人员：樊明宇，徐一，任冬淳，夏华夏，
申请(专利权)人：北京三快在线科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人