线索评级模型的训练方法、装置、设备及介质制造方法及图纸

技术编号：39253854 阅读：11 留言：0更新日期：2023-10-30 12:05

本申请公开了一种线索评级模型的训练方法、装置、设备及介质，属于人工智能领域。该方法包括：获取多个线索，多个线索中的任意一个线索包括用于预测单个对象为潜在消费对象的参考信息；对于多轮迭代过程中的至少一轮迭代过程，将多个线索输入线索评级模型，得到与多个线索分别对应的多个分数，多个分数中的任意一个分数用于表征单个对象为潜在消费对象的概率；将多个分数划分至多个分段中；根据多个分数在多个分段的分布情况，得到分布损失；根据分布损失，训练线索评级模型；当满足迭代结束条件时，结束迭代，得到训练完成后的线索评级模型。上述方法提高了分段的鲁棒性。上述方法提高了分段的鲁棒性。上述方法提高了分段的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
线索评级模型的训练方法、装置、设备及介质

[0001]本申请涉及人工智能领域，特别涉及一种线索评级模型的训练方法、装置、设备及介质。

技术介绍

[0002]线索是用于预测对象是否为潜在消费对象的参考信息，比如，对象的历史消费记录、消费数据来源(来自私域还是公域)等等。
[0003]相关技术提供了线索评级模型，线索评级模型将根据输入的线索输出对象为潜在消费对象的概率分数，相关技术还将概率分数转换为离散分数。
[0004]训练过程中，相关技术将对线索评级模型输出的多个样本概率分数进行排序，按照排序名次将多个样本概率分数划分至多个离散分数段，比如，将前10％的样本概率分数划分至5分对应的分数段，将前10％
‑
30％的样本概率分数划分至4分对应的分数段，将前30％
‑
70％的样本概率分数划分至3分对应的分数段，将前70％
‑
90％的样本概率分数划分至2分对应的分数段，将前90％
‑
100％的样本概率分数划分至1分对应的分数段。因此，按照相关技术的分段方法，将确定出最终的四个分段阈值点(10％、30％、70％和90％)。
[0005]然而，阈值点可能处于高密度的概率分布区间，样本概率分数稍有变化，可能导致样本概率分数所处的离散分数段发生移动。即，相关技术下训练得到的离散分数段并不稳定。

技术实现思路

[0006]本申请提供了一种线索评级模型的训练方法、装置、设备及介质，提高了分段的鲁棒性。所述技术方案如下：
...

【技术保护点】

【技术特征摘要】
1.一种线索评级模型的训练方法，其特征在于，所述方法包括：获取多个线索，所述多个线索中的任意一个线索包括用于预测单个对象为潜在消费对象的参考信息；对于多轮迭代过程中的至少一轮迭代过程，将所述多个线索输入所述线索评级模型，得到与所述多个线索分别对应的多个分数，所述多个分数中的任意一个分数用于表征所述单个对象为潜在消费对象的概率；将所述多个分数划分至多个分段中；根据所述多个分数在所述多个分段的分布情况，得到分布损失；根据所述分布损失，训练所述线索评级模型；当满足迭代结束条件时，结束迭代，得到训练完成后的线索评级模型。2.根据权利要求1所述的方法，其特征在于，所述根据所述多个分数在所述多个分段的分布情况，得到分布损失，包括：根据所述多个分段中每个分段的分数均方差，得到所述分布损失；或者，根据所述多个分段中每个分段的分数均值，得到所述分布损失；或者，根据所述多个分段中每个分段的分数均方差和分数均值，得到所述分布损失。3.根据权利要求2所述的方法，其特征在于，若所述分布损失是基于所述多个分段中每个分段的分数均方差计算得到的，所述线索评级模型是以减小所述多个分段中分段内的分数均方差为目标进行训练的。4.根据权利要求3所述的方法，其特征在于，所述根据所述多个分段中每个分段的分数均方差，得到所述分布损失，包括：计算所述多个分段中每个分段的分数均方差；将所述多个分段的多个分数均方差进行求和，得到均方差变量；将所述均方差变量作为所述分布损失。5.根据权利要求2所述的方法，其特征在于，若所述分布损失是基于所述多个分段中每个分段的分数均值计算得到的，所述线索评级模型是以增大所述多个分段中分段间的分数均值差为目标进行训练的。6.根据权利要求5所述的方法，其特征在于，所述根据所述多个分段中每个分段的分数均值，得到所述分布损失，包括：计算所述多个分段中每个分段的分数均值；将所述多个分段中任意两个相邻分段的分数均值的差值平方进行求和，得到均值变量；将所述均值变量的相反数作为所述分布损失。7.根据权利要求2所述的方法，其特征在于，若所述分布损失是基于所述多个分段中每个分段的分数均方差和分数均值计算得到的，所述线索评级模型是以减小所述多个分段中分段内的分数均方差以及增大所述多个分段中分段间的分数均值差为目标进行训练的。8.根据权利要求7所述的方法，其特征在于，所述根据所述多个分段中每个分段的分数均方差和分数均值，得到所述分布损失，包括：计算所述多个分段中每个分段的分数均方差；将所述多个分段的多个分数均方差进行
求和，得到均方差变量；计算所述多个分段中每个分段的分数均值；将所述多个分段中任意两个相邻分段的分数均值的差值平方进行求和，得到均值变量；将所述均方差变量减去所述均值变量得到所述分布损失。9.根据权利要求1至8任一所述的方法，其特征在于，对于所述多轮迭代过程中的至少一轮迭代过程，所述方法还包括：基于所述多个分数和多个概率标签之间的误差，得到分数损失；所述根据所述分布损失，训练所述线索评级模型，包括：根据所述分布损失和所述分数损失，训练所述线索评级模型。10.根据权利要求9所述的方法，其特征在于，所述根据所述分布损失和所述分数损失，训练所述线索评级模型，包括：将所述分...

【专利技术属性】
技术研发人员：林炳怀，王丽园，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人