线索评级模型的训练方法、装置、设备及介质制造方法及图纸

技术编号:39253854 阅读:11 留言:0更新日期:2023-10-30 12:05
本申请公开了一种线索评级模型的训练方法、装置、设备及介质,属于人工智能领域。该方法包括:获取多个线索,多个线索中的任意一个线索包括用于预测单个对象为潜在消费对象的参考信息;对于多轮迭代过程中的至少一轮迭代过程,将多个线索输入线索评级模型,得到与多个线索分别对应的多个分数,多个分数中的任意一个分数用于表征单个对象为潜在消费对象的概率;将多个分数划分至多个分段中;根据多个分数在多个分段的分布情况,得到分布损失;根据分布损失,训练线索评级模型;当满足迭代结束条件时,结束迭代,得到训练完成后的线索评级模型。上述方法提高了分段的鲁棒性。上述方法提高了分段的鲁棒性。上述方法提高了分段的鲁棒性。

【技术实现步骤摘要】
线索评级模型的训练方法、装置、设备及介质


[0001]本申请涉及人工智能领域,特别涉及一种线索评级模型的训练方法、装置、设备及介质。

技术介绍

[0002]线索是用于预测对象是否为潜在消费对象的参考信息,比如,对象的历史消费记录、消费数据来源(来自私域还是公域)等等。
[0003]相关技术提供了线索评级模型,线索评级模型将根据输入的线索输出对象为潜在消费对象的概率分数,相关技术还将概率分数转换为离散分数。
[0004]训练过程中,相关技术将对线索评级模型输出的多个样本概率分数进行排序,按照排序名次将多个样本概率分数划分至多个离散分数段,比如,将前10%的样本概率分数划分至5分对应的分数段,将前10%

30%的样本概率分数划分至4分对应的分数段,将前30%

70%的样本概率分数划分至3分对应的分数段,将前70%

90%的样本概率分数划分至2分对应的分数段,将前90%

100%的样本概率分数划分至1分对应的分数段。因此,按照相关技术的分段方法,将确定出最终的四个分段阈值点(10%、30%、70%和90%)。
[0005]然而,阈值点可能处于高密度的概率分布区间,样本概率分数稍有变化,可能导致样本概率分数所处的离散分数段发生移动。即,相关技术下训练得到的离散分数段并不稳定。

技术实现思路

[0006]本申请提供了一种线索评级模型的训练方法、装置、设备及介质,提高了分段的鲁棒性。所述技术方案如下:
[0007]根据本申请的一个方面,提供了一种线索评级模型的训练方法,所述方法包括:
[0008]获取多个线索,所述多个线索中的任意一个线索包括用于预测单个对象为潜在消费对象的参考信息;
[0009]对于多轮迭代过程中的至少一轮迭代过程,将所述多个线索输入所述线索评级模型,得到与所述多个线索分别对应的多个分数,所述多个分数中的任意一个分数用于表征所述单个对象为潜在消费对象的概率;
[0010]将所述多个分数划分至多个分段中;
[0011]根据所述多个分数在所述多个分段的分布情况,得到分布损失;
[0012]根据所述分布损失,训练所述线索评级模型;
[0013]当满足迭代结束条件时,结束迭代,得到训练完成后的线索评级模型。
[0014]在一个实施例中,所述根据所述多个分数在所述多个分段的分布情况,得到分布损失,包括:根据所述多个分段中每个分段的分数均方差,得到所述分布损失;或者,根据所述多个分段中每个分段的分数均值,得到所述分布损失;或者,根据所述多个分段中每个分段的分数均方差和分数均值,得到所述分布损失。
[0015]在一个实施例中,若所述分布损失是基于所述多个分段中每个分段的分数均方差计算得到的,所述线索评级模型是以减小所述多个分段中分段内的分数均方差为目标进行训练的。
[0016]在一个实施例中,所述根据所述多个分段中每个分段的分数均方差,得到所述分布损失,包括:计算所述多个分段中每个分段的分数均方差;将所述多个分段的多个分数均方差进行求和,得到均方差变量;将所述均方差变量作为所述分布损失。
[0017]在一个实施例中,若所述分布损失是基于所述多个分段中每个分段的分数均值计算得到的,所述线索评级模型是以增大所述多个分段中分段间的分数均值差为目标进行训练的。
[0018]在一个实施例中,所述根据所述多个分段中每个分段的分数均值,得到所述分布损失,包括:计算所述多个分段中每个分段的分数均值;将所述多个分段中任意两个相邻分段的分数均值的差值平方进行求和,得到均值变量;将所述均值变量的相反数作为所述分布损失。
[0019]在一个实施例中,若所述分布损失是基于所述多个分段中每个分段的分数均方差和分数均值计算得到的,所述线索评级模型是以减小所述多个分段中分段内的分数均方差以及增大所述多个分段中分段间的分数均值差为目标进行训练的。
[0020]在一个实施例中,所述根据所述多个分段中每个分段的分数均方差和分数均值,得到所述分布损失,包括:计算所述多个分段中每个分段的分数均方差;将所述多个分段的多个分数均方差进行求和,得到均方差变量;计算所述多个分段中每个分段的分数均值;将所述多个分段中任意两个相邻分段的分数均值的差值平方进行求和,得到均值变量;将所述均方差变量减去所述均值变量得到所述分布损失。
[0021]在一个实施例中,对于所述多轮迭代过程中的至少一轮迭代过程,所述方法还包括:基于所述多个分数和多个概率标签之间的误差,得到分数损失;所述根据所述分布损失,训练所述线索评级模型,包括:根据所述分布损失和所述分数损失,训练所述线索评级模型。
[0022]在一个实施例中,所述基于所述多个分数和多个概率标签之间的误差,得到分数损失,包括:针对所述多个分数中的任意一个分数,确定所述任意一个分数对应的概率标签;基于所述任意一个分数与所述概率标签,得到交叉熵分数损失;将所述多个分数对应的多个交叉熵分数损失进行求和,得到所述分数损失。
[0023]在一个实施例中,所述根据所述分布损失和所述分数损失,训练所述线索评级模型,包括:将所述分布损失和所述分数损失进行加权求和,得到模型整体损失;基于所述模型整体损失,训练所述线索评级模型。
[0024]在一个实施例中,所述多个分段为N个分段,所述方法还包括:确定所述N个分段的N

1个分段阈值点;针对所述N

1个分段阈值点中的一个分段阈值点,获取所述分段阈值点两侧各m个分数,m为正整数;计算2m个分数中最大分数与最小分数的差值;将所述差值除以所述最大分数,得到所述2m个分数的分布密度;对所述N

1个分段阈值点分别对应的所述2m个分数的分布密度求平均数;基于计算得到的平均结果,确定所述分布损失的权重。
[0025]在一个实施例中,所述多个分段为N个分段,所述方法还包括:确定所述N个分段的N

1个分段阈值点;针对所述N

1个分段阈值点中的一个分段阈值点,获取所述分段阈值点
两侧各m个分数,m为正整数;计算2m个分数的方差;对所述N

1个分段阈值点分别对应的所述2m个分数的方差求平均数;基于计算得到的平均结果,确定所述分布损失的权重。
[0026]在一个实施例中,所述多个分段为N个分段,所述方法还包括:确定所述N个分段的N

1个分段阈值点;针对所述N

1个分段阈值点中的一个分段阈值点,获取所述分段阈值点两侧各m个分数,m为正整数;计算第一侧的m个分数的均值和第二侧的m个分数的均值之间的差值,得到子段均值差值;对所述N

1个分段阈值点分别对应的所述子段均值差值求平均数;基于计算得到的平均结果,确定所述分布损失的权重。
[0027]在一个实施例中,在执行所述多轮迭代过程之前,所述线索评级模型已经执本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种线索评级模型的训练方法,其特征在于,所述方法包括:获取多个线索,所述多个线索中的任意一个线索包括用于预测单个对象为潜在消费对象的参考信息;对于多轮迭代过程中的至少一轮迭代过程,将所述多个线索输入所述线索评级模型,得到与所述多个线索分别对应的多个分数,所述多个分数中的任意一个分数用于表征所述单个对象为潜在消费对象的概率;将所述多个分数划分至多个分段中;根据所述多个分数在所述多个分段的分布情况,得到分布损失;根据所述分布损失,训练所述线索评级模型;当满足迭代结束条件时,结束迭代,得到训练完成后的线索评级模型。2.根据权利要求1所述的方法,其特征在于,所述根据所述多个分数在所述多个分段的分布情况,得到分布损失,包括:根据所述多个分段中每个分段的分数均方差,得到所述分布损失;或者,根据所述多个分段中每个分段的分数均值,得到所述分布损失;或者,根据所述多个分段中每个分段的分数均方差和分数均值,得到所述分布损失。3.根据权利要求2所述的方法,其特征在于,若所述分布损失是基于所述多个分段中每个分段的分数均方差计算得到的,所述线索评级模型是以减小所述多个分段中分段内的分数均方差为目标进行训练的。4.根据权利要求3所述的方法,其特征在于,所述根据所述多个分段中每个分段的分数均方差,得到所述分布损失,包括:计算所述多个分段中每个分段的分数均方差;将所述多个分段的多个分数均方差进行求和,得到均方差变量;将所述均方差变量作为所述分布损失。5.根据权利要求2所述的方法,其特征在于,若所述分布损失是基于所述多个分段中每个分段的分数均值计算得到的,所述线索评级模型是以增大所述多个分段中分段间的分数均值差为目标进行训练的。6.根据权利要求5所述的方法,其特征在于,所述根据所述多个分段中每个分段的分数均值,得到所述分布损失,包括:计算所述多个分段中每个分段的分数均值;将所述多个分段中任意两个相邻分段的分数均值的差值平方进行求和,得到均值变量;将所述均值变量的相反数作为所述分布损失。7.根据权利要求2所述的方法,其特征在于,若所述分布损失是基于所述多个分段中每个分段的分数均方差和分数均值计算得到的,所述线索评级模型是以减小所述多个分段中分段内的分数均方差以及增大所述多个分段中分段间的分数均值差为目标进行训练的。8.根据权利要求7所述的方法,其特征在于,所述根据所述多个分段中每个分段的分数均方差和分数均值,得到所述分布损失,包括:计算所述多个分段中每个分段的分数均方差;将所述多个分段的多个分数均方差进行
求和,得到均方差变量;计算所述多个分段中每个分段的分数均值;将所述多个分段中任意两个相邻分段的分数均值的差值平方进行求和,得到均值变量;将所述均方差变量减去所述均值变量得到所述分布损失。9.根据权利要求1至8任一所述的方法,其特征在于,对于所述多轮迭代过程中的至少一轮迭代过程,所述方法还包括:基于所述多个分数和多个概率标签之间的误差,得到分数损失;所述根据所述分布损失,训练所述线索评级模型,包括:根据所述分布损失和所述分数损失,训练所述线索评级模型。10.根据权利要求9所述的方法,其特征在于,所述根据所述分布损失和所述分数损失,训练所述线索评级模型,包括:将所述分...

【专利技术属性】
技术研发人员:林炳怀王丽园
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1