System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 模型的训练和博文质量评估方法、装置、设备及存储介质制造方法及图纸_技高网

模型的训练和博文质量评估方法、装置、设备及存储介质制造方法及图纸

技术编号:44894197 阅读:10 留言:0更新日期:2025-04-08 00:33
本申请提供了一种模型的训练和博文质量评估方法、装置、设备及存储介质,该方法包括:基于博文推荐系统的曝光日志,获取多个训练样本;对每一个训练样本中的样本博文的博文信息、及其对应的样本博主的用户信息进行预处理,生成每一个训练样本对应的博文侧行为特征和用户侧行为特征;通过对博文侧行为特征和用户侧行为特征进行修正处理,得到每一个训练样本对应的博文修正特征和用户修正特征;在使用多个训练样本对初始的博文质量评估模型进行迭代训练的过程中,基于每一个训练样本对应的博文侧行为特征、用户侧行为特征、博文修正特征和用户修正特征调整模型参数,以得到训练完成的博文质量评估模型。通过本申请,可以实现更精准的博文推荐。

【技术实现步骤摘要】

本申请涉及计算机,尤其涉及一种模型的训练和博文质量评估方法、装置、设备及存储介质


技术介绍

1、目前,推荐系统是解决信息过载最有效的方式之一。在关系流分发场景中,推荐系统一般分为两个阶段,分别是召回阶段和排序阶段。在召回阶段,通过用户画像、协同过滤、图网络和近似搜索等多链路方式充分挖掘用户可能感兴趣的博文,并按照时间序或蛇形排序等方式将多路召回的博文进行截断融合;在精排阶段,基于深度学习的推荐算法对召回的博文进行个性化推荐,促进用户的消费欲望。

2、但是,通过充分考虑用户多兴趣及兴趣变化而多链路召回的博文,由于不同博文针对的兴趣领域以及面对的用户基数不同,使得召回的不同兴趣领域的博文的质量计算结果存在严重的量纲问题,从而影响博文的精准推荐。


技术实现思路

1、本申请提供一种模型的训练和博文质量评估方法、装置、设备及存储介质,以实现更精准的博文推荐。

2、本申请的技术方案是这样实现的:

3、本申请提供一种博文质量评估模型的训练方法,上述方法包括:基于博文推荐系统的曝光日志,获取多个训练样本;其中,每个训练样本包括样本博文的博文信息、及其对应的样本博主的用户信息;样本博主为发布样本博文的用户;对每一个训练样本中的样本博文的博文信息、及其对应的样本博主的用户信息进行预处理,生成每一个训练样本对应的博文侧行为特征和用户侧行为特征;其中,博文侧行为特征用于表征样本博文在预设的第一时间段内的互动情况;用户侧行为特征用于表征样本博主在预设的第二时间段内发布过的博文的互动情况;通过对博文侧行为特征和用户侧行为特征进行修正处理,得到每一个训练样本对应的博文修正特征和用户修正特征;博文修正特征的置信水平高于博文侧行为特征,用户修正特征的置信水平高于用户侧行为特征;在使用多个训练样本对初始的博文质量评估模型进行迭代训练的过程中,基于每一个训练样本对应的博文侧行为特征、用户侧行为特征、博文修正特征和用户修正特征调整模型参数,直至博文质量评估模型收敛,得到训练完成的博文质量评估模型;博文质量评估模型用于对博文进行质量评估。

4、在一些可能的实施方式中,上述方法还包括:在获取多个训练样本之后,对每一个训练样本中的样本博文的博文信息、及其对应的样本博主的用户信息进行预处理,生成每一个训练样本对应的博文短期特征和用户信息特征;博文短期特征用于表征样本博文在预设的第三时间段内的互动情况,第三时间段小于第一时间段,用户信息特征用于表征样本博主的用户画像。

5、在一些可能的实施方式中,在使用多个训练样本对初始的博文质量评估模型进行迭代训练的过程中,基于每一个训练样本对应的博文侧行为特征、用户侧行为特征、博文修正特征和用户修正特征调整模型参数,直至博文质量评估模型收敛,得到训练完成的博文质量评估模型,包括:基于每一个训练样本对应的博文侧行为特征、用户侧行为特征、博文修正特征和用户修正特征,确定每一个样本博文对应的标记信息;标记信息用于标记样本博文为正样本或负样本;将每一个训练样本对应的博文短期特征和用户信息特征输入博文质量评估模型,得到博文质量评估模型输出的质量评估结果;质量评估结果包括样本博文对应的第一质量分数、以及对样本博文为正样本或负样本的预测结果;第一质量分数用于表征用户对样本博文的感兴趣程度;通过比较每一个样本博文对应的预测结果和标记信息,得到比较结果;基于每一个样本博文的比较结果,对博文质量评估模型进行调参,直至博文质量评估模型收敛。

6、在一些可能的实施方式中,基于每一个训练样本对应的博文侧行为特征、用户侧行为特征、博文修正特征和用户修正特征,确定每一个样本博文对应的标记信息,包括:对每一个训练样本对应的博文侧行为特征、用户侧行为特征、博文修正特征和用户修正特征进行线性融合处理,得到每一个训练样本中样本博文对应的初始质量分数;初始质量分数用于表征在未经博文质量评估模型处理的情况下,用户对样本博文的感兴趣程度;在样本博文的初始质量分数满足预设阈值的情况下,将样本博文标记为正样本;在样本博文的初始质量分数不满足预设阈值的情况下,将样本博文标记为负样本。

7、在一些可能的实施方式中,通过对博文侧行为特征和用户侧行为特征进行修正处理,得到每一个训练样本对应的博文修正特征和用户修正特征,包括:根据威尔逊置信区间,对博文侧行为特征进行可信度修正,得到每一个训练样本对应的博文修正特征;根据威尔逊置信区间,对用户侧行为特征进行可信度修正,得到每一个训练样本对应的用户修正特征。

8、本申请提供一种博文质量评估方法,该方法包括:基于博文推荐系统的曝光日志,获取多个曝光过的历史博文和发布历史博文的历史博主;将每一个历史博文的博文信息、及其对应的历史博主的用户信息输入训练完成的博文质量评估模型,得到博文质量评估模型输出的每一个历史博文对应的第二质量分数;博文质量评估模型采用如上述博文质量评估模型的训练方法训练得到,第二质量分数用于表征用户对历史博文的感兴趣程度;基于第二质量分数,在多个曝光过的历史博文中确定目标博文;目标博文用于博文粗排或博文精排。

9、在一些可能的实施方式中,基于第二质量分数,在多个曝光过的历史博文中确定目标博文,包括:根据预设的衰减映射关系、预设的时效期和第二质量分数,计算每一个历史博文对应的第三质量分数;第三质量分数用于表征在去除时效影响后,用户对历史博文的感兴趣程度;衰减映射关系为第二质量分数与第三质量分数之间的映射关系;将每一个历史博文的博文信息和每一个历史博文对应的第三质量分数关联保存至训练训练完成的博文质量评估模型;基于第三质量分数,在多个曝光过的历史博文中确定目标博文。

10、在一些可能的实施方式中,基于第三质量分数,在多个曝光过的历史博文中确定目标博文,包括:通过多链路召回,在多个曝光过的历史博文中筛选出多个召回博文;在训练完成的博文质量评估模型中,获取每一个召回博文对应的第三质量分数;基于每一个召回博文对应的第三质量分数,从多个召回博文中选取目标博文。

11、本申请提供一种博文质量评估模型的训练装置,上述装置包括:样本数据采集模块,用于基于博文推荐系统的曝光日志,获取多个训练样本;其中,每个训练样本包括样本博文的博文信息、及其对应的样本博主的用户信息,样本博主为发布样本博文的用户;样本数据预处理模块,用于对每一个训练样本中的样本博文的博文信息、及其对应的样本博主的用户信息进行预处理,生成每一个训练样本对应的博文侧行为特征和用户侧行为特征;其中,博文侧行为特征用于表征样本博文在预设的第一时间段内的互动情况;用户侧行为特征用于表征样本博主在预设的第二时间段内发布过的博文的互动情况;样本数据处理模块,用于通过对博文侧行为特征和用户侧行为特征进行修正处理,得到每一个训练样本对应的博文修正特征和用户修正特征;博文修正特征的置信水平高于博文侧行为特征,用户修正特征的置信水平高于用户侧行为特征;训练模块,用于在使用多个训练样本对初始的博文质量评估模型进行迭代训练的过程中,基于每一个训练样本对应的博文侧行为本文档来自技高网...

【技术保护点】

1.一种博文质量评估模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述在使用所述多个训练样本对初始的博文质量评估模型进行迭代训练的过程中,基于每一个训练样本对应的博文侧行为特征、用户侧行为特征、博文修正特征和用户修正特征调整模型参数,直至所述博文质量评估模型收敛,得到训练完成的博文质量评估模型,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于每一个训练样本对应的博文侧行为特征、用户侧行为特征、博文修正特征和用户修正特征,确定每一个样本博文对应的标记信息,包括:

5.根据权利要求1所述的方法,其特征在于,所述通过对所述博文侧行为特征和所述用户侧行为特征进行修正处理,得到每一个训练样本对应的博文修正特征和用户修正特征,包括:

6.一种博文质量评估方法,其特征在于,所述方法包括:

7.根据权利要求6所述的方法,其特征在于,所述基于所述第二质量分数,在所述多个曝光过的历史博文中确定目标博文,包括:

>8.根据权利要求7所述的方法,其特征在于,所述基于所述第三质量分数,在所述多个曝光过的历史博文中确定所述目标博文,包括:

9.一种博文质量评估装置,其特征在于,所述装置包括:

10.一种电子设备,其特征在于,所述电子设备包括:

...

【技术特征摘要】

1.一种博文质量评估模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述在使用所述多个训练样本对初始的博文质量评估模型进行迭代训练的过程中,基于每一个训练样本对应的博文侧行为特征、用户侧行为特征、博文修正特征和用户修正特征调整模型参数,直至所述博文质量评估模型收敛,得到训练完成的博文质量评估模型,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于每一个训练样本对应的博文侧行为特征、用户侧行为特征、博文修正特征和用户修正特征,确定每一个样本博文对应的标记信息,包括:

...

【专利技术属性】
技术研发人员:张勇王雷张树刘博
申请(专利权)人:微梦创科网络科技中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1