消息推送方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:37419150 阅读:13 留言:0更新日期:2023-04-30 09:42
本申请涉及一种消息推送方法、装置、计算机设备和存储介质。所述方法包括:获取初始样本集,初始样本集包括活动参与度达标的正样本,活动参与度未达标的负样本;将满足标签转换条件的负样本转换为正样本,获得中间样本集;将中间样本集集输入至预先训练好的因果模型中,通过因果模型识别出样本之间的共性因子和个性因子,为样本中包含共性因子和个性因子的基础信息标注共性因子标签和个性因子标签,获得标注后的最终样本集;将最终样本集输入至多标签多分类模型中,多标签多分类模型预测各样本对应的目标活动类型,向各样本推送与目标活动类型对应的活动消息。上述方法能够解决个性特征不显著,以及正样本过少带来训练稀疏并无法有效扩量等问题。无法有效扩量等问题。无法有效扩量等问题。

【技术实现步骤摘要】
消息推送方法、装置、计算机设备和存储介质


[0001]本申请涉及活动消息推送
,特别是涉及一种消息推送方法、装置、计算机设备和存储介质。

技术介绍

[0002]在数字营销中,可以基于已有的种子人群找到一批近似或最有可能转化的拓展人群,进而扩大投放或者精准营销人群范围。现有技术基于特征近似和偏好模型进行活动或广告投放,再基于营销结果进行打标签帮助进行圈客,在圈客时业务人员通过分析响应人群的标签分布,利用经验挑选出近似人群进行扩大;偏好模型通过倾向得分匹配(PSM)或者决策树(DT)或者对比原算法(GBDT)等建设分类模型,对非种子用户进行分类识别出潜在近似人群。
[0003]现有模型方法通过业务特征和基于结果数据再分类标签的方法,由于不同活动间的共性特征多,导致同一种子用户的标签在不同活动中被反复命中,同时又导致为该种子用户再次标注标签时加大该种子用户的标签权重,增加种子的被命中率,并且在复杂的多活动推送环境下,活动间特征共用过度无法区分类型活动特征,导致活动推送的精确度不高。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高近似客户圈客精准的活动推送方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种消息推送方法。所述方法包括:
[0006]获取初始样本集,初始样本集包括多个样本,每个样本包括用户参与不同活动类型的活动数据,以及标注活动数据所属活动类型的第一标签、标注样本对应的活动参与度是否达标的第二标签、以及标注活动数据中各基础信息的多个第三标签;将活动参与度达标的样本作为正样本,将活动参与度未达标的样本作为负样本;
[0007]将满足标签转换条件的负样本转换为正样本,获得中间样本集;
[0008]将中间样本集集输入至预先训练好的因果模型中,通过因果模型识别出样本之间的共性因子和个性因子,并为样本中包含共性因子的基础信息标注共性因子标签,为样本中包含个性因子的基础信息标注个性因子标签,获得标注后的最终样本集;共性因子为不同活动间共性特征;个性因子为区分不同活动类型的个性特征;
[0009]将最终样本集输入至多标签多分类模型中,多标签多分类模型根据第一标签、第二标签、第三标签、共性因子标签和个性因子标签,预测各样本对应的目标活动类型,向各样本推送与目标活动类型对应的活动消息。
[0010]在其中一个实施例中,将满足标签转换条件的负样本转换为正样本,获得中间样本集,包括:
[0011]将初始样本集中正样本作为初始正样本集,聚类分析初始正样本集的标签分布,
获得训练好的分类器;
[0012]将初始样本集中各负样本输入至分类器,通过分类器计算各负样本被标注为正样本的概率值;
[0013]将概率值大于预设值的负样本作为满足标签转换条件的目标负样本,将目标负样本的第二标签修正为表征目标负样本的活动参与度达标,以使目标负样本转换为正样本;
[0014]将目标负样本加入初始正样本集中,聚类分析初始正样本集的标签分布,获得新的分类器,完成一次正样本扩展过程;
[0015]迭代多次正样本扩展过程,直至最终的初始正样本集的正样本数量达到要求后,停止迭代,得到中间样本集。
[0016]在其中一个实施例中,将各负样本输入至分类器,通过分类器计算各负样本被标注为正样本的概率值,包括:
[0017]将各负样本输入至分类器,通过分类器预测各负样本被标记的第一概率值,以及预测各正样本被标记的第二概率值,计算正样本被标记的概率均值;
[0018]将概率均值的平方和第一概率值的比值,确定为负样本被标注为正样本的概率值。
[0019]在其中一个实施例中,将最终样本集输入至多标签多分类模型中,多标签多分类模型根据第一标签、第二标签、第三标签、共性因子标签和个性因子标签,预测各样本对应的目标活动类型,向各样本推送与目标活动类型对应的活动消息,包括:
[0020]对各样本的第一标签、第二标签、第三标签、共性因子标签和个性因子标签进行哑变量转化处理,得到多个单标签二分类子模型;
[0021]采用多个单标签二分类子模型分别预测各样本的活动类型,对多个单标签二分类子模型预测的活动类型进行分类,将分类结果最多的活动类型作为样本对应的目标活动类型。
[0022]在其中一个实施例中,所述方法还包括:
[0023]获取待推送活动消息;
[0024]在初始样本集中选取目标活动类型与待推动活动消息的类型相同的目标样本,将待推送活动消息优先推送给目标样本。
[0025]在其中一个实施例中,所述方法还包括:
[0026]获取待推送用户的活动数据,若待推送用户的活动数据属于初始样本集,则在初始样本集中确定待推送用户对应的目标活动类型,将目标活动类型对应的活动消息推送给待推送用户。
[0027]第二方面,本申请还提供了一种消息推送装置。所述装置包括:
[0028]获取模块,用于获取初始样本集,初始样本集包括多个样本,每个样本包括用户参与不同活动类型的活动数据,以及标注活动数据所属活动类型的第一标签、标注样本对应的活动参与度是否达标的第二标签、以及标注活动数据中各基础信息的多个第三标签;将活动参与度达标的样本作为正样本,将活动参与度未达标的样本作为负样本;
[0029]样本扩展模块,用于将满足标签转换条件的负样本转换为正样本,获得中间样本集;
[0030]因果识别模块,用于将中间样本集集输入至预先训练好的因果模型中,通过因果
模型识别出样本之间的共性因子和个性因子,并为样本中包含共性因子的基础信息标注共性因子标签,为样本中包含个性因子的基础信息标注个性因子标签,获得标注后的最终样本集;共性因子为不同活动间共性特征;个性因子为区分不同活动类型的个性特征;
[0031]多分类模块,用于将最终样本集输入至多标签多分类模型中,多标签多分类模型根据第一标签、第二标签、第三标签、共性因子标签和个性因子标签,预测各样本对应的目标活动类型,向各样本推送与目标活动类型对应的活动消息。
[0032]第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0033]获取初始样本集,初始样本集包括多个样本,每个样本包括用户参与不同活动类型的活动数据,以及标注活动数据所属活动类型的第一标签、标注样本对应的活动参与度是否达标的第二标签、以及标注活动数据中各基础信息的多个第三标签;将活动参与度达标的样本作为正样本,将活动参与度未达标的样本作为负样本;
[0034]将满足标签转换条件的负样本转换为正样本,获得中间样本集;
[0035]将中间样本集集输入至预先训练好的因果模型中,通过因果模型识别出样本之间的共性因子和个性因子,并为样本中包含共性因子的基础信息标注共性因子标签,为样本中包含个性因子的基本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种消息推送方法,其特征在于,所述方法包括:获取初始样本集,所述初始样本集包括多个样本,每个样本包括用户参与不同活动类型的活动数据,以及标注所述活动数据所属活动类型的第一标签、标注样本对应的活动参与度是否达标的第二标签、以及标注所述活动数据中各基础信息的多个第三标签;将活动参与度达标的样本作为正样本,将活动参与度未达标的样本作为负样本;将满足标签转换条件的负样本转换为正样本,获得中间样本集;将所述中间样本集集输入至预先训练好的因果模型中,通过所述因果模型识别出样本之间的共性因子和个性因子,并为样本中包含共性因子的基础信息标注共性因子标签,为样本中包含个性因子的基础信息标注个性因子标签,获得标注后的最终样本集;所述共性因子为不同活动间共性特征;所述个性因子为区分不同活动类型的个性特征;将最终样本集输入至多标签多分类模型中,所述多标签多分类模型根据所述第一标签、第二标签、第三标签、共性因子标签和个性因子标签,预测各样本对应的目标活动类型,向各样本推送与目标活动类型对应的活动消息。2.根据权利要求1所述的方法,其特征在于,所述将满足标签转换条件的负样本转换为正样本,获得中间样本集,包括:将初始样本集中正样本作为初始正样本集,聚类分析所述初始正样本集的标签分布,获得训练好的分类器;将初始样本集中各负样本输入至所述分类器,通过所述分类器计算各负样本被标注为正样本的概率值;将概率值大于预设值的负样本作为满足标签转换条件的目标负样本,将目标负样本的第二标签修正为表征目标负样本的活动参与度达标,以使目标负样本转换为正样本;将目标负样本加入所述初始正样本集中,聚类分析所述初始正样本集的标签分布,获得新的分类器,完成一次正样本扩展过程;迭代多次正样本扩展过程,直至最终的初始正样本集的正样本数量达到要求后,停止迭代,得到中间样本集。3.根据权利要求2所述的方法,其特征在于,所述将各负样本输入至所述分类器,通过所述分类器计算各负样本被标注为正样本的概率值,包括:将各负样本输入至所述分类器,通过所述分类器预测各负样本被标记的第一概率值,以及预测各正样本被标记的第二概率值,计算正样本被标记的概率均值;将所述概率均值的平方和所述第一概率值的比值,确定为负样本被标注为正样本的概率值。4.根据权利要求1所述的方法,其特征在于,所述将最终样本集输入至多标签多分类模型中,所述多标签多分类模型根据所述第一标签、第二标签、第三标签、共性因子标签和个性因子标签,预测各样本对应的目标活动类型,向各样本推送与目标活动...

【专利技术属性】
技术研发人员:李洁张琛万化李云波李健
申请(专利权)人:上海浦东发展银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1