一种对象筛选方法、装置、设备及存储介质制造方法及图纸

技术编号：39261508 阅读：8 留言：0更新日期：2023-10-30 12:14

本申请实施例提供了一种对象筛选方法、装置、设备及存储介质，可应用于人工智能、地图领域、车载场景等各种场景，该方法包括：采用因果推断模型，预测每个候选对象的活跃概率增益，然后基于多个候选对象的活跃概率增益，筛选出用于下发提醒标识的消息推送对象，实现从多个候选对象中筛选出对提醒标识敏感的消息推送对象，故向消息推送对象下发提醒标识时，有效提高消息推送对象的活跃概率，进而提高应用的活跃对象数量，同时提高资源利用率。其次，因果推断模型是与辅助模型联合训练获得的，故在训练过程中因果推断模型与辅助模型相互监督学习，并且采用对应的损失函数共同优化梯度，从而提高训练获得的因果推断模型的准确性和鲁棒性。棒性。棒性。

全部详细技术资料下载

【技术实现步骤摘要】
一种对象筛选方法、装置、设备及存储介质

[0001]本申请实施例涉及人工智能
，尤其涉及一种对象筛选方法、装置、设备及存储介质。

技术介绍

[0002]随着互联网技术的发展，各种应用层出不穷，应用的功能也越来越多。为了提高应用的活跃对象数量，相关技术下，统计下载应用的各个对象在应用中的活跃状态，并基于统计结果从各个对象中筛选出未活跃对象，然后向未活跃对象下发提醒标识(比如，桌面红点)，以提醒未活跃对象使用应用，从而提高应用的活跃对象数量。
[0003]然而，采用上述方法筛选出的未活跃对象中，存在较多对提醒标识反感的对象，故向筛选出的各个未活跃对象无差别地下发提醒标识时，依然会存在较多的未活跃对象无法转化为活跃对象，即较多下发的提醒标识并没有发挥作用，从而造成资源浪费。

技术实现思路

[0004]本申请实施例提供了一种对象筛选方法、装置、设备及存储介质，用于在下发的提醒标识时减少资源浪费。
[0005]一方面，本申请实施例提供了一种对象筛选方法，该方法包括以下步骤：
[0006]获取多个候选对象的对象特征向量；
[0007]通过已训练的因果推断模型，基于每个候选对象的对象特征向量以及预设的干预状态，确定每个候选对象的活跃概率增益，其中，每个干预状态表征：是否向相应候选对象下发提醒标识，每个活跃概率增益表征：相应候选对象在下发提醒标识时的活跃概率与未下发提醒标识时的活跃概率之间的差值，所述因果推断模型是与辅助模型联合训练获得的，在训练过程中所述辅助模型至少用于学习不同...

【技术保护点】

【技术特征摘要】
1.一种对象筛选方法，其特征在于，包括：获取多个候选对象的对象特征向量；通过已训练的因果推断模型，基于每个候选对象的对象特征向量以及预设的干预状态，确定每个候选对象的活跃概率增益，其中，每个干预状态表征：是否向相应候选对象下发提醒标识，每个活跃概率增益表征：相应候选对象在下发提醒标识时的活跃概率与未下发提醒标识时的活跃概率之间的差值，所述因果推断模型是与辅助模型联合训练获得的，在训练过程中所述辅助模型至少用于学习不同样本对象的活跃概率增益之间的差异性；基于所述多个候选对象的活跃概率增益，从所述多个候选对象中筛选出至少一个消息推送对象，并向所述至少一个消息推送对象下发提醒标识。2.如权利要求1所述的方法，其特征在于，所述因果推断模型是与辅助模型联合训练获得的，包括：采用训练样本集合，对待训练的因果推断模型和待训练的辅助模型进行联合迭代训练，获得已训练的因果推断模型，其中，每次迭代过程包括以下步骤：通过待训练的因果推断模型，基于训练样本中第一样本对象的对象特征向量和相应的真实干预状态，获得第一预测增益；通过待训练的辅助模型，基于所述第一样本对象的对象特征向量和所述训练样本中第二样本对象的对象特征向量，获得预测增益差值；基于所述第一预测增益和所述预测增益差值，对所述待训练的因果推断模型和所述待训练的辅助模型进行参数调整。3.如权利要求2所述的方法，其特征在于，所述基于所述第一预测增益和所述预测增益差值，对所述待训练的因果推断模型和所述待训练的辅助模型进行参数调整，包括：基于所述第一预测增益和所述第一样本对象的真实增益，获得第一损失值；获取所述第一样本对象与所述第二样本对象之间的真实增益差值，并基于所述真实增益差值和所述预测增益差值，确定第二损失值；基于所述第一损失值和所述第二损失值，对所述待训练的因果推断模型和所述待训练的辅助模型进行参数调整。4.如权利要求2所述的方法，其特征在于，所述辅助模型包括第一子辅助模型和第二子辅助模型；所述通过待训练的辅助模型，基于所述第一样本对象的对象特征向量和所述训练样本中第二样本对象的对象特征向量，获得预测增益差值，包括：通过所述第一子辅助模型，基于所述第一样本对象的对象特征向量，获得第二预测增益；以及通过所述第二子辅助模型，基于所述第二样本对象的对象特征向量，获得第三预测增益；将所述第二预测增益与所述第三预测增益的差值，作为所述预测增益差值。5.如权利要求4所述的方法，其特征在于，所述基于所述第一预测增益和所述预测增益差值，对所述待训练的因果推断模型和所述待训练的辅助模型进行参数调整，包括：基于所述第一预测增益和所述第一样本对象的真实增益，获得第一损失值；获取所述第一样本对象与所述第二样本对象之间的真实增益差值，并基于所述真实增益差值和所述预测增益差值，确定第二损失值；
基于所述第二预测增益和所述第一样本对象的真实增益，获得第三损失值；基于所述第一损失值、所述第二损失值和所述第三损失值，对所述待训练的因果推断模型和所述待训练的辅助模型进行参数调整。6.如权利要求2所述的方法，其特征在于，所述采用训练样本集合，对待训练的因果推断模型和待训练的辅助模型进行联合迭代训练，获得已训练的因果推断模型之前，还包括：获取干预组数据和非干预组数据，其中，所述干预组数据包括多个样本对象的对象特征向量和每个样本对象在下发提醒标识时的活跃状态，所述非干预组数据包括多个样本对象的对象特征向量和每个样本对象在未下发提醒标识时的活跃状态；基于所述干预组数据和所述非干预组数据各自包含的样本对象的活跃状态，对所述干预组数据和所述非干预组数据重新划分，获得正增益组数据和负增益组数据；将所述正增益组数据中的多个样本对象的对象特征向量，与所述负增益组数据中的多个样本对象的对象特征向量进行组合，获得训练样本集合。7.如权...

【专利技术属性】
技术研发人员：张予琛，徐国强，尹存祥，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人