对象识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:39401242 阅读:13 留言:0更新日期:2023-11-19 15:53
本申请涉及计算机技术领域,提供一种对象识别方法、装置、电子设备及存储介质,通过SPYST算法,为未标注对象子集中的各未标注对象标注标签,丰富了初始标注对象子集,解决了由于标注样本数量不足导致的召回率偏低的问题,且减少了样本标注所需的人力物力;通过DALR算法,基于标注好的各目标标注对象原始推广特征,以及随机生成的表征所述各目标标注对象分布的整体潜在表示,采用多个判别器从不同角度进行对抗学习,由于整体潜在表示相对于原始推广特征,维度更低、有用信息更多,在对象较多或是否感兴趣的对象比例不平衡的情况下,提高了推广特征的提取质量,从而提高了识别对推广产品感兴趣的对象的准确性。广产品感兴趣的对象的准确性。广产品感兴趣的对象的准确性。

【技术实现步骤摘要】
对象识别方法、装置、电子设备及存储介质


[0001]本申请涉及计算机
,公开了一种对象识别方法、装置、电子设备及存储介质。

技术介绍

[0002]在产品运营过程中,为了提高产品的推广效益,通常需要识别出对产品感兴趣的对象作为推广对象,并针对各推广对象进行产品宣传。
[0003]目前,推广对象的识别方法主要分为两类:
[0004]一、基于预设数据规则识别推广对象。
[0005]具体的,可以基于经验设置识别推广对象的数据规则,并利用设置的数据规则,从海量对象中识别出对推广产品感兴趣的推广对象。然而,基于经验设置的数据规则,不仅设置的数量有限,而且还无法捕捉各数据规则间相互关联的高维特征信息,最重要的是,还无法确定每个数据规则的最优参数,从而导致无法准确的识别出推广对象,进而降低了推广效益。
[0006]例如,基于手机购买的业务经验,设置“年纪为20

30岁、消费水平为高”为数据规则,基于该数据规则,将“年纪为20

30岁、消费水平为高”的对象,识别为购买新手机的推广对象。然而,对于喜欢玩游戏的对象来说,对手机的配置要求较高,往往也是购买新手机的推广对象,并且,随着手机的普及,十几岁的中学生也可以使用手机,手机的最广对象逐渐低龄化,因此,上述设置的数据规则,无法准确的识别出购买新手机的推广对象。
[0007]二、基于非深度学习的数据挖掘方法识别推广对象。
[0008]具体的,可以基于非深度学习算法构建识别模型,并利用识别模型,预测当前对象属于不同标签的概率,并根据预测概率,识别出推广对象。然而,在实际应用过程中,待识别对象的特征较为复杂,传统的特征表征方法和非深度学习模型难以表征,一旦特征表征不准确,将会直接影响推广对象识别的准确率。
[0009]有鉴于此,需要设计一种新的用于推广产品的对象识别模型,以克服上述缺陷。

技术实现思路

[0010]本申请实施例提供了一种对象识别方法、装置、电子设备及存储介质,用于提高识别对推广产品感兴趣的对象的准确性。
[0011]一方面,本申请实施例提供了一种对象识别方法,包括:
[0012]获取训练样本集合,其中,所述训练样本集合包含初始标注对象子集和未标注对象子集,每个初始标注对象设置有表征是否对推广产品感兴趣的标签;
[0013]基于所述训练样本集合中每个对象在设定历史时间范围内关联的属性特征和业务特征,分别获得相应对象的原始推广特征;
[0014]基于各个对象的原始推广特征,为各未标注对象标注标签,并基于标注好的各未标注对象和所述初始标注对象子集,获得目标标注对象集;
[0015]基于各目标标注对象的原始推广特征,以及随机生成的表征所述各目标标注对象分布的整体潜在表示,对待训练的对象识别模型进行至少一次迭代训练,得到用于挖掘对推广产品感兴趣对象的目标对象识别模型。
[0016]另一方面,本申请实施例提供一种对象识别装置,包括:
[0017]样本获取模块,用于获取训练样本集合,所述训练样本集合包含初始标注对象子集和未标注对象子集,其中,每个初始标注对象设置有表征是否对推广产品感兴趣的标签;
[0018]特征提取模块,用于基于所述训练样本集合中每个对象在设定历史时间范围内关联的属性特征和业务特征,分别获得相应对象的原始推广特征;
[0019]标注模块,用于基于各个对象的原始推广特征,为各未标注对象标注标签,并基于标注好的各未标注对象和所述初始标注对象子集,获得目标标注对象集;
[0020]训练模块,用于基于各目标标注对象的原始推广特征,以及随机生成的表征所述各目标标注对象分布的整体潜在表示,对待训练的对象识别模型进行至少一次迭代训练,得到用于挖掘对推广产品感兴趣对象的目标对象识别模型。
[0021]可选的,所述特征提取模块具体用于:
[0022]针对所述训练样本集合中的每个对象,执行以下操作:
[0023]获取所述对象在设定历史时间范围内的非隐私行为数据,并基于所述非隐私行为数据,确定所述对象关联的属性特征;
[0024]获取所述对象在设定历史时间范围内对推广产品产生的业务类型,并基于所述业务类型,确定所述对象关联的业务特征;
[0025]对所述对象关联的属性特征和业务特征进行预处理,得到所述对象的原始推广特征。
[0026]可选的,所述标注模块具体用于:
[0027]隐藏所述初始标注对象子集中部分初始标注对象的标签,并基于标签隐藏后的部分初始标注对象,初始化所述初始标注对象子集和所述未标注对象子集;
[0028]基于初始化后各初始标注对象和各未标注对象的原始推广特征,训练第一分类器,并基于所述第一分类器,为所述各未标注对象标注标签;
[0029]基于所述各未标注对象的标签,确定所述未标注对象子集包含的可靠负例对象子集和可靠正例对象子集;
[0030]基于可靠负例对象子集、可靠正例对象子集和所述初始标注对象子集,获得所述目标标注对象集。
[0031]可选的,所述标注模块具体用于:
[0032]针对所述未标注对象子集中的每个未标注对象,执行以下操作:
[0033]基于所述第一分类器,确定所述未标注对象为对推广产品感兴趣的正例对象的第一后验概率;
[0034]当所述第一后验概率小于概率阈值时,为所述未标注对象标记对推广产品不感兴趣的负例对象的标签,其中,所述概率阈值是基于标签隐藏后的所述部分初始标注对象中属于正例对象的参考后验概率确定的。
[0035]可选的,所述标注模块具体用于:
[0036]将各可靠负例对象、各可靠正例对象和各初始标注对象的原始推广特征,输入至
所述第一分类器,通过至少一轮迭代使所述未标注对象子集为空,得到目标标注对象集,其中,每一轮迭代执行以下操作:
[0037]隐藏所述各可靠正例对象的标签,将所述可靠正例对象子集作为新的未标注对象子集;
[0038]基于所述各可靠负例对象和所述各初始标注对象的原始推广特征,重新训练第一分类器,基于重新训练后的第一分类器,确定各未标注对象所属对象类别的第二后验概率,并基于各第二后验概率,为相应的未标注对象标注标签;
[0039]基于所述各未标注对象的第二后验概率和标签,更新所述可靠负例对象子集、所述可靠正例对象子集以及所述未标注对象子集。
[0040]可选的,所述标注模块具体用于:
[0041]对所述各第二后验概率进行排序,按照所述各未标注对象标注的标签,将前f个未标注对象存入所述可靠负例对象子集或所述可靠正例对象子集中,其中,f为大于等于1的整数;
[0042]从所述未标注对象子集中剔除前f个未标注对象。
[0043]可选的,所述训练模块针对每一次迭代训练,执行以下具体操作:
[0044]基于各原始推广特征和所述整体潜在表示,通过多次特征映射,分别获得相应目标对象的第一潜在表本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对象识别方法,其特征在于,包括:获取训练样本集合,其中,所述训练样本集合包含初始标注对象子集和未标注对象子集,每个初始标注对象设置有表征是否对推广产品感兴趣的标签;基于所述训练样本集合中每个对象在设定历史时间范围内关联的属性特征和业务特征,分别获得相应对象的原始推广特征;基于各个对象的原始推广特征,为各未标注对象标注标签,并基于标注好的各未标注对象和所述初始标注对象子集,获得目标标注对象集;基于各目标标注对象的原始推广特征,以及随机生成的表征所述各目标标注对象分布的整体潜在表示,对待训练的对象识别模型进行至少一次迭代训练,得到用于挖掘对推广产品感兴趣对象的目标对象识别模型。2.如权利要求1所述的方法,其特征在于,基于所述训练样本集合中每个对象在设定历史时间范围内关联的属性特征和业务特征,分别获得相应对象的原始推广特征,包括:针对所述训练样本集合中的每个对象,执行以下操作:获取所述对象在设定历史时间范围内的非隐私行为数据,并基于所述非隐私行为数据,确定所述对象关联的属性特征;获取所述对象在设定历史时间范围内对推广产品产生的业务类型,并基于所述业务类型,确定所述对象关联的业务特征;对所述对象关联的属性特征和业务特征进行预处理,得到所述对象的原始推广特征。3.如权利要求1所述的方法,其特征在于,所述基于各个对象的原始推广特征,为各未标注对象标注标签,并基于标注好的各未标注对象和所述初始标注对象子集,获得目标标注对象集,包括:隐藏所述初始标注对象子集中部分初始标注对象的标签,并基于标签隐藏后的部分初始标注对象,初始化所述初始标注对象子集和所述未标注对象子集;基于初始化后各初始标注对象和各未标注对象的原始推广特征,训练第一分类器,并基于所述第一分类器,为所述各未标注对象标注标签;基于所述各未标注对象的标签,确定所述未标注对象子集包含的可靠负例对象子集和可靠正例对象子集;基于可靠负例对象子集、可靠正例对象子集和所述初始标注对象子集,获得所述目标标注对象集。4.如权利要求3所述的方法,其特征在于,所述基于所述第一分类器,为所述各未标注对象标注标签,包括:针对所述未标注对象子集中的每个未标注对象,执行以下操作:基于所述第一分类器,确定所述未标注对象为对推广产品感兴趣的正例对象的第一后验概率;当所述第一后验概率小于概率阈值时,为所述未标注对象标记对推广产品不感兴趣的负例对象的标签,其中,所述概率阈值是基于标签隐藏后的所述部分初始标注对象中属于正例对象的参考后验概率确定的。5.如权利要求3所述的方法,其特征在于,所述基于可靠负例对象子集、可靠正例对象子集和所述初始标注对象子集,获得所述目标标注对象集,包括:
将各可靠负例对象、各可靠正例对象和各初始标注对象的原始推广特征,输入至所述第一分类器,通过至少一轮迭代使所述未标注对象子集为空,得到目标标注对象集,其中,每一轮迭代执行以下操作:隐藏所述各可靠正例对象的标签,将所述可靠正例对象子集作为新的未标注对象子集;基于所述各可靠负例对象和所述各初始标注对象的原始推广特征,重新训练第一分类器,基于重新训练后的第一分类器,确定各未标注对象所属对象类别的第二后验概率,并基于各第二后验概率,为相应的未标注对象标注标签;基于所述各未标注对象的第二后验概率和标签,更新所述可靠负例对象子集、所述可靠正例对象子集以及所述未标注对象子集。6.如权利要求5所述的方法,其特征在于,所述基于所述各未标注对象的第二后验概率和标签,更新所述可靠负例对象子集、所述可靠正例对象子集以及所述未标注对象子集,包括:对所述各第二后验概率进行排序,按照所述各未标注对象标注的标签,将前f个未标注对象存入所述可靠负例对象子集或所述可靠正例对象子集中,其中,f为大于等于1的整数;从所述未标注对象子集中剔除前f个未标注对象。7.如权利要求1所述的方法,其特征在于,所述基于各目标标注对象的原始推广特征,以及随机生成的表征所述各目标标注对象分布的整体潜在表示,对待训练的对象识别模型进行至少一次迭代训练,得到用于挖掘对推广产品感兴趣对象的目标对象识别模型,其中,每一次迭代训练,执行以下操作:基于各原始推广特征和所述整体潜在表示,通过多次特征映射,分别获得相应目标对象的第一潜在表示、重构推广特征、第二潜在表示和相似推广特征;对各原始推广特征、各第一潜在表示、各重构推广特征、各第二潜在表示和各相似推广特征进行多次对抗学习,得到所述各目标标注对象的目标概率分布;基于所述目标概率分布,确定所述各目标标注对象对推广产品感兴趣的预测概率;基于各特征映射子损失值以及各对抗学习子损失值,确定目标损失值,并基于所述目标损失值,调整所述待训练的对象识别模型的参数。8.如权利要求7所述的方法,其特征在于,所述基于各原始推广特征和所述整体潜在表示,通过多次特征映射,分别获得相应目标对象的第一潜在表示、第二潜在表示、重构推广特征和相似推广特征,包括:对所述各目标标注对象的原始推广特征进行特征映射,获得相应目标标注对象的第一潜在表示,并对各第一潜在表示进行特征映射,获得相应目标标注对象的重构推广特征;对随机生成的整体潜在表示进行采样,获得相应目标标注对象的第二潜在表示,并对各第二潜在表示进行特征映射,生成相应目标标注对象的相似推广特征。9...

【专利技术属性】
技术研发人员:樊鹏
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1