【技术实现步骤摘要】
对象识别方法、装置、电子设备及存储介质
[0001]本申请涉及计算机
,公开了一种对象识别方法、装置、电子设备及存储介质。
技术介绍
[0002]在产品运营过程中,为了提高产品的推广效益,通常需要识别出对产品感兴趣的对象作为推广对象,并针对各推广对象进行产品宣传。
[0003]目前,推广对象的识别方法主要分为两类:
[0004]一、基于预设数据规则识别推广对象。
[0005]具体的,可以基于经验设置识别推广对象的数据规则,并利用设置的数据规则,从海量对象中识别出对推广产品感兴趣的推广对象。然而,基于经验设置的数据规则,不仅设置的数量有限,而且还无法捕捉各数据规则间相互关联的高维特征信息,最重要的是,还无法确定每个数据规则的最优参数,从而导致无法准确的识别出推广对象,进而降低了推广效益。
[0006]例如,基于手机购买的业务经验,设置“年纪为20
‑
30岁、消费水平为高”为数据规则,基于该数据规则,将“年纪为20
‑
30岁、消费水平为高”的对象,识别为购买新手机的推广对象。然而,对于喜欢玩游戏的对象来说,对手机的配置要求较高,往往也是购买新手机的推广对象,并且,随着手机的普及,十几岁的中学生也可以使用手机,手机的最广对象逐渐低龄化,因此,上述设置的数据规则,无法准确的识别出购买新手机的推广对象。
[0007]二、基于非深度学习的数据挖掘方法识别推广对象。
[0008]具体的,可以基于非深度学习算法构建识别模型,并利用识别模型,预测 ...
【技术保护点】
【技术特征摘要】
1.一种对象识别方法,其特征在于,包括:获取训练样本集合,其中,所述训练样本集合包含初始标注对象子集和未标注对象子集,每个初始标注对象设置有表征是否对推广产品感兴趣的标签;基于所述训练样本集合中每个对象在设定历史时间范围内关联的属性特征和业务特征,分别获得相应对象的原始推广特征;基于各个对象的原始推广特征,为各未标注对象标注标签,并基于标注好的各未标注对象和所述初始标注对象子集,获得目标标注对象集;基于各目标标注对象的原始推广特征,以及随机生成的表征所述各目标标注对象分布的整体潜在表示,对待训练的对象识别模型进行至少一次迭代训练,得到用于挖掘对推广产品感兴趣对象的目标对象识别模型。2.如权利要求1所述的方法,其特征在于,基于所述训练样本集合中每个对象在设定历史时间范围内关联的属性特征和业务特征,分别获得相应对象的原始推广特征,包括:针对所述训练样本集合中的每个对象,执行以下操作:获取所述对象在设定历史时间范围内的非隐私行为数据,并基于所述非隐私行为数据,确定所述对象关联的属性特征;获取所述对象在设定历史时间范围内对推广产品产生的业务类型,并基于所述业务类型,确定所述对象关联的业务特征;对所述对象关联的属性特征和业务特征进行预处理,得到所述对象的原始推广特征。3.如权利要求1所述的方法,其特征在于,所述基于各个对象的原始推广特征,为各未标注对象标注标签,并基于标注好的各未标注对象和所述初始标注对象子集,获得目标标注对象集,包括:隐藏所述初始标注对象子集中部分初始标注对象的标签,并基于标签隐藏后的部分初始标注对象,初始化所述初始标注对象子集和所述未标注对象子集;基于初始化后各初始标注对象和各未标注对象的原始推广特征,训练第一分类器,并基于所述第一分类器,为所述各未标注对象标注标签;基于所述各未标注对象的标签,确定所述未标注对象子集包含的可靠负例对象子集和可靠正例对象子集;基于可靠负例对象子集、可靠正例对象子集和所述初始标注对象子集,获得所述目标标注对象集。4.如权利要求3所述的方法,其特征在于,所述基于所述第一分类器,为所述各未标注对象标注标签,包括:针对所述未标注对象子集中的每个未标注对象,执行以下操作:基于所述第一分类器,确定所述未标注对象为对推广产品感兴趣的正例对象的第一后验概率;当所述第一后验概率小于概率阈值时,为所述未标注对象标记对推广产品不感兴趣的负例对象的标签,其中,所述概率阈值是基于标签隐藏后的所述部分初始标注对象中属于正例对象的参考后验概率确定的。5.如权利要求3所述的方法,其特征在于,所述基于可靠负例对象子集、可靠正例对象子集和所述初始标注对象子集,获得所述目标标注对象集,包括:
将各可靠负例对象、各可靠正例对象和各初始标注对象的原始推广特征,输入至所述第一分类器,通过至少一轮迭代使所述未标注对象子集为空,得到目标标注对象集,其中,每一轮迭代执行以下操作:隐藏所述各可靠正例对象的标签,将所述可靠正例对象子集作为新的未标注对象子集;基于所述各可靠负例对象和所述各初始标注对象的原始推广特征,重新训练第一分类器,基于重新训练后的第一分类器,确定各未标注对象所属对象类别的第二后验概率,并基于各第二后验概率,为相应的未标注对象标注标签;基于所述各未标注对象的第二后验概率和标签,更新所述可靠负例对象子集、所述可靠正例对象子集以及所述未标注对象子集。6.如权利要求5所述的方法,其特征在于,所述基于所述各未标注对象的第二后验概率和标签,更新所述可靠负例对象子集、所述可靠正例对象子集以及所述未标注对象子集,包括:对所述各第二后验概率进行排序,按照所述各未标注对象标注的标签,将前f个未标注对象存入所述可靠负例对象子集或所述可靠正例对象子集中,其中,f为大于等于1的整数;从所述未标注对象子集中剔除前f个未标注对象。7.如权利要求1所述的方法,其特征在于,所述基于各目标标注对象的原始推广特征,以及随机生成的表征所述各目标标注对象分布的整体潜在表示,对待训练的对象识别模型进行至少一次迭代训练,得到用于挖掘对推广产品感兴趣对象的目标对象识别模型,其中,每一次迭代训练,执行以下操作:基于各原始推广特征和所述整体潜在表示,通过多次特征映射,分别获得相应目标对象的第一潜在表示、重构推广特征、第二潜在表示和相似推广特征;对各原始推广特征、各第一潜在表示、各重构推广特征、各第二潜在表示和各相似推广特征进行多次对抗学习,得到所述各目标标注对象的目标概率分布;基于所述目标概率分布,确定所述各目标标注对象对推广产品感兴趣的预测概率;基于各特征映射子损失值以及各对抗学习子损失值,确定目标损失值,并基于所述目标损失值,调整所述待训练的对象识别模型的参数。8.如权利要求7所述的方法,其特征在于,所述基于各原始推广特征和所述整体潜在表示,通过多次特征映射,分别获得相应目标对象的第一潜在表示、第二潜在表示、重构推广特征和相似推广特征,包括:对所述各目标标注对象的原始推广特征进行特征映射,获得相应目标标注对象的第一潜在表示,并对各第一潜在表示进行特征映射,获得相应目标标注对象的重构推广特征;对随机生成的整体潜在表示进行采样,获得相应目标标注对象的第二潜在表示,并对各第二潜在表示进行特征映射,生成相应目标标注对象的相似推广特征。9...
【专利技术属性】
技术研发人员:樊鹏,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。