【技术实现步骤摘要】
广告投放中的用户画像方法及装置
本专利技术涉及广告投放
,特别是涉及一种广告投放中的用户画像方法及装置。
技术介绍
在通过应用软件投放广告时,为了保证投放有广告的应用软件的用户为符合广告主要求的目标人群,需要对应用软件的用户进行用户画像。具体的,可以基于用户使用应用软件产生的用户数据,挖掘用户特征,进而利用用户特征为用户标记标签,实现用户画像。但是,专利技术人在实现本专利技术的过程中发现,通过上述方式实现的用户画像,存在标签不够丰富的情况,导致广告投放中的用户画像不够准确。
技术实现思路
本专利技术实施例的目的在于提供一种广告投放中的用户画像方法及装置,以实现提高广告投放中的用户画像准确度的效果。具体技术方案如下:第一方面,本专利技术实施例提供了一种广告投放中的用户画像方法,该方法包括:获取应用软件的多个用户数据以及每个用户数据对应的设备标识;其中,任一用户数据对应的设备标识为用户操作所述应用软件产生该用户数据时,使用的设备的标识;将所述多个用户数据中,至少两个不同的设备标识分别对应的用户数据划分为一组用户数据,得到多组用户数据;分别基于所述多组用户数据,利用预先训练得到的二分类模型,获得关于该组用户数据是否属于同一用户的分类结果;其中,所述二分类模型为预先利用多组样本用户数据,以及每组样本用户数据是否属于同一用户的标注信息训练得到的模型;针对每组样本用户数据,该组样本用户数据包括至少两个不同的设备标识分别对应的样本用户数据;基于所述分类结果为 ...
【技术保护点】
1.一种广告投放中的用户画像方法,其特征在于,所述方法包括:/n获取应用软件的多个用户数据以及每个用户数据对应的设备标识;其中,任一用户数据对应的设备标识为用户操作所述应用软件产生该用户数据时,使用的设备的标识;/n将所述多个用户数据中,至少两个不同的设备标识分别对应的用户数据划分为一组用户数据,得到多组用户数据;/n分别基于所述多组用户数据,利用预先训练得到的二分类模型,获得关于该组用户数据是否属于同一用户的分类结果;其中,所述二分类模型为预先利用多组样本用户数据,以及每组样本用户数据是否属于同一用户的标注信息训练得到的模型;针对每组样本用户数据,该组样本用户数据包括至少两个不同的设备标识分别对应的样本用户数据;/n基于所述分类结果为属于同一用户的用户数据,获取该用户的用户标签,并为该用户标记所获取的用户标签。/n
【技术特征摘要】
1.一种广告投放中的用户画像方法,其特征在于,所述方法包括:
获取应用软件的多个用户数据以及每个用户数据对应的设备标识;其中,任一用户数据对应的设备标识为用户操作所述应用软件产生该用户数据时,使用的设备的标识;
将所述多个用户数据中,至少两个不同的设备标识分别对应的用户数据划分为一组用户数据,得到多组用户数据;
分别基于所述多组用户数据,利用预先训练得到的二分类模型,获得关于该组用户数据是否属于同一用户的分类结果;其中,所述二分类模型为预先利用多组样本用户数据,以及每组样本用户数据是否属于同一用户的标注信息训练得到的模型;针对每组样本用户数据,该组样本用户数据包括至少两个不同的设备标识分别对应的样本用户数据;
基于所述分类结果为属于同一用户的用户数据,获取该用户的用户标签,并为该用户标记所获取的用户标签。
2.根据权利要求1所述的方法,其特征在于,任一用户数据包括:用户的IP地址,以及该用户数据的产生时间;
所述将所述多个用户数据中,至少两个不同的设备标识分别对应的用户数据划分为一组用户数据,得到多组用户数据,包括:
将至少两个不同的设备标识分别对应的用户数据中,所述IP地址相同的用户数据划分为一个数据对;
针对每个数据对,统计该数据对中所述产生时间属于预设时间段的用户数据的个数;
将所述用户数据的个数大于预设个数阈值的数据对,作为一组用户数据,得到多组用户数据。
3.根据权利要求1所述的方法,其特征在于,所述基于所述分类结果为属于同一用户的一组用户数据,获取该用户的用户标签,包括:
获取与所述广告投放的投放场景匹配的特征提取规则;
从所述分类结果为属于同一用户的一组用户数据中,选择符合所述特征提取规则的数据,作为该用户的特征信息;
针对每个用户,获取该用户的特征信息的类型;任一特征信息的类型按照该特征信息包含的指定字段的差异划分;
针对每个用户,利用与该用户的特征信息的类型对应的标签获取模型,获取该用户的用户标签。
4.根据权利要求3所述的方法,其特征在于,所述获取与所述广告投放的投放场景匹配的特征提取规则,包括:
展示关于刻画目标用户的刻画指标的选取界面;
获取被选取的刻画指标,并基于所获取的刻画指标,确定与所述广告投放的投放场景匹配的特征提取规则。
5.根据权利要求3所述的方法,其特征在于,所述特征提取规则包括:标识符;
所述从所述分类结果为属于同一用户的用户数据中,选择符合所述特征提取规则的数据,作为该用户的特征信息,包括:
从所述分类结果为属于同一用户的用户数据中,选择具有所述标识符的数据,作为该用户的特征信息。
6.根据权利要求3所述的方法,其特征在于,所述从所述分类结果为属于同一用户的用户数据中,选择符合所述特征提取规则的数据,作为该用户的特征信息,包括:
从所述分类结果为属于同一用户的用户数据中,选择符合所述特征提取规则的数据,作为该用户的原始特征;
在预存的原始特征与爬取规则以及指定网站的对应关系中,分别查找与每个用户的原始特征对应的爬取规则和指定网站;其中,任一原始特征对应的爬取规则用于爬取与该原始特征关联,且表明的特征与该原始特征不同的数据;
针对每个用户,爬取该用户对应的指定网站中,满足该用户对应的爬取规则的数据,作为该用户的扩展特征;
针对每个用户,将该用户的原始特征和该用户的扩展特征,作为该用户的特征信息。
7.根据权利要求3所述的方法,其特征在于,所述任一特征信息的类型包括:第...
【专利技术属性】
技术研发人员:江伟伟,童有军,李旸,
申请(专利权)人:北京悠易网际科技发展有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。