广告投放中的用户画像方法及装置制造方法及图纸

技术编号:26034858 阅读:15 留言:0更新日期:2020-10-23 21:12
本发明专利技术实施例提供了一种广告投放中的用户画像方法、装置及设备,获取应用软件的多个用户数据以及每个用户数据对应的设备标识;将所述多个用户数据中,至少两个不同的设备标识分别对应的用户数据划分为一组用户数据,得到多组用户数据;分别基于所述多组用户数据,利用预先训练得到的二分类模型,获得关于该组用户数据是否属于同一用户的分类结果;针对每组样本用户数据,该组样本用户数据包括至少两个不同的设备标识分别对应的样本用户数据;基于所述分类结果为属于同一用户的用户数据,获取该用户的用户标签,并为该用户标记所获取的用户标签。本发明专利技术可以提高用户标签的丰富程度。

【技术实现步骤摘要】
广告投放中的用户画像方法及装置
本专利技术涉及广告投放
,特别是涉及一种广告投放中的用户画像方法及装置。
技术介绍
在通过应用软件投放广告时,为了保证投放有广告的应用软件的用户为符合广告主要求的目标人群,需要对应用软件的用户进行用户画像。具体的,可以基于用户使用应用软件产生的用户数据,挖掘用户特征,进而利用用户特征为用户标记标签,实现用户画像。但是,专利技术人在实现本专利技术的过程中发现,通过上述方式实现的用户画像,存在标签不够丰富的情况,导致广告投放中的用户画像不够准确。
技术实现思路
本专利技术实施例的目的在于提供一种广告投放中的用户画像方法及装置,以实现提高广告投放中的用户画像准确度的效果。具体技术方案如下:第一方面,本专利技术实施例提供了一种广告投放中的用户画像方法,该方法包括:获取应用软件的多个用户数据以及每个用户数据对应的设备标识;其中,任一用户数据对应的设备标识为用户操作所述应用软件产生该用户数据时,使用的设备的标识;将所述多个用户数据中,至少两个不同的设备标识分别对应的用户数据划分为一组用户数据,得到多组用户数据;分别基于所述多组用户数据,利用预先训练得到的二分类模型,获得关于该组用户数据是否属于同一用户的分类结果;其中,所述二分类模型为预先利用多组样本用户数据,以及每组样本用户数据是否属于同一用户的标注信息训练得到的模型;针对每组样本用户数据,该组样本用户数据包括至少两个不同的设备标识分别对应的样本用户数据;基于所述分类结果为属于同一用户的用户数据,获取该用户的用户标签,并为该用户标记所获取的用户标签。第二方面,本专利技术实施例提供了一种广告投放中的用户画像装置,该装置包括:数据获取模块,用于获取应用软件的多个用户数据以及每个用户数据对应的设备标识;其中,任一用户数据对应的设备标识为用户操作所述应用软件产生该用户数据时,使用的设备的标识;数据关联模块,用于将所述多个用户数据中,至少两个不同的设备标识分别对应的用户数据划分为一组用户数据,得到多组用户数据;分别基于所述多组用户数据,利用预先训练得到的二分类模型,获得关于该组用户数据是否属于同一用户的分类结果;其中,所述二分类模型为预先利用多组样本用户数据,以及每组样本用户数据是否属于同一用户的标注信息训练得到的模型;针对每组样本用户数据,该组样本用户数据包括至少两个不同的设备标识分别对应的用户数据;标签标记模块,用于基于所述分类结果为属于同一用户的用户数据,获取该用户的用户标签,并为该用户标记所获取的用户标签。第三方面,本专利技术实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现上述第一方面所述的广告投放中的用户画像方法步骤。第四方面,本专利技术实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面所述的广告投放中的用户画像方法。本专利技术实施例有益效果:本专利技术实施例提供的方案中,二分类模型为预先利用多组样本用户数据,以及每组样本用户数据是否属于同一用户的标注信息训练得到的模型,且针对每组样本用户数据,该组样本用户数据包括不同的至少两个设备标识分别对应的用户数据。因此,将多个用户数据中,不同的至少两个设备标识分别对应的用户数据划分为一组用户数据,得到多组用户数据,进而分别基于多组用户数据,利用预先训练得到的二分类模型,可以获得关于该组用户数据是否属于同一用户的分类结果。在此基础上,任一用户数据对应的设备标识为用户操作应用软件产生该用户数据时,使用的设备的标识,那么将应用软件的多个用户数据中,不同的至少两个设备标识分别对应的用户数据划分为一组用户数据,可以保证同一用户的一组用户数据,是该用户使用不同的至少两个设备产生的用户数据。并且,同一用户使用不同设备很可能对应用软件进行不同的操作,相应的产生不同的用户数据。因此,基于分类结果为属于同一用户的用户数据,获取该用户的用户标签,并为该用户标记所获取的用户标签,相当于为该用户标记不同设备产生的用户数据对应的用户标签,使得为该用户标记的用户标签不再局限于一个设备产生的用户数据对应的用户标签,可以增加该用户的用户标签的丰富程度,提高广告投放中的用户画像准确度。当然,实施本专利技术的任一产品或方法并不一定需要同时达到以上所述的所有优点。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。图1为本专利技术一实施例提供的广告投放中的用户画像方法的流程示意图;图2为本专利技术一实施例提供的广告投放中的用户画像方法中,特征提取规则的获取流程示例图;图3为本专利技术一实施例提供的广告投放中的用户画像方法中,用户标签的获取流程示例图;图4为本专利技术一实施例提供的广告投放中的用户画像装置的结构示意图;图5为本专利技术一实施例提供的电子设备的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。为了便于理解,下面对本专利技术一实施例提供的广告投放中的用户画像方法进行介绍。在具体应用中,本专利技术实施例提供的广告投放中的用户画像方法,可以应用于电子设备,该电子设备可以是DSP(demindsideplatform,需求方平台,为广告主和广告媒体的中间媒介,帮助广告主实现自动化的广告投放)的设备。示例性的,该电子设备具体可以是服务器、计算机、以及智能移动终端等设备。如图1所示,本专利技术一实施例提供的广告投放中的用户画像方法的流程,该方法可以包括如下步骤:S101,获取应用软件的多个用户数据以及每个用户数据对应的设备标识。其中,任一用户数据对应的设备标识为用户操作应用软件产生该用户数据时,使用的设备的标识。在具体应用中,用户可以使用安装有应用软件的电子设备对该应用软件进行操作,从而产生用户数据,且用户所使用的电子设备的标识会被应用软件记录。因此,可以从应用软件或者应用软件对应的服务器,或者存储关于应用软件用户的数据的存储设备中,获取应用软件的多个用户数据以及每个用户数据对应的设备标识,不同的设备具有不同的设备标识。示例性的,设备标识可以包括:移动终端的设备标识“Deviceid”,计算机的设备标识“Cookie”,以及互联网电视的设备标识“TVid”等等。其中,对于移动终端的设备标识,还可以按照操作系统分为:移动终端的操作系本文档来自技高网...

【技术保护点】
1.一种广告投放中的用户画像方法,其特征在于,所述方法包括:/n获取应用软件的多个用户数据以及每个用户数据对应的设备标识;其中,任一用户数据对应的设备标识为用户操作所述应用软件产生该用户数据时,使用的设备的标识;/n将所述多个用户数据中,至少两个不同的设备标识分别对应的用户数据划分为一组用户数据,得到多组用户数据;/n分别基于所述多组用户数据,利用预先训练得到的二分类模型,获得关于该组用户数据是否属于同一用户的分类结果;其中,所述二分类模型为预先利用多组样本用户数据,以及每组样本用户数据是否属于同一用户的标注信息训练得到的模型;针对每组样本用户数据,该组样本用户数据包括至少两个不同的设备标识分别对应的样本用户数据;/n基于所述分类结果为属于同一用户的用户数据,获取该用户的用户标签,并为该用户标记所获取的用户标签。/n

【技术特征摘要】
1.一种广告投放中的用户画像方法,其特征在于,所述方法包括:
获取应用软件的多个用户数据以及每个用户数据对应的设备标识;其中,任一用户数据对应的设备标识为用户操作所述应用软件产生该用户数据时,使用的设备的标识;
将所述多个用户数据中,至少两个不同的设备标识分别对应的用户数据划分为一组用户数据,得到多组用户数据;
分别基于所述多组用户数据,利用预先训练得到的二分类模型,获得关于该组用户数据是否属于同一用户的分类结果;其中,所述二分类模型为预先利用多组样本用户数据,以及每组样本用户数据是否属于同一用户的标注信息训练得到的模型;针对每组样本用户数据,该组样本用户数据包括至少两个不同的设备标识分别对应的样本用户数据;
基于所述分类结果为属于同一用户的用户数据,获取该用户的用户标签,并为该用户标记所获取的用户标签。


2.根据权利要求1所述的方法,其特征在于,任一用户数据包括:用户的IP地址,以及该用户数据的产生时间;
所述将所述多个用户数据中,至少两个不同的设备标识分别对应的用户数据划分为一组用户数据,得到多组用户数据,包括:
将至少两个不同的设备标识分别对应的用户数据中,所述IP地址相同的用户数据划分为一个数据对;
针对每个数据对,统计该数据对中所述产生时间属于预设时间段的用户数据的个数;
将所述用户数据的个数大于预设个数阈值的数据对,作为一组用户数据,得到多组用户数据。


3.根据权利要求1所述的方法,其特征在于,所述基于所述分类结果为属于同一用户的一组用户数据,获取该用户的用户标签,包括:
获取与所述广告投放的投放场景匹配的特征提取规则;
从所述分类结果为属于同一用户的一组用户数据中,选择符合所述特征提取规则的数据,作为该用户的特征信息;
针对每个用户,获取该用户的特征信息的类型;任一特征信息的类型按照该特征信息包含的指定字段的差异划分;
针对每个用户,利用与该用户的特征信息的类型对应的标签获取模型,获取该用户的用户标签。


4.根据权利要求3所述的方法,其特征在于,所述获取与所述广告投放的投放场景匹配的特征提取规则,包括:
展示关于刻画目标用户的刻画指标的选取界面;
获取被选取的刻画指标,并基于所获取的刻画指标,确定与所述广告投放的投放场景匹配的特征提取规则。


5.根据权利要求3所述的方法,其特征在于,所述特征提取规则包括:标识符;
所述从所述分类结果为属于同一用户的用户数据中,选择符合所述特征提取规则的数据,作为该用户的特征信息,包括:
从所述分类结果为属于同一用户的用户数据中,选择具有所述标识符的数据,作为该用户的特征信息。


6.根据权利要求3所述的方法,其特征在于,所述从所述分类结果为属于同一用户的用户数据中,选择符合所述特征提取规则的数据,作为该用户的特征信息,包括:
从所述分类结果为属于同一用户的用户数据中,选择符合所述特征提取规则的数据,作为该用户的原始特征;
在预存的原始特征与爬取规则以及指定网站的对应关系中,分别查找与每个用户的原始特征对应的爬取规则和指定网站;其中,任一原始特征对应的爬取规则用于爬取与该原始特征关联,且表明的特征与该原始特征不同的数据;
针对每个用户,爬取该用户对应的指定网站中,满足该用户对应的爬取规则的数据,作为该用户的扩展特征;
针对每个用户,将该用户的原始特征和该用户的扩展特征,作为该用户的特征信息。


7.根据权利要求3所述的方法,其特征在于,所述任一特征信息的类型包括:第...

【专利技术属性】
技术研发人员:江伟伟童有军李旸
申请(专利权)人:北京悠易网际科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1