广告目标群体触达比率评估方法及装置制造方法及图纸

技术编号:14200629 阅读:162 留言:0更新日期:2016-12-17 14:22
本发明专利技术提供一种广告目标群体触达比率评估方法及装置,其中方法包括:获取Hbase数据库中的样本库数据,样本库数据中包括:各样本用户的属性数据以及对应的广告设备标识;属性数据中包括样本用户的至少一个属性的数据;获取Hbase数据库中当前时刻之前第一预设时间段内广告所触达的第一用户群体的监测数据;采用Hadoop框架将第一用户群体的监测数据与样本库数据进行分布式匹配,获取活跃样本库数据;根据活跃样本库数据中各个样本群体的加权值以及当前时刻之前第二预设时间段内广告所触达的第二用户群体的监测数据计算第二用户群体中目标群体的触达比率,从而通过Hbase数据库和Hadoop框架的采用,能够增大监测的用户量,并通过分布式计算提高计算速率和计算效率。

Method and device for evaluating contact ratio of advertisement target group

The invention provides a touch of the advertising target group and device ratio evaluation method, the method includes: acquiring data in Hbase database database, including database data: attribute data of each sample of users and advertising device identification corresponding to the attribute data; including at least one sample user attribute data; monitoring data before to get the current time Hbase database in the first preset time period as the first touch advertising user groups; using Hadoop framework will monitor the data and sample data of the first library user groups distributed matching, get active sample data; calculation of the target user groups in second groups according to the weighted active population sample data in each sample the value and monitoring data before the current time second preset touch advertising of second user groups during the period. Through the use of Hbase database and Hadoop framework, it can increase the number of users, and improve the computing speed and efficiency through distributed computing.

【技术实现步骤摘要】

本专利技术涉及通信
,尤其涉及一种广告目标群体触达比率评估方法及装置
技术介绍
目前,对广告目标群体触达比率进行评估的方法中,对广告主投放的广告进行监测,获取广告所触达的用户群体的监测数据,将监测数据以MongoDB的格式保存在MySQL数据库中,将监测数据与预先调研得到的样本库数据进行匹配,获取样本库数据与监测数据之间的交集,进而通过这个交集计算获取样本库数据中目标群体的触达比率。然而现有技术中,MySQL数据库只能支持存储百万用户的样本数据或监测数据,难以满足广告所触达的千万用户的监测数据的存储需求;另外,MySQL数据库的数据一般存储在单服务器内存里,在单服务器内存里做触达比率计算,计算速度慢,不适用于千万级数据的计算,从而降低了评估速率和评估效率。
技术实现思路
本专利技术提供一种广告目标群体触达比率评估方法及装置,用于解决现有技术中评估速率和评估效率差的问题。本专利技术的第一个方面是提供一种广告目标群体触达比率评估方法,包括:获取Hbase数据库中的样本库数据,所述样本库数据中包括:各样本用户的属性数据以及对应的广告设备标识;所述属性数据中包括所述样本用户的至少一个属性的数据;获取Hbase数据库中当前时刻之前第一预设时间段内广告所触达的第一用户群体的监测数据,所述第一用户群体的监测数据中包括:第一用户群体中各用户的属性数据以及对应的广告设备标识;采用Hadoop框架将所述第一用户群体的监测数据与所述样本库数据进行分布式匹配,获取活跃样本库数据,所述活跃样本库数据中包括:各个活跃样本用户的属性数据以及对应的广告设备标识;获取所述活跃样本库数据中各个样本群体的加权值,所述样本群体中的各个活跃样本用户具有相同的第一属性;获取当前时刻之前第二预设时间段内广告所触达的第二用户群体的监测数据;根据所述活跃样本库数据中各个样本群体的加权值计算所述第二用户群体中目标群体的触达比率。进一步的,所述获取样本库数据,包括:获取各样本用户的属性数据以及对应的广告设备标识;判断所述样本用户的属性数据中是否存在预设的属性,以及预设的属性的数据是否为空;若所述样本用户的属性数据中存在预设的属性,且预设的属性的数据不为空,则将所述样本用户的属性数据以及对应的广告设备标识存入所述样本库中。进一步的,所述采用Hadoop框架将所述第一用户群体的监测数据与所述样本库数据进行分布式匹配,获取活跃样本库数据,包括:针对所述样本库数据中的每个样本用户,判断所述第一用户群体的监测数据中是否包括有所述样本用户的属性数据以及对应的广告设备标识;若所述第一用户群体的监测数据中包括有所述样本用户的属性数据以及对应的广告设备标识,则确定所述样本用户为活跃样本用户;若所述第一用户群体的监测数据中不包括有所述样本用户的属性数据以及对应的广告设备标识,则确定所述样本用户为非活跃样本用户。进一步的,所述获取所述活跃样本库数据中各个样本群体的加权值,所述样本群体中的各个活跃样本用户具有相同的第一属性,包括:获取所有用户的属性数据,根据所述第一属性对所有用户进行划分,得到各个群体以及各个群体的占比;获取所述活跃样本库数据中各个样本群体的占比;针对所述活跃样本库数据中的各个样本群体,将所述样本群体的占比与所有用户的属性数据中对应的群体的占比的比值确定为所述样本群体的加权值;所述样本群体与所述对应的群体具有相同的第一属性。进一步的,所述根据所述活跃样本库数据中各个样本群体的加权值计算所述第二用户群体中目标群体的触达比率,包括:获取活跃样本库数据中的目标群体,所述目标群体中的各活跃样本用户具有预设的属性数据以及对应的广告设备标识;将目标群体中各活跃样本用户对应的加权值之和与第二用户群体中各用户对应的加权值之和的比值确定为所述第二用户群体中目标群体的触达比率。本专利技术中,提供一种广告目标群体触达比率评估方法,通过获取Hbase数据库中的样本库数据,所述样本库数据中包括:各样本用户的属性数据以及对应的广告设备标识;所述属性数据中包括所述样本用户的至少一个属性的数据;获取Hbase数据库中当前时刻之前第一预设时间段内广告所触达的第一用户群体的监测数据;采用Hadoop框架将所述第一用户群体的监测数据与所述样本库数据进行分布式匹配,获取活跃样本库数据;根据活跃样本库数据中各个样本群体的加权值以及当前时刻之前第二预设时间段内广告所触达的第二用户群体的监测数据计算第二用户群体中目标群体的触达比率,从而通过Hbase数据库和Hadoop框架的采用,能够增大监测的用户量,并通过分布式计算提高计算速率和计算效率。本专利技术的第二个方面是提供一种广告目标群体触达比率评估装置,包括:第一获取模块,用于获取Hbase数据库中的样本库数据,所述样本库数据中包括:各样本用户的属性数据以及对应的广告设备标识;所述属性数据中包括所述样本用户的至少一个属性的数据;第二获取模块,用于获取Hbase数据库中当前时刻之前第一预设时间段内广告所触达的第一用户群体的监测数据,所述第一用户群体的监测数据中包括:第一用户群体中各用户的属性数据以及对应的广告设备标识;匹配模块,用于采用Hadoop框架将所述第一用户群体的监测数据与所述样本库数据进行分布式匹配,获取活跃样本库数据,所述活跃样本库数据中包括:各个活跃样本用户的属性数据以及对应的广告设备标识;第三获取模块,用于获取所述活跃样本库数据中各个样本群体的加权值,所述样本群体中的各个活跃样本用户具有相同的第一属性;第四获取模块,用于获取当前时刻之前第二预设时间段内广告所触达的第二用户群体的监测数据;计算模块,用于根据所述活跃样本库数据中各个样本群体的加权值计算所述第二用户群体中目标群体的触达比率。进一步的,所述第一获取模块包括:第一获取单元,用于获取各样本用户的属性数据以及对应的广告设备标识;第一判断单元,用于判断所述样本用户的属性数据中是否存在预设的属性,以及预设的属性的数据是否为空;存入单元,用于在所述样本用户的属性数据中存在预设的属性,且预设的属性的数据不为空时,将所述样本用户的属性数据以及对应的广告设备标识存入所述样本库中。进一步的,所述匹配模块包括:第二判断单元,用于针对所述样本库数据中的每个样本用户,判断所述第一用户群体的监测数据中是否包括有所述样本用户的属性数据以及对应的广告设备标识;第一确定单元,用于在所述第一用户群体的监测数据中包括有所述样本用户的属性数据以及对应的广告设备标识时,确定所述样本用户为活跃样本用户;第二确定单元,用于在所述第一用户群体的监测数据中不包括有所述样本用户的属性数据以及对应的广告设备标识时,确定所述样本用户为非活跃样本用户。进一步的,所述第三获取模块包括:第二获取单元,用于获取所有用户的属性数据,根据所述第一属性对所有用户进行划分,得到各个群体以及各个群体的占比;第三获取单元,用于获取所述活跃样本库数据中各个样本群体的占比;第三确定单元,用于针对所述活跃样本库数据中的各个样本群体,将所述样本群体的占比与所有用户的属性数据中对应的群体的占比的比值确定为所述样本群体的加权值;所述样本群体与所述对应的群体具有相同的第一属性。进一步的,所述计算模块包括:第四获取单元,用于获取活跃样本库数据中的目标群体,所述目标群体中的各活本文档来自技高网...
广告目标群体触达比率评估方法及装置

【技术保护点】
一种广告目标群体触达比率评估方法,其特征在于,包括:获取Hbase数据库中的样本库数据,所述样本库数据中包括:各样本用户的属性数据以及对应的广告设备标识;所述属性数据中包括所述样本用户的至少一个属性的数据;获取Hbase数据库中当前时刻之前第一预设时间段内广告所触达的第一用户群体的监测数据,所述第一用户群体的监测数据中包括:第一用户群体中各用户的属性数据以及对应的广告设备标识;采用Hadoop框架将所述第一用户群体的监测数据与所述样本库数据进行分布式匹配,获取活跃样本库数据,所述活跃样本库数据中包括:各个活跃样本用户的属性数据以及对应的广告设备标识;获取所述活跃样本库数据中各个样本群体的加权值,所述样本群体中的各个活跃样本用户具有相同的第一属性;获取当前时刻之前第二预设时间段内广告所触达的第二用户群体的监测数据;根据所述活跃样本库数据中各个样本群体的加权值计算所述第二用户群体中目标群体的触达比率。

【技术特征摘要】
1.一种广告目标群体触达比率评估方法,其特征在于,包括:获取Hbase数据库中的样本库数据,所述样本库数据中包括:各样本用户的属性数据以及对应的广告设备标识;所述属性数据中包括所述样本用户的至少一个属性的数据;获取Hbase数据库中当前时刻之前第一预设时间段内广告所触达的第一用户群体的监测数据,所述第一用户群体的监测数据中包括:第一用户群体中各用户的属性数据以及对应的广告设备标识;采用Hadoop框架将所述第一用户群体的监测数据与所述样本库数据进行分布式匹配,获取活跃样本库数据,所述活跃样本库数据中包括:各个活跃样本用户的属性数据以及对应的广告设备标识;获取所述活跃样本库数据中各个样本群体的加权值,所述样本群体中的各个活跃样本用户具有相同的第一属性;获取当前时刻之前第二预设时间段内广告所触达的第二用户群体的监测数据;根据所述活跃样本库数据中各个样本群体的加权值计算所述第二用户群体中目标群体的触达比率。2.根据权利要求1所述的方法,其特征在于,所述获取样本库数据,包括:获取各样本用户的属性数据以及对应的广告设备标识;判断所述样本用户的属性数据中是否存在预设的属性,以及预设的属性的数据是否为空;若所述样本用户的属性数据中存在预设的属性,且预设的属性的数据不为空,则将所述样本用户的属性数据以及对应的广告设备标识存入所述样本库中。3.根据权利要求1所述的方法,其特征在于,所述采用Hadoop框架将所述第一用户群体的监测数据与所述样本库数据进行分布式匹配,获取活跃样本库数据,包括:针对所述样本库数据中的每个样本用户,判断所述第一用户群体的监测数据中是否包括有所述样本用户的属性数据以及对应的广告设备标识;若所述第一用户群体的监测数据中包括有所述样本用户的属性数据以及对应的广告设备标识,则确定所述样本用户为活跃样本用户;若所述第一用户群体的监测数据中不包括有所述样本用户的属性数据以及对应的广告设备标识,则确定所述样本用户为非活跃样本用户。4.根据权利要求1所述的方法,其特征在于,所述获取所述活跃样本库数据中各个样本群体的加权值,所述样本群体中的各个活跃样本用户具有相同的第一属性,包括:获取所有用户的属性数据,根据所述第一属性对所有用户进行划分,得到各个群体以及各个群体的占比;获取所述活跃样本库数据中各个样本群体的占比;针对所述活跃样本库数据中的各个样本群体,将所述样本群体的占比与所有用户的属性数据中对应的群体的占比的比值确定为所述样本群体的加权值;所述样本群体与所述对应的群体具有相同的第一属性。5.根据权利要求1所述的方法,其特征在于,所述根据所述活跃样本库数据中各个样本群体的加权值计算所述第二用户群体中目标群体的触达比率,包括:获取活跃样本库数据中的目标群体,所述目标群体中的各活跃样本用户具有预设的属性数据以及对应的广告设备标识;将目标群体中各活跃样本用户对应的加权值之和与第二用户群体中各用户对应的加权值之和的比值确定为所述第二用户群体中目标群体的触达比率。6.一种广告目标群...

【专利技术属性】
技术研发人员:陈琛
申请(专利权)人:精硕世纪科技北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1