一种基于用户画像的异常广告流量检测方法技术

技术编号:23767766 阅读:47 留言:0更新日期:2020-04-11 20:46
本发明专利技术公开了一种基于用户画像的异常广告流量检测方法,通过网页操作数据收集用户属性,追踪用户行为信息,并通过特征模型针对用户的属性以及行为分析进行特征识别,依据特征勾画出用户画像,即通过特征可以实现用户标签化,最后通过聚类分析,识别出是否为有效用户。本发明专利技术结合用户历史数据,能够准确地识别出异常流量,同时该方案结合实时分析技术能够加快异常流量监测速度,提高了时效性。

An abnormal advertising traffic detection method based on user profile

【技术实现步骤摘要】
一种基于用户画像的异常广告流量检测方法
本专利技术涉及计算机领域,尤其涉及一种基于用户画像的异常广告流量检测方法。
技术介绍
随着互联网技术的发展,人们的生活方式也发生了变化,在线广告业务需求在不断增长,越来越的广告主选择在线投放广告,面对巨大市场利润,在线广告业务恶意作弊现象日趋严重,对在线广告行业以及广告主带来了巨大损失。
技术实现思路
本专利技术的目的是针对现有技术的缺陷,提供了了一种有效鉴别异常广告流量方法,主要用于解决在信息有限的web端环境下如何有效地鉴别异常流量,确保广告主的利益。为了实现以上目的,本专利技术采用以下技术方案:一种基于用户画像的异常广告流量检测方法,包括以下步骤:步骤一、对用户浏览的广告进行用户行为追踪:收集用户属性信息及用户行为信息,并通过浏览器中的Cookie信息定位用户,同时通过IP信息二次定位用户;步骤二、对用户属性进行特征化分析:针对单次用户分析收集到的用户属性以、行为信息及时间段内整体流量情况,每一个属性以及行为都会生成一个用户标签;步骤三、在步骤二的基础上对单个用户进行画像分析:通过聚合分析多个用户标签的历史数据,进一步调整用户特征信息;步骤四、对步骤三得到用户特征信息,通过使用k-means聚类算法,针对上述特征进行聚类分析,得到用户类型,判断是否为有效用户,据此判断出该用户流量是否为有效流量。进一步的,步骤一中,用户属性信息包括户标识符、IP地址、请求时间、点击时间、广告主题。进一步的,步骤一中,用户行为信息包括页面操作数据、在线停留时间信息。进一步的,步骤四中,按时间维度、地域维度辅助分析用户流量,具体步骤如下:(1)按时间、地域、广告类型维度统计数据,时间维度分为,时、天、月,地域维度按照实际地理位置进行划分,广告类型按照用户浏览的广告类型数据进行划分;(2)在步骤(1)的基础上分析用户历史数据,计算流量趋势,按照趋势数据预测时间广告异常状况。进一步的,步骤二中,用户标签包括以下信息:用户标识符,是用户唯一性标识信息,用于连接用户的行文以及属性;IP地址,用于标识出用户的地址位置信息;广告主题,用于表示出用户兴趣点;请求时间,按照小时进行分片,标注用户当前浏览时间;点击时间,按照小时进行分片,标注用户当前浏览点击广告时间;在线停留时间,按照秒单位进行统计,注明用户页面停留时间;页面操作数据,按照操作类型进行统计,包括点击次数、点击位置、页面移动。进一步的,步骤三中,调整用户特征信息具体包括:IP地址、请求时间统计:通过分析地理纬度变化情况以及联合请求时间纬度,标识出用户地理位置变动幅度数据;通过广告主题统计,分析历史广告主题浏览记录统计出用户广告主题浏览类型数据;请求时间,通过请求时间统计出用户请求频率数据;点击时间,通过请求时间以及点击时间统计出用户操作频率数据;在线停留时间,通过分析在线停留时间统计出用户浏览页面频率;页面操作数据,通过页面操作数据统计出用户平均浏览有效操作数据。采用本专利技术技术方案,本专利技术的有益效果为:与现有技术相比,本专利技术通过一系列用户行为进行分析,同时结合用户历史数据,能够准确地识别出异常流量,同时该方案结合实时分析技术能够加快异常流量监测速度,增加时效性。附图说明图1是现有技术流程图一种基于用户画像的异常广告流量检测方法。具体实施方式结合附图对本专利技术具体方案具体实施例作进一步的阐述。以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。本专利技术方法通过网页操作数据收集用户属性,追踪用户行为信息,通过特征模型针对用户的属性以及行为分析进行特征识别,依据特征勾画出用户画像,通过特征可以实现用户标签化,最后通过聚类分析,识别出是否为有效用户。其中有效流量代表有效用户的行为,有效用户代表有效流量,其它类型用户表示异常流量。实施例一、具体如图所示,一种基于用户画像的异常广告流量检测方法,包括以下步骤:步骤一、对用户浏览的广告进行用户行为追踪:收集用户属性信息及用户行为信息,并通过浏览器中的Cookie信息定位用户,同时通过IP信息二次定位用户;步骤二、对用户属性进行特征化分析:针对单次用户分析收集到的用户属性以、行为信息及时间段内整体流量情况,每一个属性以及行为都会生成一个用户标签;步骤三、在步骤二的基础上对单个用户进行画像分析:通过聚合分析多个用户标签的历史数据,进一步调整用户特征信息;这一步骤针对用户历史上下文数据进行分析,即单次用户行为无法准确勾画出用户画像信息,结合历史数据进行分析能够更加精准地勾画出用户的画像信息。步骤四、对步骤三得到用户特征信息,即用户画像,通过使用k-means聚类算法,针对上述特征进行聚类分析,得到用户类型,判断是否为有效用户,据此判断出该用户流量是否为有效流量。步骤一中,用户属性信息包括户标识符、IP地址、请求时间、点击时间、广告主题。用户行为信息包括页面操作数据、在线停留时间信息。实施例二、为了更加精准预测异常流量,在实施例一的基础上,步骤四中,可进一步的按时间维度、地域维度辅助分析用户流量,具体步骤如下:(1)按时间、地域、广告类型维度统计数据,时间维度分为,时、天、月,地域维度按照实际地理位置进行划分,广告类型按照用户浏览的广告类型数据进行划分;(2)在步骤(1)的基础上分析用户历史数据,计算流量趋势,按照趋势数据预测时间广告异常状况。本专利技术步骤二中,用户标签包括以下信息:用户标识符,是用户唯一性标识信息,用于连接用户的行文以及属性;IP地址,用于标识出用户的地址位置信息;广告主题,用于表示出用户兴趣点;请求时间,按照小时进行分片,标注用户当前浏览时间;点击时间,按照小时进行分片,标注用户当前浏览点击广告时间;在线停留时间,按照秒单位进行统计,注明用户页面停留时间;页面操作数据,按照操作类型进行统计,包括点击次数、点击位置、页面移动。本专利技术步骤三中,调整用户特征信息具体包括:IP地址、请求时间统计:通过分析地理纬度变化情况以及联合请求时间纬度,标识出用户地理位置变动幅度数据;通过广告主题统计,分析历史广告主题浏览记录统计出用户广告主题浏览类型数据;请求时间,通过请求时间统计出用户请求频率数据;点击时间,通过请求时间以及点击时间统计出用户操作频率数据;在线停留时间,通过分析在线停留时间统计出用户浏览页面频率;页面操作数据,通过页面操作数据统计出用户平均浏览有效操作数据。本专利技术采用实时数据分析+历史数据预测方式从系统层面和用户层面两个方面进本文档来自技高网...

【技术保护点】
1.一种基于用户画像的异常广告流量检测方法,其特征在于,包括以下步骤:/n步骤一、对用户浏览的广告进行用户行为追踪:收集用户属性信息及用户行为信息,并通过浏览器中的Cookie信息定位用户,同时通过IP信息二次定位用户;/n步骤二、对用户属性进行特征化分析:针对单次用户分析收集到的用户属性以、行为信息及时间段内整体流量情况,每一个属性以及行为都会生成一个用户标签;/n步骤三、在步骤二的基础上对单个用户进行画像分析:通过聚合分析多个用户标签的历史数据,进一步调整用户特征信息;/n步骤四、对步骤三得到用户特征信息,通过使用k-means聚类算法,针对上述特征进行聚类分析,得到用户类型,判断是否为有效用户,据此判断出该用户流量是否为有效流量。/n

【技术特征摘要】
1.一种基于用户画像的异常广告流量检测方法,其特征在于,包括以下步骤:
步骤一、对用户浏览的广告进行用户行为追踪:收集用户属性信息及用户行为信息,并通过浏览器中的Cookie信息定位用户,同时通过IP信息二次定位用户;
步骤二、对用户属性进行特征化分析:针对单次用户分析收集到的用户属性以、行为信息及时间段内整体流量情况,每一个属性以及行为都会生成一个用户标签;
步骤三、在步骤二的基础上对单个用户进行画像分析:通过聚合分析多个用户标签的历史数据,进一步调整用户特征信息;
步骤四、对步骤三得到用户特征信息,通过使用k-means聚类算法,针对上述特征进行聚类分析,得到用户类型,判断是否为有效用户,据此判断出该用户流量是否为有效流量。


2.如权利要求1所述的一种基于用户画像的异常广告流量检测方法,其特征在于,步骤一中,用户属性信息包括户标识符、IP地址、请求时间、点击时间、广告主题。


3.如权利要求1所述的一种基于用户画像的异常广告流量检测方法,其特征在于,步骤一中,用户行为信息包括页面操作数据、在线停留时间信息。


4.如权利要求1所述的一种基于用户画像的异常广告流量检测方法,其特征在于,步骤四中,按时间维度、地域维度辅助分析用户流量,具体步骤如下:
(1)按时间、地域、广告类型维度统计数据,时间维度分为,时、天、月,...

【专利技术属性】
技术研发人员:陈逗
申请(专利权)人:杭州古点网络科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1