本发明专利技术披露了实现互联网用户访问情况统计分析的方法及装置,其中方法包括:提取及记录每一来访用户对象所代表的用户机的信息,根据用户机的信息的相似度合并用户对象。本发明专利技术通过学习过程记录不同的Cookie所代表的用户机的信息以及对Cookie所发生的浏览行为,对用户相似程度进行判断,将有可能是同一个用户产生的Cookie进行合并,并基于合并后Cookie的浏览行为记录统计分析访问频次和浏览行为习惯,由此可避免因用户清除Cookie等因素造成的用户行为关联性丢失和统计误差,从而能够真实客观地评价网站的受访情况。
【技术实现步骤摘要】
本专利技术涉及互联网服务提供商统计分析服务网站受访情况的方法,尤其涉及基于Cookie实现网站受访情况统计分析的方法及装置。
技术介绍
Cookie是服务器暂时存放在上网用户的电脑里的资料,即ー种文本文件,以便让服务器能够识别网络用户身份。当用户访问某ー网站吋,Web服务器会首先传递ー份Cookie资料放在用户的机器上,将用户在访问网站时所输入的文字或做的一些选择记录下来。当用户再次访问同一个网站吋,Web服务器若查询到该用户机留有Cookie资料,便会依据Cookie资料的内容来判断用户机,并送出特定的网页内容给用户机。 网站服务提供商可以利用cookie跟踪统计分析访问网站的访问频次和用户行为习惯。其中,用户行为包括浏览网站中的网页,点击网页中的广告,在网上进行购买活动,浏览网上商品,点播IPTV频道节目等;访问频次例如根据对访问页面、访问时间(在每个网页上的停留时间)、点击某ー网站链接的次数以及用户的上网时间等行为习惯进行的分析,统计出访问总人数、人均访问次数以及不同访问次数的人数分布分析等。利用统计分析出的这些受访情况信息,一方面可以为用户提供个性化的网络服务,另一方面,也可以作为了解网络用户行为习惯的工具,用于改进网站经营策略。随着互联网技术的高速发展,网络上的信息越来越多,能够提供的商品和信息服务越来越丰富,人们的生活也越来越依赖于网络,互联网用户呈爆炸式地增长。信息提供商希望通过统计分析用户的访问频次和浏览行为习惯,发现影响网站流量的相关因素,以便改善产品的质量和服务的针对性,吸引更多目标用户的访问。广告主则希望更科学地评价其广告投放的效果,并由此改善广告投放策略,将有限的广告资源更精准地集中针对潜在的客户上。目前,针对互联网用户访问频次和行为的分析,主要是基于浏览器Cookie或Flash cookie (Share 0b ject),即把Cookie与用户等同起来。比如,当统计出一个网站的访问次数大于两次的Cookie有2000个,则认为访问该网站大于两次的人有2000人。然而,依据Cookie进行统计分析存在以下问题由于用户可以自行删除cookie,或者直接阻止cookie,因此通常Cookie的生命周期要比用户短很多,一个用户有可能对应了多个CookieAookie实际只相当于用户在某段时间的行为片段;因此直接基于Cookie来统计分析相当于将ー个用户割裂为多个用户,使得统计出的用户访问频次和行为数据会与实际的结果产生较大的误差,从而导致网站受访分析的结果缺乏真实性。
技术实现思路
本专利技术所要解决的技术问题是提供一种实现互联网用户访问情况统计分析的方法及装置,能够避免统计的用户行为的关联性丢失和统计误差。为了解决上述技术问题,本专利技术提供了一种实现互联网用户访问情况统计分析的方法,包括提取及记录每一来访用户对象所代表的用户机的信息,根据用户机的信息的相似度合并用户对象。进ー步地,提取及记录每一来访用户对象所代表的用户机的信息,根据所述用户机的信息的相似度合并所述用户对象,具体包括为每ー来访的用户对象分配ー个唯一标识,针对用户对象提取并记录用户机的信息,包括IP地址、浏览器类型及其版本、操作系统类型及其版本、屏幕分辨率以及Flash版本信息中的ー种或多种;针对用户机的信息的重要性或相关程度为所述信息赋予相应的权重,包括用户机的第I信息至第η信息的各个权重,η为大于I的整数; 按如下公式计算各用户对象之间的相似度=Σ第N信息的权重*用户对象之间第N信息的相似度;式中,用户对象之间第N信息的相似度,是指该第N信息具有信息重叠部分占总信息的比率;Ν = I η ;将相似度大于或等于预定阈值的用户对象合并成代表一个互联网用户的新用户对象,为合并后的所述新用户对象重新分配ー个唯一标识,并存储新用户对象的所述标识和描述合并后浏览行为的对应关系记录。进ー步地,该方法还包括记录用户对象的浏览行为,根据用户机的信息的相似度和浏览行为的相似度合并用户对象。进ー步地,记录用户对象的浏览行为,根据用户机的信息的相似度和浏览行为的相似度合并用户对象,具体包括记录浏览行为,包括浏览网站及其页面、浏览总时间、浏览总频次以及浏览网站频道的频次行为中的ー种或多种;针对用户机的信息和浏览行为的重要性或相关程度为所述信息和浏览行为赋予相应的权重,包括用户机的第I信息至第η信息的各个权重,用户对象第I浏览行为至第m浏览行为的各个权重,n、m分别为大于I的整数;按如下公式计算各用户对象之间的相似度= Σ第N信息的权重*用户对象之间第N信息的相似度+ Σ第M浏览行为的权重*用户对象之间第M浏览行为的相似度;式中,用户对象之间第M浏览行为的相似度通过求取浏览网站频道的频次占浏览总频次的比率计算;N=l n;M=l m;将相似度大于或等于预定阈值的用户对象合并成代表一个互联网用户的新用户对象,为合并后的新用户对象重新分配ー个唯一标识,并存储新用户对象的标识和描述合并后浏览行为的对应关系记录。为了解决上述技术问题,本专利技术提供了一种实现互联网对象受访情况统计分析的方法,包括提取及记录每一来访用户对象所代表的用户机的信息,根据用户机的信息的相似度合并用户对象;记录合并的用户对象的浏览行为,根据该记录统计分析网站受访情況。为了解决上述技术问题,本专利技术提供了一种实现互联网用户访问情况统计分析的装置,包括用户机信息提取模块、存储模块以及用户合并模块,其中用户机信息提取模块,用于提取每ー来访用户对象所代表的用户机的信息,并将提取的信息记录在存储模块中用户机信息记录中;用户合并模块,用于根据存储模块记录中的用户机的信息的相似度合并用户对象,并将合并后的用户对象所发生的浏览行为记录在存储模块中合并用户行为记录中;存储模块,至少用于存储用户机信息和合并用户行为记录。进ー步地,用户合并模块针对所述用户机的信息的重要性或相关程度为信息赋予相应的权 重,根据权重及用户机的信息的相似度计算各用户对象之间的相似度,将相似度大于或等于预定阈值的用户对象合并成代表一个互联网用户的新用户对象,为合并后的新用户对象重新分配ー个唯一标识,并存储新用户对象的标识和描述合并后浏览行为的对应关系记求。进ー步地用户行为记录模块,用于将记载在用户机信息和行为记录中的用户对象所发生的浏览行为记录在用户行为记录中;用户合并模块还根据用户机的信息和浏览行为的相似度合并用户对象,并将合并后的用户对象所发生的浏览行为记录在存储模块中合并用户行为记录中;存储模块还存储用户行为记录。进一步地,用户机信息提取模块为每一来访的用户对象分配ー个唯一标识;针对用户对象提取并记录的用户机的信息包括IP地址、浏览器类型及其版本、操作系统类型及其版本、屏幕分辨率以及Flash版本信息中的ー种或多种;用户行为记录模块记录的用户对象的浏览行为包括浏览网站及其页面、浏览总时间、浏览总频次以及浏览网站频道的频次行为中的ー种或多种;用户合并模块针对用户机的信息和浏览行为的重要性或相关程度赋予相应的权重,根据所述权重、用户机的信息的相似度以及浏览行为的相似度计算各用户对象之间的相似度,将相似度大于或等于预定阈值的用户对象合并成代表一个互联网用户的新用户对象,为合并后的新用户对象重新分配ー个唯一标识,并存储新用本文档来自技高网...
【技术保护点】
一种对互联网用户访问情况统计分析的方法,包括:提取及记录每一来访用户对象所代表的用户机的信息,根据所述用户机的信息的相似度合并所述用户对象。
【技术特征摘要】
【专利技术属性】
技术研发人员:陈家耀,申志辉,欧阳佑,
申请(专利权)人:北京思博途信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。