数据处理方法和装置制造方法及图纸

技术编号:15272991 阅读:52 留言:0更新日期:2017-05-04 13:05
本发明专利技术公开了一种数据处理方法和装置。其中,该方法包括:获取使用同一网络的用户群中每个用户的网络访问识别模型,其中,网络访问识别模型至少包含用户在预设时间段内通过同一网络进行页面访问之后,所确定的网络访问识别因素;接收同样使用同一网络的当前用户的网络访问行为数据;使用每个用户的网络访问识别模型分别对当前用户的网络访问行为数据进行分析,确定用户群中与当前用户的匹配度最高的用户。本发明专利技术解决了现有技术中仅能得到同一网络的网络访问行为数据,网络访问行为数据识别精度不高的技术问题。

Data processing method and apparatus

The invention discloses a data processing method and a device. Among them, the method includes: access identification model for each user using the same network users in the network, the network access identification model contains at least a user page for a preset period of time through the same network, the network access identification factors; receiving the current users also use the same network. Network access behavior data; using each user's network access identification model respectively to the current user network access behavior data analysis, to determine the best matching with the current user user group. The invention solves the technical problems that the network access behavior data of the same network can only be obtained in the prior art, and the recognition accuracy of the network access behavior data is not high.

【技术实现步骤摘要】

本专利技术涉及互联网领域,具体而言,涉及一种数据处理方法和装置
技术介绍
随着互联网发展的加速,网络行为已经成为研究消费者的重要途径。目前用户网络访问行为数据的来源主要有:1)网络用户行为样本监测数据;2)网络服务商数据;3)网站服务器日志数据;4)第三方服务商通过页面标签技术获取的数据;5)其他方式。来源1)和2)是其中非常重要的两种方式,这些数据具有以下特点:1)能较为完整的体现网民的互联网访问路径,对全面了解当前网民的特点更加有价值;2)以家庭为单位获取数据;3)方便结合问卷调查等主观方式,能与多种数据源结合分析。但这样的数据源想要产生更高的数据价值,最重要的就是需要把以家庭为单位的数据进一步分离到每个人。现有技术描述了一种实现互联网用户访问情况统计分析的方法,该方案通过提取及记录每一来访用户对象所代表的用户机的信息,根据用户级的信息的相似度合并用户对象。通过学习过程记录不同的Cookie所代表的用户机的信息以及对Cookie所发生的浏览行为,对用户相似程度进行判断,将有可能是同一个用户产生的Cookie进行合并,并基于合并后Cookie的浏览行为记录统计分析访问频次和浏览行为习惯。由此,根据现有技术描述的基于用户机信息和浏览行为的相关度合并Cookie的方案可以确定,现有技术至少存在如下几个缺陷:1)适用数据源有限;2)分离精度有限;3)系统性误差会越来越大,没有修改的机会。针对现有技术中仅能得到同一网络的网络访问行为数据,网络访问行为数据识别精度不高的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种数据处理方法和装置,以至少解决现有技术中仅能得到同一网络的网络访问行为数据,网络访问行为数据识别精度不高的技术问题。根据本专利技术实施例的一个方面,提供了一种数据处理方法,包括:获取使用同一网络的用户群中每个用户的网络访问识别模型,其中,网络访问识别模型至少包含用户在预设时间段内通过同一网络进行页面访问之后,所确定的网络访问识别因素;接收同样使用同一网络的当前用户的网络访问行为数据;使用每个用户的网络访问识别模型分别对当前用户的网络访问行为数据进行分析,确定用户群中与当前用户的匹配度最高的用户。根据本专利技术实施例的另一方面,还提供了一种数据处理装置,包括:获取模块,用于获取使用同一网络的用户群中每个用户的网络访问识别模型,其中,网络访问识别模型至少包含用户在预设时间段内通过同一网络进行页面访问之后,所确定的网络访问识别因素;接收模块,用于接收同样使用同一网络的当前用户的网络访问行为数据;确定模块,用于使用每个用户的网络访问识别模型分别对当前用户的网络访问行为数据进行分析,确定用户群中与当前用户的匹配度最高的用户。在本专利技术实施例中,通过获取使用同一网络的用户群中每个用户的网络访问识别模型,并接收同样使用同一网络的当前用户的网络访问行为数据,使用每个用户的网络访问识别模型分别对当前用户的网络访问行为数据进行分析,确定用户群中与当前用户的匹配度最高的用户。因此,上述方案可以实现识别不同用户的网络访问行为数据的目的,由于用户属于使用同一网络的用户群,进一步还可以实现将以用户群为单位的网络访问行为数据分离到用户群中每个用户的目的,从而解决现有技术中仅能得到同一网络的网络访问行为数据,网络访问行为数据识别精度不高的技术问题。由此可知,本申请实施例提供的方案可以把以家庭为单位的数据进一步分离到个人,提高网络访问行为数据的识别精度,具有更高的数据价值。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种数据处理方法的流程图;图2是根据本专利技术实施例的一种可选的数据处理方法的流程图;图3是根据本专利技术实施例的一种数据处理装置的示意图;图4是根据本专利技术实施例的一种可选的数据处理装置的示意图;图5是根据本专利技术实施例的一种可选的数据处理装置的示意图;图6是根据本专利技术实施例的一种可选的数据处理装置的示意图;图7是根据本专利技术实施例的一种可选的数据处理装置的示意图;图8是根据本专利技术实施例的一种可选的数据处理示意图;以及图9是根据本专利技术实施例的一种可选的数据处理示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。下面对本专利技术实施例进行描述的过程中出现的部分名词或术语适用于如下解释:网络用户行为样本监测:主要是指选取一定的样本,对其网络访问行为进行持续性的数据采集,可依托路由器等硬件设备或上网设备中的监测客户端完成,基于这样一定规模的样本即可完成对庞大网民群体行为进行监测和分析。网络服务商:是指ISP(InternetServiceProvider的缩写),字面意思是网络服务提供者。网络服务商的类型包括物理网络运营者NP、接入服务者IAP、Web服务器等。实施例1根据本专利技术实施例,提供了一种数据处理方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。图1是根据本专利技术实施例的一种数据处理方法的流程图,如图1所示,该方法包括如下步骤:步骤S102,获取使用同一网络的用户群中每个用户的网络访问识别模型,其中,网络访问识别模型至少包含用户在预设时间段内通过同一网络进行页面访问之后,所确定的网络访问识别因素。具体地,上述步骤中的网络访问识别模型表明用户进行页面访问的访问习惯,例如用户经常访问的网页的类型,访问该类型网页的时长和频率等信息。在一种可选的方案中,从一个家庭路由器中提取得到该家庭中所有用户的网络访问行为数据,对该网络访问行为数据进行分析,确定每个用户的网络访问识别模型。步骤S104,接收同样使用同一网络的当前用户的网络访问行为数据。具体地,上述步骤中的网络访问行为数据可以是用户进行页面访问生成的数据,上述数据可以保存在路由器或者网络服务商服务器中。当前用户可以是使用同一网络的用户群中任意一个用户,也可以是非用户群中的任意一个用户,例如用户群是一个家庭中的三个成员A、B和C,当前用户是客人D。此处需要说明的是,本申请上述步骤S102和S104的执行顺序可以相互交换,即本文档来自技高网
...
数据处理方法和装置

【技术保护点】
一种数据处理方法,其特征在于,包括:获取使用同一网络的用户群中每个用户的网络访问识别模型,其中,所述网络访问识别模型至少包含用户在预设时间段内通过所述同一网络进行页面访问之后,所确定的网络访问识别因素;接收同样使用所述同一网络的当前用户的网络访问行为数据;以及使用所述每个用户的网络访问识别模型分别对所述当前用户的网络访问行为数据进行分析,确定所述用户群中与所述当前用户的匹配度最高的用户。

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取使用同一网络的用户群中每个用户的网络访问识别模型,其中,所述网络访问识别模型至少包含用户在预设时间段内通过所述同一网络进行页面访问之后,所确定的网络访问识别因素;接收同样使用所述同一网络的当前用户的网络访问行为数据;以及使用所述每个用户的网络访问识别模型分别对所述当前用户的网络访问行为数据进行分析,确定所述用户群中与所述当前用户的匹配度最高的用户。2.根据权利要求1所述的方法,其特征在于,用户访问页面所确定的所述网络访问识别因素包括如下任意一个或多个参数:访问页面的访问次数、访问时长、跳出率、访问频率和访问深度。3.根据权利要求2所述的方法,其特征在于,所述获取使用同一网络的用户群中每个用户的网络访问识别模型的步骤包括:获取所述预设时间段内使用所述同一网络的所述每个用户的网络访问行为数据;根据所述预设时间段内的所述每个用户的网络访问行为数据,确定所述用户群中每个用户的网络访问识别因素和相应的权重;以及根据所述每个用户的网络访问识别因素xi和相应的权重ki,按照公式yi=k1x1+k2x2+…+knxn生成所述每个用户的网络访问识别模型yi,其中,i为自然数。4.根据权利要求3所述的方法,其特征在于,所述使用所述每个用户的网络访问识别模型分别对所述当前用户的网络访问行为数据进行分析,确定所述用户群中与所述当前用户的匹配度最高的用户的步骤包括:从所述当前用户的网络访问行为数据中,提取得到所述当前用户进行页面访问后的网络访问识别因素;使用所述每个用户的网络访问识别模型yi对所述当前用户的网络访问识别因素进行处理,计算得到所述当前用户对应任意一个用户的网络访问识别模型yi的预测结果值;以及将所述预测结果值最高的用户确定为与所述当前用户匹配度最高的用户。5.根据权利要求3至4中任意一项所述的方法,其特征在于,使...

【专利技术属性】
技术研发人员:胡立芳唐珺
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1