数据采集方法、装置、计算机系统和计算机可读存储介质制造方法及图纸

技术编号:31306663 阅读:49 留言:0更新日期:2021-12-12 21:23
本公开提供了一种数据采集方法、装置、计算机系统和计算机可读存储介质。其中,该方法包括:获取用户针对网页中的目标网页元素的触发操作;响应于触发操作,根据目标网页元素确定针对目标网页元素的伪类样式;通过解析伪类样式获得请求信息,其中,请求信息中包括与触发操作相关的参数信息;以及将请求信息发送至服务端,以使得服务端根据请求信息中的参数信息对触发操作进行采集。息对触发操作进行采集。息对触发操作进行采集。

【技术实现步骤摘要】
数据采集方法、装置、计算机系统和计算机可读存储介质


[0001]本公开涉及计算机、互联网
,更具体地,涉及一种数据采集方法、装置、计算机系统和计算机可读存储介质。

技术介绍

[0002]随着互联网技术的发展,网站成为当前信息交互和信息获取的一个重要通道,诸如企业信息网、娱乐新闻网、生活服务网等为日常生活提供了极大的便利。为顺应时代发展和用户需求,同类型的网站被不同企业开发并投入应用显然不可避免。因此,收集更接近用户喜好的网站信息以提升自身网站的核心竞争力是每个企业规划在内的目标。
[0003]在实现本公开构思的过程中,专利技术人发现相关技术中至少存在如下问题,现有的网站信息收集方法采用与低级浏览器兼容性差且容易被用户禁用的JavaScript脚本,导致无法较为有效的对网页中用户行为数据的采集。

技术实现思路

[0004]有鉴于此,本公开提供了一种数据采集方法、装置、计算机系统和计算机可读存储介质。
[0005]本公开的一个方面提供了一种数据采集方法,包括:获取用户针对网页中的目标网页元素的触发操作;响应于所述触发操作,根据所述目标网页元素确定针对所述目标网页元素的伪类样式;通过解析所述伪类样式获得请求信息,其中,所述请求信息中包括与所述触发操作相关的参数信息;以及将所述请求信息发送至服务端,以使得所述服务端根据所述请求信息中的参数信息对所述触发操作进行采集。
[0006]根据本公开的实施例,所述请求信息中还包括与用于渲染所述目标网页元素的资源信息对应的地址信息,所述方法还包括:在将所述请求信息发送至服务端之后,所述服务端还根据所述请求信息中的地址信息向所述网页返回所述资源信息。
[0007]根据本公开的实施例,所述伪类样式包括:网页元素字段,表征所述目标网页元素;伪类字段,表征针对所述目标网页元素的触发操作的类型;以及伪元素字段,用于承载所述伪类样式中的请求信息。
[0008]根据本公开的实施例,响应于所述触发操作,根据所述目标网页元素确定针对所述目标网页元素的伪类样式还包括:根据所述目标网页元素确定所述网页元素字段;根据所述触发操作的类型确定所述伪类字段;以及根据所述网页元素字段和所述伪类字段确定所述伪类样式。
[0009]本公开的另一个方面提供了又一种数据采集方法,包括:获取来自客户端的请求信息,其中,所述请求信息中包括与用户的触发操作相关的参数信息,所述请求信息是所述客户端通过解析所述触发操作针对的目标网页元素的伪类样式得到的,所述伪类样式是响应于所述触发操作,根据所述目标网页元素确定的;以及根据所述请求信息中的参数信息对所述触发操作进行采集。
[0010]根据本公开的实施例,所述请求信息中还包括与用于渲染所述目标网页元素的资源信息对应的地址信息,所述方法还包括:根据所述请求信息中的地址信息向所述网页返回所述资源信息。
[0011]根据本公开的实施例,根据所述请求信息中的参数信息对所述触发操作进行采集包括:获取所述参数信息中的至少一个信息收集参数,其中,所述信息收集参数包括参数名和参数值;针对每个所述信息收集参数,将所述信息收集参数中的所述参数名和所述参数值分别存储入数据库中,得到至少一条信息日志;以及将至少一条所述信息日志作为针对所述触发操作的采集结果。
[0012]本公开的另一个方面提供了一种数据采集装置,包括:第一获取模块,用于获取用户针对网页中的目标网页元素的触发操作;确定模块,用于响应于所述触发操作,根据所述目标网页元素确定针对所述目标网页元素的伪类样式;解析模块,用于通过解析所述伪类样式获得请求信息,其中,所述请求信息中包括与所述触发操作相关的参数信息;以及发送模块,用于将所述请求信息发送至服务端,以使得所述服务端根据所述请求信息中的参数信息对所述触发操作进行采集。
[0013]本公开的另一个方面提供了又一种数据采集装置,包括:第二获取模块,用于获取来自客户端的请求信息,其中,所述请求信息中包括与用户的触发操作相关的参数信息,所述请求信息是所述客户端通过解析所述触发操作针对的目标网页元素的伪类样式得到的,所述伪类样式是响应于所述触发操作,根据所述目标网页元素确定的;以及采集模块,用于根据所述请求信息中的参数信息对所述触发操作进行采集。
[0014]本公开的另一方面提供了一种计算机系统,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上任一项所述的方法。
[0015]本公开的另一方面提供了一种计算机可读存储介质,其上存储有计算机可执行指令,所述指令在被执行时用于实现如上任一项所述的方法。
[0016]本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上任一项所述的方法。
[0017]根据本公开的实施例,通过采用了获取用户针对网页中的目标网页元素的触发操作;响应于触发操作,根据目标网页元素确定针对目标网页元素的伪类样式;通过解析伪类样式获得请求信息,其中,请求信息中包括与触发操作相关的参数信息;以及将请求信息发送至服务端,以使得服务端根据请求信息中的参数信息对触发操作进行采集的技术手段。由于响应于触发操作的网页元素的信息展示通常伴随着伪类样式,并且与触发操作相关的参数信息可以通过解析伪类样式直接得到,所以用户在网页元素上的触发操作可以通过解析伪类样式的形式直接采集得到,而无需额外的数据采集脚本,从而至少部分地克服了传统的数据采集脚本在低级浏览器中不兼容以及可能被禁用的技术问题,进而达到了在任何浏览器环境下均可实现对网页中的用户操作行为进行采集的技术效果。
附图说明
[0018]通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
[0019]图1示意性示出了根据本公开实施例的可以应用数据采集方法的示例性系统架构;
[0020]图2示意性示出了根据本公开实施例的客户端数据采集方法的流程图;
[0021]图3示意性示出了根据本公开实施例的服务端数据采集方法的流程图;
[0022]图4示意性示出了根据本公开实施例的客户端和服务端协同工作时的数据采集方法的流程图;
[0023]图5示意性示出了根据本公开的实施例的客户端数据采集装置的框图;
[0024]图6示意性示出了根据本公开的实施例的服务端数据采集装置的框图;以及
[0025]图7示意性示出了根据本公开实施例的适于实现上文描述的数据采集方法的计算机系统的框图。
具体实施方式
[0026]以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据采集方法,包括:获取用户针对网页中的目标网页元素的触发操作;响应于所述触发操作,根据所述目标网页元素确定针对所述目标网页元素的伪类样式;通过解析所述伪类样式获得请求信息,其中,所述请求信息中包括与所述触发操作相关的参数信息;以及将所述请求信息发送至服务端,以使得所述服务端根据所述请求信息中的参数信息对所述触发操作进行采集。2.根据权利要求1所述的方法,其中,所述请求信息中还包括与用于渲染所述目标网页元素的资源信息对应的地址信息,所述方法还包括:在将所述请求信息发送至服务端之后,所述服务端还根据所述请求信息中的地址信息向所述网页返回所述资源信息。3.根据权利要求1所述的方法,其中,所述伪类样式包括:网页元素字段,表征所述目标网页元素;伪类字段,表征针对所述目标网页元素的触发操作的类型;以及伪元素字段,用于承载所述伪类样式中的请求信息。4.根据权利要求3所述的方法,其中,响应于所述触发操作,根据所述目标网页元素确定针对所述目标网页元素的伪类样式还包括:根据所述目标网页元素确定所述网页元素字段;根据所述触发操作的类型确定所述伪类字段;以及根据所述网页元素字段和所述伪类字段确定所述伪类样式。5.一种数据采集方法,包括:获取来自客户端的请求信息,其中,所述请求信息中包括与用户的触发操作相关的参数信息,所述请求信息是所述客户端通过解析所述触发操作针对的目标网页元素的伪类样式得到的,所述伪类样式是响应于所述触发操作,根据所述目标网页元素确定的;以及根据所述请求信息中的参数信息对所述触发操作进行采集。6.根据权利要求5所述的方法,其中,所述请求信息中还包括与用于渲染所述目标网页元素的资源信息对应的地址信息,所述方法还包括:根据所述请求信息中的地址信...

【专利技术属性】
技术研发人员:黄俊峰
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1