页面数据采集方法及装置、电子设备、存储介质制造方法及图纸

技术编号:21361592 阅读:19 留言:0更新日期:2019-06-15 09:22
本申请揭示了一种页面数据采集方法及装置,涉及大数据技术领域。所述方法包括:在前端页面加载完成后,获取与所述前端页面进行数据采集相关联的全部标签信息,所述标签信息为进行标签属性扩展的HTML标签;根据所获取标签信息中的事件属性值,监听所述前端页面中触发的采集事件,所述采集事件与所述标签信息中的事件属性值相对应;如果监听到所触发的采集事件,根据所述标签信息中对应的数据属性值,对所述采集事件所对应的数据进行采集。本申请对前端页面中可能触发的若干采集事件的监听,以及对若干采集事件进行相应数据采集的过程均由一个采集程序实现,简化了前端应用程序,便于开发人员进行维护。

Page Data Acquisition Method and Device, Electronic Equipment and Storage Media

This application discloses a method and device for page data acquisition, which relates to the field of large data technology. The method includes: after loading the front-end page, acquiring all tag information associated with data acquisition of the front-end page, the tag information is HTML tag for tag attribute extension; according to the event attribute value of the acquired tag information, monitoring the collection event triggered in the front-end page, the collection event and the event belonging in the tag information. If the triggered acquisition event is monitored, the data corresponding to the acquisition event is collected according to the corresponding data attribute values in the tag information. This application monitors several acquisition events that may be triggered in front-end pages and collects corresponding data from several acquisition events by a acquisition program, which simplifies the front-end application program and facilitates the maintenance of developers.

【技术实现步骤摘要】
页面数据采集方法及装置、电子设备、存储介质
本申请涉及大数据
,特别涉及一种页面数据采集方法及装置、电子设备、计算机可读存储介质。
技术介绍
随着互联网技术的发展,B/S(浏览器和服务器)架构模式逐渐兴起,在这种架构下,软件应用的用户交互界面通过浏览器来实现,软件应用的业务逻辑在服务器实现。浏览器也称为前端,前端通过采集网页中的用户交互数据,并将采集的数据发送至服务器进行逻辑处理,从而实现用户交互功能。在现有技术中,前端采集用户交互数据的方法都是通过调用采集方法实现的。具体地,开发人员通过在前端应用程序中写入若干采集事件的监听程序以及对应的采集方法,使得前端应用程序在运行时,一旦监听到前端页面中所触发的采集事件,则通过调用相应的采集方法来采集相关数据。很显然,前端页面需要采集的数据越多,需要开发人员写入的采集事件监听程序和采集方法也越多,导致前端应用程序在运行过程中负载很大,容易引起前端页面卡顿的问题,也不利于开发人员对前端应用程序进行维护。
技术实现思路
基于上述技术问题,本申请提供了一种页面数据采集方法及装置、电子设备、计算机可读存储介质。本申请所揭示的技术方案包括:一种页面数据采集方法,所述方法包括:在前端页面加载完成后,获取与所述前端页面进行数据采集相关联的全部标签信息,所述标签信息为进行标签属性扩展的HTML标签;根据所获取标签信息中的事件属性值,监听所述前端页面中触发的采集事件,所述采集事件与所述标签信息中的事件属性值相对应;如果监听到所触发的采集事件,根据所述标签信息中对应的数据属性值,对所述采集事件所对应的数据进行采集。进一步地,所述在前端页面加载完成后,获取与所述前端页面进行数据采集相关联的全部标签信息,包括:获取前端提供的标签获取接口;根据所述前端页面中所采集数据的数据类型,分别调用所述标签获取接口,获得与所述前端页面进行数据采集相关联的全部标签信息。进一步地,所述根据所获取标签信息中的事件属性值,监听所述前端页面中触发的采集事件,所述采集事件与所述标签信息中的事件属性值相对应,包括:根据所获取标签信息的不同类型,分别设置监听线程对所述前端页面中的相应区域进行监听,所述采集事件与所述标签信息中的事件属性值相对应;如果监听到所述区域被触发,则获取所述区域所对应的事件属性值。进一步地,所述根据所述标签信息中对应的数据属性值,进行所述采集事件所对应数据的采集,包括:根据所监听到采集事件对应的事件属性值,从所述全部标签信息中查找包含所述事件属性值的标签信息;从所查找到的标签信息中提取数据属性值,获取所述数据属性值所对应的数据。进一步地,在所述根据所述标签信息中对应的数据属性值,对所述采集事件所对应的数据进行采集之后,所述方法还包括:将所采集的数据发送至后端服务器,所述后端服务器用于进行所述数据的逻辑处理。一种页面数据采集装置,所述装置包括:标签信息获取模块,用于在前端页面加载完成后,获取与所述前端页面进行数据采集相关联的全部标签信息,所述标签信息为进行标签属性扩展的HTML标签;采集事件监听模块,用于根据所获取标签信息中的事件属性值,监听所述前端页面中触发的采集事件,所述采集事件与所述标签信息中的事件属性值相对应;数据采集模块,用于在监听到触发了采集事件的情况下,根据所述标签信息中对应的数据属性值,对所述采集事件所对应的数据进行采集。一种电子设备,所述电子设备包括:处理器;存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如前所述的页面数据采集方法。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如前所述的页面数据采集方法。本申请的实施例提供的技术方案可以包括以下有益效果:在上述技术方案中,前端应用程序中所加载的HTML标签预先进行了属性扩展,使得每一HTML标签中均包括相应的事件属性值和数据属性值,通过获取全部的HTML标签,并根据这些HTML标签中的事件属性值监听前端页面中触发的采集事件,以及根据HTML标签中的数据属性值进行相应数据的采集。因此在本申请中,对前端页面中可能触发的若干采集事件的监听,以及对若干采集事件进行相应数据采集的过程均由一个采集程序实现,简化了前端应用程序,便于开发人员进行维护。应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并于说明书一起用于解释本申请的原理。图1是根据一示例性实施例示出的本专利技术实施环境的示意图;图2是根据一示例性实施例示出的一种终端的硬件框图;图3是根据一示例性实施例示出的一种页面数据采集方法的流程图;图4是根据一示例性实施例示出的一种页面数据采集装置的框图。通过上述附图,已示出本专利技术明确的实施例,后文中将有更详细的描述,这些附图和文字描述并不是为了通过任何方式限制本专利技术构思的范围,而是通过参考特定实施例为本领域技术人员说明本专利技术的概念。具体实施方式这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。图1是根据一示例性实施例示出的一种实施环境的示意图。如图1所示,本专利技术的实施环境包括:终端100和服务器200。在本专利技术中,终端100用于运行浏览器,该浏览器中加载有前端页面以与用户进行交互操作。终端100具体可以是智能手机、平板电脑、笔记本电脑、计算机或者其他任意能够运行浏览器的电子设备,在此不加以限定。服务器200则用于存储海量数据,以响应终端发起的服务请求,根据服务请求进行数据处理。服务器200可以是一台服务器,或者是由若干服务器组成的服务器集群,本处也不进行限定。需要说明的是,终端100与服务器200之间预先建立有线或者无线的网络连接,从而使得终端100能够与服务器200进行数据交互。图2是根据一示例性实施例示出的一种图1所示终端100的硬件结构框图。如图2所示,终端可以包括以下一个或者多个组件:处理组件101,存储器102,电源组件103,多媒体组件104,音频组件105,传感器组件107以及通信组件108。其中,上述组件并不全是必须的,终端可以根据自身功能需求增加其他组件或减少某些组件,本实施例不作限定。处理组件101通常控制终端的整体操作,诸如与显示,数据通信,相机操作以及日志数据处理相关联的操作等。处理组件101可以包括一个或多个处理器109来执行指令,以完成上述操作的全部或部分步骤。此外,处理组件101可以包括一个或多个模块,便于处理组件101和其他组件之间的交互。例如,处理组件101可以包括多媒体模块,以方便多媒体组件104和处理组件101之间的交互。存储器102被配置为存储各种类型的数据以支持在终端的操作。这些数据的示例包括用于在终端上操作的任何应用程序或方法的指令。存储器102可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如SRAM(静态随机存取存储器),EEPROM(电可擦除可编程只读本文档来自技高网...

【技术保护点】
1.一种页面数据采集方法,其特征在于,所述方法包括:在前端页面加载完成后,获取与所述前端页面进行数据采集相关联的全部标签信息,所述标签信息为进行标签属性扩展的HTML标签;根据所获取标签信息中的事件属性值,监听所述前端页面中触发的采集事件,所述采集事件与所述标签信息中的事件属性值相对应;如果监听到所触发的采集事件,根据所述标签信息中对应的数据属性值,对所述采集事件所对应的数据进行采集。

【技术特征摘要】
1.一种页面数据采集方法,其特征在于,所述方法包括:在前端页面加载完成后,获取与所述前端页面进行数据采集相关联的全部标签信息,所述标签信息为进行标签属性扩展的HTML标签;根据所获取标签信息中的事件属性值,监听所述前端页面中触发的采集事件,所述采集事件与所述标签信息中的事件属性值相对应;如果监听到所触发的采集事件,根据所述标签信息中对应的数据属性值,对所述采集事件所对应的数据进行采集。2.根据权利要求1所述的方法,其特征在于,所述在前端页面加载完成后,获取与所述前端页面进行数据采集相关联的全部标签信息,包括:获取前端提供的标签获取接口;根据所述前端页面中所采集数据的数据类型,分别调用所述标签获取接口,获得与所述前端页面进行数据采集相关联的全部标签信息。3.根据权利要求1所述的方法,其特征在于,所述根据所获取标签信息中的事件属性值,监听所述前端页面中触发的采集事件,所述采集事件与所述标签信息中的事件属性值相对应,包括:根据所获取标签信息的不同类型,分别设置监听线程对所述前端页面的相应区域进行监听,所述前端页面的相应区域为所述标签信息中事件属性值所对应区域;如果监听到所述区域被触发,则获取所述区域所对应的事件属性值。4.根据权利要求1所述的方法,其特征在于,所述根据所述标签信息中对应的数据属性值,进行所述采集事件所对应数据的采集,包括:根据所监听到采集事件对应的事件属性值,从所述全部标签信息中查找包含所述事件属性值的标签信息;从所查找到的标签信息中提取数据属性值,获取所述数据属性值所对应的数据。5.根据权利要求1所述的方法,其特征在于,在所述根据所述标签信息中对应的数据属性值,对所述采集...

【专利技术属性】
技术研发人员:倪振
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1