一种基于页面引擎的数据提取方法及系统技术方案

技术编号:36683265 阅读:15 留言:0更新日期:2023-02-27 19:43
本申请涉及一种基于页面引擎的数据提取方法及系统,涉及计算机信息技术领域,解决了页面引擎的数据一般都存储在默认存储装置上,而这个默认地址不一定是当前用户所想要存储的存储装置的问题,其包括:获取系统登录人员身份信息;根据登录人员身份信息与数据存储模块的对应关系,分析确定存储本次提取数据的数据存储模块;执行对页面引擎的数据提取,并存储入数据存储模块内。本申请具有如下效果:提高了用户寻找所需类别数据的效率。高了用户寻找所需类别数据的效率。高了用户寻找所需类别数据的效率。

【技术实现步骤摘要】
一种基于页面引擎的数据提取方法及系统


[0001]本申请涉及计算机信息
,尤其是涉及一种基于页面引擎的数据提取方法及系统。

技术介绍

[0002]目前随着Web2.0的兴起,AJAX(Asynchronous JavaScr i pt and XML,异步JavaScr i pt和XML)技术风靡一时,客户端与服务器端异步交互的方式既减小了服务器端的压力,而且带来了更好的用户体验。然而,使用该技术产生的大量动态网页给网络数据获取造成了新的难题,传统的用于采集静态网页的Web数据采集工具如网络爬虫抓取的内容远少于页面呈现的内容,大量动态网页中的有用信息无法获取使得以网络数据为主要处理对象的工作无法顺利进行,严重影响了网络内容监控,网络数据挖掘等学科的发展。
[0003]因此,如何改进传统的Web数据采集系统,使之支持动态页面解析,已经成为了当前信息采集技术的一个研究热点。
[0004]当前动态页面采集的主要方法大体有两种:一是利用开源浏览器接口(如F i refox),以编写插件的形式对浏览器输出结果进行采集;二是利用现有的脚本解释引擎(如Sp i derMonkey、Rh i no等)根据信息采集的需要对相关DOM(DocumentObject Mode l,文档对象模型)对象进行绑定,对输出结果进行采集。
[0005]现有基于页面引擎的数据提取方法,在进行提取数据后,会将相应数据全部存储入同一存储装置。
[0006]针对上述中的相关技术,专利技术人发现存在有如下缺陷:页面引擎的数据一般都存储在默认存储装置上,而这个默认地址不一定是当前用户所想要存储的存储装置。

技术实现思路

[0007]为了提高用户寻找所需类别数据的效率,本申请提供一种基于页面引擎的数据提取方法及系统。
[0008]第一方面,本申请提供一种基于页面引擎的数据提取方法,采用如下的技术方案:
[0009]一种基于页面引擎的数据提取方法,包括:
[0010]获取系统登录人员身份信息;
[0011]根据登录人员身份信息与数据存储模块的对应关系,分析确定存储本次提取数据的数据存储模块;
[0012]执行对页面引擎的数据提取,并存储入数据存储模块内。
[0013]可选的,系统登录人员身份信息的获取包括:
[0014]获取当天日期尾号;
[0015]根据当天日期尾数的奇偶性与身份信息识别顺序的对应关系,分析确定身份识别顺序,身份识别顺序包括先指纹识别再虹膜识别以及先虹膜识别再指纹识别两种识别顺序;
[0016]获取用户的身份识别信息以及身份识别顺序;
[0017]当前仅当用户的身份识别信息正确且身份识别顺序与所分析确定的身份识别顺序一致,确定登录人员身份信息。
[0018]可选的,还包括位于获取用户的身份识别信息以及身份识别顺序之后,且与当前仅当用户的身份识别信息正确且身份识别顺序与所分析确定的身份识别顺序一致,确定登录人员身份信并行的步骤,具体如下:
[0019]若用户的身份识别信息正确且身份识别顺序与所分析确定的身份识别顺序不一致,则提醒用户作二次身份识别;
[0020]获取当前时段;
[0021]根据当天时段尾数的奇偶性与身份信息识别顺序的对应关系,分析确定身份识别顺序,身份识别顺序包括先指纹识别再虹膜识别以及先虹膜识别再指纹识别两种识别顺序;
[0022]获取用户的身份识别信息以及身份识别顺序;
[0023]当前仅当用户的身份识别信息正确且身份识别顺序与所分析确定的身份识别顺序一致,确定登录人员身份信息。
[0024]可选的,还包括位于获取用户的身份识别信息以及身份识别顺序之后,且与当前仅当用户的身份识别信息正确且身份识别顺序与所分析确定的身份识别顺序一致,确定登录人员身份信并行的步骤,具体如下:
[0025]若用户的身份识别信息不一致且身份识别顺序与所分析确定的身份识别顺序一致,则提醒用户作二次身份识别;
[0026]获取用户的身份识别信息;
[0027]当且仅当同时通过指纹识别以及虹膜识别完成对用户的身份信息识别,则确定登录人员身份信息。
[0028]可选的,根据登录人员身份信息与数据存储模块的对应关系,分析确定存储本次提取数据的数据存储模块包括:
[0029]获取加载有于页面引擎的数据提取程度的终端是否插接有移动存储装置;
[0030]若为是,则以相应移动存储装置作为本次提取数据的整体数据存储模块;
[0031]若为否,根据登录人员身份信息与存储不同类型数据的数据存储模块的对应关系,分析确定不同类型数据的数据存储模块。
[0032]可选的,还包括位于执行对页面引擎的数据提取,并存储入数据存储模块内之后的步骤,具体如下:
[0033]获取用户对数据存储路径展示的倾向模式;
[0034]根据用户对数据存储路径展示的倾向模式展示本次不同数据所存储入的数据存储模块情况。
[0035]可选的,用户对数据存储路径展示的倾向模式的获取包括:
[0036]根据所获取的数据类型组合与展示对象的对应关系,分析确定展示对象,展示对象包括用户自身和公众;
[0037]若展示对象为用户自身,则根据用户在不同时段对数据存储路径展示的倾向模式,分析确定用户对数据存储路径展示的倾向模式;
[0038]若展示对象为公众,则以公众所倾向的对数据存储路径展示的倾向模式,作为用户对数据存储路径展示的倾向模式。
[0039]可选的,还包括位于根据用户对数据存储路径展示的倾向模式展示本次不同数据所存储入的数据存储模块情况之后的步骤,具体如下:
[0040]若展示对象为用户自身,则分析在预设时间内用户是否对存储路径进行修改;
[0041]若为是,则按照用户所修改的存储路径进行数据存储调整,并将调整后的存储情况发送至用户所持终端;
[0042]若为否,则将存储情况发送至用户所持终端。
[0043]第二方面,本申请提供一种基于页面引擎的数据提取系统,采用如下的技术方案:
[0044]一种基于页面引擎的数据提取系统,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序,该程序能够被处理器加载执行时实现如第一方面所述的基于页面引擎的数据提取方法。
附图说明
[0045]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
[0046]图1是本申请实施例一种基于页面引擎的数据提取方法的流程示意图。
[0047]图2是本申请另一实施例系统登录人员身份信息的获取流程示意图。
[0048]图3是本申请另一实施例位于获取用户的身份识别信息以本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于页面引擎的数据提取方法,其特征在于,包括:获取系统登录人员身份信息;根据登录人员身份信息与数据存储模块的对应关系,分析确定存储本次提取数据的数据存储模块;执行对页面引擎的数据提取,并存储入数据存储模块内。2.根据权利要求1所述的一种基于页面引擎的数据提取方法,其特征在于,系统登录人员身份信息的获取包括:获取当天日期尾号;根据当天日期尾数的奇偶性与身份信息识别顺序的对应关系,分析确定身份识别顺序,身份识别顺序包括先指纹识别再虹膜识别以及先虹膜识别再指纹识别两种识别顺序;获取用户的身份识别信息以及身份识别顺序;当前仅当用户的身份识别信息正确且身份识别顺序与所分析确定的身份识别顺序一致,确定登录人员身份信息。3.根据权利要求2所述的一种基于页面引擎的数据提取方法,其特征在于,还包括位于获取用户的身份识别信息以及身份识别顺序之后,且与当前仅当用户的身份识别信息正确且身份识别顺序与所分析确定的身份识别顺序一致,确定登录人员身份信并行的步骤,具体如下:若用户的身份识别信息正确且身份识别顺序与所分析确定的身份识别顺序不一致,则提醒用户作二次身份识别;获取当前时段;根据当天时段尾数的奇偶性与身份信息识别顺序的对应关系,分析确定身份识别顺序,身份识别顺序包括先指纹识别再虹膜识别以及先虹膜识别再指纹识别两种识别顺序;获取用户的身份识别信息以及身份识别顺序;当前仅当用户的身份识别信息正确且身份识别顺序与所分析确定的身份识别顺序一致,确定登录人员身份信息。4.根据权利要求2所述的一种基于页面引擎的数据提取方法,其特征在于,还包括位于获取用户的身份识别信息以及身份识别顺序之后,且与当前仅当用户的身份识别信息正确且身份识别顺序与所分析确定的身份识别顺序一致,确定登录人员身份信并行的步骤,具体如下:若用户的身份识别信息不一致且身份识别顺序与所分析确定的身份识别顺序一致,则提醒用户作二次身份识别;获取用户的身份识别信息;当且仅当同时通过指纹识别以及虹膜识别完成对用户的身份信息识别,则确定登录人员身份信...

【专利技术属性】
技术研发人员:吴梦晟苏世杰梁启华郑新刚刘永满
申请(专利权)人:福建慧舟信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1