本发明专利技术公开了一种区块链数据提取方法,涉及数据处理技术领域;包括首先进行身份验证;完成身份验证后,用户终端向对应的目标数量的区块链节点发送数据获取请求;应用节点接收到数据获取请求后,按照数据获取规则向应用节点中的每一个区块链节点获取数据切片;对数据切片中的所有对象进行查重分析;得到对象的聚重值;按照聚重值的大小对标准对象进行排序,选取排名前W1的标准对象反馈至用户终端;本发明专利技术通过传输包含一定量数据的数据切片的方式,降低在一次网络传输中数据的传输量,并减少网络传输轮次,进而提高了数据读取效率;同时可以从多个数据节点中获取数据信息,减少了数据查询次序和时间,有效的降低了数据读取的延迟。有效的降低了数据读取的延迟。有效的降低了数据读取的延迟。
【技术实现步骤摘要】
区块链数据提取方法
[0001]本专利技术涉及数据处理
,具体涉及区块链数据提取方法。
技术介绍
[0002]伴随着计算机技术、通信技术、互联网技术的发展,数据积累的越来越多。面对激增的数据,人们希望能够挖掘出有价值的信息,从而可以更好地利用这些数据为人们服务,其中,Top
‑
K查询在搜索引擎、电子商务等领域有着广泛的应用,而Top
‑
K查询是从海量数据中返回最符合需求的前K个结果。
[0003]由于数据量的急剧增长,实际应用中多采用分布式存储系统,包括多个数据缓存节点和一个数据查询节点,在进行分布式Top
‑
K查询的过程中,将各个数据缓存节点的数据传输至数据查询节点,以便于数据查询节点从中选出最符合需求的前K个结果。最简单的方案是将各个数据缓存节点的数据全部发送至数据查询节点,然而这样使得传输的数据达到百万级别,而数据缓存节点和数据查询节点之间的传输带宽是有一定限制的,在数据传输总量较大的情况下,数据传输效率较低,影响了数据查询效率,而在另一种方案中,数据查询节点以逐个数据的获取方式从各个数据缓存节点获取数据,通过渐进的方案构建最终的K个结果,然而采用这种方式获得的K个结果会有大量的数据传输次数,也影响了数据查询效率。
技术实现思路
[0004]针对现有技术存在的不足,本专利技术目的是提供区块链数据提取方法。
[0005]本专利技术的目的可以通过以下技术方案实现:区块链数据提取方法,包括如下步骤:
[0006]步骤一:新用户在用户模块进行注册,获取唯一的系统ID以及对应的唯一密钥;用户通过唯一的系统ID登陆系统,并通过对应的唯一密钥进行身份验证;
[0007]本专利技术通过系统ID信息和对应的密钥信息组合对身份进行验证,避免设备故障造成的误判;提高数据读取的私密性,避免数据被侵占,同时保证用户账号的合理使用;
[0008]步骤二:完成身份验证后,用户终端接入区块链平台,通过用户终端向对应的目标数量的区块链节点发送数据获取请求,所述数据获取请求中包括用户标识和数据属性标识;同时将接收到数据获取请求的区块链节点标记为应用节点;
[0009]步骤三:应用节点接收到数据获取请求后,按照数据获取规则向应用节点中的每一个区块链节点获取数据切片,具体为:向每个应用节点获取一个数据切片;其中数据切片中包含的对象均满足第一预设条件;所述第一预设条件为与数据获取请求中的用户标识和数据属性标识相对应;所述数据获取规则包括过滤门限和获取数量;即每个数据切片所包含对象的访问值大于所述过滤门限且所包含对象的数量不大于所述获取数量;
[0010]步骤四:对数据切片中的所有对象进行查重分析;得到对象的聚重值;具体为:
[0011]S41:对数据切片中的所有对象的关键词进行提取,当两个对象的关键词重合度大于等于预设重合度λ%,则认为这两个对象为同一对象;其中λ为预设值;
[0012]S42:对被认为是同一对象的对象进行访问值比较,将访问值最大的对象作为标准对象;
[0013]将标准对象的同一数量标记为L1;所述同一数量表示为被认为与标准对象为同一对象的对象数量;
[0014]将标准对象的节点分布数量标记为L2,所述节点分布数量表示为被认为与标准对象为同一对象的节点分布数量;
[0015]S43:利用公式GZ=L1
×
g1+L2
×
g2计算得到标准对象的聚重值GZ,其中g1、g2均为系数因子;
[0016]步骤五:按照聚重值GZ的大小对标准对象进行排序,选取排名前W1的标准对象反馈至用户终端;本专利技术通过传输包含一定量数据的数据切片的方式,降低在一次网络传输中数据的传输量,并减少网络传输轮次,进而提高了数据读取效率。
[0017]进一步地,身份验证的具体步骤包括:
[0018]S11:用户通过用户模块输入登录信息,所述登录信息包括系统ID信息和对应的唯一密钥信息;对系统ID信息和密钥信息进行信息混合,得到址钥信息组和组合特值H;所述信息混合的具体操作步骤为:
[0019]首先获取到输入登陆信息的时间戳,时间戳按照月、日、时的格式获取,对应将月日时的各个位数的数字标记为X1
‑
X6,得到时间数字组Xi,i=1,...,6;
[0020]根据公式对时间数字组进行处理,得到组合特值H;具体计算公式为:H=X1+X2+X3+X4+X5+X6;对组合特值H进行判定;当H为奇数时,此时自动将系统ID信息和密钥信息按照系统ID信息在前,密钥信息在后的方式组合,形成址钥信息组;
[0021]当H为偶数时,此时自动将系统ID信息和密钥信息按照密钥信息在前,系统ID信息在后的方式组合,形成址钥信息组;
[0022]S12:数据库中存储有字符标准本,字符标准本由字符和数值构成,每个字符对应一个唯一的数值;对址钥信息组中的字符识别,将识别的字符与字符标准本进行匹配得到字符对应的数值,将址钥信息组中的字符依照顺序转换成数值得到转换数本;对转换数本进行转换;具体为:
[0023]将转换数本的数值标记为Qi,利用公式QZi=Qi+H获取得到转换数值QZi,其中Qi与QZi一一对应;
[0024]将转换数值QZi与字符标准本进行匹配得到转换数值对应的字符,将转换数本的转换数值QZi依照顺序转换成字符得到特征信息组;
[0025]S13:数据库中存储有标准系统ID信息和对应的标准密钥信息;获取组合特值H,对标准系统ID信息和标准密钥信息进行信息混合,得到参照信息组;对参照信息组进行字符转换,得到转换信息组;所述字符转换方法与步骤S12一致;
[0026]S14:将转换信息组与特征信息组进行比较,若二者一致,则产生一通信号;
[0027]S15:将系统ID信息和对应的密钥信息与标准系统ID信息和标准密钥信息进行比对,若比对一致,则产生二通信号;
[0028]当同时产生一通信号和二通信号时,则身份验证成功。
[0029]进一步地,所述对应的目标数量的获取方法为:
[0030]S21:获取数据获取请求,结合数据库对数据获取请求中的用户标识和数据属性标
识进行特值赋予过程,得到对应数据获取请求的特值;所述特值赋予过程的具体步骤为:
[0031]首先获取到数据获取请求中的用户标识和数据属性标识;所述数据库内存储有身份信息与身份特值的对照表,以及数据属性信息与属性特值的对照表;
[0032]根据用户标识确定用户的身份信息;根据数据属性标识确定数据属性信息;根据对照表,确定与身份信息对应的身份特值;同时根据对照表,确定与数据属性信息对应的属性特值,将身份特值与属性特值进行求和得到对应数据获取请求的特值,并标记为T1;
[0033]S22:将发送数据获取请求的用户终端标记为i;采集用户终端i在系统当前时间前三十天的数据请求记录;所述数据请求记录包括请求是否成功和每次请求的发送时本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.区块链数据提取方法,包括如下步骤:步骤一:新用户在用户模块进行注册,获取唯一的系统ID以及对应的唯一密钥;用户通过唯一的系统ID登陆系统,并通过对应的唯一密钥进行身份验证;其特征在于,步骤二:完成身份验证后,用户终端接入区块链平台,通过用户终端向对应的目标数量的区块链节点发送数据获取请求,同时将接收到数据获取请求的区块链节点标记为应用节点;步骤三:应用节点接收到数据获取请求后,按照数据获取规则向应用节点中的每一个区块链节点获取数据切片,所述数据获取规则包括过滤门限和获取数量;即每个数据切片所包含对象的访问值大于所述过滤门限且所包含对象的数量不大于所述获取数量;步骤四:对数据切片中的所有对象进行查重分析,得到对象的聚重值GZ;按照聚重值GZ的大小对标准对象进行排序,选取排名前W1的标准对象反馈至用户终端。2.根据权利要求1所述的区块链数据提取方法,其特征在于,所述对应的目标数量的获取方法为:获取数据获取请求,结合数据库对数据获取请求中的用户标识和数据属性标识进行特值赋予过程,得到对应数据获取请求的特值,并标记为T1;将发送数据获取请求的用户终端标记为i;采集用户终端i在系统当前时间前三十天的数据请求记录;统计用户终端i的请求总次数并标记为C1,将请求失败次数与请求总次数进行比值计算得到请求失败率CX。3.根据权利要求2所述的区块链数据提取方法,其特征在于,将用户终端所有的请求发送时刻依据时间先后顺序进行排序;将排序后的相邻两个请求发送时刻进行时间差计算得到单次请求间隔时长;将单次请求间隔时长与间隔时长阈值相比较并经过相关处理,得到间隔影响系数GQ;利用公式QX=(T1
×
a3+C1
×
a4+GQ
【专利技术属性】
技术研发人员:唐为玮,
申请(专利权)人:合肥盈帆网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。