一种基于环境自适应的区块链节点信用评价方法技术

技术编号:38944280 阅读:20 留言:0更新日期:2023-09-25 09:41
本发明专利技术提供一种基于环境自适应的区块链节点信用评价方法,涉及区块链节点信用评价领域,包括步骤:利用DQN算法对区块链节点进行分片并选择各分片的领导节点;设计节点信用评价算法,通过对照DQN算法选择的领导节点对节点信用评价算法进行调整;在区块链节点中部署节点信用评价算法并实时对节点进行评价,当领导节点性能下降可能影响系统稳定性时用片内评价最优的节点对当前领导节点进行替换。本发明专利技术通过DQN算法为区块链系统选择了能使共识算法在当前部署环境下性能最优的分片方案与各分片的领导节点;同时通过领导节点选择结果对节点信用评价算法进行调整,以在区块链系统运行过程中选出能使区块链性能在当前部署环境下最优的领导节点。最优的领导节点。最优的领导节点。

【技术实现步骤摘要】
一种基于环境自适应的区块链节点信用评价方法


[0001]本专利技术专利技术属于区块链节点信用评价领域,尤其涉及一种基于环境自适应的区块链节点信用评价方法。

技术介绍

[0002]区块链是一种分布式账本技术,它通过密码学、共识机制、智能合约等技术实现了去中心化、防篡改、可追溯等特点。其中区块链的共识机制的作用是保证区块链中各节点的一致性,它的优劣直接影响了区块链的性能。常见的区块链共识算法包括工作量证明(PoW)算法、委托股权证明(DPoS)算法、实用拜占庭容错(PBFT)算法等,它们可以解决不同场景下的区块链节点一致性问题。但是当区块链节点数量增加时,共识算法的通信复杂度提升,会导致区块链系统出现延迟升高、吞吐量下降、中心化程度增加等等问题,这限制了区块链在更广泛领域的应用。为了解决上述问题,可以利用分片技术,即通过聚类算法将区块链节点分隔成多个并行的子系统,进而提升共识算法的可拓展性以及区块链系统的去中心化程度。但是这也带来了各分片间数据不一致性的风险,因为各分片的领导节点若发生故障或作恶都会导致该分片中的节点无法完成共识以及与其它分片节点的同步,在这种情况下各分片的领导节点是否可靠就影响了整个区块链系统的稳定性。
[0003]目前常见的方案是设计一种针对区块链节点的节点信用评价算法来综合评价节点历史表现、节点网络环境、节点工作负载等因素对节点的影响,并使用该算法来选择各分片的领导节点。但是,这种评价方法只可以做到避免将可靠性低的节点选为领导节点,并不能保证选出的是能使共识算法性能最优的节点。因为评价算法中不同因素的权重设置会导致最终选出的领导节点不一样,而算法中不同因素的权重是和环境密切相关的,目前的方案缺乏根据部署环境不同来对评价算法中各因素权重进行调整的设计。
[0004]通过上述分析,现有的解决方法存在的问题及缺陷为:
[0005]由于在不同的部署环境中,节点网络环境、节点工作负载等因素对节点的影响可能是不同的,比如当区块链部署在网络环境复杂的场景时评价算法中网络环境影响的权重就应该提升,当部署在节点算力弱或节点任务负载较重的系统时则应该提升节点负载影响的权重。所以当前的算法难以在不同部署环境下准确评估节点的信用,因为不同信用计算公式对节点的信用评估结果是不同的。
[0006]解决上述问题及缺陷的困难在于:一,确定当前部署环境中哪些节点是能够让共识算法性能最优的节点。由于节点信用评价算法不能准确评估当前部署环境下各影响因素的权重,也就难以确定各集群的领导节点,因为不同信用计算公式对节点的信用评估结果是不同的。二,如何确定评价机制中各要素的权重。不同部署环境下节点历史表现、节点网络环境、节点工作负载对节点选择的影响是不同的,需要找到方法来根据环境不同调整信用计算公式中各因素的权重。
[0007]解决上述问题的意义为:共识算法的性能优劣决定了区块链性能的优劣。当区块链的部署场景中节点数量多、部署分散的场景时,分片技术可以提升区块链的吞吐量和可
扩展性。而为了区块链系统的稳定性,保证各分片的数据一致性,就需要为各分片选出可靠的领导节点。而区块链的部署环境多样,如何在不同的部署环境下选择区块链系统各分片的领导节点是当前亟待解决的问题。

技术实现思路

[0008]为解决现有技术存在的问题,本专利技术采用以下技术方案:
[0009]一种基于环境自适应的区块链节点信用评价方法,包括以下步骤:
[0010]利用DQN算法对区块链节点进行分片并选择各分片的领导节点;
[0011]设计节点信用评价算法,通过对照DQN算法选择的领导节点对节点信用评价算法进行调整;
[0012]在区块链节点中部署节点信用评价算法并实时对节点进行评价,当领导节点性能下降可能影响系统稳定性时用片内评价最优的节点对当前领导节点进行替换;
[0013]其中,所述利用DQN算法对区块链节点进行分片并选择各分片的领导节点,具体包括:
[0014]明确将要参与共识的节点;
[0015]对参与共识的节点进行预分片,并在每一分片中随机选择领导节点;所述领导节点负责片内共识与片间共识;
[0016]将节点评价与领导节点选择问题转化为马尔可夫决策问题,并确定马尔可夫决策问题模型的参数;
[0017]利用DQN算法对马尔可夫决策问题模型进行训练,获得决策网络;
[0018]利用所述决策网络对区块链节点进行分片以及选择各分片领导节点。
[0019]作为优选实施例,所述明确将要参与共识的节点,具体包括:
[0020]随机挑选一个节点N0作为领导节点,开始广播探测信号,其余节点收到探测信号后进行回复,领导节点确认全部参与共识的节点,将参与共识的节点编号为{1,2,3,...,N0}并将节点编号同步至其它节点。
[0021]作为优选实施例,所述马尔可夫决策问题模型的参数包括状态空间S
t
、动作空间A
t
、奖励函数R
t
以及每次动作与区块链系统交互时间Time。
[0022]作为优选实施例,所述状态空间S
t
表示为:
[0023]S
t
={M
t
,L
t
,P
t
,D
t
,W
t
};
[0024]其中,t为时间步,M
t
是时间步t每个分片领导节点在交互时间Time接收到的数据数的平均值,L
t
是时间步t各分片领导节点的编号,D
t
是时间步t中各分片中从节点计算与组内其它节点通信延迟的均值,W
t
是时间步t领导节点的工作负载的均值;
[0025]所述动作空间A
t
包括各分片中各节点的编号以及领导节点的编号;
[0026]所述奖励函数R
t
表示为:
[0027][0028]其中为每一分片中领导节点与分片内其它节点的通信延迟的平均值,为每一分片领导节点处理数据所用时间的平均值,M
t
为所用时间中上传数据量。
[0029]作为优选实施例,所述利用DQN算法对马尔可夫决策问题模型进行训练,获得决策
网络,具体包括:
[0030]S141、初始化DQN算法的训练网络Q与目标网络Q

的参数;
[0031]S142、计算状态空间S
t
,根据训练网络Q以ε

贪婪策略选择动作执行,即对各分片节点以及领导节点进行调整,经过与区块链系统交互后更新奖励函数R
t
和状态向量S
t+1

[0032]S143、将经验序列(S
t
,A
t
,R
t
,S
t+1
)存入经验集合D,判断经验集合D中的数据量是否已经达到预设阈值,若未达到预期则返回步骤本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于环境自适应的区块链节点信用评价方法,其特征在于:包括以下步骤:利用DQN算法对区块链节点进行分片并选择各分片的领导节点;设计节点信用评价算法,通过对照DQN算法选择的领导节点对节点信用评价算法进行调整;在区块链节点中部署节点信用评价算法并实时对节点进行评价,当领导节点性能下降可能影响系统稳定性时用片内评价最优的节点对当前领导节点进行替换;其中,所述利用DQN算法对区块链节点进行分片并选择各分片的领导节点,具体包括:明确将要参与共识的节点;对参与共识的节点进行预分片,并在每一分片中随机选择领导节点;所述领导节点负责片内共识与片间共识;将节点评价与领导节点选择问题转化为马尔可夫决策问题,并确定马尔可夫决策问题模型的参数;利用DQN算法对马尔可夫决策问题模型进行训练,获得决策网络;利用所述决策网络对区块链节点进行分片以及选择各分片领导节点。2.根据权利要求1所述的基于环境自适应的区块链节点信用评价方法,其特征在于:所述明确将要参与共识的节点,具体包括:随机挑选一个节点N0作为领导节点,开始广播探测信号,其余节点收到探测信号后进行回复,领导节点确认全部参与共识的节点,将参与共识的节点编号为{1,2,3,...,N0}并将节点编号同步至其它节点。3.根据权利要求1所述的基于环境自适应的区块链节点信用评价方法,其特征在于:所述马尔可夫决策问题模型的参数包括状态空间S
t
、动作空间A
t
、奖励函数R
t
以及每次动作与区块链系统交互时间Time。4.根据权利要求3所述的基于环境自适应的区块链节点信用评价方法,其特征在于:所述状态空间S
t
表示为:S
t
={M
t
,L
t
,P
t
,D
t
,W
t
};其中,t为时间步,M
t
是时间步t每个分片领导节点在交互时间Time接收到的数据数的平均值,L
t
是时间步t各分片领导节点的编号,D
t
是时间步t中各分片中从节点计算与组内其它节点通信延迟的均值,W
t
是时间步t领导节点的工作负载的均值;所述动作空间A
t
包括各分片中各节点的编号以及领导节点的编号;所述奖励函数R
t
表示为:其中为每一分片中领导节点与分片内其它节点的通信延迟的平均值,为每一分片领导节点处理数据所用时间的平均值,M
t
为所用时间中上传数据量。5.根据权利要求1所述的基于环境自适应的区块链节点信用评价方法,其特征在于:所述利用DQN算法对马尔可夫决策问题模型进行训练,获得决策网络,具体包括:S141、初始化DQN算法的训练网络Q与目标网络Q

的参数;S142、计算状态空间S
t
,根据训练网络Q以ε

贪婪策略选择动作执行,即对各分片节点以及领导节点进行调整,经过与区块链系统交互后更新奖励函数R
t
...

【专利技术属性】
技术研发人员:裴庆祺张一帆吴志辉
申请(专利权)人:广州链融信息技术有限公司佛山链融新技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1