一种基于区块链和隐私保护的分布式支持向量机及其优化方法技术

技术编号:31480986 阅读:16 留言:0更新日期:2021-12-18 12:14
本发明专利技术公开了一种基于区块链和隐私保护的分布式支持向量机及其优化方法,包括:建立基于区块链的具有隐私保护的分布式支持向量机系统模型,并依据区块链共识PBFT协议完成节点间的交互过程。通过分析本地节点在训练过程及共识过程中的计算复杂度,给出基于能耗及系统能量利用率考虑的计算资源分配的优化方法。仿真结果表明,本发明专利技术的技术方案和模型在训练和共识过程中可以为节点及模型提供隐私保护,在能耗约束的条件下,通过对各节点各步骤的资源进行优化,提高系统总能量的利用率和分布式支持向量机学习过程的性能。支持向量机学习过程的性能。支持向量机学习过程的性能。

【技术实现步骤摘要】
一种基于区块链和隐私保护的分布式支持向量机及其优化方法


[0001]本专利技术涉及分布式机器学习中隐私保护、数据分配及资源分配相关
,具体来说,是一种基于区块链和隐私保护的分布式支持向量机及其优化方法,进一步涉及到结合纵向分布式数据节点、区块链中的联盟链的构建方式、PBFT共识机制与部分同态加密算法隐私保护算法的计算方法及资源分配优化方法。
技术背景
[0002]近年来,互联网数据日益增长,因此处理数据的机器学习方法应用逐渐广泛。传统机器学习方法把所有数据汇总于一台机器或是一个数据中心,由一个数据分析者进行集中式的模型训练。但由于隐私安全的问题,大多数情况下,各学习的参与方很难完全共享数据,因此存在着十分严重的“数据孤岛”问题;且在训练过程中,传统机器学习会造成隐私泄露问题;同时,由于现下处在一个互联网信息爆炸时代,单一节点去完成一个完整数据库的获取和后续的训练困难十分大。分布式机器学习的目标是将具有庞大数据和计算量的任务分布式地部署到多台机器上,以提高数据计算地速度和可扩展性,减少任务耗时。
[0003]联盟链:只针对特定某个群体的成员和有限的第三方,内部指定多个预选的节点为记账人,每个块的生成由所有的预选节点共同决定,其他接入节点可以参与交易,但不过问记账过程,其他第三方可以通过该区块链开放的API进行限定查询。为了获得更好的性能,联盟链对于共识或验证节点的配置和网络环境有一定要求。有了准入机制,可以使得交易性能更容易提高,避免由参次不齐的参与者产生的一些问题。
[0004]PBFT共识机制:PBFT是Practical Byzantine FaultTolerance的缩写,即:实用拜占庭容错算法。是一种区块链共识机制,是在联盟链共识节点较少的情况下BFT的一种解决方案。

技术实现思路

[0005]本专利技术针对已有的技术发展问题需求以及不足之处,提供了一种基于区块链和隐私保护的分布式支持向量机及其优化方法。该方法基于纵向分割数据库的分布式机器学习框架训练一个支持向量机模型,融入区块链和同态加密技术。区块链去中心化的特点可以保证本模型在进行通信过程中的安全性,同态加密技术可以保证分布式数据的隐私性;同时结合能耗公式与计算复杂度实现各节点在训练、交互与聚合的过程中的资源优化配置,以便在固定能耗的前提下,实现能量利用最大化地完成含有PBFT共识协议的训练过程。
[0006]为解决上述问题,本专利技术采用如下的技术方案:
[0007]一种基于区块链和隐私保护的分布式支持向量机及其优化方法包括以下步骤:
[0008]S1、结合区块链和隐私保护技术建立分布式支持向量机学习过程
[0009]S2、各参与节点利用智能合约完成分布式共识过程
[0010]S3、分布式支持向量机学习过程及区块链共识过程的性能分析
[0011]S4、能源约束下的资源分配优化
[0012]具体的,本专利技术采用分布式学习的框架,允许各参与节点P
i
既是原始数据的持有者,也作为分布式支持向量机学习过程的参与者。各节点各自获取具有不同属性的纵向分割数据作为原始数据;训练过程中不存在任何原始数据的交互,训练模型的中间值通过引入部分同态加密技术实现隐私保护;分类器采用利用超平面进行二分类的支持向量机(SVM)算法;最终采用PBFT共识协议规定训练与聚合交互过程,实现数据的处理。
[0013]借助智能合约将交易形式的训练参数进行传递与记录,所有节点间形成的分布式共识过程包括三类,分别为参与方对局部参数的密文反馈交易(ELW)、参与方对局部参数的聚合反馈交易(ELW

A)、参与方对聚合参数局部中间值解密交易(DGW

A)。
[0014]在本专利技术的整个系统可以被大体分为两个过程:分布式学习训练过程与区块链的共识过程。在本专利技术中,通过建立基于联盟链具有隐私保护的分布式支持向量机学习模型,详细分析各个节点P
i
在不同过程中的任务,结合计算复杂度、计算成本和损失函数优化进行固定能源下,系统总能量利用率的整体优化。
附图说明
[0015]图1为本专利技术的整体系统模型
[0016]图2为PBFT共识机制流程图
[0017]图3为分布式学习训练结果图(N=4,无优化)
[0018]图4为在不同总能量的限制条件下资源分配优化前后模型训练结果
具体实施方式
[0019]下面结合附图和实施例对本专利技术做进一步说明。
[0020]S1、结合区块链和隐私保护技术建立分布式支持向量机学习过程
[0021]S11、结合区块链建立的分布式支持向量机学习过程
[0022]图1位本专利技术的系统模型。结合区块链建立的分布式支持向量机学习过程可以被描述为:所有获取信任得到许可的参与节点被部署在区块链内,形成可信的环境。各节点利用各自获取的原始数据进行本地的局部模型训练,并加密训练出的模型中间值进行交互,利用聚合后的中间值进行判断,实现基于随机梯度下降法的SVM训练任务。
[0023]在本专利技术中,设N个参与节点的集合为P={P1,P2,

,P
N
},P
i
表示拥有子数据集的参与者,D
i
(i=1,2,

,N)表示参与方P
i
拥有的子数据集。
[0024]首先需要明确,y=(w
T
x+b)为支持向量机需要通过学习数据找到的超平面,该专利技术中,引入多个参与节点对纵向分割后的数据进行学习、聚合,其支持向量机的原始优化问题改写如下:
[0025][0026][0027]其中m为数据集的大小,为参与者P
i
的数据集中的第j条数据。
[0028]对于参与者P
i
基于随机梯度下降的SVM如式(2):
[0029][0030]对于每次迭代来说,可以根据式(3)来计算梯度:
[0031][0032]当(wx
j
<1),I[(wx
j
<1)]=1;反之,I[(wx
i
<1)]=0。根据上述判断,我们可以确定w的更新方向,利用式(4)来更新w:
[0033]w
t+1
=w
t

λΔ
t
[0034]由于本方案中虽然不需要共享原始数据,但需要通过多个参与者P
i
共享中间量,并根据式(2),共同确定模型更新方向,因此判断更新的过程如式(5):
[0035][0036]S12、结合隐私保护技术建立的分布式支持向量机学习过程
[0037]由于在多方学习的过程中,各个节点都需要涉及到与区块链共享中间值的过程,传递等中间量,期间各节点训练出的模型中间量w会在传递过程中涉及到隐私问题,为在保护隐私的同时,完成无可信第三方的通本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于区块链和隐私保护的分布式支持向量机及其优化方法,其特征在于,包括以下步骤:S1、结合区块链和隐私保护技术建立分布式支持向量机学习过程所有获取信任得到许可的参与节点被部署在区块链内,形成可信的环境;各节点利用各自获取的原始数据进行本地的局部模型训练,并加密训练出的模型中间值进行交互,利用聚合后的中间值进行判断,实现基于随机梯度下降法的SVM训练任务;S2、各参与节点利用智能合约完成分布式共识过程采用的区块链中的共识机制选用PBFT算法,通过智能合约完成将模型中间值与相关参数以交易的形式在参与节点间更新、交互并实现上链认证;共识过程中,包括三种交易类型,分别是:参与方对局部参数的密文反馈交易ELW、参与方对局部参数的聚合反馈交易ELW

A、参与方对聚合参数局部中间值解密交易DGW

A;S3、分布式学习过程及区块链共识过程的性能分析节点P
i
模型计算与共识两部分的性能分析如下:S31、分布式学习过程性能分析在分布式学习过程中,每个节点的计算能力用表示,μ1和μ2分别表示节点进行任意一步明文计算和任意一步密文计算所需要的CPU cycles;S32、区块链共识过程性能分析PBFT算法的主要包括预准备(Pre

Prepare)、准备(Prepare)和确认(Commit)三个步骤,一整套共识过程中还包括最初的请求Request和最终的回应客户端Reply两个过程;整个过程被描述为:终端将请求消息签名和MAC提交到区块链的主节点;主节点首先对收到的客户端请求消息签名和MAC进行验证;如果验证有效,则按照智能合约的约定,执行其中的计算过程,然后将符合一定数量的有效交易及计算结果打包成一个新区块,并广播给其余验证节点;各验证节点验证各自接收到的区块,验证区块和交易的签名和MAC,核实后按照智能合约要求验证交易内部的计算结果;并向所有其他验证节点发送其验证结果;当新区块内的计算结果在所有有效验证节点中依据PBFT协议达成一致后,它将被添加到区块链中;在共识过程中,每个节点的计算能力用表示;β和θ分别代表各节点生成或验证一个签名和生成或验证一个MAC需要的CPU cycles;主节点每隔时间从交易池中按顺序提取一次迭代过程的全部交易数量为K=3N;α为在主节点上调用智能合约验证所需的计算任务所消耗的CPU周期的均值;如果节点承担作为主节点的职责,则此时的如果节点承担作为主节点的职责,则此时的反之,若此时的节点只作为副节点参与共识过程,则此时的之,若此时的节点只作为副节点参与共识过程,则此时的S4、固定能源下的资源分配优化S41、资源优化方案设分布式学习迭代次数为R轮,每次迭代后得到的模型参数为w(R),引入理想损失函数F(w
*
),w
*
表示基于全部数据训练可获得的理想模型参数,将最小化可达损失函数的目标等效;
S42、资源优化方案求解当能量约束取等号时,优化目标迭代次数R取到最大值,利用约...

【专利技术属性】
技术研发人员:杨睿哲谢欣儒孙恩昌孙艳华张延华于非
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1