System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于双区块链的联邦学习加密数据审计方法及其系统技术方案_技高网

一种基于双区块链的联邦学习加密数据审计方法及其系统技术方案

技术编号:43396837 阅读:5 留言:0更新日期:2024-11-19 18:13
本发明专利技术公开了一种基于双区块链的联邦学习加密数据审计方法,使用双区块链的结构对联邦学习的客户端梯度进行审计,其中行为区块链负责记录交易信息与为梯度密文添加噪声,审计区块链负责实施审计算法对梯度集合进行核查,使用改良国密SM9算法对客户端梯度数据进行同态加密,所述审计算法针对一个梯度方阵,通过“先整体、后逐行逐列、最后单个梯度”的方法逐步缩小审计范围来定位威胁梯度。本发明专利技术通过区块链与同态加密技术对联邦学习过程中存在的投毒攻击、搭便车攻击等梯度攻击进行高准确率的审计,同时使用双区块链的结构,优化了审计资源配置,降低故障损失。

【技术实现步骤摘要】

本专利技术涉及一种基于双区块链的联邦学习加密数据审计方法及其系统,通过双区块链的结构与联邦学习的架构实现数据隐私保护,利用改良的国密算法sm9进行同态加密,设计审计算法审计模型训练过程中存在的梯度攻击威胁,属于人工智能安全领域。


技术介绍

1、审计是一种系统性的、独立的评估和检查活动,旨在验证和评估组织、系统、过程、项目或账务的准确性、合规性和可靠性。审计在各个领域和行业中扮演着重要的角色,它有助于确保数据的准确性和可靠性,并保护利益和资产,随着信息化建设与大数据时代发展,审计也被广泛应用于机器学习领域。作为分布式隐私保护机器学习新范式,联邦学习可能存在一些非可信参与方,它们可能试图通过提供虚假或损坏的加密梯度来干扰或破坏联邦学习过程。针对联邦学习中的加密梯度数据进行审计,定位存在的投毒攻击与搭便车攻击恶意梯度,对于维护模型学习效果是十分必要的。

2、然而,传统数据审计方法依赖于中心化的审计机构或第三方来验证数据和计算的准确性和合法性。这种中心化的信任模型可能引入单点故障,一旦审计机构或第三方受到攻击或操纵,审计结果可能受到质疑或篡改。此外,传统审计方法通常缺乏透明度,审计过程和结果对于参与者来说不可见或不可验证,从而可能导致对审计结果的怀疑和不信任。且传统的数据审计方法需要访问原始数据或解密数据才能进行审计,这与联邦学习的数据保留本地特性相悖,给参与成员带来了数据安全和隐私的风险。此外,传统数据审计方法无法有效地激励联邦学习中参与方合作并惩罚参与方的不当行为,不利于模型收敛。

3、区块链技术的出现为联邦学习的数据审计提供了新的可能性。区块链是一个去中心化、不可篡改的分布式账本,可以记录和验证交易和数据的完整性。文献《blockchainassisted federated learning for enabling network edge intelligence》通过利用区块链技术实现参与节点的审计,保证联邦学习过程的可靠性,并设计了一个匹配审计机制以避免隐私泄露。同态加密技术允许在加密状态下对数据进行计算操作,而无需解密数据本身,为联邦学习加密梯度的审计也提供了重要支持,如文献《blockchain andhomomorphic encryption based privacy-preserving model aggregation for medicalimages》即利用同态加密与区块链实现对隐私敏感模型的安全聚合。然而,在现有的方法中,使用单个区块链进行审计存在性能限制、故障风险大、资源利用率低等问题。

4、国密算法,以sm系列密码为代表,相比于国际主流的rsa算法,具有更高的效率、更低的功耗,然而国密算法不具有同态性质,在隐私保护时不占优势。2022年的文章《基于国密sm2和sm9的加法同态加密方案》实现了国密算法的加法同态,然而这种改良方法尚没有应用落地,且该方法中,密钥的生成依赖于kgc,不适用于联邦场景中多个加密方且对隐私保护需求极高的情境。

5、现有的联邦学习数据审计方法依赖于中心化的审计机构或第三方,可能引入单点故障和信任问题。且传统数据审计方法需要访问原始数据或解密数据,与联邦学习的数据保留本地特性相冲突,增加数据安全和隐私风险。引入区块链的审计方法则存在性能限制、故障风险大、资源利用率低等问题。最新的实现同态加密的改良国密算法却尚未落地应用且集中式生成密钥不易获得联邦成员信任。


技术实现思路

1、本专利技术的目的在于提供一种能够进行数据隐私保护、确保参与方公平与安全、高效利用资源的联邦学习数据审计方法,包括客户端模块、服务器端模块、行为区块链模块以及审计区块链模块,所述审计方法在四大模块按照一定步骤循环进行,直到模型训练收敛。本专利技术能够有效审计联邦学习中的梯度攻击威胁,并且合理分配了区块链的资源配置,具有较低的故障损失,使用改良国密算法分布式生成密钥且执行同态加密,密码效率更高、功耗更小、贴切分布式多用户情境。

2、本专利技术首先公开了一种基于双区块链的联邦学习加密数据审计方法,使用双区块链的结构对联邦学习的客户端梯度进行审计,其中行为区块链负责记录交易信息与为梯度密文添加噪声,审计区块链负责实施审计算法对梯度集合进行核查,使用改良sm9算法对客户端梯度数据进行同态加密,所述审计算法针对一个梯度方阵,通过“先整体、后逐行逐列、最后单个梯度”的方法逐步缩小审计范围来定位威胁梯度。本专利技术所述方法的主要步骤包括:

3、步骤s1、服务器分发全局模型给审计区块链与各客户端,分发测试数据集给审计区块链;

4、步骤s2、客户端训练得到本地数据梯度,用改良国密sm9算法进行同态加密,调用智能合约计算测试数据集上的模型损失,向行为区块链提交梯度密文和损失;

5、步骤s3、行为区块链为梯度密文添加噪声并记录交易信息,将密文与损失转交给审计区块链;

6、步骤s4、审计区块链聚合梯度,审计梯度组合并逐步缩小范围,定位恶意数据;

7、步骤s5、服务器端聚合审计区块链,进行全局模型更新;

8、方法循环上述5个步骤,直到全局模型收敛,训练结束。

9、步骤s2中,针对每个客户端,将需要加密的本地梯度数据设为m,经过改良sm9算法,得到梯度密文c=(c1,c2,c3),主要步骤包括:

10、步骤s2.1、为模n乘法群,kgc随机生成作为加密主私钥,根据sharmir门限秘密共享方案,随机构造t-1次多项式f(x)∈zq[x]:

11、f(x)=msk+a1x+a2x2+…+at-1xt-1

12、其中msk=f(0),a1,a2,...,at-1∈zq;

13、步骤s2.2、随机选取n个元素x1,x2,...,xn∈zq,n为联邦成员的个数,计算mski=f(xi),将(xi,mski)分别分发给联邦成员clienti(i=1,2,...,n);

14、步骤s2.3、n名成员中的t位分享自己分得的密钥碎片mski以复原msk:

15、

16、步骤s2.4、设g1,g2为阶为素数n的加法循环群,p1,p2是它们的生成元,根据恢复的全局主私钥msk,计算全局主公钥:

17、mpk=[msk]p1

18、步骤s2.5、设解密方即审计区块链的标识为id,hid为加密私钥生成函数标识符,kgc在有限域fn上计算:

19、t1=h1(id||hid,n)+msk

20、t2=msk·t1-1

21、审计区块链以此得到解密私钥:

22、skid=[t2]p2

23、步骤s2.6、定义密码杂凑函数:

24、

25、计算群g中的元素qb=h1(id||hid,n)p1+mpk;

26、步骤s2.7、生成随机数计算群g1中的元素c1=[r]qb;

27、步骤s2.8、gt为阶为素数n的乘法本文档来自技高网...

【技术保护点】

1.一种基于双区块链的联邦学习加密数据审计方法,其特征在于使用双区块链的结构对联邦学习的客户端梯度进行审计,其中行为区块链负责记录交易信息与为梯度密文添加噪声,审计区块链负责实施审计算法对梯度集合进行核查,对客户端梯度数据进行同态加密,使用改良后分布式生成密钥且具有了加法同态加密功能的国密SM9算法来实现加密,所述审计算法针对一个梯度方阵,通过“先整体、后逐行逐列、最后单个梯度”的方法逐步缩小审计范围来定位威胁梯度。

2.根据权利要求1所述的基于双区块链的联邦学习加密数据审计方法,其特征在于所述方法包括:

3.根据权利要求2所述的基于双区块链的联邦学习加密数据审计方法,其特征在于,步骤S2中,使用改良国密SM9算法对本地梯度进行同态加密,步骤包括:

4.根据权利要求2所述的基于双区块链的联邦学习加密数据审计方法,其特征在于,步骤S3中,行为区块链为梯度密文添加噪声,步骤包括:

5.根据权利要求2所述的基于双区块链的联邦学习加密数据审计方法,其特征在于,步骤S4中,审计区块链聚合梯度,审计梯度组合并逐步缩小范围,定位恶意数据,主要步骤包括:

6.一种基于双区块链的联邦学习加密数据审计系统,其特征在于,该系统用于实现权利要求1~5任一项所述的基于双区块链的联邦学习加密数据审计方法,所述系统包括客户端模块、行为区块链模块、审计区块链模块和服务器模块;

7.一种移动终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~5任一项所述的基于双区块链的联邦学习加密数据审计方法。

8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1~5任一项所述的基于双区块链的联邦学习加密数据审计方法中的步骤。

...

【技术特征摘要】

1.一种基于双区块链的联邦学习加密数据审计方法,其特征在于使用双区块链的结构对联邦学习的客户端梯度进行审计,其中行为区块链负责记录交易信息与为梯度密文添加噪声,审计区块链负责实施审计算法对梯度集合进行核查,对客户端梯度数据进行同态加密,使用改良后分布式生成密钥且具有了加法同态加密功能的国密sm9算法来实现加密,所述审计算法针对一个梯度方阵,通过“先整体、后逐行逐列、最后单个梯度”的方法逐步缩小审计范围来定位威胁梯度。

2.根据权利要求1所述的基于双区块链的联邦学习加密数据审计方法,其特征在于所述方法包括:

3.根据权利要求2所述的基于双区块链的联邦学习加密数据审计方法,其特征在于,步骤s2中,使用改良国密sm9算法对本地梯度进行同态加密,步骤包括:

4.根据权利要求2所述的基于双区块链的联邦学习加密数据审计方法,其特征在于,步骤s3中,行为区块链为梯度密文添...

【专利技术属性】
技术研发人员:张璐
申请(专利权)人:南京审计大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1