System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据共享和隐私保护,尤其涉及一种基于联邦学习的多私域访客画像共享与隐私保护路由方法。
技术介绍
1、随着互联网和移动设备的普及,企业积累了大量的访客数据,如何有效地利用访客数据构建全面、准确的访客画像成为一个亟待解决的问题;
2、传统的访客画像构建方法通常依赖于中心化的数据存储和处理方式,即将所有数据收集到一个中心服务器进行分析,然而,中心化的方式存在着数据孤岛、隐私泄露和数据安全等问题;
3、联邦学习作为一种分布式机器学习范式,允许多个参与方在不共享原始数据的情况下进行协作训练,有效地解决了数据孤岛和隐私保护的问题,但现有的基于联邦学习的访客画像构建方法仍存在特征敏感度量化和隐私保护机制不完善、模型聚合效率和准确性较低以及数据共享和访问控制机制不够灵活的问题;
4、因此,亟需一种方案解决现有技术中存在的问题。
技术实现思路
1、本专利技术实施例提供一种基于联邦学习的多私域访客画像共享与隐私保护路由方法,至少能解决现有技术中存在的部分问题。
2、本专利技术实施例的第一方面,提供一种基于联邦学习的多私域访客画像共享与隐私保护路由方法,包括:
3、获取多个独立私域环境中的访客画像原始数据,基于js散度计算所述访客画像原始数据中每个类别的数据对应的信息熵,得到特征敏感度量化指标,通过动态规划算法计算差分隐私预算的最优分配方案,得到差分隐私预算分配结果并构建混合噪声生成器,构建混合噪声序列并添加至所述访客画像原始数据
4、基于多层次递归神经网络和图神经网络构建混合网络结构,在所述混合网络结构中的每一层添加自适应注意力机制和残差连接机制得到特征提取网络,将所述加密特征向量添加至所述特征提取网络得到初始特征表示,基于所述初始特征表示确定数据质量评估指标,通过时序加权衰减算法计算每个独立私域环境的历史贡献度,将所述数据质量评估指标与所述历史贡献度进行加权融合得到模型聚合权重,构建双层异步联邦优化框架并基于所述模型聚合权重对所述特征提取网络进行更新和异常检测,确定有效局部模型参数并得到更新后的特征提取网络;
5、将更新后的特征提取网络和加密特征向量添加至双重自编码器结构中进行特征降维得到中间特征表示,通过稀疏自编码层进行关键特征提取并根据预先设置的特征指纹生成函数生成每个用户对应的特征指纹,计算不同特征指纹之间的相似度并进行聚类,得到初始特征簇,执行信息损失最小化算法进行用户分组,基于多层异构特征交互图和图注意力网络计算得到用户节点相似度矩阵,基于所述子密钥分量对所述用户节点相似度矩阵进行部分解密,结合多方安全计算协议聚合每个独立私域环境对应的部分解密结果,得到完整用户相似度信息并根据预先构建的分级数据访问策略为每个用户分配解密组件,结合基于分层动态密钥协商机制构建的数据传输通道进行安全共享。
6、在一种可选的实施方式中,
7、获取多个独立私域环境中的访客画像原始数据,基于js散度计算所述访客画像原始数据中每个类别的数据对应的信息熵,得到特征敏感度量化指标,通过动态规划算法计算差分隐私预算的最优分配方案,得到差分隐私预算分配结果并构建混合噪声生成器,构建混合噪声序列并添加至所述访客画像原始数据中,生成隐私保护特征向量,通过基于理想格的公钥加密算法生成全同态加密密钥对并对所述隐私保护特征向量进行加密,得到加密特征向量,对所述全同态加密密钥通过维特比算法进行门限密码分割,得到多个子密钥分量并通过分布式一致性协议将所述子密钥分量发送至所述独立私域环境包括:
8、获取多个独立私域环境中的访客画像原始数据,所述访客画像原始数据包括用户标识、年龄、性别、地域、浏览记录及购买记录;
9、计算所述访客画像原始数据中每个数据类别的概率分布与整体数据的平均分布,将所述数据类别的概率分布与所述平均分布代入库勒莱布勒散度公式,计算得到第一个散度值,将所述整体数据的概率分布与所述平均分布代入库勒莱布勒散度公式,计算得到第二个散度值,将所述第一个散度值与所述第二个散度值进行加权平均得到詹森-香农散度,将所述詹森-香农散度归一化处理得到特征敏感度量化指标;
10、构建基于动态规划的差分隐私预算分配模型,将总隐私预算设为目标约束条件,将所述特征敏感度量化指标设为优化权重,构建状态转移方程,其中所述状态转移方程的状态变量为已分配的隐私预算,决策变量为待分配的隐私预算,基于所述状态转移方程迭代计算最优子结构,得到每个数据类别的隐私预算分配值;
11、构建混合噪声生成器,所述混合噪声生成器包括拉普拉斯噪声模块与高斯噪声模块,计算每个所述数据类别的数值敏感度,将所述数值敏感度与对应的所述隐私预算分配值分别代入拉普拉斯分布函数与高斯分布函数,基于所述拉普拉斯分布函数与所述高斯分布函数计算各个所述数据类别对应的噪声强度,根据所述噪声强度通过所述混合噪声生成器对各个所述数据类别添加随机噪声,得到混合噪声序列并将所述混合噪声序列添加至所述访客画像原始数据中,得到隐私保护特征向量;
12、构建理想格密码系统的安全参数,基于所述安全参数生成两个大整数作为公钥,随机选择多项式作为私钥,将所述公钥与所述私钥组合形成所述全同态加密密钥对,选择随机噪声多项式,利用所述全同态加密密钥对中的公钥对所述隐私保护特征向量进行加密运算,得到加密特征向量;
13、将所述全同态加密密钥对中的私钥进行系数分解得到系数向量,对所述系数向量进行多项式插值运算得到多个坐标点,通过维特比算法对所述坐标点进行秘密分割,得到多个子密钥分量,通过分布式一致性协议将所述多个子密钥分量分别分发至各个所述独立私域环境。
14、在一种可选的实施方式中,
15、通过维特比算法对所述坐标点进行秘密分割,得到多个子密钥分量包括:
16、随机选择两个大于100的素数并相乘得到模数,计算所述素数减一后的最小公倍数得到私钥参数,选择具有指定阶数的生成元,所述生成元的阶数为所述模数的平方,将所述模数和所述生成元组合得到公钥;
17、为每个坐标点选择随机数,将所述坐标点的横坐标与纵坐标分别与所述生成元和所述随机数进行模幂运算,得到加密坐标点,所述加密坐标点包括加密横坐标与加密纵坐标,将所有所述加密坐标点构建形成加密坐标点矩阵;
18、构建状态转移方程,所述状态转移方程的输入变量为所述加密坐标点,所述状态转移方程的输出变量为加密路径得分,在密文域上执行动态规划计算,基于所述状态转移方程递推计算每个状态节点的最优路径得分,通过反向回溯得到全局最优加密路径,其中,所述全局最优加密路径由多个加密坐标点按照转移顺序连接构成;
19、基于所述全局本文档来自技高网...
【技术保护点】
1.基于联邦学习的多私域访客画像共享与隐私保护路由方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,获取多个独立私域环境中的访客画像原始数据,基于JS散度计算所述访客画像原始数据中每个类别的数据对应的信息熵,得到特征敏感度量化指标,通过动态规划算法计算差分隐私预算的最优分配方案,得到差分隐私预算分配结果并构建混合噪声生成器,构建混合噪声序列并添加至所述访客画像原始数据中,生成隐私保护特征向量,通过基于理想格的公钥加密算法生成全同态加密密钥对并对所述隐私保护特征向量进行加密,得到加密特征向量,对所述全同态加密密钥通过维特比算法进行门限密码分割,得到多个子密钥分量并通过分布式一致性协议将所述子密钥分量发送至所述独立私域环境包括:
3.根据权利要求2所述的方法,其特征在于,通过维特比算法对所述坐标点进行秘密分割,得到多个子密钥分量包括:
4.根据权利要求1所述的方法,其特征在于,基于多层次递归神经网络和图神经网络构建混合网络结构,在所述混合网络结构中的每一层添加自适应注意力机制和残差连接机制得到特征提取网络,将所述加密特征向量添加至
5.根据权利要求4所述的方法,其特征在于,所述历史贡献度对应的计算公式如下:
6.根据权利要求1所述的方法,其特征在于,将更新后的特征提取网络和加密特征向量添加至双重自编码器结构中进行特征降维得到中间特征表示,通过稀疏自编码层进行关键特征提取并根据预先设置的特征指纹生成函数生成每个用户对应的特征指纹,计算不同特征指纹之间的相似度并进行聚类,得到初始特征簇,执行信息损失最小化算法进行用户分组,基于多层异构特征交互图和图注意力网络计算得到用户节点相似度矩阵,基于所述子密钥分量对所述用户节点相似度矩阵进行部分解密,结合多方安全计算协议聚合每个独立私域环境对应的部分解密结果,得到完整用户相似度信息并根据预先构建的分级数据访问策略为每个用户分配解密组件,结合基于分层动态密钥协商机制构建的数据传输通道进行安全共享包括:
7.根据权利要求6所述的方法,其特征在于,通过安全多方计算协议将每个私域环境的部分解密结果进行聚合,基于角色访问控制模型构建分级数据访问策略,将用户划分为不同的权限级别包括:
8.基于联邦学习的多私域访客画像共享与隐私保护路由系统,用于实现前述权利要求1-7中任一项所述的方法,其特征在于,包括:
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至7中任意一项所述的方法。
...【技术特征摘要】
1.基于联邦学习的多私域访客画像共享与隐私保护路由方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,获取多个独立私域环境中的访客画像原始数据,基于js散度计算所述访客画像原始数据中每个类别的数据对应的信息熵,得到特征敏感度量化指标,通过动态规划算法计算差分隐私预算的最优分配方案,得到差分隐私预算分配结果并构建混合噪声生成器,构建混合噪声序列并添加至所述访客画像原始数据中,生成隐私保护特征向量,通过基于理想格的公钥加密算法生成全同态加密密钥对并对所述隐私保护特征向量进行加密,得到加密特征向量,对所述全同态加密密钥通过维特比算法进行门限密码分割,得到多个子密钥分量并通过分布式一致性协议将所述子密钥分量发送至所述独立私域环境包括:
3.根据权利要求2所述的方法,其特征在于,通过维特比算法对所述坐标点进行秘密分割,得到多个子密钥分量包括:
4.根据权利要求1所述的方法,其特征在于,基于多层次递归神经网络和图神经网络构建混合网络结构,在所述混合网络结构中的每一层添加自适应注意力机制和残差连接机制得到特征提取网络,将所述加密特征向量添加至所述特征提取网络得到初始特征表示,基于所述初始特征表示确定数据质量评估指标,通过时序加权衰减算法计算每个独立私域环境的历史贡献度,将所述数据质量评估指标与所述历史贡献度进行加权融合得到模型聚合权重,构建双层异步联邦优化框架并基于所述模型聚合权重对所述特征提取网络进行更新和异常检测,确定有效局部模型参数并...
【专利技术属性】
技术研发人员:于惊涛,广宇昊,曾黎,傅强,
申请(专利权)人:北京易汇众盟网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。