System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 区块链隐私保护下的用户细分方法与系统技术方案_技高网
当前位置: 首页 > 专利查询>扬州大学专利>正文

区块链隐私保护下的用户细分方法与系统技术方案

技术编号:44265416 阅读:0 留言:0更新日期:2025-02-14 22:08
本发明专利技术公开了一种区块链隐私保护下的用户细分方法与系统,融合本地化差分隐私机制与区块链技术的数据存储架构,旨在确保用户数据安全的同时,有效规避隐私泄露的风险。在此基础上,设计并实现了一种基于密度距离度量的聚类算法,即KDE‑KMeans算法。在该算法中,引入了密度距离评分作为评估样本与聚类中心相似性的核心指标。此评分机制不仅充分考量了传统距离因素作为主导相似度判定的基石,还将样本间的密度差异作为辅助评估维度纳入考量范畴,从而构建了一个更为全面且细致的相似性评估框架。与现有技术相比,本发明专利技术在聚类准确性的评估上,显著优于传统基于距离的聚类算法,充分验证了该算法在复杂数据环境下的有效性和适用性。

【技术实现步骤摘要】

本专利技术属于用户聚类领域,具体涉及一种区块链隐私保护下的用户细分方法与系统


技术介绍

1、在当今数字化时代,随着信息技术的飞速发展和数据量的爆炸式增长,数据已成为推动社会进步和经济发展的新动力。企业和机构通过收集和分析大量数据,可以更好地理解市场趋势、优化产品服务和提升客户满意度。随着市场竞争的加剧,企业亟需通过深入的客户洞察来制定更为精准的市场策略。个性化服务已经成为了数字化产品和服务的重要趋势。而实现个性化服务的核心在于对用户进行有效的细分和分析,以了解用户的偏好和行为模式。

2、然而,在个人敏感信息泄露频发的背景下,数据的广泛应用也带来了严重的隐私保护问题。聚类过程中同样面临着聚类准确性不高,效果不佳的现象。因此如何在利用数据进行准确聚类的同时保护用户的隐私安全成为了一个亟需解决的问题。


技术实现思路

1、专利技术目的:针对上述现有技术的不足,本专利技术目的在于提供一种区块链隐私保护下的用户细分方法与系统,融合本地化差分隐私机制与区块链技术的数据存储架构,旨在确保用户数据安全的同时,有效规避隐私泄露的风险。在此基础上,设计并实现了一种基于密度距离度量的聚类算法,以提高聚类算法在复杂数据环境下的有效性和适用性。

2、技术方案:为实现上述专利技术目的,本专利技术采用如下技术方案:区块链隐私保护下的用户细分方法,包括以下步骤:

3、获取用户数据,使用差分隐私算法对用户数据进行加噪处理;

4、将加噪后的用户数据经过共识后上链;>

5、获取链上数据,并使用ked-kmeans聚类算法实现用户细分,所述ked-kmeans聚类算法运用基于高斯核函数的核密度估计找到密度峰值来初始化聚类中心,并使用密度距离评分来衡量样本与聚类中心的相似性,所述密度距离评分为归一化距离和密度差加权和;所述距离为欧几里得距离,所述密度差为基于高斯核函数估计的核密度差。

6、进一步地,所述使用差分隐私算法对用户数据进行加噪处理时,选择拉普拉斯分布对数据进行加噪。

7、进一步地,核密度估计公式为:其中,x是评估点,sj是样本点,h是带宽,k(·)是高斯核函数,n是样本的总数。

8、进一步地,密度距离评分公式为:

9、fd(s,c)=dnor(si,c)*λ+fnor(si,c)*(1-λ)

10、其中λ∈(0,1)为权重系数,dnor(si,c)和fnor(si,c)为样本点si与聚类中心c的归一化距离和密度差。

11、进一步地,所述密度距离评分中,以距离作为影响相似性的主要因素,以密度差作为影响相似性的次要因素。

12、进一步地,所述ked-kmeans聚类算法,包括如下步骤:

13、(1)对用户数据集s进行多维核密度估计,计算每个用户样本点si的核密度值f(si)

14、(2)初始化kde-kmeans算法聚类中心,包括:

15、(2.1)找到核密度值最大的用户样本点作为第一个聚类中心;

16、(2.2)对于用户数据集中的每一个用户样本si,计算它与最近一个已选聚类中心c的距离d(si,c);

17、(2.3)以概率选择新的聚类中心ci;

18、(2.4)重复步骤(2.2)至(2.3)直到选择出所有k个中心;

19、(3)每个用户样本点被分配到与之密度距离评分最小的中心点,形成k个聚类;

20、(4)对于每个聚类,计算聚类内所有用户样本点的均值,并将此均值作为新的聚类中心ci,并计算新聚类中心的核密度值f(ci);

21、(5)重复步骤(3)至(4),直到聚类中心不再发生变化,或者达到预设的迭代次数或精度要求。

22、区块链隐私保护下的用户细分系统,包括:

23、数据隐私处理模块,用于获取用户数据,使用差分隐私算法对用户数据进行加噪处理;

24、区块链存储模块,用于将加噪后的用户数据经过共识后上链;

25、以及用户细分模块,用于获取链上数据,并使用ked-kmeans聚类算法实现用户细分,所述ked-kmeans聚类算法运用基于高斯核函数的核密度估计找到密度峰值来初始化聚类中心,并使用密度距离评分来衡量样本与聚类中心的相似性,所述密度距离评分为归一化距离和密度差加权和;所述距离为欧几里得距离,所述密度差为基于高斯核函数估计的核密度差。

26、一种计算机系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序/指令,所述计算机程序/指令被处理器执行时实现所述的区块链隐私保护下的用户细分方法的步骤。

27、一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述的区块链隐私保护下的用户细分方法的步骤。

28、一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现所述的区块链隐私保护下的用户细分方法的步骤。

29、有益效果:与现有技术相比,本专利技术具有如下优点:本专利技术所述的区块链隐私保护下的用户细分方法,在聚类准确性的评估上,所提kde-kmeans算法显著优于现有的传统算法。由于区块链隐私保护下用户数据的多样性,在形成数据样本时的各个簇密度并不均衡,本专利技术在处理那些簇间密度差异显著的样本数据时,其优势尤为突出,充分表明了本专利技术在复杂数据环境下的有效性和适用性。

本文档来自技高网...

【技术保护点】

1.区块链隐私保护下的用户细分方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的区块链隐私保护下的用户细分方法,其特征在于,所述使用差分隐私算法对用户数据进行加噪处理时,选择拉普拉斯分布对数据进行加噪。

3.根据权利要求1所述的区块链隐私保护下的用户细分方法,其特征在于,核密度估计公式为:其中,x是评估点,sj是样本点,h是带宽,K(·)是高斯核函数,n是样本的总数。

4.根据权利要求1所述的区块链隐私保护下的用户细分方法,其特征在于,密度距离评分公式为:

5.根据权利要求1所述的区块链隐私保护下的用户细分方法,其特征在于,所述密度距离评分中,以距离作为影响相似性的主要因素,以密度差作为影响相似性的次要因素。

6.根据权利要求1所述的区块链隐私保护下的用户细分方法,其特征在于,所述KED-KMeans聚类算法,包括如下步骤:

7.区块链隐私保护下的用户细分系统,其特征在于,包括:

8.一种计算机系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序/指令,其特征在于,所述计算机程序/指令被处理器执行时实现根据权利要求1-6任一项所述的区块链隐私保护下的用户细分方法的步骤。

9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现根据权利要求1-6任一项所述的区块链隐私保护下的用户细分方法的步骤。

10.一种计算机程序产品,包括计算机程序/指令,其特征在于,所述计算机程序/指令被处理器执行时实现根据权利要求1-6任一项所述的区块链隐私保护下的用户细分方法的步骤。

...

【技术特征摘要】

1.区块链隐私保护下的用户细分方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的区块链隐私保护下的用户细分方法,其特征在于,所述使用差分隐私算法对用户数据进行加噪处理时,选择拉普拉斯分布对数据进行加噪。

3.根据权利要求1所述的区块链隐私保护下的用户细分方法,其特征在于,核密度估计公式为:其中,x是评估点,sj是样本点,h是带宽,k(·)是高斯核函数,n是样本的总数。

4.根据权利要求1所述的区块链隐私保护下的用户细分方法,其特征在于,密度距离评分公式为:

5.根据权利要求1所述的区块链隐私保护下的用户细分方法,其特征在于,所述密度距离评分中,以距离作为影响相似性的主要因素,以密度差作为影响相似性的次要因素。

6.根据权利要求1所述的区块链隐私保护下的用户细...

【专利技术属性】
技术研发人员:王嘉瑶董浩宋扬
申请(专利权)人:扬州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1