System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种数字化商品运营平台数据安全保护方法技术_技高网

一种数字化商品运营平台数据安全保护方法技术

技术编号:42331800 阅读:5 留言:0更新日期:2024-08-14 16:08
本发明专利技术涉及数据安全保护技术领域,具体涉及一种数字化商品运营平台数据安全保护方法。该方法包括:获取流程数据;根据所有用户在同一维度的流程数据的字符分布和数据长度,确定每一维度的区分度;根据区分度从流程数据中筛选得到低区分数据,处理得到低区分白化矩阵;确定没维度的原始统计序列;基于预设单位向量进行数据分解,得到分解数据,确定分解统计序列;对每一维度的原始统计序列与分解统计序列进行相似分析,确定最优的预设单位向量;将最优的预设单位向量所对应所有维度的分解数据组成分量矩阵,对分量矩阵进行数据加密,得到加密数据。本发明专利技术实施例能够在保留统计特性的同时,提升数据的安全性和可靠性。

【技术实现步骤摘要】

本专利技术涉及数据安全保护,具体涉及一种数字化商品运营平台数据安全保护方法


技术介绍

1、随着数字化转型的加速,商品运营平台已成为企业连接用户、分析市场趋势、优化产品策略的核心工具。商品运营平台收集和分析大量的用户行为的流程数据,如点击流、浏览历史、购买记录等,以提供个性化推荐、优化用户体验,并制定更加精准的市场策略。因此,需要对相关用户的点击流程数据进行安全保护。

2、相关技术中,使用哈希加密的方式实现数据加密,这种方式下,能够保留流程数据本身的统计特性,同时保护流程数据不被还原。但是由于流程数据中包含各种信息,不同维度的信息的复杂程度和变化程度是不同的,这就导致复杂程度和变化程度小的维度所对应流程数据由于加密后加密值数量较少,复杂度较低,容易被彩虹表破解,难以保护数据的安全。


技术实现思路

1、为了解决相关技术中复杂程度和变化程度小的维度所对应流程数据,由于加密后加密值数量较少,复杂度较低,容易被彩虹表破解,难以保护数据的安全的技术问题,本专利技术提供一种数字化商品运营平台数据安全保护方法,所采用的技术方案具体如下:

2、本专利技术提出了一种数字化商品运营平台数据安全保护方法,方法包括:

3、获取不同用户在进行单次点击行为下不同维度的流程数据;根据所有用户在同一维度的流程数据的字符分布和数据长度,确定每一维度的区分度;

4、根据所述区分度从所述流程数据中筛选得到低区分数据;对低区分数据进行数据编码量化和白化处理,得到低区分白化矩阵;根据所述低区分白化矩阵中同一维度下元素的统计分析,确定对应维度的原始统计序列;

5、确定任一预设单位向量,基于所述预设单位向量对所述低区分白化矩阵中同一维度的数据进行数据分解,得到分解数据,对所述分解数据进行统计分析,确定分解统计序列;

6、对每一维度的原始统计序列与分解统计序列进行数值差异分析和向量相似分析,确定保留统计分析特性最优的预设单位向量;

7、将最优的预设单位向量所对应所有维度的分解数据组成分量矩阵,对所述分量矩阵进行数据加密,得到加密数据。

8、进一步地,所述每一维度的区分度的获取方法,包括:

9、确定每一维度下所有数据的平均长度和长度方差,根据所述平均长度和长度方差确定长度区分因子,其中,所述平均长度和长度方差均与所述长度区分因子呈正相关关系;

10、根据同一维度下所有数据的字符分布,确定字符区分因子;

11、结合所述长度区分因子和所述字符区分因子,确定所述区分度,其中,所述长度区分因子和所述字符区分因子与所述区分度呈正相关关系,所述区分度的取值为归一化后的数值。

12、进一步地,所述根据同一维度下所有数据的字符分布,确定字符区分因子,包括:

13、将所述流程数据作为字符序列,采用空字符对长度较小的字符序列进行补全,计算序列中每一索引位置的字符种类的数值;

14、对所有索引位置的字符种类的数值进行求均处理,得到字符区分因子。

15、进一步地,根据所述区分度从所述流程数据中筛选得到低区分数据,包括:

16、将维度的区分度小于预设区分阈值的流程数据作为低区分数据。

17、进一步地,所述统计分析至少包括数据均值、均方根、字符种类方差,原始统计序列的获取方法,包括:

18、获取所述低区分白化矩阵中同一维度下的元素在不同统计分析后的统计数据值;

19、基于预设顺序对不同统计分析下的统计数据值进行排序,得到原始统计序列。

20、进一步地,所述对每一维度的原始统计序列与分解统计序列进行数值差异分析和向量相似分析,确定保留统计分析特性最优的预设单位向量,包括:

21、根据每一维度下原始统计序列与分解统计序列的差异分析,确定预设单位向量的统计特性保留率;

22、根据所述预设单位向量与低区分白化矩阵对应每一维度的单位向量的相似度,确定预设单位向量的偏移度;

23、计算所述统计特性保留率和所述偏移度的乘积,得到分解特征指标;

24、将所述分解特征指标数值最大的预设单位向量,作为最优的预设单位向量。

25、进一步地,所述预设单位向量的统计特性保留率的获取方法,包括:

26、确定所述原始统计序列与分解统计序列中表示相同统计分析的结果的差值绝对值,并对该差值绝对值进行最大最小值归一化得到对应维度下对应统计分析的统计差异指标;

27、将所有维度下所有统计分析的统计差异指标的均值,作为对应预设单位向量的统计特性保留率。

28、进一步地,所述预设单位向量的偏移度的获取方法,包括:

29、获取每一维度的所有数据的单位向量,作为维度单位向量;

30、确定每一维度的维度单位向量与预设单位向量的余弦相似度,作为对应维度的维度相似指标;

31、将所有维度的维度相似指标的均值进行负相关映射,得到偏移度。

32、进一步地,所述基于所述预设单位向量对所述低区分白化矩阵中同一维度的数据进行数据分解,得到分解数据,包括:

33、基于所述预设单位向量对所述低区分白化矩阵中同一维度的数据进行矩阵正交分解,得到分解数据。

34、进一步地,对所述分量矩阵进行数据加密,得到加密数据,包括:

35、采用哈希加密算法,对所述分量矩阵进行哈希加密得到加密数据。

36、本专利技术具有如下有益效果:

37、本专利技术实施例通过获取不同用户在进行单次点击行为下不同维度的流程数据;根据所有用户在同一维度的流程数据的字符分布和数据长度,确定每一维度的区分度,区分度的获取可以用于有效分辨易被破解的低区分数据,从而可以实现数据的初步筛选,将高区分数据直接进行数据加密,低区分数据进行进一步数据变换,以提升整体数据加密的加密效率,通过各种统计分析,确定原始统计序列和经过数据分解过后的分解统计序列,进而在后续对原始统计序列与分解统计序列进行数值差异分析和向量相似分析,确定最优的预设单位向量,则数值差异分析和向量相似分析能够确定原始统计序列与分解统计序列的相似性特征,从而在提高数据复杂程度的同时,尽可能保留较多的统计特性,得到分量矩阵,对分量矩阵进行数据加密,得到加密数据,该加密数据为保留统计特性的加密数据,可以直接基于该加密数据进行统计分析,能够避免被轻易破解,提升数据的安全性和可靠性。

本文档来自技高网...

【技术保护点】

1.一种数字化商品运营平台数据安全保护方法,其特征在于,所述方法包括:

2.如权利要求1所述的一种数字化商品运营平台数据安全保护方法,其特征在于,所述每一维度的区分度的获取方法,包括:

3.如权利要求2所述的一种数字化商品运营平台数据安全保护方法,其特征在于,所述根据同一维度下所有数据的字符分布,确定字符区分因子,包括:

4.如权利要求1所述的一种数字化商品运营平台数据安全保护方法,其特征在于,根据所述区分度从所述流程数据中筛选得到低区分数据,包括:

5.如权利要求1所述的一种数字化商品运营平台数据安全保护方法,其特征在于,所述统计分析至少包括数据均值、均方根、字符种类方差,原始统计序列的获取方法,包括:

6.如权利要求1所述的一种数字化商品运营平台数据安全保护方法,其特征在于,所述对每一维度的原始统计序列与分解统计序列进行数值差异分析和向量相似分析,确定保留统计分析特性最优的预设单位向量,包括:

7.如权利要求6所述的一种数字化商品运营平台数据安全保护方法,其特征在于,所述预设单位向量的统计特性保留率的获取方法,包括:

8.如权利要求6所述的一种数字化商品运营平台数据安全保护方法,其特征在于,所述预设单位向量的偏移度的获取方法,包括:

9.如权利要求1所述的一种数字化商品运营平台数据安全保护方法,其特征在于,所述基于所述预设单位向量对所述低区分白化矩阵中同一维度的数据进行数据分解,得到分解数据,包括:

10.如权利要求1所述的一种数字化商品运营平台数据安全保护方法,其特征在于,对所述分量矩阵进行数据加密,得到加密数据,包括:

...

【技术特征摘要】

1.一种数字化商品运营平台数据安全保护方法,其特征在于,所述方法包括:

2.如权利要求1所述的一种数字化商品运营平台数据安全保护方法,其特征在于,所述每一维度的区分度的获取方法,包括:

3.如权利要求2所述的一种数字化商品运营平台数据安全保护方法,其特征在于,所述根据同一维度下所有数据的字符分布,确定字符区分因子,包括:

4.如权利要求1所述的一种数字化商品运营平台数据安全保护方法,其特征在于,根据所述区分度从所述流程数据中筛选得到低区分数据,包括:

5.如权利要求1所述的一种数字化商品运营平台数据安全保护方法,其特征在于,所述统计分析至少包括数据均值、均方根、字符种类方差,原始统计序列的获取方法,包括:

6.如权利要求1所述的一种数字化商品运营平台数据安全保...

【专利技术属性】
技术研发人员:张凯高云峰罗勇
申请(专利权)人:智选数字技术广州股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1