一种设备本地生产数据隐私保护方法及系统技术方案

技术编号:39602676 阅读:43 留言:0更新日期:2023-12-03 20:02
本发明专利技术涉及数据加密技术领域,具体涉及一种设备本地生产数据隐私保护方法及系统

【技术实现步骤摘要】
一种设备本地生产数据隐私保护方法及系统


[0001]本专利技术涉及数据加密
,具体涉及一种设备本地生产数据隐私保护方法及系统


技术介绍

[0002]数据加密控制可以有效地降低数据传输和处理的时间和成本;通过控制存储器中的数据进行压缩后进行加密,可以减少数据泄露的风险,从而保护用户隐私,控制数据进行压缩加密对于节省存储空间

提高数据传输和处理效率以及增加数据安全性都具有重要意义,存储器的运行控制取决于所存储数据的数据量,在数据量较大时,存储器的运行控制效果较差,因此,在面对庞大的本地生产数据时,对于数据的自适应压缩加密至关重要

[0003]相关技术中,直接通过算术编码控制软件对数据进行压缩加密,由于生产数据通常为日志数据,数据量较为庞大,且重复数据更多,此时会导致数据在压缩并加密后占用更多的存储资源,也即是说,数据加密的存储资源占用较多,导致存储器的运行控制效果较差


技术实现思路

[0004]为了解决数据加密效果较差,导致存储资源占用较多,进一步导致存储器的运行控制效果较差的技术问题,本专利技术提供一种设备本地生产数据隐私保护方法及系统,所采用的技术方案具体如下:一方面,本专利技术提出了一种设备本地生产数据隐私保护方法,方法包括:获取设备本地生产过程中的生产数据,使用不同长度的窗口依次遍历所述生产数据,统计不同长度的窗口所分别对应的重复字符串,使用预设字符替换重复字符串,得到待测数据;将相邻长度的两个窗口中长度较大的窗口作为第一窗口,长度较小的窗口作为第二窗口,根据第一窗口和第二窗口所对应待测数据中字符的数量差异和第二窗口所对应待测数据中字符的数量,确定所述第一窗口的字符数量影响系数;根据任一窗口中不同字符的频次确定所述窗口对应待测数据中字符的频次离散程度,根据不同字符的频次和所述窗口中字符的总数量,确定所述待测数据中字符的分布混乱程度;根据所述生产数据和不同长度的窗口所对应待测数据中各个字符频次的最小值,从所述不同长度的窗口中筛选候选窗口;根据同一候选窗口的所述字符数量影响系数

所述频次离散程度和所述分布混乱程度,确定所述候选窗口的优选系数,根据所述优选系数确定最优窗口,对所述最优窗口的待测数据进行算术编码并加密,得到加密数据

[0005]进一步地,所述使用不同长度的窗口依次遍历所述生产数据,统计不同长度的窗口所分别对应的重复字符串,包括:使用第一长度的窗口遍历所述生产数据,统计生产数据中字符排列完全相同的字
符串作为第一长度的重复字符串;将第一长度减1作为第二长度,在除第一长度的重复字符串之外的生产数据中,使用第二长度的窗口进行遍历,获得第二长度下的重复字符串;对窗口长度依次递减,并分别在剩余的生产数据中进行重复字符串识别的迭代,直至窗口长度为2时迭代完成;将迭代完成后所统计所有长度的重复字符串作为第一长度的窗口所对应的重复字符串

[0006]进一步地,所述根据第一窗口和第二窗口所对应待测数据中字符的数量差异和第二窗口所对应待测数据中字符的数量,确定所述第一窗口的字符数量影响系数,包括:将所述第一窗口所对应待测数据中字符的数量与所述第二窗口所对应待测数据中字符的数量的差值绝对值作为第一窗口和第二窗口的字符数量差异;将所述字符数量差异与第二窗口所对应待测数据中字符的数量的比值归一化值作为所述第一窗口的字符数量影响系数

[0007]进一步地,所述根据任一窗口中不同字符的频次确定所述窗口对应待测数据中字符的频次离散程度,包括:计算同一窗口中字符频次的均值作为字符均值;基于标准差计算公式,根据所述不同字符的频次

所述字符均值和所述字符的类型数量,计算得到该窗口对应字符频次的标准差,并将所述标准差的归一化值作为所述字符的频次离散程度

[0008]进一步地,所述根据不同字符的频次和所述窗口中字符的总数量,确定所述待测数据中字符的分布混乱程度,包括:计算不同字符的频次分别与所述窗口中字符的总数量的比值作为对应字符的频率;基于信息熵公式,根据所有字符的频率计算得到所述待测数据中字符分布的信息熵,并将所述信息熵进行归一化处理得到所述分布混乱程度

[0009]进一步地,所述根据所述生产数据和不同长度的窗口所对应待测数据中各个字符频次的最小值,从所述不同长度的窗口中筛选候选窗口,包括:将所述待测数据中字符频次的最小值大于等于所述生产数据中字符频次的最小值的窗口作为候选窗口

[0010]进一步地,所述根据同一候选窗口的所述字符数量影响系数

所述频次离散程度和所述分布混乱程度,确定所述候选窗口的优选系数,包括:根据所述频次离散程度和所述分布混乱程度,确定字符分布影响系数,其中,所述频次离散程度与所述字符分布影响系数呈正相关关系,所述分布混乱程度与所述字符分布影响系数呈正相关关系,所述字符分布影响系数的取值为归一化的数值;计算所述字符数量影响系数和所述字符分布影响系数的乘积作为所述优选系数

[0011]进一步地,所述根据所述优选系数确定最优窗口,包括:将所述优选系数最大的候选窗口作为最优窗口

[0012]进一步地,采用
AES
算法获得加密数据

[0013]另一方面,本专利技术还提出了一种设备本地生产数据隐私保护系统,包括存储器和
处理器,所述处理器执行所述存储器存储的计算机程序,以实现前述所述的一种设备本地生产数据隐私保护方法

[0014]本专利技术具有如下有益效果:本专利技术通过获取设备本地生产过程中的生产数据,统计不同长度的窗口所分别对应的重复字符串,使用预设字符替换重复字符串,得到待测数据,能够将排列重复的字符组合为字符串,可以理解的是,由于所选窗口的长度不同,所对应的待测数据也不同,因此,对待测数据的加密也不同,在不确定重复字符串的解密密钥时,无法有效根据待测数据进行反推得到生产数据,根据不同待测数据中字符的数量差异和待测数据中字符的数量,确定窗口的字符数量影响系数,在字符数量变化较大时,可以表征对应生产数据内重复的字符被有效转换为重复字符串,也即此次迭代所对应的效果更优,使得加密效率和加密效果均具有明显提升;根据生产数据和不同长度的窗口所对应待测数据中各个字符频次的最小值,从不同长度的窗口中筛选候选窗口,通过对不同长度的窗口进行筛选,从而减少后续对不同窗口进行分析的计算量,进而能够有效提升窗口分析的速度;计算不同窗口分别对应待测数据中字符的频次离散程度和分布混乱程度,可以理解的是,字符分布越离散,且越混乱,对应的加密效果越优,因此本专利技术结合字符数量影响系数

频次离散程度和分布混乱程度确定优选系数,能够有效考量字符变化

字符分布的影响,使得最优窗口的待测数据能够在保证自身加密效果的同时,尽可能减少加密数据的数据量,提升加密处理效率,也即是说,本专利技术对编码分布一致性较高的生产数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种设备本地生产数据隐私保护方法,其特征在于,所述方法包括:获取设备本地生产过程中的生产数据,使用不同长度的窗口依次遍历所述生产数据,统计不同长度的窗口所分别对应的重复字符串,使用预设字符替换重复字符串,得到待测数据;将相邻长度的两个窗口中长度大的窗口作为第一窗口,长度小的窗口作为第二窗口,根据第一窗口和第二窗口所对应待测数据中字符的数量差异和第二窗口所对应待测数据中字符的数量,确定所述第一窗口的字符数量影响系数;根据任一窗口中不同字符的频次确定所述窗口对应待测数据中字符的频次离散程度,根据不同字符的频次和所述窗口中字符的总数量,确定所述待测数据中字符的分布混乱程度;根据所述生产数据和不同长度的窗口所对应待测数据中各个字符频次的最小值,从所述不同长度的窗口中筛选候选窗口;根据同一候选窗口的所述字符数量影响系数

所述频次离散程度和所述分布混乱程度,确定所述候选窗口的优选系数,根据所述优选系数确定最优窗口,对所述最优窗口的待测数据进行算术编码并加密,得到加密数据
。2.
如权利要求1所述的一种设备本地生产数据隐私保护方法,其特征在于,所述使用不同长度的窗口依次遍历所述生产数据,统计不同长度的窗口所分别对应的重复字符串,包括:使用第一长度的窗口遍历所述生产数据,统计生产数据中字符排列完全相同的字符串作为第一长度的重复字符串;将第一长度减1作为第二长度,在除第一长度的重复字符串之外的生产数据中,使用第二长度的窗口进行遍历,获得第二长度下的重复字符串;对窗口长度依次递减,并分别在剩余的生产数据中进行重复字符串识别的迭代,直至窗口长度为2时迭代完成;将迭代完成后所统计所有长度的重复字符串作为第一长度的窗口所对应的重复字符串
。3.
如权利要求1所述的一种设备本地生产数据隐私保护方法,其特征在于,所述根据第一窗口和第二窗口所对应待测数据中字符的数量差异和第二窗口所对应待测数据中字符的数量,确定所述第一窗口的字符数量影响系数,包括:将所述第一窗口所对应待测数据中字符的数量与所述第二窗口所对应待测数据中字符的数量的差值绝对值作为第一窗口和第二窗口的字符数量差异;将所述字符数量差异与第二窗口所对应待测数据中字符的数量的比值归一化值作为所述第一窗口的字符数量影响系数
。4.
如权利要求1所述的一种设备本地生产数据隐私保护方法,其特征在于,所述根据任一窗口中不...

【专利技术属性】
技术研发人员:朱军武茂国朱立豪张中华邢亚
申请(专利权)人:山东万世机械科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1