一种智慧镜柜消毒日志数据优化存储方法技术

技术编号:39651861 阅读:10 留言:0更新日期:2023-12-09 11:20
本发明专利技术涉及数据处理技术领域,提出了一种智慧镜柜消毒日志数据优化存储方法,包括:采集智慧镜柜的消毒日志数据,得到待存储的消毒异常数据序列;对消毒异常数据序列获取异常二进制数据序列,获取不同窗口长度的若干子块;根据不同窗口长度下子块类型的分布,得到最优窗口长度及若干二进制子块;根据每种二进制子块的出现频率,结合幂律分布的频率序列,获取每种二进制子块对应的最优提取步长

【技术实现步骤摘要】
一种智慧镜柜消毒日志数据优化存储方法


[0001]本专利技术涉及数据处理
,具体涉及一种智慧镜柜消毒日志数据优化存储方法


技术介绍

[0002]智慧镜柜通常用于存放药品或其他消毒物品,并通过内置的系统记录消毒操作的日期

时间和其他相关数据,通过对日志数据中异常数据进行提取,并按照时间节点存储,以此来判断系统运行的稳定性,确保消毒系统运行过程中的稳定性,同时可根据历史异常数据进行数据预测,在镜柜系统即将出现运行异常时预警,因此需要对产生的大量异常数据进行存储,从而保证智慧镜柜的正常工作运行

[0003]由于对异常数据的精度要求较高,因此在进行异常数据的压缩存储时通常采用无损压缩,现有的无损数据压缩算法包括
LZW
压缩算法

霍夫曼编码等;无损压缩算法在对存在冗余的数据有较好的处理效果,但异常数据的数据值规律性较弱,即所提取的异常数据中数据的冗余程度较小,因此在对异常数据进行压缩存储时,压缩效果较差;而霍夫曼编码对于呈现幂律分布的数据具有较好的编码压缩效果,因此需要对异常数据进行转换使得符合幂律分布,从而提高智慧镜柜消毒日志数据的压缩存储效果


技术实现思路

[0004]本专利技术提供一种智慧镜柜消毒日志数据优化存储方法,以解决现有的消毒日志异常数据冗余程度小而影响压缩存储效率的问题,所采用的技术方案具体如下:本专利技术一个实施例提供了一种智慧镜柜消毒日志数据优化存储方法,该方法包括以下步骤:采集智慧镜柜的消毒日志数据,得到待存储的消毒异常数据序列;对消毒异常数据序列获取异常二进制数据序列,通过不同窗口长度的可变窗口对异常二进制数据序列进行划分得到若干子块;根据不同窗口长度下子块类型的分布,得到最优窗口长度及若干二进制子块;根据每种二进制子块的出现频率,结合幂律分布的频率序列,获取每种二进制子块对应的最优提取步长

最优运算方法及最优基元子串,得到最优转换数据及异常转换数据序列;根据异常转换数据序列对智慧镜柜的消毒异常数据序列进行压缩存储

[0005]进一步的,所述得到待存储的消毒异常数据序列,包括的具体方法为:获取每个维度的消毒日志数据,对于任意一个维度,将该维度的消毒日志数据中,不符合异常阈值的数据进行提取,并按照对应的时间戳进行排列,得到的序列记为待存储的消毒异常数据序列

[0006]进一步的,所述对消毒异常数据序列获取异常二进制数据序列,包括的具体方法为:
对消毒异常数据序列中每个异常数据进行二进制转换,得到每个异常数据的二进制数据,获取每个二进制数据的编码长度,将编码长度最大值作为二进制编码的固定长度,对每个二进制数据在首位之前进行补0,使得补0后的二进制数据的长度等于固定长度,将补0后的二进制数据记为每个异常数据的二进制编码,将所有二进制编码按照异常数据的排列顺序进行排列,得到的序列记为异常二进制数据序列

[0007]进一步的,所述通过不同窗口长度的可变窗口对异常二进制数据序列进行划分得到若干子块,包括的具体方法为:对于任意一个窗口长度,通过该窗口长度的窗口对异常二进制数据序列进行不重叠划分,得到若干子块,对于最后剩余的若干位二进制编码,若位数等于该窗口长度,得到一个子块;若位数小于该窗口长度,在末位补0,使得剩余的位数等于窗口长度,得到一个子块;得到该窗口长度的若干子块

[0008]进一步的,所述得到最优窗口长度及若干二进制子块,包括的具体方法为:根据每个窗口长度下子块类型的分布,以及幂律分布的频率序列,获取每个窗口长度的幂律相似度;对于任意一个窗口长度,获取该窗口长度与最大窗口长度的比值,获取比值与幂律相似度的乘积,将乘积记为该窗口长度的优选程度;对每个窗口长度获取优选程度,将优选程度最大的窗口长度作为最优窗口长度,最优窗口长度对应的若干子块记为二进制子块

[0009]进一步的,所述每个窗口长度的幂律相似度,具体的获取方法为:对于任意一个窗口长度,获取该窗口长度下的子块数量,以及每个子块所属的子块类型;获取该窗口长度下每个子块类型的出现频率,若该窗口长度的某个子块类型在得到的子块中均没有出现,不获取该子块类型的出现频率;按照从大到小降序对该窗口长度下所有子块类型的出现频率进行排列,得到的序列记为该窗口长度的子块频率分布序列;获取子块频率分布序列中元素数量,获取相等元素数量的幂律分布的频率序列;对子块频率分布序列与获取到的幂律分布的频率序列计算余弦相似度,得到的结果记为该窗口长度的幂律相似度

[0010]进一步的,所述每种二进制子块对应的最优提取步长

最优运算方法及最优基元子串,具体的获取方法为:将最优窗口长度的子块频率分布序列,记为初始子块频率分布序列,表示为,其中表示按照出现频率降序排列第种二进制子块所属子块类型的出现频率,表示二进制子块所属子块类型的数量;将最优窗口长度对应的幂律分布的频率序列记为幂律序列,则幂律序列表示为;若,需要将个子块进行改变,其中表示二进制子块的数量,将记为的改变数量;构建可变的提取步长,对于任意一个提取步长,从第一个二进制子块开始提取,每隔提取步长进行一次二进制子块提取,将该提取步长提取到的二进制子块数量记为;统计提取到的所有二进制子块中对应子块类型的二进制子块的数量,
记为该提取步长在的提取数量;获取每个提取步长在的提取数量,第个提取步长在的提取差值的计算方法为:其中,表示按照出现频率降序排列第一种二进制子块所属子块类型的出现频率,表示二进制子块的数量,表示第个提取步长在的提取数量,表示求绝对值;获取每个提取步长在的提取差值,记为每个提取步长在的优选系数,将在的优选系数的最小值对应的提取步长,作为对应子块类型的二进制子块的最优提取步长,将最优提取步长下提取到的二进制子块记为可变子块;将最优窗口长度下所有子块类型分别作为一个基元子串,采用任意一个基元子串与任意一种运算方法,与每个可变子块进行二进制运算,得到若干运算后的可变子块,记为每个可变子块在该基元子串通过该运算方法得到的运算子块;统计所有运算子块中对应子块类型的运算子块数量,以及对应子块类型的运算子块数量,获取与比值,记为该基元子串与该种运算方法的优选系数;采用每个基元子串与每种运算方法对可变子块运算得到对应的运算子块,获取每个基元子串与每种运算方法的优选系数,将优选系数最小值对应的基元子串与运算方法,记为对应子块类型的二进制子块的最优基元子串与最优运算方法;若,需要将个子块被改变,获取每个提取步长提取到的二进制子块的数量;对于任意一个提取步长,获取该提取步长在的提取数量,以及该提取步长在的提取数量;获取每个提取步长在与的提取数量,第个提取步长在的提取差值的计算方法为:其中,表示按照出现频率降序排列第一种二进制子块所属子块类型的出现频率,表示二进制子块的数量,表示第个提取步长在的提取数量,表示求绝对值;获取第个提取步长在的提取数量,将与的均值,作为第个提取步长在的优选系数;获本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种智慧镜柜消毒日志数据优化存储方法,其特征在于,该方法包括以下步骤:采集智慧镜柜的消毒日志数据,得到待存储的消毒异常数据序列;对消毒异常数据序列获取异常二进制数据序列,通过不同窗口长度的可变窗口对异常二进制数据序列进行划分得到若干子块;根据不同窗口长度下子块类型的分布,得到最优窗口长度及若干二进制子块;根据每种二进制子块的出现频率,结合幂律分布的频率序列,获取每种二进制子块对应的最优提取步长

最优运算方法及最优基元子串,得到最优转换数据及异常转换数据序列;根据异常转换数据序列对智慧镜柜的消毒异常数据序列进行压缩存储
。2.
根据权利要求1所述的一种智慧镜柜消毒日志数据优化存储方法,其特征在于,所述得到待存储的消毒异常数据序列,包括的具体方法为:获取每个维度的消毒日志数据,对于任意一个维度,将该维度的消毒日志数据中,不符合异常阈值的数据进行提取,并按照对应的时间戳进行排列,得到的序列记为待存储的消毒异常数据序列
。3.
根据权利要求1所述的一种智慧镜柜消毒日志数据优化存储方法,其特征在于,所述对消毒异常数据序列获取异常二进制数据序列,包括的具体方法为:对消毒异常数据序列中每个异常数据进行二进制转换,得到每个异常数据的二进制数据,获取每个二进制数据的编码长度,将编码长度最大值作为二进制编码的固定长度,对每个二进制数据在首位之前进行补0,使得补0后的二进制数据的长度等于固定长度,将补0后的二进制数据记为每个异常数据的二进制编码,将所有二进制编码按照异常数据的排列顺序进行排列,得到的序列记为异常二进制数据序列
。4.
根据权利要求1所述的一种智慧镜柜消毒日志数据优化存储方法,其特征在于,所述通过不同窗口长度的可变窗口对异常二进制数据序列进行划分得到若干子块,包括的具体方法为:对于任意一个窗口长度,通过该窗口长度的窗口对异常二进制数据序列进行不重叠划分,得到若干子块,对于最后剩余的若干位二进制编码,若位数等于该窗口长度,得到一个子块;若位数小于该窗口长度,在末位补0,使得剩余的位数等于窗口长度,得到一个子块;得到该窗口长度的若干子块
。5.
根据权利要求1所述的一种智慧镜柜消毒日志数据优化存储方法,其特征在于,所述得到最优窗口长度及若干二进制子块,包括的具体方法为:根据每个窗口长度下子块类型的分布,以及幂律分布的频率序列,获取每个窗口长度的幂律相似度;对于任意一个窗口长度,获取该窗口长度与最大窗口长度的比值,获取比值与幂律相似度的乘积,将乘积记为该窗口长度的优选程度;对每个窗口长度获取优选程度,将优选程度最大的窗口长度作为最优窗口长度,最优窗口长度对应的若干子块记为二进制子块
。6.
根据权利要求5所述的一种智慧镜柜消毒日志数据优化存储方法,其特征在于,所述每个窗口长度的幂律相似度,具体的获取方法为:对于任意一个窗口长度,获取该窗口长度下的子块数量,以及每个子块所属的子块类型;获取该窗口长度下每个子块类型的出现频率,若该窗口长度的某个子块类型在得到的
子块中均没有出现,不获取该子块类型的出现频率;按照从大到小降序对该窗口长度下所有子块类型的出现频率进行排列,得到的序列记为该窗口长度的子块频率分布序列;获取子块频率分布序列中元素数量,获取相等元素数量的幂律分布的频率序列;对子块频率分布序列与获取到的幂律分布的频率序列计算余弦相似度,得到的结果记为该窗口长度的幂律相似度
。7.
根据权利要求1所述的一种智慧镜柜消毒日志数据优化存储方法,其特征在于,所述每种二进制子块对应的最优提取步长

最优运算方法及最优基元子串,具体的获取方法为:将最优窗口长度的子块频率分布序列,记为初始子块频率分布序列,表示为,其中表示按照出现频率降序排列第种二进制子块所属子块类型的出现频率,表示二进制子块所属子块类型的数量;将最优窗口长度对应的幂律分布的频率序列记为幂律序列,则幂律序列表示为;若,需要将个子块进行改变,其中表示二进制子块的数量,将记为的改变数量;构建可变的提取步长,对于任意一个提取步长,从第一个二进制子块开始提取,每隔提取步长进行一次二进制子块提取,将该提取步长提取到的二进制子块数量记为;统计提取到的所有二进制子块中对应子块类型的二进制子块的数量,记为该提取步长在的提取数量;获取每个提取步长在的提取数量,第个提取步长在的提取差值的计算方法为:其中,表示按照出现频率降序排列第一种二进制子块所属...

【专利技术属性】
技术研发人员:蔡明蔡兴国王庆彦雷长城李卓
申请(专利权)人:博洛尼智能科技青岛有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1