基于相似数据集的网络监测数据压缩存储和联合检测方法技术

技术编号:3508878 阅读:169 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于相似数据集的网络监测数据压缩存储和联合检测方法,要解决的技术问题是针对存在较多相同数据项的多个数据集提出一种基于表的关系数据库压缩存储和联合检测方法。技术方案是采用关系模型对数据建模,利用关系数据库对数据进行存储和管理,采用基于状态标记序列的压缩方法对同一关系框架下的多个相似数据集进行压缩存储;使用查询语句恢复出原始的数据集;通过对压缩后的数据表进行查询实现对多个原始数据集的多种类型的联合检测。本发明专利技术利用大量数据集之间的相似性,将多个数据集增量式地压缩到数据库的同一个表中,可以应用于多种类型网络监测数据的压缩存储,也可用于存储其他类型的网络历史数据或相似数据集。

【技术实现步骤摘要】

【技术保护点】
一种基于相似数据集的网络监测数据压缩存储和联合检测方法,其特征在于采用关系模型对数据建模,利用关系数据库对数据进行存储和管理,采用基于状态标记序列的压缩方法对同一关系框架下的多个相似数据集进行压缩存储,使用查询语句恢复出原始的数据集,通过对压缩后的数据表进行查询实现对多个原始数据集的多种类型的联合检测;基于状态标记序列的压缩方法的过程是:令R↓[1]=〈X↓[1],X↓[2],…,X↓[n]〉,R↓[2]=〈stamp〉,stamp是一个字符串,R=R↓[1]×R↓[2];S↓[1]、S↓[2]、…、S↓[K]互为关系框架R↓[1]上的相似数据集;S↓[0]是关系框架R上的具体关系,作为S↓[1]、S↓[2]、…、S↓[K]的压缩集,用来记录压缩之后的数据集,其初始值为空集;结合状态标记序列,先后将S↓[1]、S↓[2]、…、S↓[K]逐个压缩存入数据库,压缩存储过程是:输入:关系框架R↓[1]上的K个相似数据集S↓[1]、S↓[2]、…、S↓[K],数据集的状态标记标识STAMP[1]=“1”、STAMP[2]=“2”、…、STAMP[ K]=“K”;输出:带状态标记序列的压缩数据集S↓[0],S↓[0]是关系框架R上的具体关系;1)S↓[0]初始时是一个空集;2)i=1,2,…,K,重复执行以下步骤:3)j=1,2,…,#S↓[i](数据集 S↓[i]的元素个数),重复执行以下步骤:4)从数据集S↓[i]中任取一个元素r,并将r从S↓[i]去除;5)如果存在r′∈S↓[0]使得它的各个属性值都和r相同,即r′.x↓[1]=r.x↓[1]、r′.x↓[2]=r.x ↓[2]、…、r′.x↓[n]=r.x↓[n],则修改r′对应的状态标记序列:r′.stamp=r′.stamp+STAMP[i];6)否则,构造一个新的stamp,stamp=STAMP[i],把〈r,stamp〉作为一条新的记录 添加到S↓[0]中。...

【技术特征摘要】

【专利技术属性】
技术研发人员:朱培栋宁洪邓文平蔡开裕赵建强周丽涛
申请(专利权)人:中国人民解放军国防科学技术大学
类型:发明
国别省市:43[中国|湖南]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利