一种数据库蜜罐的可验证数据构造方法及系统技术方案

技术编号:14554464 阅读:64 留言:0更新日期:2017-02-05 03:40
本发明专利技术提出一种数据库蜜罐的可验证数据构造方法及系统,包括:获取待构造的原始数据库中的数据表,并确定其各字段名称;根据所述字段名称,判断所述数据表中字段值域长度小于预设值的字段数量是否大于1,如果是则执行下一步骤,否则在数据表尾部添加一个布尔型字段;在所述数据表中选取任意两个值域长度小于预设值,且值域中包含不低于2个可用值的字段;构造所选取字段间的恒真映射,则所述字段的值域中符合所构造恒真映射的值即为所述两个字段的数据。本发明专利技术利用多个值域空间少的数据进行互为验证的模式,保证数据表不失真,又可证明其数据来源,说明数据表的非真实性。

Method and system for constructing verifiable data of database honeypot

The present invention puts forward a method to construct validation data and database system, a honeypot includes: acquiring the original database to be constructed in the data table, and determine its each field name; according to the field name, field judge the number of the data field range table length is less than the preset value is greater than 1, if it is the next step, otherwise in the data table tail adding a Boolean field; in the data table two optional range length is less than a preset value, less than 2 of available values in the range and field does not contain the selected structure; true mapping between words, then the range of the field in the with the construction of true value is the mapping of the two field data. The invention makes use of a plurality of data in the range space to verify each other, and ensures that the data table is not distorted, and the data source can be proved.

【技术实现步骤摘要】

本专利技术涉及计算机网络安全领域,特别涉及一种数据库蜜罐的可验证数据构造方法及系统
技术介绍
在现有的建立数据库蜜罐技术中,为了使数据库蜜罐能够达到迷惑攻击者,使其能够长期存在于蜜罐中记录其行为,通常采用数据构造的方式,使数据库蜜罐中的数据更接近实际的业务数据,在数据构造过程中,为了避免对真实数据的泄露,一般采用对真实数据进行处理后再添加到蜜罐中的手段。或为了能够在数据库蜜罐中的数据被泄露后,能够声明所述数据为非真实数据,证明其数据来源,采用对值域较大的字段添加水印的方式,所述方式既可以进一步嵌入额外数据,又不使数据失真而被攻击者发现。但在实际应用中,存在很多字段长度较小的情况,如性别字段:男或女,或被标记为0或1;年龄字段:一般为1-100等,这类字段的数据值域很小,无法进行添加水印。而数据库蜜罐的数据有时并非完整泄露,而仅对部分数据进行提取泄露,所以无法针对这种情况进行证明其数据来源。
技术实现思路
针对上述问题,本专利技术提出了一种针对值域长度较短字段的构造方法,通过建立两个字段间的恒真映射,使其满足预设的恒真映射计算等式,能够在保证两个字段数据不失真的前提下,达到验证数据来源的目的。在真实数据库的数据表中,是不可能出现两组字段间形成恒真映射的情况,因此可以说明数据为设计伪造的,而非真实用户数据。一种数据库蜜罐的可验证数据构造方法,包括:获取待构造的原始数据库中的数据表,并确定其各字段名称;根据所述字段名称,判断所述数据表中字段值域长度小于预设值的字段数量是否大于1,如果是则执行下一步骤,否则在数据表尾部添加一个布尔型字段;在所述数据表中选取任意两个值域长度小于预设值,且值域中包含不低于2个可用值的字段;构造所选取字段的恒真映射,则所述字段的值域中符合所构造恒真映射的值即为所述两个字段的数据。所述的方法中,所述构造所选取字段间的恒真映射关系为:预先设定恒真映射关系组合,由用户选择。一种数据库蜜罐的可验证数据构造系统,包括:获取模块,用于获取待构造的原始数据库中的数据表,并确定其各字段名称;判断模块,用于根据所述字段名称,判断所述数据表中字段值域长度小于预设值的字段数量是否大于1,如果是,则进入筛选模块,否则在数据表尾部添加一个布尔型字段;筛选模块,用于在所述数据表中选取任意两个值域长度小于预设值,且值域中包含不低于2个可用值的字段;映射建立模块,用于构造所选取字段的恒真映射,则所述字段的值域中符合所构造恒真映射的值即为所述两个字段的数据。利用本专利技术方法构造数据,所述恒真映射的等式可由用户选择,能够使攻击者认为所述数据为真实数据,达到迷惑攻击者的目的,同时如果数据被攻击者公开,则可以通过公开用户选择的恒真映射等式,验证所述公开的数据为伪造的数据,并非真实的数据。本专利技术提出一种数据库蜜罐的可验证数据构造方法及系统,包括:获取待构造的原始数据库中的数据表,并确定其各字段名称;根据所述字段名称,判断所述数据表中字段值域长度小于预设值的字段数量是否大于1,如果是则执行下一步骤,否则在数据表尾部添加一个布尔型字段;在所述数据表中选取任意两个值域长度小于预设值,且值域中包含不低于2个可用值的字段;构造所选取字段间的恒真映射,则所述字段的值域中符合所构造恒真映射的值即为所述两个字段的数据。本专利技术利用多个值域空间少的数据进行互为验证的模式,保证数据表不失真,又可证明其数据来源,说明数据表的非真实性。附图说明为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一种数据库蜜罐的可验证数据构造方法实施例流程图;图2为本专利技术一种数据库蜜罐的可验证数据构造系统实施例示意图。具体实施方式为了使本
的人员更好地理解本专利技术实施例中的技术方案,并使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图对本专利技术中技术方案作进一步详细的说明。针对上述问题,本专利技术提出了一种针对值域长度较短字段的构造方法,通过建立两个字段间的恒真映射,使其满足预设的恒真映射计算等式,能够在保证两个字段数据不失真的前提下,达到验证数据来源的目的。在真实数据库的数据表中,是不可能出现两组字段间形成恒真映射的情况,因此可以说明数据为设计伪造的,而非真实用户数据。一种数据库蜜罐的可验证数据构造方法,如图1所示,包括:S101:获取待构造的原始数据库中的数据表,并确定其各字段名称;S102:根据所述字段名称,判断所述数据表中字段值域长度小于预设值的字段数量是否大于1,如果是则执行下一步骤,否则在数据表尾部添加一个布尔型字段;字段值域长度较小的字段如性别、年龄等;如果小于预设值的字段数量仅有1个,则在数据表尾部添加布尔型字段,字段的名称可以为与原始数据库中的数据表内容相关联的字段内容;如果没有短字段,则可以按照现有添加水印的方法。S103:在所述数据表中选取任意两个值域长度小于预设值,且值域中包含不低于2个可用值的字段;S104:构造所选取字段的恒真映射,则所述字段的值域中符合所构造恒真映射的值即为所述两个字段的数据。所述的方法中,所述构造所选取字段间的恒真映射关系为:预先设定恒真映射关系组合,由用户选择。恒真映射的方式有多种,假设所选取字段分别为A和B,且A和B的值域中均不低于两个可用值,则分别表示为A(a1、a2、a3……aN),B(b1、b2、b3……bM),则A与B的恒真映射关系可以为如下几种:采用下标取模的方式:aX(aX%M),其中(1≤X≤N);或a(bY%N)bY,其中(1≤Y≤M);采用奇偶映射方式,如果aXbY,则X与Y均为偶数,此方法的产出组合情况较多,对于数据集小的情况不宜采用,即可声明的可信度较低;采用N和M的最小值,及aXbY,对于两者值空间大小不明显的情况下采用较好;采用一种hash算法,如crc,md5等,区某值的模或除余的值,对A值进行运算,得到的值在通过对B的最大值M取模的值Y,即为B中bY作为与A对应的值。此种方法对于A的空间较大的时候,而B的空间较小时可采用,反之亦然。以采用下标取模的方式举例说明具体为:假设某数据表定义为个人信息表,其中包括:(姓名vachar(8);年龄int(8),--(18-99);性别bool;地址varchar(512);……)由上表可以看出,该表的年龄和性别字段的值域很小,无法添加水印。但可能被单独暴露于公众。所以两个属性采用本方法构造数据如下:年龄:值域为18-99;性别:0(女),1(男);可按如下方式构造数据:a.在年龄的值域空间中随机取得一个数值A=38;b.采本文档来自技高网
...

【技术保护点】
一种数据库蜜罐的可验证数据构造方法,其特征在于,包括:获取待构造的原始数据库中的数据表,并确定其各字段名称;根据所述字段名称,判断所述数据表中字段值域长度小于预设值的字段数量是否大于1,如果是则执行下一步骤,否则在数据表尾部添加一个布尔型字段;在所述数据表中选取任意两个值域长度小于预设值,且值域中包含不低于2个可用值的字段;构造所选取字段间的恒真映射,则所述字段的值域中符合所构造恒真映射的值即为所述两个字段的数据。

【技术特征摘要】
1.一种数据库蜜罐的可验证数据构造方法,其特征在于,包括:
获取待构造的原始数据库中的数据表,并确定其各字段名称;
根据所述字段名称,判断所述数据表中字段值域长度小于预设值的字段数量是否大于1,如果是则执行下一步骤,否则在数据表尾部添加一个布尔型字段;
在所述数据表中选取任意两个值域长度小于预设值,且值域中包含不低于2个可用值的字段;
构造所选取字段间的恒真映射,则所述字段的值域中符合所构造恒真映射的值即为所述两个字段的数据。
2.如权利要求1所述的方法,其特征在于,所述构造所选取字段间的恒真映射关系为:预先设定恒真映射关...

【专利技术属性】
技术研发人员:王维肖新光
申请(专利权)人:哈尔滨安天科技股份有限公司
类型:发明
国别省市:黑龙江;23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1