System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于数据库水印实现数据溯源的方法技术_技高网

一种基于数据库水印实现数据溯源的方法技术

技术编号:41673686 阅读:5 留言:0更新日期:2024-06-14 15:29
本发明专利技术特别涉及一种基于数据库水印实现数据溯源的方法。该基于数据库水印实现数据溯源的方法,使用数据库水印对系统在开放数据的过程中的数据进行预处理,将数据库的水印作为专属于当前系统的标识,嵌入数据的BIT级层面;在数据使用过程中,通过验证检测出的水印是否与嵌入的水印是否一致来判定是否为盗版数据,若一致则不是盗版数据,若不一致,则对检测出的水印进行解析,根据提取出的水印信息分析数据泄露路径。该基于数据库水印实现数据溯源的方法,在对数据精度影响比较低的情况下,通过数据库水印标识的嵌入与检测,实现了数据的溯源,在数据发生泄漏或者被盗以后,可以通过嵌入的水印信息维护数据拥有者的版权,并迅速判断泄漏路径。

【技术实现步骤摘要】

本专利技术涉及数据安全,特别涉及一种基于数据库水印实现数据溯源的方法


技术介绍

1、随着云计算、大数据、移动互联网技术的发展,数据量出现飞速的增长。数据的各种共享与分发不可避免的加大了公民个人隐私信息泄露以及被盗取的风险。网民在网络活动中会产生包含浏览记录、爱好、习惯等行为信息,还包含着个人的账号和密码等身份信息。这些数据产生后,会在网络中被流转,存储和分发。

2、各种新型互联网技术的崛起在为人们带来便利的同时,也成为恶意人员泛滥和攻击的温床。数据的安全问题是网络安全问题中最为突出的,也是与公民个人关系最为紧密相关的,不仅会影响企业商业利益,还会影响公民的生命与财产安全,一旦数据安全出现问题,其破坏力非常巨大。因此,如何有效和安全地使用数据,成为当今大数据背景下的首要需求。

3、现阶段网络中使用和流通的数据不单单是存储的静态记录,这些数据通常需要通过数据分析和数据挖掘来发挥其潜在价值,这就意味着这些数据不可能只存放于一处,而可能会被分发给各个机构。数据在发送到云平台中或数据中心中存储后,会依次分发给各个用户使用,进而进行精准营销或用于数据技术的实验,这样数据被层层分发,层层使用。

4、然而,在数据分发的过程中会遇到各种威胁:(1)外部黑客的攻击导致信息泄露;(2)内部人员为了利益贩卖数据;(3)分发用户恶意向外部泄露数据等等。这些操作都会造成数据的丢失、篡改,进而会给行业经济造成莫大的损失,更不利于知识产权的保护。由于数据会进行多次分发,因此实际情况中难以有效定位到泄露的用户,恶意分发用户的责任常常难以确定并进行追究,所以数据溯源技术成为目前数据安全技术中的研究重点,这也是面对实际问题下的合理诉求。

5、基于上述情况,本专利技术提出了一种基于数据库水印实现数据溯源的方法。


技术实现思路

1、本专利技术为了弥补现有技术的缺陷,提供了一种简单高效的基于数据库水印实现数据溯源的方法。

2、本专利技术是通过如下技术方案实现的:

3、一种基于数据库水印实现数据溯源的方法,其特征在于:使用数据库水印对系统在开放数据的过程中的数据进行预处理,将数据库的水印作为专属于当前系统的标识,嵌入数据的bit(比特)级层面;

4、在数据使用过程中,通过验证检测出的水印是否与嵌入的水印是否一致来判定是否为盗版数据,若一致则不是盗版数据,若不一致,则对检测出的水印进行解析,根据提取出的水印信息分析数据泄露路径。

5、包括以下步骤:

6、步骤s1、数据库水印预处理

7、在嵌入之前,对数据库属性信息进行预处理,确定数据库表中的参数信息;

8、所述步骤s1中,数据库关系r的属性信息包括主键属性和标记的v个候选属性a0,...,av-1,其中a0,...,av-1都是数值型属性,a0,...,av-1的ξ个最低有效位lsb的变化是不可察觉的。

9、数据库表的参数信息包括但不限于数据库表中元组总数η、数值型属性总数ν、属性中能够用于标记的最低有效位lsb的数目ξ、被标记的元组百分比1/γ、标记的元组数w、水印检测的显著性水平α和检测所需的正确标记元组的最小数目τ;

10、γ是一个控制参数,用来控制被标记的元组百分比,标记的元组数w为数据库表中元组总数η与被标记的元组百分比1/γ的乘积,即w≈η/γ;用r.ai表示元组r∈r中属性ai的值。

11、步骤s2、数据库水印嵌入

12、使用主键p和密钥k从v个候选属性中选择要执行水印标记的属性,并决定嵌入水印的位置和信息;

13、所述秘钥k由数据库所有者决定或者采用当前数据所有者的标识信息;

14、所述步骤s2中,将数据库中的数值类型的数据进行bit级的修改,在数据允许的误差范围内,对数值型数据的最低有效位则进行修改;具体修改与嵌入过程,如下:

15、步骤s2.1、从选定元组的v个候选属性中选择要执行水印标记的属性;

16、步骤s2.2、对于选定的属性,确定要标记的最低有效位lsb;

17、步骤s2.3、由密钥k与选定元组的主键p在预制的水印串中选取嵌入水印的比特位;

18、步骤s2.4、将嵌入水印元组的主键p和嵌入比特值记录在辅助表中,将水印比特嵌入到指定位置;

19、步骤s2.5、水印嵌入后,利用嵌入比特值替换选定属性中所选定的比特值,将修改后数据提交回数据库。

20、所述步骤s2.4中,水印嵌入算法使用二进制水印,哈希函数选用md5加密算法。

21、步骤s3、数据库水印检测

22、数据使用过程中,通过验证检测出的水印是否与嵌入前水印是否一致来判定该数据是否为盗版数据;

23、对于数据包,自定义设定一个阈值λ,若数据包中检测到的不是盗版数据的元组总检测数totalcount达到阈值λ,则判定该份数据不是盗版数据。

24、所述步骤s3中,具体实现步骤如下:

25、步骤s3.1、通过分类器找到被检测数据嵌入水印的元组,从数据库中找出对应元组的水印信息,包括执行水印标记的属性,对应属性标记的最低有效位lsb和嵌入水印的比特位;

26、步骤s3.2、找出被检测数据水印串中的水印信息,与步骤s3.1中查找出的水印信息进行比对;

27、如果被检测数据水印串中的水印信息与数据库中查询到的对应元组的水印信息相同,则被检测数据不是盗版,否则是盗版;

28、步骤s3.3、对于被检测数据组成的数据包,水印位的元组数matchcoun初始值为0,如果其中一条被检测数据不是盗版,则水印位的元组数matchcount加1,如果其中一条被检测数据是盗版,则水印位的元组数matchcount不变;

29、遍历数据包中所有的被检测数据,如果元组总检测数totalcount大于阈值λ则不是盗版,否则是盗版。

30、基于对数据库水印的设置,将数据库水印的预处理、嵌入和检测接口封装至软件开发工具包sdk中,对外提供统一的接口,使得各应用在集成该软件开发工具包sdk时能够以工具类的形式使用该软件开发工具包sdk。

31、一种基于数据库水印实现数据溯源的设备,其特征在于:包括存储器和处理器;所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序时实现如上所述的方法步骤。

32、一种可读存储介质,其特征在于:所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的方法步骤。

33、本专利技术的有益效果是:该基于数据库水印实现数据溯源的方法,在对数据精度影响比较低的情况下,通过数据库水印标识的嵌入与检测,实现了数据的溯源,在数据发生泄漏或者被盗以后,可以通过嵌入的水印信息维护数据拥有者的版权,并迅速判断泄漏路径,精准定位到叛徒。

本文档来自技高网...

【技术保护点】

1.一种基于数据库水印实现数据溯源的方法,其特征在于:使用数据库水印对系统在开放数据的过程中的数据进行预处理,将数据库的水印作为专属于当前系统的标识,嵌入数据的BIT级层面;

2.根据权利要求1所述的基于数据库水印实现数据溯源的方法,其特征在于:包括以下步骤:

3.根据权利要求2所述的基于数据库水印实现数据溯源的方法,其特征在于:所述步骤S1中,数据库关系R的属性信息包括主键属性和标记的v个候选属性A0,...,Av-1,其中A0,...,Av-1都是数值型属性,A0,...,Av-1的ξ个最低有效位LSB的变化是不可察觉的。

4.根据权利要求3所述的基于数据库水印实现数据溯源的方法,其特征在于:数据库表的参数信息包括但不限于数据库表中元组总数η、数值型属性总数ν、属性中能够用于标记的最低有效位LSB的数目ξ、被标记的元组百分比1/γ、标记的元组数w、水印检测的显著性水平α和检测所需的正确标记元组的最小数目τ;

5.根据权利要求4所述的基于数据库水印实现数据溯源的方法,其特征在于:所述步骤S2中,将数据库中的数值类型的数据进行BIT级的修改,在数据允许的误差范围内,对数值型数据的最低有效位则进行修改;具体修改与嵌入过程,如下:

6.根据权利要求5所述的基于数据库水印实现数据溯源的方法,其特征在于:所述步骤S2.4中,水印嵌入算法使用二进制水印,哈希函数选用MD5加密算法。

7.根据权利要求6所述的基于数据库水印实现数据溯源的方法,其特征在于:所述步骤S3中,具体实现步骤如下:

8.根据权利要求2~7任意一项所述的基于数据库水印实现数据溯源的方法,其特征在于:基于对数据库水印的设置,将数据库水印的预处理、嵌入和检测接口封装至软件开发工具包SDK中,对外提供统一的接口,使得各应用在集成该软件开发工具包SDK时能够以工具类的形式使用该软件开发工具包SDK。

9.一种基于数据库水印实现数据溯源的设备,其特征在于:包括存储器和处理器;所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序时实现如权利要求1至7任意一项所述的方法步骤。

10.一种可读存储介质,其特征在于:所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述的方法步骤。

...

【技术特征摘要】

1.一种基于数据库水印实现数据溯源的方法,其特征在于:使用数据库水印对系统在开放数据的过程中的数据进行预处理,将数据库的水印作为专属于当前系统的标识,嵌入数据的bit级层面;

2.根据权利要求1所述的基于数据库水印实现数据溯源的方法,其特征在于:包括以下步骤:

3.根据权利要求2所述的基于数据库水印实现数据溯源的方法,其特征在于:所述步骤s1中,数据库关系r的属性信息包括主键属性和标记的v个候选属性a0,...,av-1,其中a0,...,av-1都是数值型属性,a0,...,av-1的ξ个最低有效位lsb的变化是不可察觉的。

4.根据权利要求3所述的基于数据库水印实现数据溯源的方法,其特征在于:数据库表的参数信息包括但不限于数据库表中元组总数η、数值型属性总数ν、属性中能够用于标记的最低有效位lsb的数目ξ、被标记的元组百分比1/γ、标记的元组数w、水印检测的显著性水平α和检测所需的正确标记元组的最小数目τ;

5.根据权利要求4所述的基于数据库水印实现数据溯源的方法,其特征在于:所述步骤s2中,将数据库中的数值类型的数据进行bit级的修改,在数...

【专利技术属性】
技术研发人员:郭祥跃
申请(专利权)人:浪潮云信息技术股份公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1