一种数据库敏感数据自动识别方法技术

技术编号：11755076 阅读：181 留言：0更新日期：2015-07-22 03:19

本发明专利技术公开了一种数据库敏感数据自动识别方法，包括如下步骤：a)配置数据源，并为数据源中库表的敏感字段设置识别匹配算法；b)获取已配置的数据源和识别匹配算法，在后台启动多个线程，采用JDBC方式与指定的数据库建立长连接，一个线程处理一个用户下的所有表或处理一张表；c)对每一张库表采取抽样的方式随机抽取指定的数据，将抽取出来的数据按设置的识别匹配算法进行检验；d)检验通过则标记为敏感数据，并自动保存记录。本发明专利技术通过对数据库敏感数据进行自动识别，能够解决敏感数据人工梳理困难，内容定位不准确问题，降低人工梳理耗时，降低人工成本，提高梳理准确性，提高维护工作效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种数据库处理方法，尤其涉及。
技术介绍
随着移动业务支撑系统数据应用越来越广泛，个人信息安全保障已越来越被公司重视。如何规避日常生产运行所涉及的大量敏感信息，成为信息安全首要考虑问题，而承载核心业务系统的生产数据库更是重中之重。在日常信息化建设中，不可避免的需要从生产库迀移至测试库的大量业务测试数据，如何满足信息化建设基础上，最大限度地保护敏感信息，是当前面临的重要挑战。现阶段，基于运行环境安全管控已有诸多规范，并拥有完善的安全加固方案。而生产数据同步到测试库、开发库、报表库等用于开发、测试、报表查询过程中，如敏感信息没有及时屏蔽，则存在敏感数据泄露风险。现有通常做法是通过业务人员对数据库结构和数据进行手工梳理，得出敏感数据清单，如对业务和数据库结构不了解，会造成内容定位不准确问题，并且需要专家级别的业务人员才能操作，梳理难度大，成本非常高，维护效率极低。现有技术的缺点如下:1)数据库梳理敏感数据内容定位不准确。2)数据库梳理敏感数据梳理难度大。3)数据库梳理敏感数据人工成本非常高。4)数据库梳理敏感数据维护效率低。
技术实现思路
本专利技术所要解决的技术问题是提供，能够解决敏感数据人工梳理困难，内容定位不准确问题，降低人工梳理耗时，降低人工成本，提高梳理准确性，提高维护工作效率。本专利技术为解决上述技术问题而采用的技术方案是提供，包括如下步骤:a)配置数据源，并为数据源中库表的敏感字段设置识别匹配算法；b)获取已配置的数据源和识别匹配算法，在后台启动多个线程，采用JDBC方式与指定的数据库建立长连接，一个线程处理一个用户下的所有...

【技术保护点】
一种数据库敏感数据自动识别方法，其特征在于，包括如下步骤：a)配置数据源，并为数据源中库表的敏感字段设置识别匹配算法；b)获取已配置的数据源和识别匹配算法，在后台启动多个线程，采用JDBC方式与指定的数据库建立长连接，一个线程处理一个用户下的所有表或处理一张表；c)对每一张库表采取抽样的方式随机抽取指定的数据，将抽取出来的数据按设置的识别匹配算法进行检验；d)检验通过则标记为敏感数据，并自动保存记录。

【技术特征摘要】

【专利技术属性】
技术研发人员：程永新，胡永，郭振宇，
申请(专利权)人：上海新炬网络信息技术有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人