System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及数据隐私保护,尤其涉及一种数据库的智能隐私保护方法、设备及介质。
技术介绍
1、在当今数据驱动时代,数据库作为信息社会的基石,承载着前所未有的海量数据,其中不乏高度敏感的个人身份信息、精密的财务数据以及至关重要的健康记录等。随着数据量的激增与数据流通的加速,数据安全管理面临着前所未有的挑战,尤其是敏感信息的保护,已成为社会各界关注的焦点。
2、传统的隐私保护方法,在应对现代复杂多变的威胁环境时,逐渐显露出其局限性。一方面,传统的数据加密与访问控制技术,虽能在一定程度上阻止未授权访问,但往往难以精准识别合法需求与潜在风险之间的微妙界限,导致“一刀切”的保护措施既限制了数据的有效利用,又未能完全阻断数据泄露的通道。另一方面,随着攻击手段的不断进化,如高级持续性威胁、内部威胁及供应链攻击等,传统的防御体系显得力不从心,保护效果大打折扣,以致现有的隐私保护方法存在敏感信息识别、分类不准确以及隐私数据保护效果不佳的问题。
技术实现思路
1、本申请实施例提供了一种数据库的智能隐私保护方法、设备及介质,用于解决如下技术问题:现有的隐私保护方法存在敏感信息识别、分类不准确以及隐私数据保护效果不佳的问题。
2、本申请实施例采用下述技术方案:
3、本申请实施例提供一种数据库的智能隐私保护方法。包括,通过预置敏感信息识别模型对待识别数据进行分析,得到参考敏感信息;对参考敏感信息进行二次校验,将校验结果反馈至预置敏感信息识别模型,以对敏感信息识别模型进行优化,
4、本申请实施例通过预置敏感信息识别模型对待识别数据进行分析,得到参考敏感信息,通过大模型能够理解复杂的语言结构和语境,从而更准确地识别隐私数据。并且经过大量多样化的数据训练,能够识别多种类型的隐私数据。其次,本申请实施例通过对目标敏感信息进行脱敏处理,并对脱敏处理后的数据进行统计分析,确保敏感信息在数据处理过程中得到保护,同时还能获得有价值的运算结果。从而有效防止未经授权的访问和数据泄露,显著提升数据安全性和系统的整体可靠性。
5、在本申请的一种实现方式中,通过预置敏感信息识别模型对待识别数据进行分析,得到参考敏感信息之前,方法还包括:对数据库数据进行预处理;其中,预处理至少包括数据清洗与数据标注;将llm大语言模型作为预置敏感信息识别模型,并将预处理后的数据库数据转换为预置敏感信息识别模型对应的输入格式;基于已标注的数据库数据与监督学习方法,对预置敏感信息识别模型进行微调,以使微调后的预置敏感信息识别模型对敏感信息进行特征提取。
6、在本申请的一种实现方式中,通过预置敏感信息识别模型对待识别数据进行分析,得到参考敏感信息,具体包括:将待识别数据输入微调后的预置敏感信息识别模型,通过微调后的预置敏感信息识别模型进行敏感信息特征提取,并将识别的敏感信息以预置格式形式进行输出;其中,敏感信息至少包括敏感信息的类型以及敏感信息的位置;通过验证集对微调后的预置敏感信息识别模型进行检测,在检测通过的情况下,确定输出敏感信息正确。
7、在本申请的一种实现方式中,对参考敏感信息进行二次校验,将校验结果反馈至预置敏感信息识别模型,以对敏感信息识别模型进行优化,得到目标敏感信息识别模型,具体包括:通过正则表达式对参考敏感信息进行二次校验;其中,二次校验至少包括格式校验、逻辑校验以及数据一致性校验中的一项;确定出二次校验对应的错误信息,将错误信息作为新的标注数据添加至训练集;通过添加新的标注数据后的训练集,对预置敏感信息识别模型进行迭代优化;直至输出的敏感信息的识别结果符合预设要求,确定出预置敏感信息识别模型此时对应的参数组合,以得到目标敏感信息识别模型。
8、在本申请的一种实现方式中,对脱敏处理后的数据进行统计分析之前,方法还包括:在测试环境中,将脱敏处理后的数据插入至数据库,以进行结构校验;其中,结构校验至少包括字段类型校验、长度一致校验、字段格式校验以及数据库约束校验中的一项;将脱敏后的数据格式化为结构化数据,并对校验出的异常值与缺失值进行处理。
9、在本申请的一种实现方式中,对脱敏处理后的数据进行统计分析,具体包括:在数据库中确定出多种自定义融合算法;通过多种自定义融合算法,对脱敏后的数据进行相应运算处理,以实现统计分析;其中,统计分析至少包括平均值处理、方差处理、相关性处理、趋势处理以及异常值检测处理中的一项。
10、在本申请的一种实现方式中,对统计分析结果进行验证,具体包括:将统计分析结果输入至预置模型;通过预置模型将统计分析结果与原始数据进行关键统计指标比对;其中,关键统计指标至少包括平均值、方差以及分布形态中的一项;以及将统计分析结果中脱敏数据对应的分类准确率,与原始数据对应的分类准确率进行比对;以及对统计分析结果中的异常数据进行检测,以通过检测出的异常数据对脱敏数据对应的业务逻辑进行验证。
11、在本申请的一种实现方式中,在验证通过的情况下,进行数据访问记录分析,具体包括:根据用户角色定义不同的访问权限等级;对敏感信息的访问信息进行记录,生成访问日志;其中,访问信息至少包括访问用户、访问时间以及访问操作内容;定期对访问日志进行异常检测,在确定存在异常访问行为的情况下,根据检测结果对用户的访问权限等级进行调整。
12、本申请实施例提供一种数据库的智能隐私保护设备,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:通过预置敏感信息识别模型对待识别数据进行分析,得到参考敏感信息;对参考敏感信息进行二次校验,将校验结果反馈至预置敏感信息识别模型,以对敏感信息识别模型进行优化,得到目标敏感信息识别模型;基于目标敏感信息识别模型,对生产环境中的数据进行识别,得到目标敏感信息;对目标敏感信息进行脱敏处理,并对脱敏处理后的数据进行统计分析;对统计分析结果进行验证,并在验证通过的情况下,进行数据访问记录分析,以实现数据库隐私保护。
13、本申请实施例提供的一种非易失性计算机存储介质,存储有计算机可执行指令,计算机可执行指令设置为:通过预置敏感信息识别模型对待识别数据进行分析,得到参考敏感信息;对参考敏感信息进行二次校验,将校验结果反馈至预置敏感信息识别模型,以对敏感信息识别模型进行优化,得到目标敏感信息识别模型;基于目标敏感信息识别模型,对生产环境中的数据进行识别,得到目标敏感信息;对目标敏感信息进行脱敏处理,并对脱敏处理后的数据进行统计分析;对统计分析结果进行验证,并在验证通过的情况下,进行数据访问记录分析,以实现数据库隐私保护。
14、本申请实施例采用的上述至少本文档来自技高网...
【技术保护点】
1.一种数据库的智能隐私保护方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种数据库的智能隐私保护方法,其特征在于,所述通过预置敏感信息识别模型对待识别数据进行分析,得到参考敏感信息之前,所述方法还包括:
3.根据权利要求1所述的一种数据库的智能隐私保护方法,其特征在于,所述通过预置敏感信息识别模型对待识别数据进行分析,得到参考敏感信息,具体包括:
4.根据权利要求1所述的一种数据库的智能隐私保护方法,其特征在于,所述对所述参考敏感信息进行二次校验,将校验结果反馈至所述预置敏感信息识别模型,以对所述敏感信息识别模型进行优化,得到目标敏感信息识别模型,具体包括:
5.根据权利要求1所述的一种数据库的智能隐私保护方法,其特征在于,所述对脱敏处理后的数据进行统计分析之前,所述方法还包括:
6.根据权利要求1所述的一种数据库的智能隐私保护方法,其特征在于,所述对脱敏处理后的数据进行统计分析,具体包括:
7.根据权利要求1所述的一种数据库的智能隐私保护方法,其特征在于,所述对统计分析结果进行验证,具体包括:
8.根据权利要求1所述的一种数据库的智能隐私保护方法,其特征在于,所述在验证通过的情况下,进行数据访问记录分析,具体包括:
9.一种数据库的智能隐私保护设备,其特征在于,该设备包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该设备执行权利要求1-8中的任一项所述的方法。
10.一种非易失性计算机存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令能够执行权利要求1-8任一项所述的方法。
...【技术特征摘要】
1.一种数据库的智能隐私保护方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种数据库的智能隐私保护方法,其特征在于,所述通过预置敏感信息识别模型对待识别数据进行分析,得到参考敏感信息之前,所述方法还包括:
3.根据权利要求1所述的一种数据库的智能隐私保护方法,其特征在于,所述通过预置敏感信息识别模型对待识别数据进行分析,得到参考敏感信息,具体包括:
4.根据权利要求1所述的一种数据库的智能隐私保护方法,其特征在于,所述对所述参考敏感信息进行二次校验,将校验结果反馈至所述预置敏感信息识别模型,以对所述敏感信息识别模型进行优化,得到目标敏感信息识别模型,具体包括:
5.根据权利要求1所述的一种数据库的智能隐私保护方法,其特征在于,所述对脱敏处理后的数据进行统计分析之前,所述方法还包括...
【专利技术属性】
技术研发人员:张宁,王志斌,王帅,王颖泽,苗健,吕新杰,
申请(专利权)人:瀚高基础软件股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。