System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于联邦学习的敏感数据异常访问检测方法技术_技高网

基于联邦学习的敏感数据异常访问检测方法技术

技术编号:43890985 阅读:3 留言:0更新日期:2025-01-03 13:06
本发明专利技术公开了一种基于联邦学习的敏感数据异常访问检测方法;该方法包括:通过联邦学习实现分布式训练,允许在保护用户隐私的前提下,从各个参与方的本地设备上收集模型参数并进行聚合,以构建全局的文本分类模型,从而保障数据隐私和安全;构建TextCNN模型,在本地设备上用于训练文本分类模型,能够有效地捕获文本中的局部特征,提高模型在本地数据上的准确性和泛化能力,对用户输入,程序日志等文本数据进行判断是否异常访问;本发明专利技术相较于获得令牌即可持续访问资源的静态管理方法,通过识别文本可以根据实际情况进行动态的进行异常访问检测,并且利用联邦学习,可以在保护数据安全的情况下,扩充模型训练所需要的数据量,提高模型的泛化能力。

【技术实现步骤摘要】

本专利技术涉及数据安全管控,具体的涉及基于联邦学习的敏感数据异常访问检测方法


技术介绍

1、现有计算机技术的发展,各行业大量数据通过数字化存储和处理。使得数据更容易被访问、复制和传输,同时也增加了数据面临的风险,数据泄露可能导致对个人或组织的隐私、安全、财产造成严重损失。在数据管理中,异常访问是控制数据泄露的关键步骤;

2、目前数据异常访问检测主要使用以下方法:

3、基于规则的方法:依赖于事先定义好的规则集来检测异常访问行为;例如定义一些访问频率、时间间隔、地理位置等方面的规则,当某个访问行为违反了这些规则时,就会被标记为异常。如基于行为分析方法,通过对用户的行为特征进行建模分析并定义用户行为规则,来检测某个用户在短时间内频繁访问敏感数据的行为,或者检测未授权的用户访问敏感数据的情况;还有基于统计规则的方法,利用数据的统计特征,包括均值、方差、分布等,来制定与正常访问行为不符的模式规则以检测异常行为。

4、基于机器学习的方法:机器学习技术能够通过对历史数据的学习,识别并预测未知的异常访问。常用的机器学习算法包括支持向量机(svm)、决策树、随机森林等。上述算法可以从大量数据中学习出模式,并能够自动适应新的数据情况。

5、基于身份与事件管理的方法:通过密钥和令牌管理系统来控制对敏感数据的访问权限,只有拥有有效密钥或者令牌的用户才能访问敏感数据。定期审计和监控系统日志,以及对敏感数据的访问日志,及时发现异常访问行为并进行处理。审计和日志监控能够帮助发现潜在的安全风险和威胁,保护敏感数据的安全。

6、专利号cn107426199b公开了一种网络异常行为检测与分析的方法及系统。该专利技术基于机器学习算法,根据用户的访问行为特征数据,构建支持向量机模型,对行为进行预测分析以识别异常访问行为。

7、专利号cn106570131a公开了一种基于聚类分析的敏感数据异常访问检测方法。通过建立违规场景业务规则方式,并利用聚类分析算法挖掘可能存在的违规访问,形成新的违规业务场景规则。解决了由规则更新缓慢导致无法检测新违规访问行为的问题。

8、专利号cn110213077b公开了一种确定电力监控系统安全事件的方法、装置及系统。通过关联告警记录构建攻击树,进行聚合处理与剪枝降噪得到最终的攻击链集合,确定电力监控系统安全事件。

9、专利号cn109525558b公开了一种数据泄露检测方法、系统、装置及存储介质。根据追踪和记录各会话访问流量行为,生成历史流量日志,与预设异常特征集进行匹配,得到异常特征所属类别,由所属类别判断对应的策略。

10、上述方法存在一定的局限性:

11、基于规则的方法可能会受到规则本身的刚性限制,无法适应复杂多变的访问模式。如果规则设计不够灵活或者不够全面,可能会导致漏报或误报的问题。行为分析方法需要对用户的行为模式和特征进行深入的分析和理解,这需要大量的数据和复杂的算法模型。而且,行为模式可能会随着时间的变化而变化,需要不断地更新和调整分析模型。审计和日志监控需要大量的人力和资源投入,而且对数据的处理和分析需要一定的时间和技术支持。如果监控系统不够及时和高效,可能会导致异常访问行为被忽视或者延误处理。在使用机器学习方法时,如果训练样本不足或者不够代表性,可能会导致模型的泛化能力不足,无法准确地检测异常访问行为。

12、数据的数量与质量决定了检测的准确度,然而,相关数据通常分布在不同地区或组织之间,某一方只拥有部分维度数据,上述方法要在不同的机构之间实现数据的共享利用,通常需要将不同机构的数据传输至中心服务器上进行集中处理,这可能导致敏感信息的泄露风险。一旦中心服务器被攻击或出现故障,所有数据都可能暴露或受损。


技术实现思路

1、为了解决上述问题,本专利技术提供一种基于联邦学习的敏感数据异常访问检测方法,将联邦学习与textcnn模型相结合,允许在保护用户隐私的同时,通过本地设备训练文本数据的模型,并将参数聚合到中央服务器,实现对敏感数据异常访问的实时监测和识别,保障数据安全。

2、该方法包含以下步骤:

3、s1、数据准备:收集参与方的文本数据,包括正常访问和的异常访问数据。

4、s1.1、对文本数据进行标记,将正常访问和异常访问标记为不同的类别。

5、s2、模型初始化:在每个参与方本地初始化textcnn(文本卷积神经网络)模型。

6、s3、本地训练:每个参与方使用本地的文本数据对textcnn模型进行训练。确保敏感数据不会离开参与方的本地环境,保护数据的隐私和安全性。

7、s4、模型上传:每个参与方训练完毕后,将更新的模型参数上传至中央服务器。在上传模型参数之前,对模型参数进行加密或者其他安全处理,确保模型参数的安全传输。

8、s5、参数聚合:中央服务器收到来自各个参与方的模型参数后,进行参数聚合。采用联邦平均等方法来更新全局模型。更新后的全局模型将包含各个参与方的本地数据模式和特征,以及对应的异常访问检测能力。

9、s6、模型评估:在中央服务器上或者在各个参与方本地评估更新后的全局模型的性能。

10、s7、部署和监控:将更新后的全局模型部署到实际系统中,并设置监控机制来实时检测文本访问行为。监控系统会根据全局模型的输出结果对文本访问行为进行分类,以识别异常访问行为。

11、s8、反馈和更新:根据实际应用中的反馈信息,对全局模型进行定期更新和优化,以提高模型的识别准确性和效率。

12、进一步的,所述参与方包括不同的机构或用户。

13、进一步的,所述textcnn包括卷积层、池化层和全连接层等组件。

14、进一步的,所述评估包括准确率、召回率、f1值等指标。

15、本专利技术的有益效果:

16、与现有技术相比,本专利技术的有益效果:

17、相比于现有的基于规则、统计、行为分析的方法,textcnn模型不需要依赖预先定义的规则或者统计模型;能够通过学习文本数据中的模式和特征来自动适应不同类型的文本数据和不同的异常访问行为,而无需人为调整。

18、相比于令牌管理方法,利用textcnn模型识别文本则不需要用户进行额外的身份验证,只需要对用户的文本访问行为进行监测和分析,可以减少用户的操作负担,无需进行获取、管理令牌等操作,提高用户体验。适用范围广泛,textcnn识别文本可以应用于各种类型的文本数据,包括用户输入的文本、应用程序产生的日志文本等。而令牌管理通常只适用于需要对用户进行身份验证和授权的场景。动态检测:textcnn识别文本可以动态地根据实际情况进行异常检测,而令牌管理通常是静态的,一旦用户获取了有效的令牌就可以持续访问相应的资源。

19、相比于机器学习方法,textcnn能够通过端到端的学习方式从文本数据中自动学习到特征和模式,而无需人为地定义规则或者手工提取特征。这使得模型的设计本文档来自技高网...

【技术保护点】

1.一种基于联邦学习的敏感数据异常访问检测方法,其特征在于:包括以下步骤:

2.如权利要求1所述的基于联邦学习的敏感数据异常访问检测方法,其特征在于:还包括以下步骤:

3.如权利要求1所述的基于联邦学习的敏感数据异常访问检测方法,其特征在于:其中S2步骤还包括S2.1、所述TextCNN模型包括卷积层、池化层和全连接层组件。

4.如权利要求1所述的基于联邦学习的敏感数据异常访问检测方法,其特征在于:其中S4步骤还包括S4.1、在上传模型参数前,对所述模型参数进行安全处理。

5.如权利要求4所述的基于联邦学习的敏感数据异常访问检测方法,其特征在于:所述安全处理为加密。

6.如权利要求2所述的基于联邦学习的敏感数据异常访问检测方法,其特征在于:所述评估包括准确率、召回率、F1值的指标。

7.如权利要求2所述的基于联邦学习的敏感数据异常访问检测方法,其特征在于:所述监控系统根据全局模型的输出结果对文本访问行为进行分类,识别异常访问行为。

8.如权利要求1所述的基于联邦学习的敏感数据异常访问检测方法,其特征在于:所述文本数据包括但不限于用户输入的文本和应用程序产生的日志文本。

...

【技术特征摘要】

1.一种基于联邦学习的敏感数据异常访问检测方法,其特征在于:包括以下步骤:

2.如权利要求1所述的基于联邦学习的敏感数据异常访问检测方法,其特征在于:还包括以下步骤:

3.如权利要求1所述的基于联邦学习的敏感数据异常访问检测方法,其特征在于:其中s2步骤还包括s2.1、所述textcnn模型包括卷积层、池化层和全连接层组件。

4.如权利要求1所述的基于联邦学习的敏感数据异常访问检测方法,其特征在于:其中s4步骤还包括s4.1、在上传模型参数前,对所述模型参数进行安全处理。

5.如权...

【专利技术属性】
技术研发人员:张希翔艾徐华银源陈昭利董贇刘凯杰黄依婷蒙琦张丽媛廖邓彬
申请(专利权)人:广西电网有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1