一种代码仓库中敏感信息的自动保护方法和装置制造方法及图纸

技术编号:33294340 阅读:9 留言:0更新日期:2022-05-01 00:20
本申请公开了一种代码仓库中敏感信息的自动保护方法和装置,具体为当代码仓库中有新提交的代码文件时,获取代码文件和代码文件的提交记录;对代码文件进行智能识别,识别出其中的敏感信息;对代码文件和提交记录进行脱敏处理;对经过脱敏处理的代码文件进行组装处理,得到完整的交付物,并将交付物提交到代码仓库。通过该方案即可自动完成对敏感信息的脱敏处理,而无需开发人员通过手工方式对敏感信息的处理,从而降低了程序开发的人工成本。从而降低了程序开发的人工成本。从而降低了程序开发的人工成本。

【技术实现步骤摘要】
一种代码仓库中敏感信息的自动保护方法和装置


[0001]本申请涉及程序开发
,更具体地说,涉及一种代码仓库中敏感信息的自动保护方法和装置。

技术介绍

[0002]代码仓库用于存储在程序开发过程中重复应用于的程序代码,能够减轻开发人员的工作量。原则上开发人员上传的代码中不能包括敏感信息,但因为人员素质参差不齐或者其他因素,导致敏感信息的误提交是一个很常见的问题,因此经常出现需要清理敏感信息的情况。
[0003]目前对代码仓库中敏感信息的发现和处理都是人工方式处理的,开发人员发现代码仓库中存在敏感信息后,需要手动清理代码,然后重新提交到代码仓库,还需要在提交历史记录中手动清理历史记录中的敏感信息才能完成本次敏感信息的清理工作,需要耗费开发人员的大量工作量,相应增加了程序开发的人工成本。

技术实现思路

[0004]有鉴于此,本申请提供一种代码仓库中敏感信息的自动保护方法和装置,用于自动理代码仓库中的敏感信息,以降低程序开发的人工成本。
[0005]为了实现上述目的,现提出的方案如下:
[0006]一种代码仓库中敏感信息的自动保护方法,所述自动保护方法包括步骤:
[0007]当所述代码仓库中有新提交的代码文件时,获取所述代码文件和所述代码文件的提交记录;
[0008]对所述代码文件进行智能识别,识别出其中的敏感信息;
[0009]对所述代码文件和所述提交记录进行脱敏处理;
[0010]对经过脱敏处理的代码文件进行组装处理,得到完整的交付物,并将所述交付物提交到所述代码仓库。
[0011]可选的,所述获取所述代码文件和所述代码文件的提交记录,包括步骤:
[0012]响应所述代码仓库触发的Webhook事件,从所述代码仓库获取所述代码文件和所述提交记录,并将所述代码文件和所述提交记录记录于本地。
[0013]可选的,所述对所述代码文件进行智能识别,识别出其中的敏感信息,包括步骤:
[0014]对所述代码文件进行逐行解析,从中得到多个源码段;
[0015]依次对每个所述源码段进行源码分析,识别出其中的敏感信息。
[0016]可选的,所述依次对每个所述源码段进行源码分析,识别出其中的敏感信息,包括步骤:
[0017]对所述源码段进行逐行处理,获取对应其中每个字符的ASC码;
[0018]基于所述ASC码做计算字母、数字、符号间的相邻数计算,得到所述源码段的非相邻随机率;
[0019]对所述非相邻随机率与预设的随机率阈值进行比较,如果所述非相邻随机率高于所述随机率阈值则确定所述源码段为所述敏感信息,反之则为正常信息。
[0020]可选的,所述对所述代码文件和所述提交记录进行脱敏处理,包括步骤:
[0021]清理所述代码仓库中存在所述敏感信息的代码文件的提交记录;
[0022]使用唯一标识处理敏感信息或者对所述敏感信息进行加密处理。
[0023]一种代码仓库中敏感信息的自动保护装置,所述自动保护装置包括:
[0024]文件获取模块,被配置为当所述代码仓库中有新提交的代码文件时,获取所述代码文件和所述代码文件的提交记录;
[0025]智能识别模块,被配置为对所述代码文件进行智能识别,识别出其中的敏感信息;
[0026]脱敏处理模块,被配置为对所述代码文件和所述提交记录进行脱敏处理;
[0027]组装提交模块,被配置为对经过脱敏处理的代码文件进行组装处理,得到完整的交付物,并将所述交付物提交到所述代码仓库。
[0028]可选的,所述文件获取模块被陪着为响应所述代码仓库触发的Webhook事件,从所述代码仓库获取所述代码文件和所述提交记录,并将所述代码文件和所述提交记录记录于本地。
[0029]可选的,所述智能识别模块包括:
[0030]文件解析单元,被配置为对所述代码文件进行逐行解析,从中得到多个源码段;
[0031]识别执行单元,被配置为依次对每个所述源码段进行源码分析,识别出其中的敏感信息。
[0032]可选的,所述识别执行单元包括:
[0033]码值获取子单元,用于对所述源码段进行逐行处理,获取对应其中每个字符的ASC码;
[0034]随机率计算子单元,用于基于所述ASC码做字母、数字、符号间的相邻数计算,得到所述源码段的非相邻随机率;
[0035]信息确定子单元,用于对所述非相邻随机率与预设的随机率阈值进行比较,如果所述非相邻随机率高于所述随机率阈值则确定所述源码段为所述敏感信息,反之则为正常信息。
[0036]可选的,所述脱敏处理模块包括:
[0037]第一脱敏单元,被配置为清理所述代码仓库中存在所述敏感信息的代码文件的提交记录;
[0038]第二脱敏单元,被配置为使用唯一标识处理敏感信息或者对所述敏感信息进行加密处理。
[0039]从上述的技术方案可以看出,本申请公开了一种代码仓库中敏感信息的自动保护方法和装置,具体为当代码仓库中有新提交的代码文件时,获取代码文件和代码文件的提交记录;对代码文件进行智能识别,识别出其中的敏感信息;对代码文件和提交记录进行脱敏处理;对经过脱敏处理的代码文件进行组装处理,得到完整的交付物,并将交付物提交到代码仓库。通过该方案即可自动完成对敏感信息的脱敏处理,而无需开发人员通过手工方式对敏感信息的处理,从而降低了程序开发的人工成本。
附图说明
[0040]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0041]图1为本申请实施例的一种代码仓库中敏感信息的自动保护方法的流程图;
[0042]图2为本申请实施例的一种代码仓库中敏感信息的自动保护装置的框图;
[0043]图3为本申请实施例的另一种代码仓库中敏感信息的自动保护装置的框图;
[0044]图4为本申请实施例的又一种代码仓库中敏感信息的自动保护装置的框图;
[0045]图5为本申请实施例的又一种代码仓库中敏感信息的自动保护装置的框图。
具体实施方式
[0046]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0047]实施例一
[0048]图1为本申请实施例的一种代码仓库中敏感信息的自动保护方法的流程图。
[0049]如图1所示,本实施例提供的自动保护方法用于对代码仓库中的敏感信息进行自动处理,该代码仓库中一般包括接收开发人员上传的代码文件的源码仓库和用于发布本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种代码仓库中敏感信息的自动保护方法,其特征在于,所述自动保护方法包括步骤:当所述代码仓库中有新提交的代码文件时,获取所述代码文件和所述代码文件的提交记录;对所述代码文件进行智能识别,识别出其中的敏感信息;对所述代码文件和所述提交记录进行脱敏处理;对经过脱敏处理的代码文件进行组装处理,得到完整的交付物,并将所述交付物提交到所述代码仓库。2.如权利要求1所述的自动保护方法,其特征在于,所述获取所述代码文件和所述代码文件的提交记录,包括步骤:响应所述代码仓库触发的Webhook事件,从所述代码仓库获取所述代码文件和所述提交记录,并将所述代码文件和所述提交记录记录于本地。3.如权利要求1所述的自动保护方法,其特征在于,所述对所述代码文件进行智能识别,识别出其中的敏感信息,包括步骤:对所述代码文件进行逐行解析,从中得到多个源码段;依次对每个所述源码段进行源码分析,识别出其中的敏感信息。4.如权利要求3所述的自动保护方法,其特征在于,所述依次对每个所述源码段进行源码分析,识别出其中的敏感信息,包括步骤:对所述源码段进行逐行处理,获取对应其中每个字符的ASC码;基于所述ASC码做字母、数字、符号间的相邻数计算,得到所述源码段的非相邻随机率;对所述非相邻随机率与预设的随机率阈值进行比较,如果所述非相邻随机率高于所述随机率阈值则确定所述源码段为所述敏感信息,反之则为正常信息。5.如权利要求1所述的自动保护方法,其特征在于,所述对所述代码文件和所述提交记录进行脱敏处理,包括步骤:清理所述代码仓库中存在所述敏感信息的代码文件的提交记录;使用唯一标识处理敏感信息或者对所述敏感信息进行加密处理。6.一种代码仓库中敏感信息的自动保护装置,其特征在于,...

【专利技术属性】
技术研发人员:肖宝粮叶静涛
申请(专利权)人:湖南快乐阳光互动娱乐传媒有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1