System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本说明书涉及人工智能,尤其是涉及一种印章脱敏模型建立方法、印章脱敏方法及装置。
技术介绍
1、将身份信息等敏感信息进行处理,可以保护隐私安全的,防止敏感信息被非法窃取。印章作为携带身份信息的重要载体,通常会含有人名,印章编号,公司名与手机号等敏感信息,在银行、保险与证券等金融企业或机构,在处理印章中的敏感信息时必须采取相应的安全防护措施。印章敏感信息脱敏作为一种有效的安全防护手段,有助于企业或机构合规运营,避免因数据泄露造成财产受损、引发法律纠纷。
2、现有的印章脱敏方案一般为马赛克覆盖、数据加密、物理遮挡以及ai智能擦除等。然而,使用马赛克覆盖的方式可能会破坏印章的基本结构,并且如果覆盖地不精细,马赛克覆盖后的印章仍然容易被逆向工程破解。数据加密技术是一种高效且保密性高的处理方式,即使原始数据被泄露,也难以直接读取得到敏感信息,但加密和解密过程可能会增加系统性能负担,复杂的加密算法还会导致实现难度和成本大大增加。使用物理遮挡处理印章敏感信息的方式简单且高效,但是实施成本同样较高,不适合大规模应用,并不具备普适性。使用ai智能擦除是一种相对比较好的方式,但ai智能擦除完全破坏了印章本身的数据价值,无法保持数据的关联性。
3、因此,亟需一种印章脱敏模型建立方法,使得建立的印章脱敏模型能够在保持印章基本结构的前提下,实现对印章的高效、低成本脱敏。
技术实现思路
1、鉴于目前印章脱敏方案难以在保留印章基本结构的前提下,实现对印章的高效、低成本脱敏,提出了本方案以便
2、一方面,本说明书的一些实施例的目的在于提供一种印章脱敏模型建立方法,所述方法包括:
3、获取具有印章的目标图像以及不具有印章的背景图像;
4、利用预训练的检测模型,从所述目标图像中分割得到印章标识;
5、根据所述印章标识确定对应的候选集,并基于所述候选集生成对应的合成印章标识;
6、对所述合成印章标识进行高斯模糊处理,得到模糊印章标识;
7、将所述背景图像作为背景,将所述合成印章标识融合至所述背景图像中,将模糊印章标识融合至所述背景图像中,得到成对的训练样本;
8、建立生成器以及马尔科夫判别器;
9、利用所述成对的训练样本单独交替迭代训练所述生成器以及马尔科夫判别器,得到训练完成的生成器以及马尔科夫判别器;所述训练完成的生成器以及马尔科夫判别器为印章脱敏模型,用于印章模糊化处理。
10、进一步地,利用预训练的检测模型,从所述目标图像中分割得到印章标识,包括:
11、利用预训练的检测模型,检测所述目标图像中是否存在印章标识,得到检测结果;
12、根据所述检测结果从所述目标图像中分割得到印章标识。
13、进一步地,所述预训练的检测模型利用如下方式训练得到:
14、对所述目标图像中的印章标识进行标记,得到标签信息;
15、根据所述标签信息及所述背景图像,构建得到训练样本集;
16、从训练样本集中随机选取批量样本;
17、将所述批量样本输入至检测模型的主干网络中,提取得到对应的特征图;
18、利用检测模型中的卷积神经网络分别对所述特征图进行预测,得到对应的热力图、位置偏移以及目标框;
19、根据所述的热力图、位置偏移以及目标框,利用预设的损失函数计算损失值;
20、基于所述损失值更新检测模型中的网络参数;
21、重复如上根据所述训练样本集更新所述网络参数的步骤,直至达到预设的收敛条件。
22、进一步地,根据所述印章标识确定对应的候选集,并基于所述候选集生成对应的合成印章标识,包括:
23、根据所述印章标识确定对应的多组印章文本信息以及印章外观信息;其中,所述印章文本信息包括字体格式、字体大小、文本内容、文本角度、字符间距中的一种或多种,所述印章外观信息包括印章大小、边框粗细、形状及颜色中的一种或多种;
24、对所述多组印章文本信息以及印章外观信息进行排列组合,得到印章组合信息,根据所述印章组合信息建立所述候选集;
25、从所述候选集中随机选取多个印章组合信息;
26、根据选取的印章组合信息生成对应的合成印章标识。
27、进一步地,将所述背景图像作为背景,将所述合成印章标识融合至所述背景图像中,将模糊印章标识融合至所述背景图像中,得到成对的训练样本,包括:
28、获取所述合成印章标识对应的像素坐标信息及像素信息,以及所述模糊印章标识对应的像素坐标信息及像素信息;
29、根据所述合成印章标识对应的像素坐标信息,确定所述背景图像中的第一待融合区域及所述第一待融合区域对应的像素信息;
30、根据所述模糊印章标识对应的像素坐标信息,确定所述背景图像中的第二待融合区域及所述第二待融合区域对应的像素信息;
31、将所述背景图像作为背景,并且在所述第一待融合区域中,将所述合成印章标识对应的像素信息与所述第一待融合区域对应的像素信息按照预设的系数进行线性运算,得到第一融合图像;
32、将所述背景图像作为背景,并且在所述第二待融合区域中,将所述模糊印章标识对应的像素信息与所述第二待融合区域对应的像素信息按照预设的系数进行线性运算,得到第二融合图像;
33、根据所述第一融合图像以及第二融合图像,构建得到成对的训练样本。
34、进一步地,所述生成器中的编码器用于逐层下采样,所述生成器中的解码器用于逐层上采样,编码器中的上采样层与解码器中的下采样层之间相互对称,并且每两个相互对称的层之间以跳跃连接的方式连接。
35、进一步地,利用所述成对的训练样本单独交替迭代训练所述生成器以及马尔科夫判别器,得到训练完成的生成器以及马尔科夫判别器,包括:
36、将所述训练样本输入至所述生成器中,以生成所述训练样本对应的生成图像;
37、将所述生成图像与所述训练样本输入至所述马尔科夫判别器中,以判断所述生成图像与所述训练样本是否匹配,得到判断结果;
38、根据所述判断结果计算损失,并基于所述损失,利用反向传播算法更新所述生成器以及马尔科夫判别器的参数;
39、重复如上根据所述训练样本更新所述生成器以及马尔科夫判别器的参数的步骤,直至达到预设的收敛次数,得到训练完成的生成器以及马尔科夫判别器;所述训练完成的生成器以及马尔科夫判别器为印章脱敏模型。
40、另一方面,本说明书的一些实施例还提供一种印章脱敏模型建立装置,所述装置包括:
41、另一方面,基于同一专利技术构思,本说明书的一些实施例还提供一种印章脱敏方法,所述方法包括:
42、接收待脱敏的图像;
43、将所述待脱敏的图像输入至利用前述任一实施例所述方法训练得到的印章脱敏模型中,得到脱敏后的图像。本文档来自技高网...
【技术保护点】
1.一种印章脱敏模型建立方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,利用预训练的检测模型,从所述目标图像中分割得到印章标识,包括:
3.根据权利要求2所述的方法,其特征在于,所述预训练的检测模型利用如下方式训练得到:
4.根据权利要求1所述的方法,其特征在于,根据所述印章标识确定对应的候选集,并基于所述候选集生成对应的合成印章标识,包括:
5.根据权利要求1所述的方法,其特征在于,将所述背景图像作为背景,将所述合成印章标识融合至所述背景图像中,将模糊印章标识融合至所述背景图像中,得到成对的训练样本,包括:
6.根据权利要求1所述的方法,其特征在于,所述生成器中的编码器用于逐层下采样,所述生成器中的解码器用于逐层上采样,编码器中的上采样层与解码器中的下采样层之间相互对称,并且每两个相互对称的层之间以跳跃连接的方式连接。
7.根据权利要求6所述的方法,其特征在于,利用所述成对的训练样本单独交替迭代训练所述生成器以及马尔科夫判别器,得到训练完成的生成器以及马尔科夫判别器,包括:
>8.一种印章脱敏方法,其特征在于,所述方法包括:
9.一种印章脱敏模型建立装置,其特征在于,所述装置包括:
10.一种印章脱敏装置,其特征在于,所述装置包括:
11.一种计算机设备,包括存储器、处理器、以及存储在所述存储器上的计算机程序,其特征在于,所述计算机程序被所述处理器运行时,执行根据权利要求1-8任意一项所述方法的指令。
12.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被计算机设备的处理器运行时,执行根据权利要求1-8任意一项所述方法的指令。
13.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器运行时,执行根据权利要求1-8任意一项所述方法的指令。
...【技术特征摘要】
1.一种印章脱敏模型建立方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,利用预训练的检测模型,从所述目标图像中分割得到印章标识,包括:
3.根据权利要求2所述的方法,其特征在于,所述预训练的检测模型利用如下方式训练得到:
4.根据权利要求1所述的方法,其特征在于,根据所述印章标识确定对应的候选集,并基于所述候选集生成对应的合成印章标识,包括:
5.根据权利要求1所述的方法,其特征在于,将所述背景图像作为背景,将所述合成印章标识融合至所述背景图像中,将模糊印章标识融合至所述背景图像中,得到成对的训练样本,包括:
6.根据权利要求1所述的方法,其特征在于,所述生成器中的编码器用于逐层下采样,所述生成器中的解码器用于逐层上采样,编码器中的上采样层与解码器中的下采样层之间相互对称,并且每两个相互对称的层之间以跳跃连接的方式连接。
7.根据权利要...
【专利技术属性】
技术研发人员:王迪,程海波,厉超,
申请(专利权)人:上海浦东发展银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。