System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 信息打码处理方法、装置、电子设备和可读存储介质制造方法及图纸_技高网

信息打码处理方法、装置、电子设备和可读存储介质制造方法及图纸

技术编号:41626984 阅读:2 留言:0更新日期:2024-06-13 02:26
本发明专利技术提供一种信息打码处理方法、装置、电子设备和可读存储介质,在获取上传的图片后,确定出图片中包括的多个文本块,获得各个文本块的类型,并确定出不同类型的文本块之间的关联关系。获取待处理信息,根据待处理信息和关联关系确定待处理的目标文本块,对确定出的目标文本块进行打码处理。本方案中,通过对图片中的文本块进行类型以及关联关系的确定,从而可以基于普适性的待处理信息,自动确定所需处理的文本块,进而进行打码处理。如此,可以在高自动化程度、高普适性的情况下,成功避免隐私信息的泄露。

【技术实现步骤摘要】

本专利技术涉及信息处理,具体而言,涉及一种信息打码处理方法、装置、电子设备和可读存储介质


技术介绍

1、在当前的信息化时代,在诸多领域中,用户经常需要在线上提交一些具有个人隐私信息的影像资料,以便于业务办理,例如身份证、结婚证、银行卡、行驶证等。这些影像资料由于涉及到用户的隐私信息,为了保证隐私信息不被泄露,通常需要对影像资料中的核心信息进行打码处理,例如进行马赛克处理、覆盖处理等。传统的人工处理方式效率低下,且难以处理大量业务,因此,利用基于深度学习的图像识别以及文本识别的处理方式目前比较常用。

2、但是,目前基于深度学习的处理方式中,仅仅对图片中的文字进行识别,然后基于选择进行打码处理。这种方式在打码处理时,每次需要进行具体打码对象的选择,普适性不强、自动化程度低。


技术实现思路

1、本专利技术的目的包括,例如,提供了一种信息打码处理方法、装置、电子设备和可读存储介质,其能够实现高自动化程度、高普适性地隐私信息泄露避免。

2、本专利技术的实施例可以这样实现:

3、第一方面,本专利技术提供一种信息打码处理方法,所述方法包括:

4、获取上传的图片,并确定出所述图片中包括的多个文本块;

5、获得各所述文本块的类型,并确定出不同类型的文本块之间的关联关系;

6、获取待处理信息,根据所述待处理信息和所述关联关系确定待处理的目标文本块;

7、对确定出的目标文本块进行打码处理。

8、在可选的实施方式中,所述获取上传的图片之后,所述方法还包括:

9、将所述图片输入预先训练得到的异常检测模型中,所述异常检测模型包括特征提取层以及与所述特征提取层连接的识别子网络;

10、通过所述特征提取层提取得到所述图片的图像特征;

11、利用所述识别子网络并基于所述图像特征,输出所述图片的异常识别结果。

12、在可选的实施方式中,所述识别子网络包括分别与所述特征提取层连接的第一识别子网络、第二识别子网络和第三识别子网络;

13、所述利用所述识别子网络并基于所述图像特征,输出所述图片的异常识别结果的步骤,包括:

14、利用所述第一识别子网络并基于所述图像特征输出所述图片对应的证件类型检测结果;

15、利用所述第二识别子网络并基于所述图像特征输出所述图片对应的整体异常识别结果;

16、利用所述第三识别子网络并基于所述图像特征输出所述图片对应的局部异常识别结果。

17、在可选的实施方式中,所述方法还包括预先训练得到异常检测模型的步骤,该步骤包括:

18、采集多张包括多种证件类型的图片样本,所述多张图片样本包括正样本和负样本,所述负样本包括整体异常的负样本以及局部异常的负样本;

19、利用所述多张图片样本并在构建的损失函数的指导下对建立的网络模型进行训练,直至满足预设要求时,得到训练完成的异常检测模型;

20、其中,所述损失函数由第一损失函数和第二损失函数按照对应权重累加得到,所述第一损失函数由整体异常损失函数和局部异常损失函数累加得到,所述局部异常损失函数中添加有smooth l1损失函数。

21、在可选的实施方式中,所述确定出所述图片中包括的多个文本块的步骤,包括:

22、对所述图片进行文本检测与识别,获得所述图片中包含的文本的位置信息和文本信息;

23、基于所述图片中包含的文本的位置信息划定得到多个文本块。

24、在可选的实施方式中,所述获得各所述文本块的类型,并确定出不同类型的文本块之间的关联关系的步骤,包括:

25、根据各所述文本块的位置信息从所述图片中裁剪出各所述文本块;

26、基于裁剪出的各所述文本块、各所述文本块的文本信息以及各所述文本块的位置信息,获得各所述文本块的类型和不同类型的文本块之间的关联关系,所述类型包括第一类型和第二类型,所述关联关系为第一类型的文本块与第二类型的文本块之间的关联关系。

27、在可选的实施方式中,所述对确定出的目标文本块进行打码处理的步骤,包括:

28、根据所述目标文本块的位置信息确定所述目标文本块的尺寸信息;

29、基于所述位置信息和尺寸信息对所述目标文本块进行打码处理;

30、将打码处理后的目标文本块还原至所述图片中。

31、第二方面,本专利技术提供一种信息打码处理装置,所述装置包括:

32、获取模块,用于获取上传的图片,并确定出所述图片中包括的多个文本块;

33、确定模块,用于获得各所述文本块的类型,并确定出不同类型的文本块之间的关联关系;

34、确定模块,还用于获取待处理信息,根据所述待处理信息和所述关联关系确定待处理的目标文本块;

35、处理模块,用于对确定出的目标文本块进行打码处理。

36、第三方面,本专利技术提供一种电子设备,包括一个或多个存储介质和一个或多个与存储介质通信的处理器,一个或多个存储介质存储有处理器可执行的机器可执行指令,当电子设备运行时,处理器执行所述机器可执行指令,以执行前述实施方式中任意一项所述的方法。

37、第四方面,本专利技术提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如前述实施方式中任意一项所述的方法。

38、本专利技术实施例的有益效果包括,例如:

39、本专利技术提供一种信息打码处理方法、装置、电子设备和可读存储介质,在获取上传的图片后,确定出图片中包括的多个文本块,获得各个文本块的类型,并确定出不同类型的文本块之间的关联关系。获取待处理信息,根据待处理信息和关联关系确定待处理的目标文本块,对确定出的目标文本块进行打码处理。本方案中,通过对图片中的文本块进行类型以及关联关系的确定,从而可以基于普适性的待处理信息,自动确定所需处理的文本块,进而进行打码处理。如此,可以在高自动化程度、高普适性的情况下,成功避免隐私信息的泄露。

本文档来自技高网...

【技术保护点】

1.一种信息打码处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的信息打码处理方法,其特征在于,所述获取上传的图片之后,所述方法还包括:

3.根据权利要求2所述的信息打码处理方法,其特征在于,所述识别子网络包括分别与所述特征提取层连接的第一识别子网络、第二识别子网络和第三识别子网络;

4.根据权利要求3所述的信息打码处理方法,其特征在于,所述方法还包括预先训练得到异常检测模型的步骤,该步骤包括:

5.根据权利要求1所述的信息打码处理方法,其特征在于,所述确定出所述图片中包括的多个文本块的步骤,包括:

6.根据权利要求5所述的信息打码处理方法,其特征在于,所述获得各所述文本块的类型,并确定出不同类型的文本块之间的关联关系的步骤,包括:

7.根据权利要求6所述的信息打码处理方法,其特征在于,所述对确定出的目标文本块进行打码处理的步骤,包括:

8.一种信息打码处理装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,包括一个或多个存储介质和一个或多个与存储介质通信的处理器,一个或多个存储介质存储有处理器可执行的机器可执行指令,当电子设备运行时,处理器执行所述机器可执行指令,以执行权利要求1-7中任意一项所述的方法。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-7中任意一项所述的方法。

...

【技术特征摘要】

1.一种信息打码处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的信息打码处理方法,其特征在于,所述获取上传的图片之后,所述方法还包括:

3.根据权利要求2所述的信息打码处理方法,其特征在于,所述识别子网络包括分别与所述特征提取层连接的第一识别子网络、第二识别子网络和第三识别子网络;

4.根据权利要求3所述的信息打码处理方法,其特征在于,所述方法还包括预先训练得到异常检测模型的步骤,该步骤包括:

5.根据权利要求1所述的信息打码处理方法,其特征在于,所述确定出所述图片中包括的多个文本块的步骤,包括:

6.根据权利要求5所述的信息打码处理方法,其特征在于,所述获得各所...

【专利技术属性】
技术研发人员:朱羽王小东吕文勇周智杰廖浩
申请(专利权)人:成都新希望金融信息有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1