人工识别名片信息的防泄密处理方法技术

技术编号:9007934 阅读:201 留言:0更新日期:2013-08-08 02:54
本发明专利技术提供一种人工识别名片信息的防泄密处理方法,该方法包括:获取用户的名片图像;将名片图像切割成不同类别的条目子模块,并记录条目子模块与名片图像的对应所属关系;将不同类别的条目子模块分发给操作人员进行人工识别;根据对应所属关系,对经人工识别后的不同类别的条目子模块的信息进行重组,获得名片图像的完整信息。本发明专利技术针对复杂的用机器识别算法难于识别或者要求极高识别率的名片图像,采用了一种人工识别的机制,通过将名片图像切割成条目子模块分发给操作人员识别,并在人工识别名片图像前,将涉及用户信息的条目子模块中的字块进行加密,既可以比机器更精确地识别名片,同时又能像机器识别名片一样,有效地保护用户的信息隐私。

【技术实现步骤摘要】

本专利技术属于图像处理
,涉及一种名片识别方法,特别是涉及一种。
技术介绍
当前已经有很多利用机器进行名片识别的软件,整个识别过程完全不需要人工参与,且能达到非常高的识别率,如名片全能王可以达到99%的识别率,能满足商务市场的需求。但是,在一些场合,现有的机器算法仍然无法满足需求,比如:1)识别阿拉伯语、希伯来语等语言的名片;2)要求100%准确识别名片。通过人眼的识别,可以解决这个问题,但是,建立人工识别的运维中心,会有泄漏用户信息的风险。由于名片识别不仅仅需要识别各个条目的信息,还需要识别条目的类别,一般情况下必须将整张名片的图像呈现给工人进行人眼识别,这就有可能因为工人的接触将用户的信息泄漏出去。一般的名片由如下字段组成:姓名,公司,职位,电话号码,电子邮件,地址,网页等等。工人获得名片图像后,需要判断出各个部分的文字图像对应的类型和内容,并将其类型和对应的内容输入到系统的数据库,再通过系统返回给用户。即用户的名片图像信息变成文字信息的过程中,操作员可以接触到整张名片信息,这就存在泄漏的风险。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种,用于解决现有技术中因人工接触用户名片信息导致的信息泄露的问题。为实现上述 目的及其他相关目的,本专利技术提供一种人工识别名片信息的防泄密处理方法。一种,所述包括:获取用户的名片图像;将所述名片图像切割成不同类别的条目子模块,并记录所述条目子模块与所述名片图像的对应所属关系;将所述不同类别的条目子模块分发给操作人员进行人工识别;根据所述对应所属关系,对经人工识别后的不同类别的条目子模块的信息进行重组,获得所述名片图像的完整信息。 优选地,所述不同类别的条目子模块包括姓名条目子模块、公司条目子模块、职位条目子模块、电话号码条目子模块、电子邮件条目子模块、或/和网页条目子模块。优选地,将所述不同类别的条目子模块分发给操作人员进行人工识别的具体步骤包括:将所述条目子模块继续切分成以单个数字、单个字符、或/和单个字母为单位的字块图像;对每个字块图像进行识别,判断其为数字、字符还是字母。优选地,将所述不同类别的条目子模块分发给操作人员进行人工识别的具体步骤包括:判断所述条目子模块中是否含有数字,若有则对所述数字进行A加密,记录第A加密规则,将A加密后的条目子模块供人工识别。优选地,所述A加密规则包括:对数字的位置进行随机调换;或插入无效数字混淆原有数字表不的含义。优选地,将所述不同类别的条目子模块分发给操作人员进行人工识别的具体步骤还包括:根据所述A加密规则,对人工识别后的包含数字的条目子模块的信息进行解密还原,获得所述条目子模块表示的真实信息。优选地,将所述不同类别的条目子模块分发给操作人员进行人工识别的具体步骤包括:判断所述条目子模块中是否含有英文字母和符号@,若有则对所述英文字母和符号@进行B加密,记录B加密规则,将B加密后的条目子模块供人工识别。优选地,所述B加密规则包括:对英文字母的位置进行随机调换;或插入无效英文字母或重复相邻英文字母混淆原有英文字母表示的含义。优选地,将所述不同类别的条目子模块分发给操作人员进行人工识别的具体步骤还包括:根据所述B加密规则,对人工识别后的包含英文字母和符号@的条目子模块的信息进行解密还原,获得所述条目子模块表示的真实信息。如上所述,本专利技术所述的,具有以下有益效果: 本专利技术针对复杂的用机器识别算法难于识别或者要求极高识别率的名片图像,采用了一种人工识别的机制,通过将名片图像切割成条目子模块分发给操作人员识别,并在人工识别名片图像前,将涉及用户信息的条目子模块中的字块进行加密,既可以比机器更精确地识别名片,同时又能像机器识别名片一样,有效地保护用户的信息隐私。附图说明图1为本专利技术所述的的流程示意图。图2为本专利技术所述的将不同类别的条目子模块分发给操作人员进行人工识别的流程示意图。具体实施例方式以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。请参阅附图。需要说明的是,本实施例中所提供的图示仅以示意方式说明本专利技术的基本构想,遂图式中仅显示与本专利技术中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。下面结合实施例和附图对本专利技术进行详细说明。实施例本实施例提供一种,如图1所示,所述包括:获取用户的名片图像;将所述名片图像切割成不同类别的条目子模块,并记录所述条目子模块与所述名片图像的对应所属关系;进一步,所述不同类别的条目子模块包括姓名条目子模块、公司条目子模块、职位条目子模块、电话号码条目子模块、电子邮件条目子模块、或/和网页条目子模块。将所述不同类别的条目子模块分发给操作人员进行人工识别,参见图2,具体步骤包括:首先,将所述条目子模块继续切分成以单个数字、单个字符、或/和单个字母为单位的字块图像;对每个字块图像进行识别,判断其为数字、字符还是字母。其次,判断所述条目子模块中的字块图像是否含有数字,若有则对所述数字进行A加密,记录第A加密规则,将A加密后的条目子模块供人工识别;根据所述A加密规则,对包含数字的条目子模块的人工识别信息进行解密还原,获得所述条目子模块表示的真实信息。其中,所述A加密规则包括:对数字的位置进行随机调换;或插入无效数字混淆原有数字表不的含义。判断所述条目子模块中的字块图像是否含有英文字母和符号@,若有则对所述英文字母和符号@进行B加密,记录B加密规则,将B加密后的条目子模块供人工识别;根据所述B加密规则,对包含英文字母和符号O的条目子模块的人工识别信息进行解密还原,获得所述条目子模块表示的真实信息。其中,所述B加密规则包括:对英文字母的位置进行随机调换;或插入无效英文字母或重复相邻英文字母混淆原有英文字母表示的含义。根据所述对应所属关系,对经人工识别后的不同类别的条目子模块的信息进行重组,获得所述名片图像的完整信息。假设有一张张三的名片图像,采用本专利技术所述的可以使一个操作人员只获得张三的电话号码图像区域(即电话号码条目子模块),该操作人员可以识别出该条目子模块的类型是电话号码和该电话号码的内容,但他并不知道这个电话号码是谁的,从而达到了保护用户信息的目的。对于某些孤立的名片区域条目图像信息,比如公司,职位,姓名,网页,并不会涉及到隐私;但是对于电话号码,完整的地址信息,电子邮件等条目,即使是孤立的条目子模块,也可以被利用来发送垃圾或者广告信息,对这部分区域的信息可以通过本专利技术所述的加密后在进行人工识别的方法来处理以达到保护用户信息的目的。例如:电话号码是由数字组成的,如果条目中含有数字,再判断数字个数是否大于5,若是则可基本断定该条目子模块为电话号码,此时将数字的相对位置进行随机的调整,并记录下对应的调整关系,比如电话号码为18701750441,调整后变成10157044078,工人识别后,再通过所述对应的调整关系恢复条目信息。这样,操作人员将无法接触到准确的电话号码。地址信息也本文档来自技高网...

【技术保护点】
一种人工识别名片信息的防泄密处理方法,其特征在于,所述人工识别名片信息的防泄密处理方法包括:获取用户的名片图像;将所述名片图像切割成不同类别的条目子模块,并记录所述条目子模块与所述名片图像的对应所属关系;将所述不同类别的条目子模块分发给操作人员进行人工识别;根据所述对应所属关系,对经人工识别后的不同类别的条目子模块的信息进行重组,获得所述名片图像的完整信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:张彬曹超阳李平新
申请(专利权)人:上海合合信息科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1