文档图像分类方法、装置、存储介质及计算机设备制造方法及图纸

技术编号:36043004 阅读:13 留言:0更新日期:2022-12-21 10:49
本申请提供的文档图像分类方法、装置、存储介质及计算机设备,所述方法包括:接收多个待分类文档图像;获取每个所述待分类文档图像的文本信息;利用已设置的文本二分类模型,识别并标记每个所述文本信息中的各个目标关键词;确定每个所述文本信息中任意两个所述目标关键词在该文本信息所属待分类文档图像中的空间关系;依据各个所述目标关键词以及各个所述空间关系,确定与各个所述待分类文档图像对应的二维关键词序列;依据所述二维关键词序列对各个所述待分类文档图像进行分类,得到分类结果。应用本申请提供的方法,在同类文档图像经过已设置的模型后可以提取出相同的二维关键词序列,从而能够针对文字密集的文档图像做出较好的分类结果。出较好的分类结果。出较好的分类结果。

【技术实现步骤摘要】
文档图像分类方法、装置、存储介质及计算机设备


[0001]本申请涉及计算机
,尤其涉及一种文档图像分类方法、装置、存储介质及计算机设备。

技术介绍

[0002]随着计算机技术的不断发展,办公电子化在各行各业得到了广泛应用,为了方便保存与查阅,纸质版的文档资料逐渐转化为图像。面对众多的图像,分类技术应运而生。现有的图像分类方法有很多种,如果是简单的图像可以直接编写特征分类算法,或者使用传统机器学习算法进行快速建模实验,如果是复杂的图像则需要使用深度学习算法。
[0003]专利技术人经过研究发现,现有的图像分类方法在自然场景应用广泛,但因为不同类别的文档图像之间的图像特征差异可能非常微小,不像自然场景下不同物体之间的特征差异那么显著,所以若将现有的图像分类方法应用到文字密集的文档图像中,无法得到较好的分类效果。

技术实现思路

[0004]本申请的目的旨在至少能解决上述的技术缺陷之一,特别是现有技术中无法针对文字密集的文档图像做出较好分类结果的技术缺陷。
[0005]第一方面,本申请实施例提供了一种文档图像分类方法,所述方法包括:
[0006]接收多个待分类文档图像;
[0007]获取每个所述待分类文档图像的文本信息;
[0008]利用已设置的文本二分类模型,识别并标记每个所述文本信息中的各个目标关键词;
[0009]确定每个所述文本信息中任意两个所述目标关键词在该文本信息所属待分类文档图像中的空间关系;
[0010]依据各个所述目标关键词以及各个所述空间关系,确定与各个所述待分类文档图像对应的二维关键词序列;
[0011]依据所述二维关键词序列对各个所述待分类文档图像进行分类,得到分类结果。
[0012]在其中一个实施例中,所述获取每个所述待分类文档图像的文本信息的步骤,包括:
[0013]扫描每个所述待分类文档图像,确定每个所述待分类文档图像中包含的各个字符;
[0014]对各个所述字符进行初始化,以校正各个所述字符的字符格式;
[0015]依据经过初始化的各个字符,确定每个所述待分类文档图像的文本信息。
[0016]在其中一个实施例中,所述确定每个所述文本信息中任意两个所述目标关键词在该文本信息所属待分类文档图像中的空间关系的步骤,包括:
[0017]在每个所述待分类文档图像中,确定每两个所述目标关键词的X方向距离值和Y方
向距离值;
[0018]确定第一距离值与第二距离值,所述第一距离值为各个所述X方向距离值中数值最大的X方向距离值,所述第二距离值为各个所述Y方向距离值中数值最大的Y方向距离值;
[0019]计算每两个所述目标关键词的X方向距离与所述第一距离值的第一距离比例,以及每两个所述目标关键词的Y方向距离与所述第二距离值的第二距离比例;
[0020]依据所述第一距离比例与所述第二距离比例确定每两个所述目标关键词之间的空间关系。
[0021]在其中一个实施例中,所述依据各个所述目标关键词以及各个所述空间关系,确定与各个所述待分类文档图像对应的二维关键词序列的步骤,包括:
[0022]在每个所述待分类文档图像中,依据各个所述目标关键词的文本信息,以及每两个所述目标关键词之间的所述空间关系,得到每两个所述目标关键词对应的子序列;
[0023]由各个所述子序列组成各个所述待分类文档图像对应的二维关键词序列。
[0024]在其中一个实施例中,在属于同一类的各个所述待文档图像中,每两个所述待分类文档图像对应的二维关键词序列之间的相似度大于预设阈值。
[0025]第二方面,本申请实施例还提供了一种文档图像分类装置,所述装置包括:
[0026]文档图像接收模块,用于接收多个待分类文档图像;
[0027]文本信息获取模块,用于获取每个所述待分类文档图像的文本信息;
[0028]目标关键词标记模块,用于利用已设置的文本二分类模型,识别并标记每个所述文本信息中的各个目标关键词;
[0029]空间关系确定模块,用于确定每个所述文本信息中任意两个所述目标关键词在该文本信息所属待分类文档图像中的空间关系;
[0030]二维关键词序列确定模块,用于依据各个所述目标关键词以及各个所述空间关系,确定与各个所述待分类文档图像对应的二维关键词序列;
[0031]文档图像分类模块,用于依据所述二维关键词序列对各个所述待分类文档图像进行分类,得到分类结果。
[0032]在其中一个实施例中,所述文本信息获取模块包括:
[0033]文档图像扫描单元,用于扫描每个所述待分类文档图像,确定每个所述待分类文档图像中包含的各个字符;
[0034]字符初始化单元,用于对各个所述字符进行初始化,以校正各个所述字符的字符格式;
[0035]文本信息确定单元,用于依据经过初始化的各个字符,确定每个所述待分类文档图像的文本信息。
[0036]在其中一个实施例中,所述空间关系确定模块包括:
[0037]距离值确定单元,用于在每个所述待分类文档图像中,确定每两个所述目标关键词的X方向距离值和Y方向距离值;
[0038]最大距离值确定单元,用于确定第一距离值与第二距离值,所述第一距离值为各个所述X方向距离值中数值最大的X方向距离值,所述第二距离值为各个所述Y方向距离值中数值最大的Y方向距离值;
[0039]距离比例计算单元,用于计算每两个所述目标关键词的X方向距离与所述第一距
离值的第一距离比例,以及每两个所述目标关键词的Y方向距离与所述第二距离值的第二距离比例;
[0040]空间关系确定单元,用于依据所述第一距离比例与所述第二距离比例确定每两个所述目标关键词之间的空间关系。
[0041]第三方面,本申请实施例提供了一种存储介质,所述存储介质中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述任一实施例所述文档图像分类方法的步骤。
[0042]第四方面,本申请实施例提供了一种计算机设备,包括:一个或多个处理器,以及存储器;
[0043]所述存储器中存储有计算机可读指令,所述计算机可读指令被所述一个或多个处理器执行时,执行上述任一实施例所述文档图像分类方法的步骤
[0044]从以上技术方案可以看出,本申请实施例具有以下优点:
[0045]本申请提供的文档图像分类方法、装置、存储介质及计算机设备,所述方法包括:接收多个待分类文档图像;获取每个所述待分类文档图像的文本信息;利用已设置的文本二分类模型,识别并标记每个所述文本信息中的各个目标关键词;确定每个所述文本信息中任意两个所述目标关键词在该文本信息所属待分类文档图像中的空间关系;依据各个所述目标关键词以及各个所述空间关系,确定与各个所述待分类文档图像对应的二维关键词序列;依据所述二维关键词序列对各个所述待分类文档图像进行分类,得到分类结果。应用本申请提供的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文档图像分类方法,其特征在于,所述方法包括:接收多个待分类文档图像;获取每个所述待分类文档图像的文本信息;利用已设置的文本二分类模型,识别并标记每个所述文本信息中的各个目标关键词;确定每个所述文本信息中任意两个所述目标关键词在该文本信息所属待分类文档图像中的空间关系;依据各个所述目标关键词以及各个所述空间关系,确定与各个所述待分类文档图像对应的二维关键词序列;依据所述二维关键词序列对各个所述待分类文档图像进行分类,得到分类结果。2.根据权利要求1所述的文档图像分类方法,其特征在于,所述获取每个所述待分类文档图像的文本信息的步骤,包括:扫描每个所述待分类文档图像,确定每个所述待分类文档图像中包含的各个字符;对各个所述字符进行初始化,以校正各个所述字符的字符格式;依据经过初始化的各个字符,确定每个所述待分类文档图像的文本信息。3.根据权利要求1所述的文档图像分类方法,其特征在于,所述确定每个所述文本信息中任意两个所述目标关键词在该文本信息所属待分类文档图像中的空间关系的步骤,包括:在每个所述待分类文档图像中,确定每两个所述目标关键词的X方向距离值和Y方向距离值;确定第一距离值与第二距离值,所述第一距离值为各个所述X方向距离值中数值最大的X方向距离值,所述第二距离值为各个所述Y方向距离值中数值最大的Y方向距离值;计算每两个所述目标关键词的X方向距离与所述第一距离值的第一距离比例,以及每两个所述目标关键词的Y方向距离与所述第二距离值的第二距离比例;依据所述第一距离比例与所述第二距离比例确定每两个所述目标关键词之间的空间关系。4.根据权利要求1所述的文档图像分类方法,其特征在于,所述依据各个所述目标关键词以及各个所述空间关系,确定与各个所述待分类文档图像对应的二维关键词序列的步骤,包括:在每个所述待分类文档图像中,依据各个所述目标关键词的文本信息,以及每两个所述目标关键词之间的所述空间关系,得到每两个所述目标关键词对应的子序列;由各个所述子序列组成各个所述待分类文档图像对应的二维关键词序列。5.根据权利要求1所述的文档图像分类方法,其特征在于,在属于同一类的各个所述待文档图像中,每两个所述待分类文档图像对应的二维关键词序列之间的相似度大于预设阈值。6.一种文档图像分类装置,其特征在...

【专利技术属性】
技术研发人员:卞晓瑜肖鸣林周浩然
申请(专利权)人:壹沓科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1