文本审核方法、装置、电子设备和计算机可读介质制造方法及图纸

技术编号:30145345 阅读:19 留言:0更新日期:2021-09-23 15:18
本公开的实施例公开了文本审核方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:生成目标图像对应的热力图;根据热力图,对目标图像进行图像分割,以生成区域图像集合;对区域图像集合中的每个区域图像进行文本方向检测,以生成区域图像对应的文本方向信息;根据热力图和区域图像集合中每个区域图像对应的文本方向信息,对区域图像进行细化分割,以生成子图像,得到子图像集合;对子图像集合中的每个子图像进行文本识别,以生成文本信息,得到文本信息集合;对文本信息集合中的每个文本信息进行敏感词匹配,以生成文本审核结果,得到文本审核结果集合。该实施方式提高了文本识别的准确率和文本审核的准确率。提高了文本识别的准确率和文本审核的准确率。提高了文本识别的准确率和文本审核的准确率。

【技术实现步骤摘要】
文本审核方法、装置、电子设备和计算机可读介质


[0001]本公开的实施例涉及计算机
,具体涉及文本审核方法、装置、电子设备和计算机可读介质。

技术介绍

[0002]文本审核是指对物品对应的展示信息中的内容,进行审核的一项技术。目前,在对物品对应的展示信息进行文本审核时,通常采用的方式为:采用人工的方式进行文本审核。
[0003]然而,当采用上述方式进行文本审核时,经常会存在如下技术问题:第一、随着待审核的物品对应的展示信息的数量增加,采用人工的方式,会消耗大量的审核成本,同时审核效率难以提高;第二、由于物品对应的展示信息中的文本的排列方向往往不同,采用单一方向的文本识别方法,往往会导致得到的文本识别结果不够准确,进而导致文本审核的准确率不高。

技术实现思路

[0004]本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0005]本公开的一些实施例提出了文本审核方法、装置、电子设备和计算机可读介质,来解决以上
技术介绍
部分提到的技术问题中的一项或多项。
[0006]第一方面,本公开的一些实施例提供了一种文本审核方法,该方法包括:根据目标图像中文字的分布,生成上述目标图像对应的热力图,其中,上述目标图像为包含有目标物品对应的展示信息的图像;根据上述热力图,对上述目标图像进行图像分割,以生成区域图像集合,其中,上述区域图像集合中的区域图像为含有文本的图像;对上述区域图像集合中的每个区域图像进行文本方向检测,以生成上述区域图像对应的文本方向信息,得到文本方向信息集合;根据上述热力图和上述区域图像集合中每个区域图像对应的文本方向信息,对上述区域图像进行细化分割,以生成子图像,得到子图像集合;对上述子图像集合中的每个子图像进行文本识别,以生成文本信息,得到文本信息集合;对上述文本信息集合中的每个文本信息进行敏感词匹配,以生成文本审核结果,得到文本审核结果集合。
[0007]第二方面,本公开的一些实施例提供了一种文本审核装置,装置包括:生成单元,被配置成根据目标图像中文字的分布,生成上述目标图像对应的热力图,其中,上述目标图像为包含有目标物品对应的展示信息的图像;图像分割单元,被配置成根据上述热力图,对上述目标图像进行图像分割,以生成区域图像集合,其中,上述区域图像集合中的区域图像为含有文本的图像;文字方向检测单元,被配置成对上述区域图像集合中的每个区域图像进行文本方向检测,以生成上述区域图像对应的文本方向信息,得到文本方向信息集合;细化分割单元,被配置成根据上述热力图和上述区域图像集合中每个区域图像对应的文本方
向信息,对上述区域图像进行细化分割,以生成子图像,得到子图像集合;文本识别单元,被配置成对上述子图像集合中的每个子图像进行文本识别,以生成文本信息,得到文本信息集合;敏感词匹配单元,被配置成对上述文本信息集合中的每个文本信息进行敏感词匹配,以生成文本审核结果,得到文本审核结果集合。
[0008]第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述第一方面任一实现方式所描述的方法。
[0009]第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现上述第一方面任一实现方式所描述的方法。
[0010]本公开的上述各个实施例具有如下有益效果:通过本公开的一些实施例的文本审核方法,提高了文本审核的效率和准确率。具体来说,造成文本审核的效率和准确率低下的原因在于:通过人工的方式进行文本审核难以提升审核速度,以及由于物品对应的展示信息中的文本的排列方向往往不同,采用单一方向的文本识别方法,往往会导致得到的文本识别结果不够准确,进而导致文本审核的准确率不高。基于此,本公开的一些实施例的文本审核方法,首先,根据目标图像中文字的分布,生成上述目标图像对应的热力图,其中,上述目标图像为包含有目标物品对应的展示信息的图像。实际情况中,物品对应的展示信息中的文本往往存在着文本聚集的情况,即文本在目标物品对应的展示信息的图像中的分布并不均匀。因此通过生成热力图,可以很好的表征文本在目标物品对应的展示信息的图像中的分布情况。其次,根据上述热力图,对上述目标图像进行图像分割,以生成区域图像集合,其中,上述区域图像集合中的区域图像为含有文本的图像。实际情况中,目标物品对应的展示信息的图像中往往包含较多的空白区域。对整张图像进行文本识别,会增加数据的处理量。因此,根据热力图,对上述目标图像进行图像分割,能够减少数据的处理量。然后,对上述区域图像集合中的每个区域图像进行文本方向检测,以生成上述区域图像对应的文本方向信息,得到文本方向信息集合。实际情况中,为了提高包含有目标物品对应的展示信息的图像的美观度,往往会对展示信息中的文字的排布进行调整,这就造成了展示信息中的文字的展示方式往往并不是水平排列,进而增加了文本识别难度。因此,通过确定区域图像对应的文本方向信息,能够辅助后续的文本识别。进一步,根据上述热力图和上述区域图像集合中每个区域图像对应的文本方向信息,对上述区域图像进行细化分割,以生成子图像,得到子图像集合。实际情况中,确定的区域图像中往往还会存在空白区域,为了进一步减少数据处理量。因此,结合热力图和区域图像对应的文本方向信息对图像进行进一步的分割,从而剔除区域图像中包含的空白区域。此外,对上述子图像集合中的每个子图像进行文本识别,以生成文本信息,得到文本信息集合。通过对文本进行识别,以得到子图像中包含的文本。最后,对上述文本信息集合中的每个文本信息进行敏感词匹配,以生成文本审核结果,得到文本审核结果集合。通过对文本进行敏感词进行匹配,以此确定文本信息中是否包含敏感词。通过此种方式,尤其是存在大量需要进行审核的图像,相比于人工审核的方式,能够大大提高审核效率。此外,由于加入了文本方向检测,因此,提高了文本识别结果的准确率。从而,提高了文本审核的准确率。
附图说明
[0011]结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
[0012]图1是本公开的一些实施例的文本审核方法的一个应用场景的示意图;图2是根据本公开的文本审核方法的一些实施例的流程图;图3是目标图像的示意图;图4是对区域图像进行细化分割,以生成子图像的示意图;图5是根据本公开的文本审核方法的另一些实施例的流程图;图6是目标图像的另一示意图;图7是根据文字方向向量集合,生成文本方向信息的示意图;图8是根据本公开的文本审核装置的一些实施例的结构示意图;图9是适于用来实现本公开的一些实施例的电子设备的结构示意图。
具体实施方式
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本审核方法,包括:根据目标图像中文字的分布,生成所述目标图像对应的热力图,其中,所述目标图像为包含有目标物品对应的展示信息的图像;根据所述热力图,对所述目标图像进行图像分割,以生成区域图像集合,其中,所述区域图像集合中的区域图像为含有文本的图像;对所述区域图像集合中的每个区域图像进行文本方向检测,以生成所述区域图像对应的文本方向信息,得到文本方向信息集合;根据所述热力图和所述区域图像集合中每个区域图像对应的文本方向信息,对所述区域图像进行细化分割,以生成子图像,得到子图像集合;对所述子图像集合中的每个子图像进行文本识别,以生成文本信息,得到文本信息集合;对所述文本信息集合中的每个文本信息进行敏感词匹配,以生成文本审核结果,得到文本审核结果集合。2.根据权利要求1所述的方法,其中,所述根据目标图像中文字的分布,生成所述目标图像对应的热力图,包括:确定所述目标图像中每个像素点对应的像素点信息,得到像素点信息集合;其中,所述像素点信息集合中的像素点信息表征对应的像素点落在文本所在区域内的置信度;根据所述像素点信息集合中的像素点信息,生成所述热力图。3.根据权利要求1所述的方法,其中,所述根据所述热力图,对所述目标图像进行图像分割,以生成区域图像集合,包括:根据所述热力图中的像素点对应的热力值,对所述热力图进行热力图分割,以生成子热力图,得到至少一个子热力图;将所述目标图像中分割出的与所述至少一个子热力图中的子热力图对应的图像,作为区域图像,得到所述区域图像集合。4.根据权利要求1所述的方法,其中,所述对所述区域图像集合中的每个区域图像进行文本方向检测,以生成所述区域图像对应的文本方向信息,包括:确定所述区域图像中包含的文字的位置,以生成文字位置信息序列;根据所述文字位置信息序列中每两个相邻文字位置信息,生成文字方向向量,得到文字方向向量集合;根据所述文字方向向量集合,生成所述文本方向信息。5.根据权利要求1所述的方法,其中,所述根据所述热力图和所述区域图像集合中每个区域图像对应的文本方向信息,对所述区域图像进行细化分割,以生成子图像,包括:确定目标矩形框,其中,所述目标矩形框的大小与所述区域图像的大小一致,所述目标矩形框的倾斜角度与所述区域图像对应的文本方向信息对应的倾斜角度一致;以固定步长,分别缩小所述目标矩形框的边界;响应于确定缩小后的目标矩形框包括的目标边界包含目标像素点,将所述目标边界确定为候选边界,得到候选边界集...

【专利技术属性】
技术研发人员:邓博洋
申请(专利权)人:北京每日优鲜电子商务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1