基于图像的字体识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36844966 阅读:18 留言:0更新日期:2023-03-15 16:22
本申请提供了一种基于图像的字体识别方法、装置、电子设备及存储介质,依据本申请实施例,先从待检测图像中确定目标文本元素之外的干扰文本元素,后获取该干扰文本元素之外的目标图像区域中,用于表征目标图像区域对应划分的至少一个文本段落区域的文本关联性识别结果,再根据上述至少一个文本段落区域对应的字体识别结果获得目标文本元素对应的目标字体。采用上述方案可以排除待检测图像中的干扰文本元素区域,使字体识别专注于待检测图像中的目标文本元素区域,减少字体识别的计算量,进而提高字体识别的效率,能够适应图像批量检测的需求。的需求。的需求。

【技术实现步骤摘要】
基于图像的字体识别方法、装置、电子设备及存储介质


[0001]本申请涉及计算机
,尤其涉及一种基于图像的字体识别方法、装置、电子设备及存储介质。

技术介绍

[0002]在电子商务中,通常要发布图像来宣传商品以增加广告页面访问量,进一步为商品或店铺引入流量,促进交易增长。部分商家通过在图像中设计个性独特的文字来吸引网友的访问。
[0003]但是,即使是计算机中自带的字体,也并非可以随意商用。为了规避字体侵权的情况,保护字体所有者的知识产权,有必要提供字体检测服务,协助版权问题自检,规避版权风险。
[0004]相关技术中,通常需要人工辅助来确定文本所在的图像区域,检测效率低,体验较差。

技术实现思路

[0005]本申请实施例提供一种基于图像的字体识别方法、装置、电子设备及存储介质,以解决上述一个或多个技术问题。
[0006]第一方面,本申请实施例提供了一种基于图像的字体识别方法,包括:
[0007]从待检测图像中确定目标文本元素之外的干扰文本元素;
[0008]获取所述干扰文本元素之外的目标图像区域的文本关联性识别结果,所述文本关联性识别结果表征所述目标图像区域对应划分的至少一个文本段落区域;
[0009]根据所述至少一个文本段落区域对应的字体识别结果,获得所述目标文本元素对应的目标字体。
[0010]第二方面,本申请实施例提供了一种基于图像的字体识别方法,包括:
[0011]在文本识别页面提交待识别的目标图像;
[0012]获取对所述待识别的目标图像对应识别的目标字体;所述目标字体依据至少一个文本段落区域对应的字体识别结果确定,所述文本段落区域从待检测图像中除去干扰文字元素之外的目标图像区域中基于所述目标图像区域的文本关联性识别结果划分获得;
[0013]在所述文本识别页面展示所述目标字体以及对应的侵权分析预警信息和/或侵权处理策略。
[0014]第三方面,本申请实施例提供了一种基于图像的字体识别装置,包括:
[0015]干扰文本确定模块,用于从待检测图像中确定目标文本元素之外的干扰文本元素;
[0016]文本关联识别模块,用于获取所述干扰文本元素之外的目标图像区域的文本关联性识别结果,所述文本关联性识别结果表征所述目标图像区域对应划分的至少一个文本段落区域;
[0017]目标字体获得模块,用于根据所述至少一个文本段落区域对应的字体识别结果,获得所述目标文本元素对应的目标字体。
[0018]第四方面,本申请实施例提供了一种基于图像的字体识别装置,包括:
[0019]检测图像提交模块,用于在文本识别页面提交待检测图像;
[0020]目标字体获取模块,用于获取对所述待检测图像对应识别的目标字体;所述目标字体依据至少一个文本段落区域对应的字体识别结果确定,所述文本段落区域从待检测图像中除去干扰文字元素之外的目标图像区域中基于所述目标图像区域的文本关联性识别结果划分获得;
[0021]侵权信息披露模块,用于在所述文本识别页面展示所述目标字体以及对应的侵权分析预警信息和/或侵权处理策略。
[0022]第五方面,本申请实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器在执行所述计算机程序时实现上述任一项所述的方法。
[0023]第六方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法。
[0024]与相关技术相比,本申请具有如下优点:
[0025]依据本申请实施例,先从待检测图像中确定目标文本元素之外的干扰文本元素,后获取该干扰文本元素之外的目标图像区域中,用于表征目标图像区域对应划分的至少一个文本段落区域的文本关联性识别结果,再根据上述至少一个文本段落区域对应的字体识别结果获得目标文本元素对应的目标字体。采用上述方案可以排除待检测图像中的干扰文本元素区域,使字体识别专注于待检测图像中的目标图像区域,减少字体识别的计算量,进而提高字体识别的效率,适应图像批量检测的需求。无需手动确认所需识别的文本对应的图像区域,仅需提供图像便可以获得图像中目标文本元素的字体识别结果,对于待检测图像也无特殊要求,操作简便。并且,还可以减少干扰文本元素字体对于目标文本元素字体识别准确性的影响。
[0026]其中,对待检测图像中属于同一个文本段落区域的字体识别结果进行文本关联性识别,相当于结合关联的文本进行字体的综合判断,消除了部分文本不准确的识别结果,可以提高字体识别的准确性。
[0027]上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,可依照说明书的内容予以实施,并且为了让本申请的上述和其他目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
[0028]在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本申请的一些实施方式,而不应将其视为是对本申请范围的限制。
[0029]图1示出了本申请一实施例的字体识别方案的一个应用示例的示意图;
[0030]图2示出了本申请一实施例的基于图像的字体识别方法的流程图;
[0031]图3示出了本申请另一实施例的基于图像的字体识别方法的流程图;
[0032]图4示出了本申请一实施例的基于图像的字体识别装置的结构框图;
[0033]图5示出了本申请另一实施例的基于图像的字体识别装置的结构框图;以及
[0034]图6示出了用来实现本申请实施例的电子设备的框图。
具体实施方式
[0035]在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本申请的构思或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的,而非限制性的。
[0036]为便于理解本申请实施例的技术方案,以下对本申请实施例的相关技术进行说明。以下相关技术作为可选方案与本申请实施例的技术方案可以进行任意结合,其均属于本申请实施例的保护范围。
[0037]如今市面上的字体多由字体公司享有相应的版权,如果将这些字体作为网络图像进行商业使用,则需要字体公司的授权,交纳相应的版权费用后才可以商用,但由于多种原因,近十年来字体侵权相关案件数量翻了近百倍,大量电商卖家、内容机构等因各类字体侵权而收到不同版权方的维权并蒙受损失,律师函警告一度成为大量卖家和自媒体的流行梗,每年因此产生的赔付费用或达数亿元。因此,有必要提供一种字体识别的方案,用以识别网络图像中的文本对应的字体类型,以协助进行字体版权自检,保护字体所有者的知识产权,杜绝字体侵权。
[0038]在本申请之前的相关技术中,需要人工辅助确定文本所在的图像区域,字体识别效率低,无法应对图像批量检测需求,并且增加了字本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图像的字体识别方法,包括:从待检测图像中确定目标文本元素之外的干扰文本元素;获取所述干扰文本元素之外的目标图像区域的文本关联性识别结果,所述文本关联性识别结果表征所述目标图像区域对应划分的至少一个文本段落区域;根据所述至少一个文本段落区域对应的字体识别结果,获得所述目标文本元素对应的目标字体。2.根据权利要求1所述的方法,其中,所述干扰文本元素至少包括商品对象元素和背景元素,所述从待检测图像中确定目标文本元素之外的干扰文本元素包括:调用语义分割模型的注意力检测模块从所述待检测图像中检测商品对象元素和背景元素;调用所述语义分割模型的主体分割模块对所述商品对象元素和背景元素进行边缘分割,将边缘分割后划定的图像区域确定为所述商品对象元素和背景元素对应的对象图像区域。3.根据权利要求1所述的方法,其中,所述干扰文本元素至少包括对象标识元素,所述从待检测图像中确定目标文本元素之外的干扰文本元素包括:调用目标检测模型从所述待检测图像中检测对象标识元素以及所述对象标识元素所处的标识图像区域,所述目标检测模型用于并行检测对象标识元素以及对应的标识图像区域。4.根据权利要求1所述的方法,其中,所述获取所述干扰文本元素之外的目标图像区域的文本关联性识别结果包括:获取所述干扰文本元素之外的目标图像区域的字体识别结果;对所述目标图像区域的字体识别结果进行文本关联性识别,获得所述目标图像区域的文本关联性识别结果。5.根据权利要求4所述的方法,其中,所述获取所述干扰文本元素之外的目标图像区域的字体识别结果包括:根据所述干扰文本元素所处的干扰图像区域,确定所述干扰文本元素之外的目标图像区域;对所述目标图像区域进行字体识别,获得所述目标图像区域的字体识别结果。6.根据权利要求4所述的方法,其中,所述获取所述干扰文本元素之外的目标图像区域的字体识别结果包括:获取对所述待检测图像进行字体识别得到的字体识别结果;从所述待检测图像的字体识别结果中去除所述干扰文本元素所处的干扰图像区域对应的字体识别结果,获得所述目标图像区域的字体识别结果。7.根据权利要求5或6所述的方法,其中,所述字体识别通过如下至少一个步骤实现:调用混合识别模型对待识别的图像区域进行图像识别,以根据图像特征对各个文字分别进行字体检测,...

【专利技术属性】
技术研发人员:缪瑜刘奎龙祁欣妍李可娜
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1