光学字符识别方法、装置和电子设备制造方法及图纸

技术编号:27657518 阅读:19 留言:0更新日期:2021-03-12 14:21
本公开实施例公开了光学字符识别方法、装置和电子设备。该方法的一具体实施方式包括:获取第一字符图像,其中,所述第一字符图像包括至少两个字符元素;对所述第一字符图像进行分类,生成分类结果,其中,所述分类结果包括字符元素在字符图像方向的排布方向,所述字符图像方向用于指示具有语意联系的相邻字符之间的位置关系,所述排布方向用于指示字符元素按照语意的走向;基于所述分类结果和所述第一字符图像,生成第二字符图像;对所述第二字符图像进行光学字符识别,得到识别结果。由此,提供了一种新的光学字符识别方式。

【技术实现步骤摘要】
光学字符识别方法、装置和电子设备
本公开涉及互联网
,尤其涉及一种光学字符识别方法、装置和电子设备。
技术介绍
随着互联网的发展,用户越来越多的使用终端设备实现各种功能。例如,随着智能设备的普及,人们可以轻易的获取图像。文本作为图像中的高层语义信息,能够帮助人们更好的理解图像。将图像中的文本信息转换为计算机可读可编辑的字符,对于提高多媒体检索能力、工业自动化水平、场景理解能力等具有重要意义。
技术实现思路
提供该公开内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该公开内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。第一方面,本公开实施例提供了一种光学字符识别方法,该方法包括:获取第一字符图像,其中,所述第一字符图像包括至少两个字符元素;对所述第一字符图像进行分类,生成分类结果,其中,所述分类结果包括字符元素在字符图像方向的排布方向,所述字符图像方向用于指示具有语意联系的相邻字符之间的位置关系,所述排布方向用于指示字符元素按照语意的走向;基于所述分类结果和所述第一字符图像,生成第二字符图像;对所述第二字符图像进行光学字符识别,得到识别结果。第二方面,本公开实施例提供了一种光学字符识别装置,包括:获取单元,用于获取第一字符图像,其中,所述第一字符图像包括至少两个字符元素;分类单元,用于对所述第一字符图像进行分类,生成分类结果,其中,所述分类结果包括字符元素在字符图像方向的排布方向,所述字符图像方向用于指示具有语意联系的相邻字符之间的位置关系,所述排布方向用于指示字符元素按照语意的走向;生成单元,用于基于所述分类结果和所述第一字符图像,生成第二字符图像;识别单元,用于对所述第二字符图像进行光学字符识别,得到识别结果。第三方面,本公开实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的光学字符识别方法。第四方面,本公开实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的光学字符识别方法的步骤。本公开实施例提供的光学字符识别方法、装置和电子设备,在进行光学字符识别之前,对第一字符图像进行分类,生成分类结果,并且分类结果可以包括字符元素在字符图像方向的排布方向。由此,可以获取具有语意联系的字符元素的正确走向,尽量避免了识别结果不符合语意的情况出现,提高了识别结果的准确率。附图说明结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。图1是根据本公开的光学字符识别方法的一个实施例的流程图;图2A和图2B是根据本公开的光学字符识别方法的一个应用场景的示意图图3A和图3B是根据本公开的光学字符识别方法的一个应用场景的示意图;图4是根据本公开的光学字符识别方法的另一个实施例的示意图;图5是根据本公开的光学字符识别方法的又一个实施例的示意图;图6是根据本公开的光学字符识别装置的一个实施例的结构示意图;图7是本公开的一个实施例的光学字符识别方法可以应用于其中的示例性系统架构;图8是根据本公开实施例提供的电子设备的基本结构的示意图。具体实施方式下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。请参考图1,其示出了根据本公开的光学字符识别方法的一个实施例的流程。如图1所示该光学字符识别方法,包括以下步骤:步骤101,获取第一字符图像。在本实施例中,光学字符识别方法的执行主体(例如终端设备或者服务器)可以获取第一字符图像。在本实施例中,第一字符图像可以是包括字符的图像。第一字符图像的形式和来源可以根据实际应用场景设置,在此不做限定。字符所属的语种可以也是任意的一种或者多种,在此不做限定。作为示例,第一字符图像中可以包括一个或者至少两个字符行,也可以包括一个或者至少两个字符列。作为示例,第一字符图像可以是从视频帧中截取的。在本实施例中,上述第一字符图像可以包括至少两个字符元素。在这里,上述字符元素可以指示字符。请参考图3A,图3A中的“天下皆美之”中的每个字均可以理解为一个字符元素。图3A中可以包括6个字符元素。步骤102,对第一字符图像进行分类,生成分类结果。在本实施例中,上述执行主体可以对第一字符图像进行分类,生成分类结果。在这里,分类结果可以包括字符元素在字符图像方向的排布方向。在本实施例中,字符图像方向,可以指示具有语意联系的相邻字符之间的位置关系。字符图像方向可以是标量。作为示例,第一字符图像中字符元素的字符图像方向可以包括行方向或者列方向。行方向可以指示具有语意联系的相邻字符元素之间为左右相邻,即左右相邻的字符元素形成语意群。列方向可以指示具有语意联系的相邻字符元素之间为上下相邻,即上下相邻的字符元素形成语意群。请参考图3A,图3A中的“天下皆美之”中各个字符之间可以是上下位置关系,可以理解为列方向。作为示例,第一字符图像中的字符元素的字符图像方向为斜向。斜向可以指示具有语意联系的相邻字符元素之间的中心连线是倾斜的。在这里,排布方向可以指示字符元素按照语意的走向。排布方向可以通过与字符图像方向的平行的两个矢量方向指示,这两个矢量方向可本文档来自技高网...

【技术保护点】
1.一种光学字符识别方法,其特征在于,包括:/n获取第一字符图像,其中,所述第一字符图像包括至少两个字符元素;/n对所述第一字符图像进行分类,生成分类结果,其中,所述分类结果包括字符元素在字符图像方向的排布方向,所述字符图像方向用于指示具有语意联系的相邻字符之间的位置关系,所述排布方向用于指示字符元素按照语意的走向;/n基于所述分类结果和所述第一字符图像,生成第二字符图像;/n对所述第二字符图像进行光学字符识别,得到识别结果。/n

【技术特征摘要】
1.一种光学字符识别方法,其特征在于,包括:
获取第一字符图像,其中,所述第一字符图像包括至少两个字符元素;
对所述第一字符图像进行分类,生成分类结果,其中,所述分类结果包括字符元素在字符图像方向的排布方向,所述字符图像方向用于指示具有语意联系的相邻字符之间的位置关系,所述排布方向用于指示字符元素按照语意的走向;
基于所述分类结果和所述第一字符图像,生成第二字符图像;
对所述第二字符图像进行光学字符识别,得到识别结果。


2.根据权利要求1所述的方法,其特征在于,所述第一字符图像中字符图像方向包括行方向或者列方向。


3.根据权利要求2所述的方法,其特征在于,所述对所述第一字符图像进行分类,生成分类结果,包括:
将所述第一字符图像导入预先建立的第一分类模型,得到第一排布方向。


4.根据权利要求3所述的方法,其特征在于,所述基于所述分类结果和所述第一字符图像,生成第二字符图像,包括:
响应于所述第一排布方向指示预设逆方向,将所述第一字符图像转动至所述预设正方向,得到所述第二字符图像。


5.根据权利要求4所述的方法,其特征在于,所述对所述第二字符图像进行光学字符识别,得到识别结果,包括:
将所述第二字符图像导入预先建立的第一字符识别模型,得到所述识别结果,其中,所述第一字符识别模型的训练样本集包括行方向样本和列方向样本。


6.根据权利要求2所述的方法,其特征在于,所述对所述第一字符图像进行分类,生成分类结果,包括:
将所述第一字符图像导入预先建立的第二分类模型,得到字符图像方向信息和第二排布方向。


7.根据权利要求6所述的方法,其特征在于,所述基于...

【专利技术属性】
技术研发人员:卢永晨
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1