图像识别方法、装置、电子设备和计算机可读介质制造方法及图纸

技术编号:25951316 阅读:24 留言:0更新日期:2020-10-17 03:43
本公开的实施例公开了图像识别方法、装置、电子设备和介质。该方法的一具体实施方式包括:对包括至少一个教具图像的待识别图像进行图像识别,生成每个教具图像的位置信息和类别信息;基于每个教具图像的位置信息和类别信息生成上述教具图像的编码,得到编码集合;基于编码集合,识别上述待识别图像的类别。该实施方式利用待识别图像中每个教具图像对应的编码组成的编码集合来实现对上述待识别图像的分类。

【技术实现步骤摘要】
图像识别方法、装置、电子设备和计算机可读介质
本公开的实施例涉及计算机
,具体涉及图像识别方法、装置、电子设备和计算机可读介质。
技术介绍
图像识别技术包括特征提取和分类,该技术主要基于提取到的图像特征实现对目标图像的划分。随着图像识别技术的发展,我们可以通过图片搜索更快地获取信息,也可以产生一种新的与外部世界交互的方式。但是,相关方面存在着利用图像中显示的目标图像集合生成的编码信息集合实现稳定识别待识别图像类别的需求。
技术实现思路
本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。本公开的一些实施例提出了图像识别方法、装置、电子设备和计算机可读介质,来解决以上
技术介绍
部分提到的技术问题。第一方面,本公开的一些实施例提供了一种图像识别方法,该方法包括:对包括至少一个教具图像的待识别图像进行图像识别,生成每个教具图像的位置信息和类别信息;基于每个教具图像的位置信息和类别信息生成上述教具图像的编码,得到编码集合;基于编码集合,识别上述待识别图像的类别。第二方面,本公开的一些实施例提供了一种图像识别装置,该装置包括:图像识别单元,被配置成对包括至少一个教具图像的待识别图像进行图像识别,生成每个教具图像的位置信息和类别信息;生成单元,被配置成基于每个教具图像的位置信息和类别信息生成上述教具图像的编码,得到编码集合;识别单元,被配置成基于编码集合,识别上述待识别图像的类别。第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现如第一方面中任一实现方式描述的方法。本公开的上述各个实施例中的一个实施例具有如下有益效果:通过对包括至少一个教具图像的待识别图像进行图像识别,得到每个教具图像的位置信息和类别信息。之后,利用每个教具图像的位置信息和类别信息生成上述教具图像的编码,从而得到待识别图像中的教具图像的编码组成的编码集合。最后,利用得到的编码集合,识别上述待识别图像的类别。由此,达到了稳定识别出教具拼图的类别的效果。附图说明结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。图1是根据本公开的一些实施例的图像识别方法的一个应用场景的示意图;图2是根据本公开的图像识别方法的一些实施例的流程图;图3是根据本公开的图像识别方法的另一些实施例的流程图;图4是根据本公开的图像识别装置的一些实施例的结构示意图;图5是适于用来实现本公开的一些实施例的电子设备的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。下面将参考附图并结合实施例来详细说明本公开。图1是根据本公开一些实施例的图像识别方法的一个应用场景的示意图。如图1所示,计算设备101上获取待识别的图像102。在这里,作为示例,待识别的图像102包括了教具图103、教具图104及教具图105。其中,教具图的类别用类别标签“0(比如三角形)”,“1(比如梯形)”,“2(比如平行四边形)”表示;教具图的位置信息用坐标(x,y)表示,教具图的位置信息及类别信息可用(x,y,类别标签)表示。例如图1中,教具图104为三角形,若教具图104在图像中的位置信息为(3,4),则教具图的位置信息及类别信息表示为(3,4,0)。对待识别图像102进行图像识别,获得教具图103、教具图104及教具图105的位置信息及类别信息106。之后,根据生成的教具图的位置及类别信息106,生成教具图的编码,得到编码集合107。最后,根据生成的编码集合107,识别出待识别图像的类别108。需要说明的是需要说明的是,上述计算设备101可以是硬件,也可以是软件。当计算设备为硬件时,可以实现成多个服务器或终端设备组成的分布式集群,也可以实现成单个服务器或单个终端设备。当计算设备体现为软件时,可以实现成例如用来提供分布式服务的多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。应该理解,图1中的计算设备101的数目仅仅是示意性的。根据实现需要,可以具有任意数目的计算设备101。继续参考图2,示出了根据本公开的图像识别方法的一些实施例的流程200。该图像识别方法,包括以下步骤:步骤201,对包括至少一个教具图像的待识别图像进行图像识别,生成每个教具图像的位置信息和类别信息。在一些实施例中,图像识别方法的执行主体(例如图1计算设备)可以通过各种识别、检测算法对待识别图像进行图像识别、定位。其中,待识别图像在这里可以是显示有目标对象的图像。上述目标对象包括但不限于以下至少一项:物品,例如教具;人。上述位置信息可以是上述待识别图像中显示的目标图像在待识别图像的位置信息。类别信息可以是显示的目标对象所属的类别信息。例如,四边形属于多边形。根据实际需要,上述执行体对待识别图像进行识别,生成教具图像的位置信息和类别信息。可选地,可以将待识别的图像输入到训练好的目标检测的网络模型。比如,YOLO(YouOnlyLookOnce:Unified,Real-TimeObjectDetection)目标检测算法。可选地,还可以采用传统的目标检测算法,作为示例,采用滑动窗口方法提取待识别的图像的候选框。之后,采用模式识别中的算法,提取待识别图像的特征。最后,选取训练好的分类器进行分类并采用NMS(Non-Ma本文档来自技高网...

【技术保护点】
1.一种图像识别方法,包括:/n对包括至少一个教具图像的待识别图像进行图像识别,生成每个教具图像的位置信息和类别信息;/n基于每个教具图像的位置信息和类别信息生成所述教具图像的编码;得到编码集合;/n基于编码集合,识别所述待识别图像的类别。/n

【技术特征摘要】
1.一种图像识别方法,包括:
对包括至少一个教具图像的待识别图像进行图像识别,生成每个教具图像的位置信息和类别信息;
基于每个教具图像的位置信息和类别信息生成所述教具图像的编码;得到编码集合;
基于编码集合,识别所述待识别图像的类别。


2.根据权利要求1所述的方法,其中,所述基于每个教具图像的位置信息和类别信息生成所述教具图像的编码,得到编码集合,包括:
从所述至少一个教具图像中确定出初始教具图像;
基于所述初始教具图像的位置信息和类别信息,确定所述初始教具图像的编码;
基于初始教具图像的位置信息,确定除所述初始教具图像之外的每个教具图像的编码;
汇总所确定的编码,生成编码集合。


3.根据权利要求2所述的方法,其中,所述基于初始教具图像的位置信息,确定除所述初始教具图像之外的每个教具图像的编码,包括:
基于所述初始教具图像之外的各个教具图像与所述初始教具图像的距离,生成教具图像序列;
执行以下编码生成步骤:
从教具图像序列中按序选取教具图像作为目标教具图像;
基于初始教具图像的位置信息,生成目标教具图像的编码;
确定所述教具图像序列中是否存在除了所述目标教具图像之外的教具图像。
响应于确定所述教具图像序列中不存在除了所述目标教具图像之外的教具图像,结束教具图像编码生成过程。


4.根据权利要求3所述的方法,其中,所述方法还包括:
响应于确定所述教具图像序列中存在除了所述目标教具图像之外的教具图像,将排除了所述目标教具图像的教具图像序列确定为教具图像序列,将目标教具图像确定为初始教具图像,继续执行所述编码生成步骤。


5.根据权利要求2所述的方法,其中,所述基于初始教具图像的位置信息,确定除所述初始教具图像之外的每个教具图像的编码,包括:
将所述初始教具图像之外的各个教具图像确定为教具图像集合;
执行以下编码生成步骤:
从教具图像集合中选取与所述初始教具图像距离最近的教具图像作为目标教具图像;
基于所述初始教具图像的位置信息,确定目标教具图像的编码;
确定所述教具图像集合中是否存在除了所述目标教具图像之外的教具图像。
响应于确定所述教具图像集合中不存在除了所述目标教具图像之外的教具图像,结束教具图像编码生成过程。


6.根据权利要求5所述的方法,其中,所述方法还包括:
响应于确定所述教具图像集合中存在除了所述目标教具图像之外的教具图像,将排除了所述目标教具图像的教具图像集合确定为教具图像集合,将目标教具图像确定为初始教具图像,继续执行所述编码生成步骤。


7.根据权利要求1-6之一所述的方法,其中,所述基于编码集合,识别所述待识别图像的类别,包括:
确定所述编码集合与预设图像集合中的每个预设图像的编码集合的距离,得到距离集合;
响应于所述距离集合中的最小距离小于预设阈值,将所述最小距离对应的预设图像的类别确定为待识别图像的类别。


8.一种图像识别装置,包括:
图像识别单元,被配置成对包括至少一个教具图像的待识别图像进行图像识别,生成每个教具图像的位置信息和类别信息;
生成单元,被配置成基于每个教具图像的位置信息和...

【专利技术属性】
技术研发人员:郭冠军
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1