生成图像识别模型的方法、系统及分类方法、系统和介质技术方案

技术编号:34504703 阅读:17 留言:0更新日期:2022-08-13 20:46
本发明专利技术提供一种生成用于识别输入图像的图像识别模型的方法及其系统。该方法包括:将至少一个特征提取层附加到图像识别模型;从一组预定图像中提取多个特征向量;将多个特征向量分组成多个类别;将多个类别中的每一个的多个特征向量聚类成至少一个聚类;为至少一个聚类中的每一个确定至少一个质心,使得至少一个聚类中的每一个包括至少一个质心,使得至少一个质心中的每一个由特征向量表示;基于多个类别的至少一个质心的特征向量生成分类层;以及将分类层附加到图像识别模型。另外,提供一种对输入图像进行分类的方法及其系统。对输入图像进行分类的方法及其系统。对输入图像进行分类的方法及其系统。

【技术实现步骤摘要】
【国外来华专利技术】生成图像识别模型的方法、系统及分类方法、系统和介质


[0001]本专利技术涉及一种用于生成用于识别输入图像的图像识别模型的系统及方法。本专利技术还涉及一种用于对输入图像进行分类的系统及方法。

技术介绍

[0002]由于突出的图像识别性能,深度学习方法已得到广泛的研究及应用。传统的深度学习图像识别模型由特征提取模块及分类模块组成。使用此种模型的识别过程包括获取给定物体的图像并将其输入到由数个神经网络层组成的特征提取模块,以生成图像的特征向量(基本上是数字列表)。随后,使用分类模块处理特征向量并通过将物体分类到预先定义的类别或标识符中的一者来识别物体。一般来说,分类模块由一个分类神经网络层组成,分类神经网络层通常是完全连接的节点层。在识别图像时,分类模块将这一层应用于从特征提取模块获得的特征向量并产生数字列表,每一数字对应于预先定义的类别,并且实际值表示图像与类别之间的相似度。该值越大,图像与类别越相似。最后,将检索并返送具有最大值的类别的名称,并且因此识别出图像。在使用上述深度学习图像识别模型时,整个识别过程是在神经网络模型中以端到端方式计算的。假定训练数据足够,可使用深度学习算法(诸如反向传播)对整个模型进行端到端训练。此种方法具有简单的结构,并且已针对计算效率进行了极大的优化。然而,一个主要的缺点是分类模块中的分类层在训练之后是固定的。一旦模型被训练,在没有再次重新训练整个模型的情况下,难以再添加一个类别供模型识别或者难以对一个特定类别的性能进行微调,这通常将是耗时的并且影响模型在所有类别上的性能。
[0003]另一方面,基于搜索的识别模型在上述方面比分类模型灵活得多。基于搜索的识别模型在其分类模块中不具有分类层。相反,基于搜索的识别模型由一组图像的大量索引特征向量的数据库组成。这些特征向量由特征提取模块预先提取。为识别输入图像,在接收到从特征提取模块提取的输入特征向量之后,识别模块将扫描其数据库并检索与该输入特征向量最接近(即,最相似)的索引特征向量,并且返送与该索引特征向量相关联的类别名称。与上一段中提到的传统图像识别模型相比,此种基于搜索的识别模型因数据库的引入而更加灵活。通过在识别模块中添加、移除或更新数据库中的特征向量,不仅可改善现有类别的图像识别性能,而且还可修改模型可识别的类别列表。换句话说,现在可在不重新训练下伏神经网络层的情况下对此种模型进行精细微调。
[0004]然而,基于搜索的识别模型也有其缺点。由于特征数据库大小与添加的图像的数目(通常是整个训练集而不是类别的数目)成比例,因此特征数据库大小通常很大。因此,基于搜索的识别模型通常比传统的识别模型消耗更多的存储器资源,并且在执行识别任务时还需要更多的计算。因此,在资源有限的系统(例如,移动装置)上部署该模型更加困难。对于每一类别,通过仅对少量图像进行索引甚至仅对一个图像进行索引,可减小数据库大小,但为了保持识别性能,选择正确的图像进行索引的过程并不简单。
[0005]因此,需要一种能够克服上述问题的新型识别模型。优选地,该新型识别模型结构
简单,易于更新及改善,同时仍能够实现良好的识别精确度。

技术实现思路

[0006]根据各种实施例,提供一种生成用于识别输入图像的图像识别模型的方法。所述方法包括:将至少一个特征提取层附加到所述图像识别模型;从一组预定图像提取多个特征向量;将所述多个特征向量分组成多个类别;将所述多个类别中的每一个的所述多个特征向量聚类成至少一个聚类;为所述至少一个聚类中的每一个确定至少一个质心,使得所述至少一个聚类中的每一个包括至少一个质心,使得所述至少一个质心中的每一个由特征向量表示;基于所述多个类别的所述至少一个质心的所述特征向量生成分类层;以及将所述分类层附加到所述图像识别模型。
[0007]根据各种实施例,所述方法可包括:将所述多个类别中的每一个的聚类数目改变成新的聚类数目;将所述多个类别中的每一个的所述多个特征向量重新聚类成所述新的聚类数目;为所述新的聚类数目中的每一个重新确定至少一个质心,其中所述至少一个质心中的每一个由特征向量表示;以及基于所述新的聚类数目中的每一个的所述至少一个质心的所述特征向量重新生成所述图像识别模型的所述分类层。
[0008]根据各种实施例,所述方法可包括:接收新的类别的多个图像;通过特征提取模块从所述多个图像提取多个新的特征向量;将所述多个新的特征向量聚类成至少一个新的聚类;为所述至少一个新的聚类中的每一个生成至少一个质心,其中所述至少一个质心中的每一个由特征向量表示;以及将所述至少一个新的聚类中的每一个的所述至少一个质心中的每一个的所述特征向量附加到所述图像识别模型的所述分类层。
[0009]根据各种实施例,所述方法可包括:接收所述多个类别中的一者中的多个所选图像;提取所述多个所选图像的多个新的特征向量;将所述多个新的特征向量添加到所述多个类别中的所述一者的所述多个特征向量以形成一组新的特征向量;将所述一组新的特征向量重新聚类成至少一个聚类;为所述至少一个聚类中的每一个重新生成至少一个质心,使得所述至少一个质心中的每一个由特征向量表示;以及将所述至少一个聚类中的每一个的所述至少一个质心中的每一个的所述特征向量附加到所述图像识别模型的所述分类层。
[0010]根据各种实施例,所述多个特征向量可使用k均值算法进行聚类。
[0011]根据各种实施例,提供一种用于对输入图像进行分类的方法。所述方法包括:接收所述输入图像;将所述图像输入到如上所述生成的图像识别模型,以将所述输入图像分类成所述多个类别中的一者;以及从所述图像识别模型输出所述输入图像的所述多个类别中的所述一者的类别名称。
[0012]根据各种实施例,所述方法可包括:提取所述输入图像的特征向量;将所述特征向量与所述分类层中的所述多个质心进行比较;确定所述多个质心中最接近所述特征向量的一者;标识所述多个质心中的所述一者的类别;以及检索所述多个质心中的所述一者的所述类别的类别名称。
[0013]根据各种实施例,将所述特征向量与所述多个质心进行比较可包括计算所述特征向量与所述多个类别的所述至少一个质心的所述特征向量中的每一个之间的距离。
[0014]根据各种实施例,提供一种用于生成用于识别输入图像的图像识别模型的系统。所述系统包括处理器及存储器,所述存储器与所述处理器进行通信,以用于存储可由所述
处理器执行的指令,使得所述处理器被配置成:将至少一个特征提取层附加到图像识别模型;从一组预定图像提取多个特征向量;将所述多个特征向量分组成多个类别;将所述多个类别中的每一个的所述多个特征向量聚类成至少一个聚类;为所述至少一个聚类中的每一个确定至少一个质心,使得所述至少一个聚类中的每一个包括至少一个质心,其中所述至少一个质心中的每一个由特征向量表示;基于所述多个类别的所述至少一个质心的所述特征向量生成所述分类层;以及将所述分类层附加到所述图像识别模型。
[0015]根据各种实施例,所述处理器可被配置成:将所述多个类别中的每一个的聚类数目改变成新的聚类数目;将所述多个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种生成用于识别输入图像的图像识别模型的方法,其特征在于,包括:将至少一个特征提取层附加到所述图像识别模型;从一组预定图像中提取多个特征向量;将所述多个特征向量分组成多个类别;将所述多个类别中的每一个的所述多个特征向量聚类成至少一个聚类;为所述至少一个聚类中的每一个确定至少一个质心,其中所述至少一个聚类中的每一个包括至少一个质心,其中所述至少一个质心中的每一个由特征向量表示;基于所述多个类别的所述至少一个质心的所述特征向量生成分类层;以及将所述分类层附加到所述图像识别模型。2.根据权利要求1所述的方法,其特征在于,包括将所述多个类别中的每一个的聚类数目改变成新的聚类数目,将所述多个类别中的每一个的所述多个特征向量重新聚类成所述新的聚类数目,为所述新的聚类数目中的每一个重新确定至少一个质心,其中所述至少一个质心中的每一个由特征向量表示,并且基于所述新的聚类数目中的每一个的所述至少一个质心的所述特征向量重新生成所述图像识别模型的所述分类层。3.根据权利要求1或2所述的方法,其特征在于,还包括接收新的类别的多个图像,通过特征提取模块从所述多个图像提取多个新的特征向量,将所述多个新的特征向量聚类成至少一个新的聚类,为所述至少一个新的聚类中的每一个生成至少一个质心,其中所述至少一个质心中的每一个由特征向量表示,并且将所述至少一个新的聚类中的每一个的所述至少一个质心中的每一个的所述特征向量附加到所述图像识别模型的所述分类层。4.根据权利要求1或2所述的方法,其特征在于,还包括接收所述多个类别中的一个中的多个所选图像,提取所述多个所选图像的多个新的特征向量,将所述多个新的特征向量添加到所述多个类别中的所述一个的所述多个特征向量以形成一组新的特征向量,将所述一组新的特征向量重新聚类成至少一个聚类,为所述至少一个聚类中的每一个重新生成至少一个质心,其中所述至少一个质心中的每一个由特征向量表示,并且将所述至少一个聚类中的每一个的所述至少一个质心中的每一个的所述特征向量附加到所述图像识别模型的所述分类层。5.根据权利要求1或2所述的方法,其特征在于,所述多个特征向量是使用k均值算法进行聚类的。6.一种用于对输入图像进行分类的方法,其特征在于,所述方法包括:接收所述输入图像;将所述图像输入到根据权利要求1至权利要求5中任一项所述的方法生成的图像识别模型,以将所述输入图像分类成所述多个类别中的一个;以及从所述图像识别模型输出所述输入图像的所述多个类别中的所述一个的类别名称。7.根据权利要求6所述的方法,其特征在于,所述方法包括:提取所述输入图像的特征向量;将所述特征向量与所述分类层中的所述多个质心进行比较;确定所述多个质心中最接近所述特征向量的一个;标识所述多个质心中的所述一个的类别;以及检索所述多个质心中的所述一个的所述类别的类别名称。
8.根据权利要求7所述的方法,其特征在于,将所述特征向量与所述多个质心进行比较包括计算所述特征向量与所述多个类别的所述至少一个质心的所述特征向量中的每一个之间的距离。9.一种用于生成用于识别输入图像的图像识别模型的系统,其特征在于,所述系统包括:处理器;以及存储器,所述存储器与所述处理器进行通信,以用于存储能够由所述处理器执行的指令,其中所述处理器被配置成:将至少一个特征提取层附加到图像识别模型;从一组预定图像提取多个特征向量;将所述多个...

【专利技术属性】
技术研发人员:李广达曹青东托德王振华季辛
申请(专利权)人:拍搜有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1