生成图像识别模型的方法、系统及分类方法、系统和介质技术方案

技术编号：34504703 阅读：17 留言：0更新日期：2022-08-13 20:46

本发明专利技术提供一种生成用于识别输入图像的图像识别模型的方法及其系统。该方法包括：将至少一个特征提取层附加到图像识别模型；从一组预定图像中提取多个特征向量；将多个特征向量分组成多个类别；将多个类别中的每一个的多个特征向量聚类成至少一个聚类；为至少一个聚类中的每一个确定至少一个质心，使得至少一个聚类中的每一个包括至少一个质心，使得至少一个质心中的每一个由特征向量表示；基于多个类别的至少一个质心的特征向量生成分类层；以及将分类层附加到图像识别模型。另外，提供一种对输入图像进行分类的方法及其系统。对输入图像进行分类的方法及其系统。对输入图像进行分类的方法及其系统。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】生成图像识别模型的方法、系统及分类方法、系统和介质

[0001]本专利技术涉及一种用于生成用于识别输入图像的图像识别模型的系统及方法。本专利技术还涉及一种用于对输入图像进行分类的系统及方法。

技术介绍

[0002]由于突出的图像识别性能，深度学习方法已得到广泛的研究及应用。传统的深度学习图像识别模型由特征提取模块及分类模块组成。使用此种模型的识别过程包括获取给定物体的图像并将其输入到由数个神经网络层组成的特征提取模块，以生成图像的特征向量(基本上是数字列表)。随后，使用分类模块处理特征向量并通过将物体分类到预先定义的类别或标识符中的一者来识别物体。一般来说，分类模块由一个分类神经网络层组成，分类神经网络层通常是完全连接的节点层。在识别图像时，分类模块将这一层应用于从特征提取模块获得的特征向量并产生数字列表，每一数字对应于预先定义的类别，并且实际值表示图像与类别之间的相似度。该值越大，图像与类别越相似。最后，将检索并返送具有最大值的类别的名称，并且因此识别出图像。在使用上述深度学习图像识别模型时，整个识别过程是在神经网络模型中以端到端方式计算的。假定训练数据足够，可使用深度学习算法(诸如反向传播)对整个模型进行端到端训练。此种方法具有简单的结构，并且已针对计算效率进行了极大的优化。然而，一个主要的缺点是分类模块中的分类层在训练之后是固定的。一旦模型被训练，在没有再次重新训练整个模型的情况下，难以再添加一个类别供模型识别或者难以对一个特定类别的性能进行微调，这通常将是耗时的并且影响模型在所有类别上的性能。
[00...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种生成用于识别输入图像的图像识别模型的方法，其特征在于，包括：将至少一个特征提取层附加到所述图像识别模型；从一组预定图像中提取多个特征向量；将所述多个特征向量分组成多个类别；将所述多个类别中的每一个的所述多个特征向量聚类成至少一个聚类；为所述至少一个聚类中的每一个确定至少一个质心，其中所述至少一个聚类中的每一个包括至少一个质心，其中所述至少一个质心中的每一个由特征向量表示；基于所述多个类别的所述至少一个质心的所述特征向量生成分类层；以及将所述分类层附加到所述图像识别模型。2.根据权利要求1所述的方法，其特征在于，包括将所述多个类别中的每一个的聚类数目改变成新的聚类数目，将所述多个类别中的每一个的所述多个特征向量重新聚类成所述新的聚类数目，为所述新的聚类数目中的每一个重新确定至少一个质心，其中所述至少一个质心中的每一个由特征向量表示，并且基于所述新的聚类数目中的每一个的所述至少一个质心的所述特征向量重新生成所述图像识别模型的所述分类层。3.根据权利要求1或2所述的方法，其特征在于，还包括接收新的类别的多个图像，通过特征提取模块从所述多个图像提取多个新的特征向量，将所述多个新的特征向量聚类成至少一个新的聚类，为所述至少一个新的聚类中的每一个生成至少一个质心，其中所述至少一个质心中的每一个由特征向量表示，并且将所述至少一个新的聚类中的每一个的所述至少一个质心中的每一个的所述特征向量附加到所述图像识别模型的所述分类层。4.根据权利要求1或2所述的方法，其特征在于，还包括接收所述多个类别中的一个中的多个所选图像，提取所述多个所选图像的多个新的特征向量，将所述多个新的特征向量添加到所述多个类别中的所述一个的所述多个特征向量以形成一组新的特征向量，将所述一组新的特征向量重新聚类成至少一个聚类，为所述至少一个聚类中的每一个重新生成至少一个质心，其中所述至少一个质心中的每一个由特征向量表示，并且将所述至少一个聚类中的每一个的所述至少一个质心中的每一个的所述特征向量附加到所述图像识别模型的所述分类层。5.根据权利要求1或2所述的方法，其特征在于，所述多个特征向量是使用k均值算法进行聚类的。6.一种用于对输入图像进行分类的方法，其特征在于，所述方法包括：接收所述输入图像；将所述图像输入到根据权利要求1至权利要求5中任一项所述的方法生成的图像识别模型，以将所述输入图像分类成所述多个类别中的一个；以及从所述图像识别模型输出所述输入图像的所述多个类别中的所述一个的类别名称。7.根据权利要求6所述的方法，其特征在于，所述方法包括：提取所述输入图像的特征向量；将所述特征向量与所述分类层中的所述多个质心进行比较；确定所述多个质心中最接近所述特征向量的一个；标识所述多个质心中的所述一个的类别；以及检索所述多个质心中的所述一个的所述类别的类别名称。
8.根据权利要求7所述的方法，其特征在于，将所述特征向量与所述多个质心进行比较包括计算所述特征向量与所述多个类别的所述至少一个质心的所述特征向量中的每一个之间的距离。9.一种用于生成用于识别输入图像的图像识别模型的系统，其特征在于，所述系统包括：处理器；以及存储器，所述存储器与所述处理器进行通信，以用于存储能够由所述处理器执行的指令，其中所述处理器被配置成：将至少一个特征提取层附加到图像识别模型；从一组预定图像提取多个特征向量；将所述多个...

【专利技术属性】
技术研发人员：李广达，曹青东托德，王振华，季辛，
申请(专利权)人：拍搜有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人