基于深度学习模型的图像分类识别方法、装置及存储介质制造方法及图纸

技术编号：30693198 阅读：33 留言：0更新日期：2021-11-06 09:27

本发明专利技术公开一种基于深度学习模型的图像分类识别方法、装置及存储介质，涉及图像识别技术领域，实行多个品类识别任务共用模型，并保证各任务的分类识别准确率。该方法包括：构建样本集，样本集中的样本图片标识有分类标签以及不同识别任务对应的品类编码，品类编码通过增加通道的方式记载；利用深度学习模型训练样本集，得到分类模型；识别阶段，根据识别任务对应的品类，通过增加通道的方式将品类编码插入待测图片中，并基于分类模型识别待测图片输出分类识别结果。该装置应用有上述方案所提的方法。本发明专利技术实现了单个模型对多个品类任务的识别功能，保证了各任务的识别准确率，能够对输入的待测图片进行指定品类内的分类。输入的待测图片进行指定品类内的分类。输入的待测图片进行指定品类内的分类。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习模型的图像分类识别方法、装置及存储介质

[0001]本专利技术涉及图像识别
，尤其涉及一种基于深度学习模型的图像分类识别方法、装置及存储介质。

技术介绍

[0002]近年来，基于深度学习的人工智能技术取得突破性的进展。在图像分类、目标检测、图像分割等应用场景，计算机视觉的处理能力已经接近甚至超过人类。日渐成熟的智能视觉技术在许多实际场景得以运用，也催生了大量新的应用。
[0003]很多应用场景包含多个识别任务，分别完成特定品类图像的识别。比如，比较流行的手机应用，提供了狗和花两个品类的精细化分类功能。当用户选择狗品类识别功能时，需要正确识别出照片中狗的细分类别；当用户选择识花功能时，则需要正确识别照片中花的细分类别。通常做法是针对狗和花训练两个独立的识别模型，不同的识别任务调用不同的模型进行分类识别，输出预测结果和预测置信度。目前，基于深度学习的模型具有庞大的参数量，训练输出模型文件很大。图像库ImageNet的1000类，Resnet50模型具有23.5183M个参数，模型输出文件的大小约为97M。一些专为移动端设计和优化的模型(如MobileNet)参数量较小，但加载多个模型对于移动应用来说也是不小的资源负担。一种可行的方法是将多个品类混合，训练一个统一模型。识别阶段，根据任务的不同，对识别结果进行过滤，仅保留与任务品类相关的细分类和置信度结果。由于模型参数量足够大，单个模型足以满足多个品类的特征捕捉和识别。但是，识别任务的输入图像通常包含多个品类的特征，比如，进行狗品类识别时，输入图片...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习模型的图像分类识别方法，其特征在于，包括：构建样本集，所述样本集中的样本图片标识有分类标签以及不同识别任务对应的品类编码，所述品类编码通过增加通道的方式记载；利用深度学习模型训练所述样本集，得到分类模型；根据识别任务对应的品类编码，通过增加通道的方式将所述品类编码插入待测图片中，并基于所述分类模型识别所述待测图片输出分类识别结果。2.根据权利要求1所述的方法，其特征在于，在构建样本集之前还包括：基于多种识别任务构建编码表，所述编码表中的所述识别任务与所述品类编码一一对应；基于多个分类标签构建分类标签库，所述分类标签库中各个物体品类的细分类与所述分类标签一一对应。3.根据权利要求1或2所述的方法，其特征在于，所述品类编码通过增加通道方式记载的方法包括：将图片的表现形式由三通道数组修改为四通道数组，使得品类编码通过增加的第四通道记载；所述第四通道对应的通道值为品类编码值。4.根据权利要求1所述的方法，其特征在于，所述利用深度学习模型训练所述样本集，得到分类模型的方法包括：基于迁移学习的方式，采用预设的深度学习模型根据样本集进行调优学习训练，得到分类模型。5.根据权利要求4所述的方法，其特征在于，所述预设的深度学习模型为Resnet、VGG16或者MobileNet网络模型。6.根据权利要求2所述的方法，其特征在于，所述根据识别任务对应的品类编码，通过增加通道的方式将所述品类编码插入待测图片中，并基于所述分类模型识别所述待测图片输出分类识别结果的方法，包括：手动选择...

【专利技术属性】
技术研发人员：许欢庆，郭永福，
申请(专利权)人：典基网络科技上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人