本发明专利技术公开一种基于深度学习模型的图像分类识别方法、装置及存储介质,涉及图像识别技术领域,实行多个品类识别任务共用模型,并保证各任务的分类识别准确率。该方法包括:构建样本集,样本集中的样本图片标识有分类标签以及不同识别任务对应的品类编码,品类编码通过增加通道的方式记载;利用深度学习模型训练样本集,得到分类模型;识别阶段,根据识别任务对应的品类,通过增加通道的方式将品类编码插入待测图片中,并基于分类模型识别待测图片输出分类识别结果。该装置应用有上述方案所提的方法。本发明专利技术实现了单个模型对多个品类任务的识别功能,保证了各任务的识别准确率,能够对输入的待测图片进行指定品类内的分类。输入的待测图片进行指定品类内的分类。输入的待测图片进行指定品类内的分类。
【技术实现步骤摘要】
基于深度学习模型的图像分类识别方法、装置及存储介质
[0001]本专利技术涉及图像识别
,尤其涉及一种基于深度学习模型的图像分类识别方法、装置及存储介质。
技术介绍
[0002]近年来,基于深度学习的人工智能技术取得突破性的进展。在图像分类、目标检测、图像分割等应用场景,计算机视觉的处理能力已经接近甚至超过人类。日渐成熟的智能视觉技术在许多实际场景得以运用,也催生了大量新的应用。
[0003]很多应用场景包含多个识别任务,分别完成特定品类图像的识别。比如,比较流行的手机应用,提供了狗和花两个品类的精细化分类功能。当用户选择狗品类识别功能时,需要正确识别出照片中狗的细分类别;当用户选择识花功能时,则需要正确识别照片中花的细分类别。通常做法是针对狗和花训练两个独立的识别模型,不同的识别任务调用不同的模型进行分类识别,输出预测结果和预测置信度。目前,基于深度学习的模型具有庞大的参数量,训练输出模型文件很大。图像库ImageNet的1000类,Resnet50模型具有23.5183M个参数,模型输出文件的大小约为97M。一些专为移动端设计和优化的模型(如MobileNet)参数量较小,但加载多个模型对于移动应用来说也是不小的资源负担。一种可行的方法是将多个品类混合,训练一个统一模型。识别阶段,根据任务的不同,对识别结果进行过滤,仅保留与任务品类相关的细分类和置信度结果。由于模型参数量足够大,单个模型足以满足多个品类的特征捕捉和识别。但是,识别任务的输入图像通常包含多个品类的特征,比如,进行狗品类识别时,输入图片包含狗的同时也可能包含了花,分类模型需要能够根据图片特征的品类倾向程度来预测,一定程度上影响了识别精度。而且,预测结果输出时需要过滤掉其他品类的细分类结果,预测结果的置信度的可用性降低。这种方法虽然减少模型的个数,但降低了识别精度,尤其在需要使用预测置信度的应用场景。
技术实现思路
[0004]本专利技术的目的在于提供一种基于深度学习模型的图像分类识别方法、装置及存储介质,能够提升深度学习模型分类识别的准确率。
[0005]为了实现上述目的,本专利技术的第一方面提供一种基于深度学习模型的图像分类识别方法,包括:
[0006]构建样本集,所述样本集中的样本图片标识有分类标签以及不同识别任务对应的品类编码,所述品类编码通过增加通道的方式记载;
[0007]利用深度学习模型训练所述样本集,得到分类模型;
[0008]根据识别任务对应的品类编码,通过增加通道的方式将所述品类编码插入待测图片中,并基于所述分类模型识别所述待测图片输出分类识别结果。
[0009]优选地,在构建样本集之前还包括:
[0010]基于多种识别任务构建编码表,所述编码表中的所述识别任务与所述品类编码一
一对应;
[0011]基于多个分类标签构建分类标签库,所述分类标签库中各个物体品类的细分类与所述分类标签一一对应。
[0012]较佳地,所述品类编码通过增加通道方式记载的方法包括:
[0013]将图片的表现形式由三通道数组修改为四通道数组,使得品类编码通过增加的第四通道记载;
[0014]所述第四通道对应的通道值为品类编码值。
[0015]优选地,所述利用深度学习模型训练所述样本集,得到分类模型的方法包括:
[0016]基于迁移学习的方式,采用预设的深度学习模型根据样本集进行调优学习训练,得到分类模型。
[0017]可选地,所述预设的深度学习模型为Resnet、VGG16或者MobileNet网络模型。
[0018]较佳地,所述根据识别任务对应的品类编码,通过增加通道的方式将所述品类编码插入待测图片中,并基于所述分类模型识别所述待测图片输出分类识别结果的方法,包括:
[0019]手动选择识别任务,根据编码表自动匹配出与所选识别任务对应的品类编码;
[0020]将待测图片的表现形式由三通道数组修改为四通道数组,使得所述品类编码通过增加的第四通道记载;
[0021]将所述第四通道对应的通道值设置为品类编码值;
[0022]基于所述分类模型识别出所述待测图片的分类识别结果并输出。
[0023]与现有技术相比,本专利技术提供的基于深度学习模型的图像分类识别方法具有以下有益效果:
[0024]本专利技术提供的基于深度学习模型的图像分类识别方法,首先构建样本图片中标识有分类标签以及不同识别任务对应品类编码的样本集,然后利用样本图片标识有分类标签以及不同识别任务对应的品类编码,最终通过选择识别任务匹配出对应的品类编码,并通过增加通道的方式将品类编码插入待测图片中,并基于分类模型识别待测图片输出分类识别结果。
[0025]可见,本专利技术通过增加通道的方式记载样本图片对应的品类编码,实现了训练单个模型对多个品类任务的识别功能,并且保证了各任务的识别准确率。而在图片中通过增加通道的方式记载品类编码能够起到强特征指导的作用,使得分类模型能够对输入的待测图片进行指定品类内的分类。
[0026]本专利技术的第二方面提供一种基于深度学习模型的图像分类识别装置,应用于上述技术方案所述的基于深度学习模型的图像分类识别方法中,所述装置包括:
[0027]样本集单元,用于构建样本集,所述样本集中的样本图片标识有分类标签以及不同识别任务对应的品类编码,所述品类编码通过增加通道的方式记载;
[0028]模型训练单元,用于利用深度学习模型训练所述样本集,得到分类模型;
[0029]分类识别单元,用于根据识别任务对应的品类编码,通过增加通道的方式将所述品类编码插入待测图片中,并基于所述分类模型识别所述待测图片输出分类识别结果。
[0030]优选地,还包括:
[0031]编码表单元,基于多种识别任务构建编码表,所述编码表中的所述识别任务与所
述品类编码一一对应;
[0032]标签库单元,基于多个分类标签构建分类标签库,所述分类标签库中各个物体品类的细分类与所述分类标签一一对应。
[0033]较佳地,所述品类编码通过增加通道方式记载的方法包括:
[0034]将图片的表现形式由三通道数组修改为四通道数组,使得品类编码通过增加的第四通道记载;
[0035]所述第四通道对应的通道值为品类编码值。
[0036]与现有技术相比,本专利技术提供的基于深度学习模型的图像分类识别装置的有益效果与上述技术方案提供的基于深度学习模型的图像分类识别方法的有益效果相同,在此不做赘述。
[0037]本专利技术的第三方面提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述基于深度学习模型的图像分类识别方法的步骤。
[0038]与现有技术相比,本专利技术提供的计算机可读存储介质的有益效果与上述技术方案提供的基于深度学习模型的图像分类识别方法的有益效果相同,在此不做赘述。
附图说明
[0039]此处所说明的附图用来提供对本专利技术的进一本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于深度学习模型的图像分类识别方法,其特征在于,包括:构建样本集,所述样本集中的样本图片标识有分类标签以及不同识别任务对应的品类编码,所述品类编码通过增加通道的方式记载;利用深度学习模型训练所述样本集,得到分类模型;根据识别任务对应的品类编码,通过增加通道的方式将所述品类编码插入待测图片中,并基于所述分类模型识别所述待测图片输出分类识别结果。2.根据权利要求1所述的方法,其特征在于,在构建样本集之前还包括:基于多种识别任务构建编码表,所述编码表中的所述识别任务与所述品类编码一一对应;基于多个分类标签构建分类标签库,所述分类标签库中各个物体品类的细分类与所述分类标签一一对应。3.根据权利要求1或2所述的方法,其特征在于,所述品类编码通过增加通道方式记载的方法包括:将图片的表现形式由三通道数组修改为四通道数组,使得品类编码通过增加的第四通道记载;所述第四通道对应的通道值为品类编码值。4.根据权利要求1所述的方法,其特征在于,所述利用深度学习模型训练所述样本集,得到分类模型的方法包括:基于迁移学习的方式,采用预设的深度学习模型根据样本集进行调优学习训练,得到分类模型。5.根据权利要求4所述的方法,其特征在于,所述预设的深度学习模型为Resnet、VGG16或者MobileNet网络模型。6.根据权利要求2所述的方法,其特征在于,所述根据识别任务对应的品类编码,通过增加通道的方式将所述品类编码插入待测图片中,并基于所述分类模型识别所述待测图片输出分类识别结果的方法,包括:手动选择...
【专利技术属性】
技术研发人员:许欢庆,郭永福,
申请(专利权)人:典基网络科技上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。