【技术实现步骤摘要】
一种图像分类模型的训练方法及图像分类方法、存储介质
本专利技术涉及图像处理的
,具体涉及一种图像分类模型的训练方法及图像分类方法、存储介质。
技术介绍
计算机视觉是使用计算机及相关设备对生物视觉的一种模拟,它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息。在计算机视觉的运用过程中,通常会进行图像预处理和模式识别的操作,除此之外,还会涉及图像分类、图像识别、景物分析、形状描述、几何建模和图象理解的操作。其中,图像分类是计算机视觉的核心领域之一,可以将它看作是从给定的分类集合中为图像分配一个标签的任务,具体就是分析一个输入图像并返回一个将图像分类的标签,并且这个标签是用来自预定义类别集合。目前,随着计算机运算能力的发展和图像数据的爆炸式的增长,深度学习取得了巨大的成果,研究图像分类任务往往需要大量的标注数据进行监督学习。虽然,存在一些方法可以减少对数据的依赖,比如迁移学习、少样本学习等,但是到目前为止,此类方法的应用性能依然还没法与监督学习进行相比。在实际的工程实现中,往往短期内是无法收集并标注完成大量提供深度学习训练的可用数据。这对实际的算法落地造成很多不确定的因素,如此会严重影响到图像分类研究项目的进度。此外,通过普通方式采集的数据与现场的数据之间会造成过度的拟合,不利于后期通过此类数据进行训练学习。一般情况下,深度神经网络在基准数据集上表现很好,但在数据集之外的真实世界图像上,效果就不那么让人满意了,这往往是图像分类处理时对真实场景过于敏感而导致的结果。对于这样的情况,即 ...
【技术保护点】
1.一种图像分类模型的训练方法,其特征在于,包括:/n建立关于一分类对象的第一数据集和第二数据集,所述第一数据集包含多幅标注有分类标签的第一图像,所述第二数据集包含多幅没有标注分类标签的第二图像;/n根据所述第一数据集对所述第二数据集中的所述第二图像进行分类标签的预测,得到所述第二图像对应的分类标签,并根据所述第二图像及其对应的分类标签得到标注有分类标签的第三图像以建立第三数据集;/n利用所述第一数据集和所述第三数据集对预设的深度神经网络进行训练,学习得到图像分类模型。/n
【技术特征摘要】
1.一种图像分类模型的训练方法,其特征在于,包括:
建立关于一分类对象的第一数据集和第二数据集,所述第一数据集包含多幅标注有分类标签的第一图像,所述第二数据集包含多幅没有标注分类标签的第二图像;
根据所述第一数据集对所述第二数据集中的所述第二图像进行分类标签的预测,得到所述第二图像对应的分类标签,并根据所述第二图像及其对应的分类标签得到标注有分类标签的第三图像以建立第三数据集;
利用所述第一数据集和所述第三数据集对预设的深度神经网络进行训练,学习得到图像分类模型。
2.如权利要求1所述的训练方法,其特征在于,所述根据所述第一数据集对所述第二数据集中的所述第二图像进行分类标签的预测,得到所述第二图像对应的分类标签,并根据所述第二图像及其对应的分类标签得到标注有分类标签的第三图像以建立第三数据集,包括:
从所述第一数据集中选取多幅第一图像,对预设的网络模型进行训练,得到预测模型;
从所述第二数据集中选取多幅第二图像,根据所述预测模型对所选取的第二图像进行分类标签的预测处理,得到各所选取的第二图像的预测标签;
对各幅第二图像的预测标签进行标签锐化处理,得到相应的第二图像的分类标签;
对各选取的第二图像及其对应的分类标签进行处理,得到第三图像及其对应的分类标签,并根据第三图像及其对应的分类标签建立第三数据集。
3.如权利要求2所述的训练方法,其特征在于,所述从所述第二数据集中选取多幅第二图像,根据所述预测模型对所选取的第二图像进行分类标签的预测处理,得到各所选取的第二图像的预测标签,包括:
对各幅所选取的第二图像分别进行一次或多次的图像增强处理;
将各幅所选取的第二图像及其图像增强处理后的第二图像分别输入至所述预测模型,分别得到对应的数据标签;
对于每幅所选取的第二图像,将其对应的数据标签和其图像增强处理后的第二图像所对应的数据标签进行标签平均化处理,得到其预测标签。
4.如权利要求2所述的训练方法,其特征在于,所述对各幅第二图像的预测标签进行标签锐化处理,得到相应的第二图像的分类标签,包括:
定义任意一幅第二图像的预测标签为多维向量Lˊ且Lˊ内的每一维数值表示所述第二图像从属于一分类类别的预测概率;
根据预设的prob函数对多维向量Lˊ内的每一维数值进行预测概率的修正,利用修正后的概率值更新多维向量Lˊ,得到多维向量L且作为所述第二图像的分类标签;
所述prob函数用公式表示为:
其中,p为所述第二图像从属于一分类类别的预测概率,T为预设的超参数,a为分类类别的序号,j为累加序号,N为分类类别的数目或多维向量Lˊ的维数。
5.如权利要求1-4中任一项所述的训练方法,其特征在于,所述利用所述第一数据集和所述第三数据集对预设的深度神经网络进行训练,学习得到图像分类模型,包括:
从所述第一数据集中选取多幅第一图像,并对各幅所选取的第一图像分别进行数据增强处理;
对数据增强处理之后的各幅第一图像和所述第三数据集中的各幅第三图像进行数据分组,得到参与训练的多组训练数据;
利用得到的多组训练数据对预设的深度神经网络进行训练,学习得到图像分类模型。
6.如权利要求5所述的训练方法,其特征在于,所述对数据增强处理之后的各幅第一图像和所述第三数据集中的各幅第三图像进行数据分组,得到参与训练的多组训练数据,包括:
将数据增强处理之后的各幅第一图像和所述第三数据集中的各幅第三图像进行混合重排,得到混合数据集;
从所述混合...
【专利技术属性】
技术研发人员:徐明,邵新庆,宋咏君,刘强,
申请(专利权)人:深圳力维智联技术有限公司,南京中兴力维软件有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。