一种基于深度学习的含噪声标签图像的分类方法技术

技术编号:19824007 阅读:47 留言:0更新日期:2018-12-19 15:30
本发明专利技术公开一种基于深度学习的含噪声标签图像的分类方法,涉及图像分类技术领域,本发明专利技术的方法包括如下步骤:步骤1,对语义元数据集和图像数据集进行数据提纯得到baseline数据集;步骤2,基于baseline数据集训练baseline模型,通过训练好的baseline模型提取baseline数据集的特征信息;步骤3,通过层次聚类对特征信息进行聚类,得到新的数据类别;步骤4,基于新的数据类别对baseline数据集进行重新划分,得到分类数据集data;步骤5,最后基于data数据集使用short_inception网络训练出最终的分类模型;步骤6,根据最终的分类模型对含噪声标签图像进行分类。本发明专利技术解决了现有的含噪声标签图像的分类方法无法适用于大数据集的问题。

【技术实现步骤摘要】
一种基于深度学习的含噪声标签图像的分类方法
本专利技术涉及图像分类
,尤其涉及一种基于深度学习的含噪声标签图像的分类方法。
技术介绍
卷积神经网络(CNN)指的是一类用来处理具有已知网格状拓扑结构数据的深度学习算法,特指那些使用一种称作“卷积”运算的网络,其中卷积是一种特殊形式的线性运算,具体指在不止一层的网络层进行就地矩阵乘法。RNN是一种用于处理序列数据的深度学习算法,近些年来循环神经网络(RNN)成功应用于语音识别、机器翻译、语言模型等任务中,可以说是处理文本类数据的标配网络。层次聚类指的是通过合并或者分割数据集相继生成嵌套的类簇;主要的分类策略有两种:自上而下的分裂法和自下而上的集聚法。半监督学习是监督学习和无监督学习相结合的一种学习方法,同时使用大量无标签数据和少量的有标签数据来进行学习,由于所需带标签数据比较少,只需要很少的时间和精力就可以获得一部分高精准的带标签数据,然后基于这部分高精准的带标签数据作为监督信号进行建模迭代分类,在某些分类任务中可以获得不错的效果,并且可以大大减少学习成本。但是缺陷也是显而易见的,由于具有高精度带标签的数据只有很少一部分,当带标签数据所占总体数据量过小(可能只是全部数据的千分之一、万分之一等),并且带标签的数据在总体数据中分布不均匀的时候,基于这部分带标签数据来对整个数据集建立好的模型,显然是不可能的。
技术实现思路
本专利技术的目的在于:为解决现有的含噪声标签图像的分类方法无法适用于大数据集的问题,本专利技术提供一种基于深度学习的含噪声标签图像的分类方法。为解决上述问题,本专利技术的技术方案如下:一种基于深度学习的含噪声标签图像的分类方法,包括如下步骤:步骤1:对语义元数据集和图像数据集进行数据提纯得到baseline数据集;数据提纯的具体步骤包括获取词向量和图片向量、将这两个向量进行权值连接得到综合向量、将综合向量传入混合距离相似度算法中、最后计算得到各个数据的相似度;其中词向量为所有子词向量、词均值向量串联而成;步骤2:基于baseline数据集训练baseline模型,通过训练好的baseline模型提取baseline数据集的特征信息;步骤3:通过层次聚类对特征信息进行聚类,得到新的数据类别;步骤4:基于新的数据类别对baseline数据集进行重新划分,得到分类数据集data;步骤5:最后基于data数据集使用short_inception网络训练出最终的分类模型;short_inception网络结构包括输入层、三层s_inception块、全连接层fc和输出层,s_inception块与s_inception块之间使用了的短连接层short_cut,s_inception块包括输入层、卷积核、池化层和concat层;步骤6:根据最终的分类模型对含噪声标签图像进行分类。具体地,所述步骤1的具体步骤为:步骤1.1:获取语义元数据集的n维词向量;获取图片数据的m维图片向量;步骤1.2:将n维词向量和m维图片向量进行权值连接,串联得到一个p*m+q*n维向量,其中,p和q是权值系数;步骤1.3:将这p*m+q*n维向量传入混合距离相似度算法中,计算得到各个向量的相似度;步骤1.4:剔除相似度距离大的数据,得到噪声小的baseline数据集。具体地,所述步骤3中,层次聚类的方法采用SD距离法,具体的层次聚类的步骤为:具体的SD法公式如下所示:其中,α和β是控制方向和大小的权重系数,θ是向量a和向量b的夹角ai和bi是向量a和向量b上的第i个元素,这里是求其对应元素平方和。具体地,所述混合距离相似度算法的具体步骤为:(1)对这p*m+q*n维向量通过排序策略得到在欧式距离上最相似的前K个向量;(2)对筛选出的K个向量,计算相应的余弦相似度并结合欧氏距离得到最终的混合相似度,具体计算如公式为:其中,α为欧氏距离影响因子,α取值范围为[0,1],混合距离相似度的取值范围为[0,1],b和c为偏值因素,范围为[0,1],euc(x,y)为通过归一化后的欧氏距离,为通过归一化后的欧氏距离,为通过归一化后的欧氏距离。采用上述方案后,本专利技术的有益效果如下:(1)文本词向量表示中,传统的方法是简单的将各个词的词向量相加求均值从而得到元数据的词向量表示,但是会损失句子的语序信息,本专利技术的方法是将每个词的词向量串联得到一个包含语序的向量,并同时串联自传统方法中得到的均值向量,从而得到一个新的向量,由该方法得到的向量一方面能够保留原始文本的语序信息,另一方面能够比较全面的囊括原始文本的语义信息;(2)传统的方法是简单将词向量之间的欧式距离或者余弦距离作为相似度值,这种方法固然简单,但是却忽略了文本的复杂性,文本数据是复杂的,涉及很多的语义和语法等信息,简单使用欧式或余弦度量并不能含括这些语义语法属性,本专利技术采用了一种混合距离相似性算法,此算法在兼顾向量在数值和方向维度的同时,引入权值和偏值因素,能够更好的考虑到文本数据的语义和语法信息,更适合进行相似性度量;(3)SD距离弥补了欧几里得距离和曼哈顿距离在样本方向上的缺失,并且计算量远小于马氏距离的计算量;(4)short_inception的网络结构,使得训练出的分类模型性能更好。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。通过附图所示,本专利技术的上述及其它目的、特征和优势将更加清晰。在全部附图中相同的附图标记指示相同的部分。并未刻意按实际尺寸等比例缩放绘制附图,重点在于示出本专利技术的主旨。图1为本专利技术的流程示意图;图2为本专利技术的数据提纯流程示意图;图3本专利技术的short_inception网络结构图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。下面,将结合本专利技术最优选的一个实施例对本专利技术进行更加清楚、完整的说明。本实施例的一种基于深度学习的含噪声标签图像的分类方法,如图1所示,包括如下步骤:步骤1:对语义元数据集和图像数据集进行数据提纯得到baseline数据集;数据提纯的具体步骤包括获取词向量和图片向量、将这两个向量进行权值连接得到综合向量、将综合向量传入混合距离相似度算法中,最后计算得到各个数据的相似度;其中词向量为所有子词向量、词均值向量串联而成;原始数据集是混含许多噪声数据(与正常数据不符的干扰数据)的图片数据集,所以需要先对这部分数据进行数据提纯,即剔除原始数据集中的噪声数据,得到提纯后的含有噪声少的数据集,因为在噪声少的数据集上建立模型才能更准确的反映数据的真实分布情况,即建立的模型性能更高更准确;这里进行提纯操作的过程中需要借助元数据的辅助,所谓元数据这里指的是网络中对于每个图片数据内容的文本描述,例如图片标题、图片内容的文字表达等,这些元数据本文档来自技高网...

【技术保护点】
1.一种基于深度学习的含噪声标签图像的分类方法,其特征在于,包括如下步骤:步骤1:对语义元数据集和图像数据集进行数据提纯得到baseline数据集;数据提纯的具体步骤包括获取词向量和图片向量、将这两个向量进行权值连接得到综合向量、将综合向量传入混合距离相似度算法中、最后计算得到各个数据的相似度;其中词向量为所有子词向量、词均值向量串联而成;步骤2:基于baseline数据集训练baseline模型,通过训练好的baseline模型提取baseline数据集的特征信息;步骤3:通过层次聚类对特征信息进行聚类,得到新的数据类别;步骤4:基于新的数据类别对baseline数据集进行重新划分,得到分类数据集data;步骤5:最后基于data数据集使用short_inception网络训练出最终的分类模型;short_inception网络结构包括输入层、三层s_inception块、全连接层fc和输出层,s_inception块与s_inception块之间使用了的短连接层short_cut,s_inception块包括输入层、卷积核、池化层和concat层;步骤6:根据最终的分类模型对含噪声标签图像进行分类。...

【技术特征摘要】
1.一种基于深度学习的含噪声标签图像的分类方法,其特征在于,包括如下步骤:步骤1:对语义元数据集和图像数据集进行数据提纯得到baseline数据集;数据提纯的具体步骤包括获取词向量和图片向量、将这两个向量进行权值连接得到综合向量、将综合向量传入混合距离相似度算法中、最后计算得到各个数据的相似度;其中词向量为所有子词向量、词均值向量串联而成;步骤2:基于baseline数据集训练baseline模型,通过训练好的baseline模型提取baseline数据集的特征信息;步骤3:通过层次聚类对特征信息进行聚类,得到新的数据类别;步骤4:基于新的数据类别对baseline数据集进行重新划分,得到分类数据集data;步骤5:最后基于data数据集使用short_inception网络训练出最终的分类模型;short_inception网络结构包括输入层、三层s_inception块、全连接层fc和输出层,s_inception块与s_inception块之间使用了的短连接层short_cut,s_inception块包括输入层、卷积核、池化层和concat层;步骤6:根据最终的分类模型对含噪声标签图像进行分类。2.根据权利要求1所述的一种基于深度学习的含噪声标签图像的分类方法,其特征在于,所述步骤1的具体步骤为:步骤1.1:获取语义元...

【专利技术属性】
技术研发人员:杨国武秦晓明何沂娟陈祥陈浩鲁品肃
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1