The invention discloses a classification method based on correlation entropy and migration learning, which belongs to the field of machine learning technology. It is used to solve the problem of dilution assumption of unpredictable noise and insufficient sample labeling of target data set in the existing technology, make full use of label information of source data set, learn together through source data set and target data set, and in severe noise environment. The knowledge from the source data set is migrated robustly to the target data set, which can significantly improve the classification and recognition effect on the target data set.
【技术实现步骤摘要】
一种基于相关熵和迁移学习的分类方法
本专利技术属于机器学习
,具体涉及一种基于相关熵和迁移学习的分类方法。
技术介绍
在传统的机器学习框架下,监督学习的任务是利用有标注的训练样本来学习一个分类模型,并利用这个模型对测试样本进行分类和预测。这些传统的监督学习模型存在一个基本假设,即大量的有标注的训练样本和测试样本服从相同的概率分布。然而在当前众多的研究领域中,由于昂贵的人工标注代价,训练样本和测试样本通常分别来自源域和目标域两个不同的领域,从而服从不同的概率分布。在这种情况下,传统的分类模型无法扩展到测试样本所在的目标域。迁移学习旨在通过挖掘两个领域间的关联,将源域的知识传递到目标域,从而帮助测试样本的分类。因此,迁移学习能有效解决标注样本不足的问题,节约人力成本,在机器学习和模式识别中占据重要地位。传统的迁移学习方法以线性模型为主,同时也逐渐向基于深度网络等非线性模型过渡。近年来,能抵抗实际噪声的知识迁移受到越来越多的关注。然而已有的鲁棒的知识迁移方法存在以下问题。这些鲁棒方法假设数据中存在的噪声是稀疏的,然而在实际问题中,数据可能被各种复杂的、不可预知的噪声所污染。这些被复杂噪声污染的数据将严重影响已有知识迁移方法的结果,甚至造成负迁移。对不可预知的噪声而言,基于相关熵的损失函数能够带来优于传统经验损失函数的鲁棒效果,对相关熵研究的重要性在鲁棒学习领域已经形成共识。如何基于相关熵理论进一步发展迁移学习技术方法仍然存在极大挑战。
技术实现思路
为克服上述问题,本专利技术提出一种基于相关熵和迁移学习的分类方法,充分利用源数据集的标签信息,通过源数据集和目标 ...
【技术保护点】
1.一种基于相关熵和迁移学习的分类方法,包括以下步骤:分别对有标签的源数据集、无标签的目标数据集进行归一化;利用基于相关熵的迁移学习算法,对所述归一化的源数据集和目标数据集进行迁移迭代训练,得到特征变换矩阵;利用所述特征变换矩阵,将所述归一化的源数据集和目标数据集都映射到一特征空间,在该特征空间中所述归一化的源数据集和目标数据集的概率分布相同;在所述特征空间中,利用所述归一化的源数据集及其标签信息进行训练,得到目标分类器;利用目标分类器对所述归一化的目标数据集进行分类预测,以实现目标数据集的分类。
【技术特征摘要】
1.一种基于相关熵和迁移学习的分类方法,包括以下步骤:分别对有标签的源数据集、无标签的目标数据集进行归一化;利用基于相关熵的迁移学习算法,对所述归一化的源数据集和目标数据集进行迁移迭代训练,得到特征变换矩阵;利用所述特征变换矩阵,将所述归一化的源数据集和目标数据集都映射到一特征空间,在该特征空间中所述归一化的源数据集和目标数据集的概率分布相同;在所述特征空间中,利用所述归一化的源数据集及其标签信息进行训练,得到目标分类器;利用目标分类器对所述归一化的目标数据集进行分类预测,以实现目标数据集的分类。2.如权利要求1所述的方法,其特征在于,所述归一化为L2范数归一化。3.如权利要求1所述的方法,其特征在于,所述基于相关熵的迁移学习算法的目标方程为:其中,是基于相关熵的误差损失函数,W是特征变换矩阵,C是重构系数矩阵,Xt是目标数据集组成的矩阵,Xs是源数据集组成的向量,σ是高斯函数带宽,(WXt-WXsC)i是误差矩阵(WXt-WXsC)的第i列向量,λ1和λ2是平衡系数,m表示目标数据集的数据样本个数。4.如权利要求3所述的方法...
【专利技术属性】
技术研发人员:王微,武斌,黄志宇,于洁,
申请(专利权)人:中国科学院软件研究所,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。