【技术实现步骤摘要】
一种基于联合迁移极限学习机的数据分类方法
[0001]本专利技术涉及机器学习
,尤其涉及一种基于联合迁移极限学习机的数据分类方法。
技术介绍
[0002]极限学习机(ELM)因其具有学习速度快和泛化性能好的优点,广泛应用在模式识别、计算科学和机器学习等方面,由于ELM无需调整输入权重和偏置,只需通过求解最小二乘来优化输出权重,因此,它在工业故障诊断、医学诊断、高光谱图像分类、人脸识别和脑机接口等领域受到广泛关注;
[0003]然而,与传统的机器学习模型一样,ELM通常需要训练样本与测试样本遵循相同分布才能获得良好精度,当在训练样本不足的情况下其性能衰退并且效果不佳,而且收集相同分布训练样本通常情况下是耗时的、昂贵的,这导致ELM模型的分类结果并不令人满意,迁移学习可以解决ELM的上述不足,它通过借助与目标域(测试样本)存在分布差异但相关的其他领域丰富标记数据样本作为训练样本(源域),学习可靠的机器学习模型,对当前目标域(测试样本)进行预测;
[0004]当前,许多学者设计了诸多结合迁移学习的极限学习机模型
‑
迁移极限学习机(TLELM),根据领域间分布调整方式的不同,我们大体将它们分为三种类型:1)目标样本监督型:该类方法通常要求目标域中存在一些标记样本以便调整从源域学习得到的机器学习模型,其中,最典型方法是领域自适应极限学习机(DAELM),它通过将ELM延伸至迁移学习环境,以解决传感器领域中电鼻子系统在测量中出现的漂零问题,后续的在线领域适应极限学习机(ODAELM)和在线 ...
【技术保护点】
【技术特征摘要】
1.一种基于联合迁移极限学习机的数据分类方法,其特征在于,包括以下步骤:S1:对源域和目标域样本数据分别进行预处理,获取源域和目标域数据集和S2:分别采用源域和目标域数据集D
S
与D
T
构建CDMA度量并加入到极限学习机隐含层进行模型训练,构造带CDMA的ELM模型,并用D
S
与D
T
计算迁移极限学习机ELM
‑
CDMA的模型参数β1;S3:构造具有输出权重对齐和参数逼近的ELM模型,通过对齐β1和目标域输出权重β
T
,使得源域和目标域间的输出权重在跨领域知识迁移过程中彼此靠近,同时得到β1向目标域对齐后的中间权重β
temp
;借助β
temp
,并通过源域经验风险误差和领域间输出权重逼近正则项,构建新的迁移极限学习机模型目标函数,并获取其输出权重β2;S4:采用β1与β2对所述目标域数据集D
T
进行标签预测,并得到其标签S5:循环执行步骤S1
‑
S4直到不再改变,输出预测结果2.根据权利要求1所述的一种基于联合迁移极限学习机的数据分类方法,其特征在于,所述S1中对源域和目标域样本数据进行预处理包括以下步骤:S1
‑
1:源域用符号表示,x
Si
表示源域样本,y
Si
表示源域样本对应的标签,n
S
是源域样本数量;S1
‑
2:目标域用符号应的标签,n
T
是目标域样本数量;S1
‑
3:将D
S0
与D
T0
分别进行归一化处理,得到D
S
与D
T
。3.根据权利要求1所述的一种基于联合迁移极限学习机的数据分类方法,其特征在于,所述S2中构造带CDMA的ELM模型构造过程包括以下步骤:S2
‑
1:结合激活函数将D
S
和D
T
映射为H
S
和H
T
;S2
‑
2:假定带有N个样本x
i
和相应标签y
i
的标记数据集构建具有L个隐藏层节点的经典ELM模型,如下:ELM根据输入样本的x
i
输出o
i
,w
j
和b
j
是输入权重和偏差,β是输出权重的向量表示,如果我们想要一个最优的β,则解以下损失函数:其中,||β||2是避免模型过拟合的参数稀疏约束。我们将式(2)转换为矩阵形式:
其中,H=[g(x
...
【专利技术属性】
技术研发人员:臧绍飞,马建伟,马晓毓,李兴海,吕进锋,马超,
申请(专利权)人:河南科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。