【技术实现步骤摘要】
基于量化最小误差熵的宽度学习方法、介质及设备
[0001]本专利技术涉及宽度学习
,更具体地说,涉及一种基于量化最小误差熵的宽度学习方法、介质及设备。
技术介绍
[0002]宽度学习是近几年提出的一种高效的机器学习方法。宽度学习模型结构简单,主要由特征层、增强层和输出层构成。宽度学习模型的训练过程主要分为三步:1.数据经过随机线性映射到特征映射层;2.将特征层的输出输入到增强映射层,通过线性变换与非线性激活函数生成一系列增强特征;3.将特征层与增强层的输出连接起来一起输入到输出层,通过岭回归算法学习输出层的参数。其中特征层与增强层的参数是随机生成的,不需要在训练模型的过程中学习,只有输出层的参数需要通过岭回归算法学习,这大大加快了模型的训练速度。此外,宽度学习模型能够通过动态扩展来取得更好的性能,这避免了像深度学习那样重新训练整个模型的复杂过程,而只需要重新训练模型的扩展部分。由于这些特性,宽度学习在一些任务中能够取得和深度学习相较的性能,却不需要太多的训练时间或者高性能的计算设备,这大大减少了训练模型的投入成本。
[0003]然而,标准的宽度学习模型依据最小均方误差准则来训练输出层的权重。最小均方误差准则计算简单、易于实现,在数据中不存在噪声或者数据中只有高斯噪声的情况下,能够取得较好的性能。但是现实应用中的数据往往不服从高斯分布,而是有更为复杂的分布。如果训练数据被非高斯噪声或者是离群值污染了,基于最小均方误差准则训练出来的模型性能往往不理想。这是因为最小均方误差准则会放大离群值的负面影响,从而使模
【技术保护点】
【技术特征摘要】
1.一种基于量化最小误差熵的宽度学习方法,其特征在于:包括如下步骤:S1,输入一个包含N个样本的样本集合S1,输入一个包含N个样本的样本集合D表示输入矩阵的维度,初始化宽度学习模型;S2,通过岭回归算法来计算输出层的初始权重w0,并基于最小均方误差来计算出目标函数J(w0),初始化目标函数L(w0)=J(w0);S3,计算每个样本的预测误差e
k
;S4,通过量化每个样本的预测误差e
k
,得到带有r个量化误差c
r
的量化误差集合C及r个量化误差c
r
对应的量化数目s
r
的集合S,以及量化误差数目L;S5,求出权重w
t
和目标函数L(w
t
);其中,t=1,...,T,t为迭代次数,T为最大迭代次数;S6,当目标函数L(w
t
)与前一次迭代学习时的目标函数L(w
t
‑1)之间差值的绝对值小于终止迭代阈值η,或者达到最大迭代次数T时,结束训练,将当前权重w
t
作为宽度学习模型的输出层权重w;否则跳至步骤S3,进行下一次迭代学习。2.根据权利要求1所述的基于量化最小误差熵的宽度学习方法,其特征在于:所述步骤S1,初始化宽度学习模型包括:设定宽度学习模型中包含n组特征映射和m组增强映射,每组特征映射节点中包含p个特征节点,每组增强映射中包含q个增强节点;计算出n组特征映射Z
n
≡[Z1,...,Z
n
]和m组增强映射H
m
≡[H1,...,H
m
],进而得到输出层的输入矩阵A:A=[Z
n
|H
m
]。3.根据权利要求1所述的基于量化最小误差熵的宽度学习方法,其特征在于:所述步骤S2包括如下步骤:通过岭回归算法来求解输出层的初始权重w0:w0=(A
T
A+λI)
‑1A
T
y其中,I表示单位矩阵;A表示输入矩阵;基于最小均方误差来计算出目标函数J(w0)为:其中,λ表示正则系数;初始化目标函数L(w0)=J(w0)。4.根据权利要求1所述的基于量化最小误差熵的宽度学习方法,其特征在于:所述步骤S3,每个样本的预测误差e
k
为:e
k
=y
k
‑
a
k
W
t
‑1其中,a
k
为输入矩阵A的第k行。5.根据权利要求1所述的基于量化最小误差熵的宽度学习方法,其特征在于:所述步骤S4包括:S41,设定量化误差集合为C,设定量化误差集合C中每个量化误差c
r
对应的量化数目s
r
的集合为S,量化误...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。