【技术实现步骤摘要】
一种特征提取方法、装置、终端设备及介质
[0001]本申请属于数据处理
,尤其涉及一种特征提取方法
、
装置
、
终端设备及介质
。
技术介绍
[0002]数据广泛存在于城市实际生产和日常生活中,例如随处可见的图像数据
、
生物医药领域的基因表达数据
、
城市地下管网各类传感器数据等
。
数据的不断增加给数据的存储
、
计算分析和应用都带来了巨大的困难,且数据中存在大量的冗余
、
噪声等不利因素,使得分类
、
识别和聚类等任务的难度急剧增加
。
[0003]此外,在有监督的情况下获取特征提取矩阵对数据进行特征提取的过程中需要获取标注数据,而大量标注数据的获取需要投入大量人财物力,且标注质量的好坏也对特征提取的精度有较大影响
。
因此,如何在无监督的情况下对数据进行特征提取是亟需解决的技术问题
。
技术实现思路
[0004]本申请实施例提供了一种特征提取方法
、
装置
、
终端设备及介质,可以在无监督的情况下获取特征提取矩阵,对数据进行特征提取
。
[0005]第一方面,本申请实施例提供了一种特征提取方法,该方法包括:获取初始样本集,所述初始样本集中包含
N
个初始样本,每一所述初始样本对应有一个稀疏表示系数向量,所述稀疏表示系数向量用于使每一所述初始样本被所述 ...
【技术保护点】
【技术特征摘要】
1.
一种特征提取方法,其特征在于,所述方法包括:获取初始样本集,所述初始样本集中包含
N
个初始样本,每一所述初始样本对应有一个稀疏表示系数向量,所述稀疏表示系数向量用于使每一所述初始样本被所述初始样本集中的其他
N
‑1个初始样本进行稀疏表示;其中,每一所述初始样本被所述初始样本集中的其他
N
‑1个初始样本进行稀疏表示时存在稀疏表示误差,每一所述初始样本被特征提取矩阵提取特征时具有样本特征;基于所述稀疏表示误差,确定每一所述稀疏表示系数向量的目标向量值;基于所述目标向量值,将每一所述初始样本以所述初始样本集中的其他
N
‑1个初始样本进行稀疏表示得到目标样本,生成包含所述目标样本的目标样本集,每一所述目标样本被所述特征提取矩阵提取特征时具有样本特征;基于所述初始样本集中每一所述初始样本的样本特征和所述目标样本集中每一所述目标样本的样本特征之间的样本特征差异,确定所述特征提取矩阵的目标矩阵值;基于所述目标矩阵值,对所述初始样本进行特征提取
。2.
如权利要求1所述的方法,其特征在于,所述特征提取矩阵对应有初始矩阵值,在所述基于所述稀疏表示误差,确定每一所述稀疏表示系数向量的目标向量值之前,所述方法还包括:基于所述初始矩阵值,对所述初始样本集中的每一所述初始样本进行重构得到对应的重构样本,生成包含所述重构样本的重构样本集;对于所述重构样本集中的每一所述重构样本,基于对应的所述稀疏表示系数向量,确定每一所述重构样本对应的稀疏表示样本;基于所述重构样本和对应的所述稀疏表示样本,确定所述稀疏表示误差
。3.
如权利要求2所述的方法,其特征在于,在所述确定所述特征提取矩阵的目标矩阵值之后,所述方法还包括:判断当前的迭代数据是否满足设定的迭代条件;若所述当前的迭代数据不满足所述设定的迭代条件,则通过所述目标矩阵值,对所述特征提取矩阵的初始矩阵值进行更新,并迭代执行所述基于所述初始矩阵值,对所述初始样本集中的每一所述初始样本进行重构得到对应的重构样本,生成包含所述重构样本的重构样本集的步骤
。4.
如权利要求2所述的方法,其特征在于,所述基于所述稀疏表示误差,确定每一所述稀疏表示系数向量的目标向量值,包括:基于每一所述初始样本分别与所述初始样本集中的其他
N
‑1个初始样本之间的融合距离,获取每一所述初始样本对应的距离向量,所述融合距离是基于初始样本之间的距离和重构样本之间的距离得到;将每一所述初始样本对应的所述稀疏表示系数向量和所述距离向量进行点乘,得到加权距离和;基于所述稀疏表示误差和所述加权距离和,确定每一所述稀疏表示系数向量的目标向量值
。5.
如权利要求1所述的方法,其特征在于,所述基于所述初始样本集中每一所述初始样本的样本特征和所述目标样本集中每一所述目标样本的样本特征之间的样本特征差异...
【专利技术属性】
技术研发人员:袁明冬,刘博,阮威健,胡金晖,张力元,
申请(专利权)人:中电科新型智慧城市研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。