一种特征提取方法技术

技术编号:39520412 阅读:14 留言:0更新日期:2023-11-25 18:59
本申请适用于数据处理技术领域,提供了一种特征提取方法

【技术实现步骤摘要】
一种特征提取方法、装置、终端设备及介质


[0001]本申请属于数据处理
,尤其涉及一种特征提取方法

装置

终端设备及介质


技术介绍

[0002]数据广泛存在于城市实际生产和日常生活中,例如随处可见的图像数据

生物医药领域的基因表达数据

城市地下管网各类传感器数据等

数据的不断增加给数据的存储

计算分析和应用都带来了巨大的困难,且数据中存在大量的冗余

噪声等不利因素,使得分类

识别和聚类等任务的难度急剧增加

[0003]此外,在有监督的情况下获取特征提取矩阵对数据进行特征提取的过程中需要获取标注数据,而大量标注数据的获取需要投入大量人财物力,且标注质量的好坏也对特征提取的精度有较大影响

因此,如何在无监督的情况下对数据进行特征提取是亟需解决的技术问题


技术实现思路

[0004]本申请实施例提供了一种特征提取方法

装置

终端设备及介质,可以在无监督的情况下获取特征提取矩阵,对数据进行特征提取

[0005]第一方面,本申请实施例提供了一种特征提取方法,该方法包括:获取初始样本集,所述初始样本集中包含
N
个初始样本,每一所述初始样本对应有一个稀疏表示系数向量,所述稀疏表示系数向量用于使每一所述初始样本被所述初始样本集中的其他
N
‑1个初始样本进行稀疏表示;其中,每一所述初始样本被所述初始样本集中的其他
N
‑1个初始样本进行稀疏表示时存在稀疏表示误差,每一所述初始样本被特征提取矩阵提取特征时具有样本特征;基于所述稀疏表示误差,确定每一所述稀疏表示系数向量的目标向量值;基于所述目标向量值,将每一所述初始样本以所述初始样本集中的其他
N
‑1个初始样本进行稀疏表示得到目标样本,生成包含所述目标样本的目标样本集,每一所述目标样本被所述特征提取矩阵提取特征时具有样本特征;基于所述初始样本集中每一所述初始样本的样本特征和所述目标样本集中每一所述目标样本的样本特征之间的样本特征差异,确定所述特征提取矩阵的目标矩阵值;基于所述目标矩阵值,对所述初始样本进行特征提取

[0006]第二方面,本申请实施例提供了一种特征提取装置,该装置包括:样本集获取模块,用于获取初始样本集,所述初始样本集中包含
N
个初始样本,每一所述初始样本对应有一个稀疏表示系数向量,所述稀疏表示系数向量用于使每一所述初始样本被所述初始样本集中的其他
N
‑1个初始样本进行稀疏表示;其中,每一所述初始样本被所述初始样本集中的其他
N
‑1个初始样本进行稀疏表示时存在稀疏表示误差,每一所述初始样本被特征提取矩阵提取特征时具有样本特征;
向量确定模块,用于基于所述稀疏表示误差,确定每一所述稀疏表示系数向量的目标向量值;样本生成模块,用于基于所述目标向量值,将每一所述初始样本以所述初始样本集中的其他
N
‑1个初始样本进行稀疏表示得到目标样本,生成包含所述目标样本的目标样本集,每一所述目标样本被所述特征提取矩阵提取特征时具有样本特征;矩阵确定模块,用于基于所述初始样本集中每一所述初始样本的样本特征和所述目标样本集中每一所述目标样本的样本特征之间的样本特征差异,确定所述特征提取矩阵的目标矩阵值;特征提取模块,用于基于所述目标矩阵值,对所述初始样本进行特征提取

[0007]第三方面,本申请实施例提供了一种终端设备,包括存储器

处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面中所述的一种特征提取方法

[0008]第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面中所述的一种特征提取方法

[0009]第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中所述的一种特征提取方法

[0010]本申请实施例与现有技术相比存在的有益效果是:本申请获取初始样本集,初始样本集中包含
N
个初始样本,每一初始样本对应有一个稀疏表示系数向量,稀疏表示系数向量用于使每一初始样本被初始样本集中的其他
N
‑1个初始样本进行稀疏表示;其中,每一初始样本被初始样本集中的其他
N
‑1个初始样本进行稀疏表示时存在稀疏表示误差,每一初始样本被特征提取矩阵提取特征时具有样本特征;基于稀疏表示误差,确定每一稀疏表示系数向量的目标向量值;基于目标向量值,将每一初始样本以初始样本集中的其他
N
‑1个初始样本进行稀疏表示得到目标样本,生成包含目标样本的目标样本集,每一目标样本被特征提取矩阵提取特征时具有样本特征;基于初始样本集中每一初始样本的样本特征和目标样本集中每一目标样本的样本特征之间的样本特征差异,确定特征提取矩阵的目标矩阵值;基于目标矩阵值,对初始样本进行特征提取

本申请无需对初始样本集进行数据标注即可实现在无监督的情况下获取特征提取矩阵,对初始样本进行特征提取

附图说明
[0011]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

[0012]图1是本申请一实施例提供的一种特征提取方法的流程示意图;图2是本申请另一实施例提供的一种特征提取方法的流程示意图;图3是本申请一实施例提供的一种特征提取装置的示意性结构框图;图4是本申请一实施例提供的终端设备的结构示意图

具体实施方式
[0013]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构

技术之类的具体细节,以便透彻理解本申请实施例

然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请

在其它情况中,省略对众所周知的系统

装置

电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述

[0014]应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征

整体

步骤

操作

元素和
/
或组件的存在,但并不排除一个或多个其本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种特征提取方法,其特征在于,所述方法包括:获取初始样本集,所述初始样本集中包含
N
个初始样本,每一所述初始样本对应有一个稀疏表示系数向量,所述稀疏表示系数向量用于使每一所述初始样本被所述初始样本集中的其他
N
‑1个初始样本进行稀疏表示;其中,每一所述初始样本被所述初始样本集中的其他
N
‑1个初始样本进行稀疏表示时存在稀疏表示误差,每一所述初始样本被特征提取矩阵提取特征时具有样本特征;基于所述稀疏表示误差,确定每一所述稀疏表示系数向量的目标向量值;基于所述目标向量值,将每一所述初始样本以所述初始样本集中的其他
N
‑1个初始样本进行稀疏表示得到目标样本,生成包含所述目标样本的目标样本集,每一所述目标样本被所述特征提取矩阵提取特征时具有样本特征;基于所述初始样本集中每一所述初始样本的样本特征和所述目标样本集中每一所述目标样本的样本特征之间的样本特征差异,确定所述特征提取矩阵的目标矩阵值;基于所述目标矩阵值,对所述初始样本进行特征提取
。2.
如权利要求1所述的方法,其特征在于,所述特征提取矩阵对应有初始矩阵值,在所述基于所述稀疏表示误差,确定每一所述稀疏表示系数向量的目标向量值之前,所述方法还包括:基于所述初始矩阵值,对所述初始样本集中的每一所述初始样本进行重构得到对应的重构样本,生成包含所述重构样本的重构样本集;对于所述重构样本集中的每一所述重构样本,基于对应的所述稀疏表示系数向量,确定每一所述重构样本对应的稀疏表示样本;基于所述重构样本和对应的所述稀疏表示样本,确定所述稀疏表示误差
。3.
如权利要求2所述的方法,其特征在于,在所述确定所述特征提取矩阵的目标矩阵值之后,所述方法还包括:判断当前的迭代数据是否满足设定的迭代条件;若所述当前的迭代数据不满足所述设定的迭代条件,则通过所述目标矩阵值,对所述特征提取矩阵的初始矩阵值进行更新,并迭代执行所述基于所述初始矩阵值,对所述初始样本集中的每一所述初始样本进行重构得到对应的重构样本,生成包含所述重构样本的重构样本集的步骤
。4.
如权利要求2所述的方法,其特征在于,所述基于所述稀疏表示误差,确定每一所述稀疏表示系数向量的目标向量值,包括:基于每一所述初始样本分别与所述初始样本集中的其他
N
‑1个初始样本之间的融合距离,获取每一所述初始样本对应的距离向量,所述融合距离是基于初始样本之间的距离和重构样本之间的距离得到;将每一所述初始样本对应的所述稀疏表示系数向量和所述距离向量进行点乘,得到加权距离和;基于所述稀疏表示误差和所述加权距离和,确定每一所述稀疏表示系数向量的目标向量值
。5.
如权利要求1所述的方法,其特征在于,所述基于所述初始样本集中每一所述初始样本的样本特征和所述目标样本集中每一所述目标样本的样本特征之间的样本特征差异...

【专利技术属性】
技术研发人员:袁明冬刘博阮威健胡金晖张力元
申请(专利权)人:中电科新型智慧城市研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1