System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及图像分类,特别涉及一种图片特征提取方法、系统、设备和介质。
技术介绍
1、随着科学技术的发展和进步,高维数据在很多领域都很常见,而降维是解决高维问题的关键。线性判别分析(lda)是一种众所周知的监督降维方法。在矩阵数据时,经典lda通常将矩阵拉直为一个向量,这就出现了高维低数据的情况,即小样本问题,使得经典lda出现奇异性问题,由此出现了2dlda。但2dlda虽能解决经典lda的奇异性问题,但其在面对异常值和噪声时仍表现较高的敏感性。为提升2dlda的稳定性,国内外研究者提出了各种改进方法,但这些都是围绕在矩阵维数相对样本数较低的情况下做出的改进。然而,随着时代的发展,数据的维数变得越来越大,最典型的就是图片的像素越来越多,因此这就使得2dlda面临和经典lda相同小样本问题。
2、随着科技的发展,出现了越来越多的矩阵数据,其中最典型的就是图片数据。lda在解决这类问题时,通常的做法是将矩阵拉直变成一个向量,但这种做法使得数据维度相对样本数来说变得非常大,不但造成了小样本问题还使得计算难度以及计算成本增加。由此m li在2005年提出了2dlda来解决这类问题,但由于2dlda使用f范数作为距离度量,所以2dlda仍具有对异常值和噪声敏感的问题。人们为了解决这个问题,在2dlda的基础上不断做出改进。sifaou h等人(2020)在2020年提出了首次大维背景下基于spikedmodel对经典lda的改进(i-lda),其有效避免了r-lda正则化参数选择困难以及lda在高维情况下与每个类相关的协方差矩
3、可见,以上改进的模型均未考虑2d场景下的高维情况的出现,以至于在图片特征的提取中,因为2d高维数据处理不当而导致后续模型搭建过程出现效果不佳,图片特征提取误差大的问题。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种图片特征提取方法、系统、设备和介质。
2、本说明书采用下述技术方案:
3、本说明书提供了一种图片特征提取方法,包括:
4、获取带标签的2d图片数据样本,所述2d图片数据样本的总体协方差矩阵∑具有spiked结构;
5、确定2d图片数据各样本的类内散布矩阵sw和各样本的类间散布矩阵sb,以及2d图片数据类内散布矩阵sw中各样本的特征值λ和特征向量u;
6、用2d图片数据的总体协方差矩阵∑的样本特征值l替换图片数据类内散布矩阵sw的样本特征值λ,并对2d图片数据样本的类内散布矩阵sw结构进行频谱修正和正则化以使其具有spiked结构,并用正则化后的类内散布矩阵替换原2d图片数据的类内散布矩阵sw,记新的类内散布矩阵为
7、构建转换矩阵w,利用转换矩阵w对2d图片数据样本进行降维处理,提取2d图片样本特征。
8、优选地,所述2d图片数据样本的总体协方差矩阵∑具有spiked结构,具体包括:在2d图片数据样本的维度与样本大小具有相同数量级的情况下,总体协方差矩阵∑的特征值l的分布服从marcenko-pasturlow曲线,将偏离于分布中心的特征值分别记为大、小spiked特征根。
9、优选地,所述对2d图片数据类内散布矩阵sw结构进行频谱修正和正则化,具体包括:
10、用2d图片数据的总体协方差矩阵∑的特征值l替换2d图片数据的类内散布矩阵sw的特征值λ,并重新构建2d图片数据的类内散布矩阵sw的结构,使新的2d图片数据的类内散布矩阵sw和图片数据的总体协方差矩阵∑具有相同的spiked结构,以对类内散布矩阵sw进行频谱修正;
11、对频谱修正后的2d图片数据类内散布矩阵sw进行正则化。
12、优选地,所述构建转换矩阵w,利用转换矩阵w对2d图片数据样本进行降维处理,提取2d图片样本特征,具体包括:
13、计算2d图片数据类内散布矩阵的逆矩阵右乘类间散布矩阵sb的特征值ξ和特征向量w;
14、将得到的特征值ξ进行降序排列,取前k个特征值ξ对应的特征向量w组成转换矩阵w;
15、将转换矩阵w与2d图片数据样本矩阵xij相乘,将2d图片数据样本矩阵xij投影到更加低维的空间中,获得投影矩阵yij,即对2d图片数据样本进行降维处理。
16、优选地,所述确定2d图片数据的类内散布矩阵sw和类间散布矩阵sb,包括以下步骤:
17、对2d图片数据进行清洗,剔除每个图片数据中都相同的行或列;
18、计算清洗后图片数据的类样本均值和总体样本均值;
19、利用图片数据的类样本均值和总体样本均值分别计算类内散布矩阵sw和类间散布矩阵sb。
20、优选地,所述2d图片数据类内散布矩阵sw的特征值λ和特征向量u,是通过对2d图片数据样本的类内散布矩阵sw进行谱分解而得到。
21、本说明书提供一种图片特征提取系统,包括:
22、图片数据样本获取模块,用于获取带标签的2d图片数据样本;
23、计算模块,用于计算2d图片数据的类内散布矩阵sw和类间散布矩阵sb,以及2d图片数据类内散布矩阵sw的特征值λ和特征向量u;
24、图片数据类内散布矩阵sw的频谱修正和正则化模块,用于将2d图片数据类内散布矩阵sw的特征值λ替换为2d图片数据样本总体协方差矩阵∑的特征值l,并对2d图片数据的类内散布矩阵sw进行频谱修正和正则化,并替换原2d图片数据类内散布矩阵sw,记新的类内散布矩阵为
25、图片特征提取模块,用于构建转换矩阵w,利用转换矩阵w对2d图片数据样本进行降维处理,提取2d图片样本特征。
26、本说明书提供一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述一种图片特征提取方法。
27、本说明书提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述一种图片特征提取方法。
28、本说明书提供的一种图片特征提取方法,对比现有技术,其有益效果如下:
29、本说明书提出的图片特征提取的方法中,在原有图片数据样本总体协方差矩阵的结构上引入了spiked模型,同时将图片数据样本类内散布矩阵谱分解的特征值替换为图片数据样本总体协方差矩阵的特征值,并对图片数据样本的类内散布矩阵结构进行频谱修正和正则化,使其更完整地保留了总体协方差矩阵的结构信息,将估计误差控制在更小的范围内,从而达到在2d场景中高维情况下的更高的识别效果。
本文档来自技高网...【技术保护点】
1.一种图片特征提取方法,其特征在于,包括:
2.如权利要求1所述的一种图片特征提取方法,其特征在于,所述2D图片数据样本的总体协方差矩阵∑具有Spiked结构,具体包括:在2D图片数据样本的维度与样本大小具有相同数量级的情况下,总体协方差矩阵∑的特征值l的分布服从Marcenko-PasturLow曲线,将偏离于分布中心的特征值分别记为大、小Spiked特征根。
3.如权利要求1所述的一种图片特征提取方法,其特征在于,所述对2D图片数据类内散布矩阵Sw结构进行频谱修正和正则化,具体包括:
4.如权利要求1所述的一种图片特征提取方法,其特征在于,所述构建转换矩阵W,利用转换矩阵W对2D图片数据样本进行降维处理,提取2D图片样本特征,具体包括:
5.如权利要求1所述的一种图片特征提取方法,其特征在于,所述确定2D图片数据的类内散布矩阵Sw和类间散布矩阵Sb,包括以下步骤:
6.如权利要求1所述的一种图片特征提取方法,其特征在于,所述2D图片数据类内散布矩阵Sw的特征值λ和特征向量u,是通过对2D图片数据样本的类内散布矩阵S
7.一种图片特征提取系统,其特征在于,包括:
8.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~6任一项所述的方法。
9.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述权利要求1~6任一所述的方法。
...【技术特征摘要】
1.一种图片特征提取方法,其特征在于,包括:
2.如权利要求1所述的一种图片特征提取方法,其特征在于,所述2d图片数据样本的总体协方差矩阵∑具有spiked结构,具体包括:在2d图片数据样本的维度与样本大小具有相同数量级的情况下,总体协方差矩阵∑的特征值l的分布服从marcenko-pasturlow曲线,将偏离于分布中心的特征值分别记为大、小spiked特征根。
3.如权利要求1所述的一种图片特征提取方法,其特征在于,所述对2d图片数据类内散布矩阵sw结构进行频谱修正和正则化,具体包括:
4.如权利要求1所述的一种图片特征提取方法,其特征在于,所述构建转换矩阵w,利用转换矩阵w对2d图片数据样本进行降维处理,提取2d图片样本特征,具体包括:
...
【专利技术属性】
技术研发人员:张晓颖,李华,孙全文,王正召,吕洋,刘洁,
申请(专利权)人:长春大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。