基于PCANet的图像分类方法和装置制造方法及图纸

技术编号：28376284 阅读：36 留言：0更新日期：2021-05-08 00:03

本申请提出一种基于PCANet的图像分类方法和装置。其中，方法包括：获取图像数据；对图像数据进行数据大小和格式的处理，并对处理后的图像数据进行预处理，将预处理后的图像数据分为训练图像集和测试图像集；根据PCANet模型和训练图像集进行模型训练，以生成PCANet特征提取模型；将测试图像集中的图像输入至经过训练的PCANet特征提取模型以提取特征，并将提取出的特征输入至SVM分类器进行分类。本申请基于PCANet网络模型，全自动地对图像进行分类，从而可以提高分类过程的效率和效果，并能使图像分类过程更简单，有效减少传统分类模型的复杂度，提高分类准确率和可靠性。

全部详细技术资料下载

【技术实现步骤摘要】
基于PCANet的图像分类方法和装置
本申请涉及图像处理和模式识别领域，特别涉及一种基于PCANet图像分类方法和装置。
技术介绍
深度学习的概念源于人工神经网络的研究，通过组合低层特征，形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。随着这几年人工智能的迅速发展，深度学习在搜索技术，数据挖掘，机器学习，机器翻译，自然语言处理，多媒体学习，语音，推荐和个性化技术，以及其他相关领域都取得了很多成果。深度学习使机器模仿视听和思考等人类的活动，解决了很多复杂的模式识别难题，使得人工智能相关技术取得了很大进步。图像是人类视觉、运动分析、数据融合等研究的基础，是周围景色事物的客观反映，是人类感知和认识世界之间的桥梁。因此在生物医学图像识别，航空遥感、通讯领域、机器视觉等领域中，对图像的研究分类时是研究工作的重点之一。但在实际情况中对图像的分类往往会遇到很多情况，比如不同样本规模不一样并且维数很大、数量很少等问题。相关技术中，传统图像分类算法精度低、速度慢，使用深度学习结合机器学习分类器分类方法，可以有效解决上述问题。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本申请的第一个目的在于提出一种基于PCANet的图像分类方法，该方法可以提高二维图像或者三维图像的分类准确率且模型简单易优化。本申请的第二个目的在于提出一种基于PCANet的图像分类装置。为达上述目的，本申请第一方面实施例提出了一种基于PCANet的图像分类，包括：r>获取图像数据；对所述图像数据进行数据大小和格式的处理，并对处理后的所述图像数据进行预处理，将预处理后的图像数据分为训练图像集和测试图像集；根据PCANet模型和所述训练图像集进行模型训练，以生成PCANet特征提取模型；将所述测试图像集中的图像输入至经过训练的PCANet特征提取模型以提取特征，并将提取出的特征输入至SVM分类器进行分类。可选地，在本申请一些实施例中，所述PCANet模型包括：第一步：利用所有N幅原始训练图像和主成分分析PCA方法生成L1个滤波器，并利用PCA滤波器与所述原始训练图像分别进行卷积，则所述原始训练图像中的每一幅图像生成L1幅图像，即共生成N*L1幅图像；第二步：再次利用PCA方法和所述第一步生成的所有N*L1幅图像生成新的L2个滤波器，并利用新生成的滤波器对所述第一步生成的每一幅图像分别进行卷积，即所述第一步生成的所有图像中的每一幅图像生成L2幅图像，即共生成N*L1*L2幅图像；第三步：所述第一步生成的所有的图像中，对其中每一幅图像生成的L2幅图像进行二进制哈希，将L2幅图像合并成一副图像，即共合成N*L1幅图像；第四步：对哈希处理后的所有N*L1幅图像进行取块处理，每幅图像取β个块，每个块像素大小为k5*k6，并统计每个块的直方图，将每一幅原始图像对应的所有块统计的直方图进行串联，得到一个一维的特征向量，用所得到的特征向量代表所述原始训练图像，即最后生成N个特征向量。可选地，在本申请一些实施例中，所述第一步具体包括：步骤1)对所述N幅原始图像训练集中第j幅原始训练图像进行处理，以每一个像素点为中心，取k1*k2像素大小的图像块，将取出块的像素点重新进行排序，变成一列n维的列向量，并进行标准化处理，使其均值为0，标准差为1，标准化后的向量如下式表示：其中，表示所述第j幅原始训练图像中的第i块的列向量，表示第i块列向量中均值为0，标准差为1的像素点；步骤2)按顺序将取出的块列向量排列成新的矩阵如下式表示：其中，表示同一幅图像中不同块的列向量；步骤3)将所述所有N幅原始训练图像进行所述步骤1)和步骤2)处理，处理好的N幅原始训练图像按顺序排列成新的矩阵X，得到如下矩阵：其中，分别表示不同图像按照式(2)处理后得到的矩阵。可选地，在本申请一些实施例中，在得到所述矩阵X之后，所述方法还包括：对所述矩阵X利用所述PCA方法进行降维处理，PCA在一组标准正交滤波器中最小化重构误差为：其中，IL1为单位矩阵，其中，式(4)的解V为XXT的特征向量；所述PCA滤波器的表达式为如式(5)所示：其中，mat是将向量映射到矩阵的函数；ql(XXT)表示XXT的第l个特征向量，为所述第一步生成的第l个滤波器。可选地，在本申请一些实施例中，通过如下式(6)对所述PCA滤波器与所述原始训练图像中第j幅原始训练图像Γj进行卷积：其中，*表示卷积，利用滤波器对所有N幅原始训练图像进行卷积，生成L1*N幅图像；其中，在获得卷积后的图像之后，通过如下公式(7)对所述卷积后的图像进行最大池化层处理：其中，符号“×”表示最大池化操作，P1表示所述第一步的最大池化层，表示进行最大池化层处理后的图像。可选地，在本申请一些实施例中，所述第二步具体包括：步骤1)以所述第一步中卷积操作后每一幅原始训练图像生成的L1幅图像之中的第l幅图像的每一个像素点为中心，取k3*k4像素大小的块，将取出块的像素点重新进行排序，变成一列，并进行标准化处理，使其均值为0，标准差为1，标准化后的向量如式(8)表示：其中，表示原始训练图像中第j幅图像与第l个滤波器新生成的第l幅图像中的第b块的列向量。表示第b块列向量中均值为0，标准差为1的像素点；步骤2)按顺序将取出的块列向量排列成新的矩阵会得到：步骤3)将所有N*L1幅图像进行所述步骤1)和步骤2)处理，处理好的N*L1幅图像按顺序排列成新的矩阵Y，得到如下矩阵：其中，分别表示不同图像按照式(9)处理后得到的矩阵。可选地，在本申请实施例中，在得到所述矩阵Y之后，所述方法还包括：通过PCA滤波器对所述矩阵Y进行PCA降维处理；其中，所述PCA滤波器的表达式为：其中，qh(YYT)表示YYT的第h个特征向量，所述公式(11)的解为YYT的特征向量，为所述第二步生成的第h个滤波器。可选地，在本申请实施例中，在所述利用新生成的滤波器对所述第一步生成的每一幅图像分别进行卷积之后，所述第二步还包括：对卷积后的图像进行最大池化层处理。可选地，在本申请一些实施例中，所述SVM分类器的决策函数表示如下：其中，Tm表示超平面，ω表示超平面法向量，pm表示特征向量，z表示偏置，ζm表示松弛系数，C表示惩罚因子，N表示训练图像个数。为达到上述目的，本申请第二方面实施例提出的一种基于PCANet的图像分类装置，包括：获取模块，用于获取图像数据；处理模块，用于对所述图像数据进行数据大小和格式的处理，并对处理后的所述图像数据进行预处理，将预处理后的图像数据分为训练图像集和测试图像集；生成模块，用于根据PCANet模型和所述训练图像集进行模型训练，以本文档来自技高网...

【技术保护点】
1.一种基于PCANet的图像分类方法，其特征在于，包括：/n获取图像数据；/n对所述图像数据进行数据大小和格式的处理，并对处理后的所述图像数据进行预处理，将预处理后的图像数据分为训练图像集和测试图像集；/n根据PCANet模型和所述训练图像集进行模型训练，以生成PCANet特征提取模型；/n将所述测试图像集中的图像输入至经过训练的PCANet特征提取模型以提取特征，并将提取出的特征输入至SVM分类器进行分类。/n

【技术特征摘要】
1.一种基于PCANet的图像分类方法，其特征在于，包括：
获取图像数据；
对所述图像数据进行数据大小和格式的处理，并对处理后的所述图像数据进行预处理，将预处理后的图像数据分为训练图像集和测试图像集；
根据PCANet模型和所述训练图像集进行模型训练，以生成PCANet特征提取模型；
将所述测试图像集中的图像输入至经过训练的PCANet特征提取模型以提取特征，并将提取出的特征输入至SVM分类器进行分类。

2.根据权利要求1所述的基于PCANet的图像分类方法，其特征在于，所述PCANet模型包括：
第一步：利用所有N幅原始训练图像和主成分分析PCA方法生成L1个滤波器，并利用PCA滤波器与所述原始训练图像分别进行卷积，则所述原始训练图像中的每一幅图像生成L1幅图像，即共生成N*L1幅图像；
第二步：再次利用PCA方法和所述第一步生成的所有N*L1幅图像生成新的L2个滤波器，并利用新生成的滤波器对所述第一步生成的每一幅图像分别进行卷积，即所述第一步生成的所有图像中的每一幅图像生成L2幅图像，即共生成N*L1*L2幅图像；
第三步：所述第一步生成的所有的图像中，对其中每一幅图像生成的L2幅图像进行二进制哈希，将L2幅图像合并成一副图像，即共合成N*L1幅图像；
第四步：对哈希处理后的所有N*L1幅图像进行取块处理，每幅图像取β个块，每个块像素大小为k5*k6，并统计每个块的直方图，将每一幅原始图像对应的所有块统计的直方图进行串联，得到一个一维的特征向量，用所得到的特征向量代表所述原始训练图像，即最后生成N个特征向量。

3.根据权利要求2所述的基于PCANet的图像分类方法，其特征在于，所述第一步具体包括：
步骤1)对所述N幅原始图像训练集中第j幅原始训练图像进行处理，以每一个像素点为中心，取k1*k2像素大小的图像块，将取出块的像素点重新进行排序，变成一列n维的列向量，并进行标准化处理，使其均值为0，标准差为1，标准化后的向量如下式表示：

其中，表示所述第j幅原始训练图像中的第i块的列向量，表示第i块列向量中均值为0，标准差为1的像素点；
步骤2)按顺序将取出的块列向量排列成新的矩阵如下式表示：

其中，表示同一幅图像中不同块的列向量；
步骤3)将所述所有N幅原始训练图像进行所述步骤1)和步骤2)处理，处理好的N幅原始训练图像按顺序排列成新的矩阵X，得到如下矩阵：

其中，分别表示不同图像按照式(2)处理后得到的矩阵。

4.根据权利要求3所述的基于PCANet的图像分类方法，其特征在于，在得到所述矩阵X之后，所述方法还包括：
对所述矩阵X利用所述PCA方法进行降维处理，PCA在一组标准正交滤波器中最小化重构误差为：

其中，IL1为单位矩阵，其中，式(4)的解V为XXT的特征向量；所述PCA滤波器的表达式为如式(5)所示：

其中，mat是将向量映射到矩阵的函数；ql(XXT)表示XXT的第l个特征向量，为所述第一步生成的第l个滤波器。

5.根据权利要...

【专利技术属性】
技术研发人员：王瑜，贾洪飞，
申请(专利权)人：北京工商大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人