一种基于EMD特征提取和稀疏表示的细胞分类方法技术

技术编号：13977064 阅读：115 留言：0更新日期：2016-11-11 17:29

一种基于EMD特征提取和稀疏表示的细胞分类方法，本方法采用了一种基于EMD的细胞特征提取方法。首先利用正交子空间投影OSP方法对医学高光谱图像进行波段选择，降低维数，减少数据冗余。然后用二维EMD方法对降维后的数据进行特征提取，将数据分解为一系列频率由高到低排列的IMF分量。采用基于稀疏表示的分类器SRC对数据进行分类，通过比较残差来对样本分类，计算得到的残差越小，则将该样本归为到这一类中。基于EMD特征提取和稀疏表示的细胞分类方法中，EMD表现出来很好的时频特性，在高光谱数据特征提取上具有明显的潜力和优势。同时利用基于稀疏表示的分类器SRC，更大大的保证了分类的精度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种基于EMD(经验模式分解)的细胞特征提取方法，并采用稀疏表示的分类方法对其进行分类识别，属于医学高光谱分类识别领域。
技术介绍
传统的医学检测方法是一系列的化学分析法，对组织切片进行染色，实验过程复杂，周期长，速度慢，强度大，误差大，测量的可重复性差，通过人眼观察实现癌细胞识别，受实验者的主观影响很大，容易造成误诊。随着成像技术的发展，医学诊断也越来越依赖于成像技术。成像形式包括核磁共振成像(MRI)，计算机断层扫描成像(CT)，超声波扫描术，核成像技术等等。近年来，基于光学成像技术及模式识别的全自动、智能化组织切片中细胞分析和诊断研究引起不少学者的重视。高光谱成像技术的快速发展也使其迅速成为医学成像的一员。基于高光谱成像技术以及模式识别的发展，逐渐走入人们的视线，为实时医疗成像进行快速诊断提供了可能。相较传统的医疗诊断方法，能够摆脱繁琐的前期数据的处理，包括对细胞染色，对获得的样本进行离心操作获取分离其他成分等等操作，从而摆脱实验者的主观因素快速准确的对病情进行判断。近年来，高光谱成像技术与生物医学显微镜结合而成的高光谱显微技术成为最受人们关注的一种医学成像技术。它可近距离对生物医学切片进行成像，并同时获得观测对象的图像维信息和光谱维信息。传统的医学治疗都是通过医生用肉眼观察医学影像上的病变区域形态，而每天都会产生很多医学影像，既耗费时间而且精确度不高。相比传统的纤维成像方式，高光谱成像技术可提供更丰富的信息进行病理分析，辅助医学研究人员从更加全面的角度对组织器官和细胞切片进行研究分析。本专利技术公开了一种快速识别匹配病变细胞的方法，...

【技术保护点】
一种基于EMD特征提取和稀疏表示的细胞分类方法，S1对医学血细胞的高光谱数据用OSP进行波段选择；从血细胞图像所有波段中选择起主要作用的波段子集，剔除部分高冗余的波段；不仅能大大降低医学血细胞图像的数据维数,而且能比较完整地保留有用的信息,提高分类精度；S2采用EMD分解的方法提取血细胞高光谱图像特征；EMD能够自适应地从高频到低频提取信号的本质特征，EMD对血细胞的高光谱图像进行分解，通过多次的筛分过程，一方面消除信号中的骑波，另一方面平滑高低不平的振幅，得到一系列的从高频到低频的IMF，然后从IMF中提取合适的特征，进行分类；S3利用SRC分类器进行分类；SRC用训练样本稀疏线性地表示测试样本，并根据类别线性重构误差最小化分类；其特征在于：该方法的实施步骤如下，步骤1、血细胞的高光谱数据量大，但是各波段间往往具有相关性，这造成数据的冗余，也就是常说的维数灾难；为了提高运算精度和节省运算时间先对数据用OSP方法对血细胞数据进行波段选择；波段选择的原则是：信息含量多、相关性小、光谱差异大、可分性好的波段就是应该选择的最佳波段；具体算法如下：定义B1和B2是血细胞光谱数据φ中的两个波段，...

【技术特征摘要】
1.一种基于EMD特征提取和稀疏表示的细胞分类方法，S1对医学血细胞的高光谱数据用OSP进行波段选择；从血细胞图像所有波段中选择起主要作用的波段子集，剔除部分高冗余的波段；不仅能大大降低医学血细胞图像的数据维数,而且能比较完整地保留有用的信息,提高分类精度；S2采用EMD分解的方法提取血细胞高光谱图像特征；EMD能够自适应地从高频到低频提取信号的本质特征，EMD对血细胞的高光谱图像进行分解，通过多次的筛分过程，一方面消除信号中的骑波，另一方面平滑高低不平的振幅，得到一系列的从高频到低频的IMF，然后从IMF中提取合适的特征，进行分类；S3利用SRC分类器进行分类；SRC用训练样本稀疏线性地表示测试样本，并根据类别线性重构误差最小化分类；其特征在于：该方法的实施步骤如下，步骤1、血细胞的高光谱数据量大，但是各波段间往往具有相关性，这造成数据的冗余，也就是常说的维数灾难；为了提高运算精度和节省运算时间先对数据用OSP方法对血细胞数据进行波段选择；波段选择的原则是：信息含量多、相关性小、光谱差异大、可分性好的波段就是应该选择的最佳波段；具体算法如下：定义B1和B2是血细胞光谱数据φ中的两个波段，每个波段有N个像素点；用B1和B2来估算第三个波段B；为了找到一个波段使它和B1和B2最不相似，一个关于B1和B2的正交子空间P被构造为：P＝I-Z(ZTZ)-1ZT式中，I是一个N阶单位矩阵，Z是一个N×2矩阵，Z的第一列包含B1的所有像素，Z的第二列包含B2的所有像素；计算出y0＝PTy，y包含B的所有像素，y0是B1和B2的正交子空间中的B的分量；产生最大正交分量‖y0‖的波段被认为是与B1和B2最不像似的波段，被选为B3；步骤2、利用EMD方法进行特征描述，提取血细胞的特征；EMD经验模式分解将复杂的信号分解为适宜于Hilbert变换的IMF函数分量，由于本征模函数IMF的本质是信号在不同频率范围内原信号的本质特征，原信号噪声的集合表示为残差形式，所以提取信号的本质特征通过保留每个IMF分量和丢弃残余量来实现，IMF必须满足下列基本条件：1)整个信号长度上的极大值点数、极小值点数与过零点的数目相等或相差为1；2)在任意时刻，由包络线定义的极大值和极小值的平均值为0；第一个条件很明显，它和传统的窄带的稳定高斯过程的要求一样；第二个条件是必要的，以此保证瞬时频率不会出现不期望的波动而诱导不对称的波形；EMD分解实质是对一个时间序列信号进行平稳化的处理过程，它将信号分解为一系列频率由高到低排列的IMF分量和一个余量之和，IMF的获得是一个不断循环迭代的过程，最后筛选出满足条件的IMF；该过程不断的从大尺度信号中剔除均值包络线，直到满足停止条件，筛选结束；对一个信号S(t)进行EMD分解的具体步骤如下：(1)外部初始化，令血细胞图像为r0(m,n)＝f(m,n)，j＝1(2)提取第j个IMF函数：a)内部初始化hj,0(m,n)＝rj-1(m,n)，k＝1；b)利用形态学算法或8邻域像素，找出hj,k-1(m,n)中的局部极大值和局部极小值点集；c)使用合适的二维曲面插值方法，分别对极大值点和极小值点进行包络拟合，插值计算出hj,k-1(m,n)的上包络面umax,k-1(m,n)和下包络面umin,k-1(m,n)；d)确定上下包络的均值：meank-1(m,n)＝[umax,k-1(m,n)+umin,k-1(m,n)]/2；e)从图像中减去均值，得到：hj,k(m,n)＝hj,k-1(m,n)-meank-1(m,n)f)计算终止条件，若满足IMF条件则有cj(m,n)＝hj,k(m,n)否则令k＝k+1,转到步骤b(3)求残余量rj(m,n)＝rj-1(m,n)-cj(m,n)若rj中仍有不少于两个的极值点或者分解所得的IMF数目未达到要求，则将rj看做新的数据，并继续从步骤2进行分解，j＝j+1(4)最后得到的二维EMD分解的结果是： f ( m , n ) = Σ j = 1 n c j ( m , n ) + r n ( m , n ) ]]>二维EMD中IMF筛选停止的SD计算公式如下： S D = Σ m = 1 M Σ n = 1 N [ | h j , k - 1 ( m , ...

【专利技术属性】
技术研发人员：李伟，张秋实，
申请(专利权)人：北京化工大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人