一种基于EMD特征提取和稀疏表示的细胞分类方法技术

技术编号:13977064 阅读:108 留言:0更新日期:2016-11-11 17:29
一种基于EMD特征提取和稀疏表示的细胞分类方法,本方法采用了一种基于EMD的细胞特征提取方法。首先利用正交子空间投影OSP方法对医学高光谱图像进行波段选择,降低维数,减少数据冗余。然后用二维EMD方法对降维后的数据进行特征提取,将数据分解为一系列频率由高到低排列的IMF分量。采用基于稀疏表示的分类器SRC对数据进行分类,通过比较残差来对样本分类,计算得到的残差越小,则将该样本归为到这一类中。基于EMD特征提取和稀疏表示的细胞分类方法中,EMD表现出来很好的时频特性,在高光谱数据特征提取上具有明显的潜力和优势。同时利用基于稀疏表示的分类器SRC,更大大的保证了分类的精度。

【技术实现步骤摘要】

本专利技术涉及一种基于EMD(经验模式分解)的细胞特征提取方法,并采用稀疏表示的分类方法对其进行分类识别,属于医学高光谱分类识别领域。
技术介绍
传统的医学检测方法是一系列的化学分析法,对组织切片进行染色,实验过程复杂,周期长,速度慢,强度大,误差大,测量的可重复性差,通过人眼观察实现癌细胞识别,受实验者的主观影响很大,容易造成误诊。随着成像技术的发展,医学诊断也越来越依赖于成像技术。成像形式包括核磁共振成像(MRI),计算机断层扫描成像(CT),超声波扫描术,核成像技术等等。近年来,基于光学成像技术及模式识别的全自动、智能化组织切片中细胞分析和诊断研究引起不少学者的重视。高光谱成像技术的快速发展也使其迅速成为医学成像的一员。基于高光谱成像技术以及模式识别的发展,逐渐走入人们的视线,为实时医疗成像进行快速诊断提供了可能。相较传统的医疗诊断方法,能够摆脱繁琐的前期数据的处理,包括对细胞染色,对获得的样本进行离心操作获取分离其他成分等等操作,从而摆脱实验者的主观因素快速准确的对病情进行判断。近年来,高光谱成像技术与生物医学显微镜结合而成的高光谱显微技术成为最受人们关注的一种医学成像技术。它可近距离对生物医学切片进行成像,并同时获得观测对象的图像维信息和光谱维信息。传统的医学治疗都是通过医生用肉眼观察医学影像上的病变区域形态,而每天都会产生很多医学影像,既耗费时间而且精确度不高。相比传统的纤维成像方式,高光谱成像技术可提供更丰富的信息进行病理分析,辅助医学研究人员从更加全面的角度对组织器官和细胞切片进行研究分析。本专利技术公开了一种快速识别匹配病变细胞的方法,通过对医学图像的特征提取来压缩信息,从而对血细胞进行分类找出病变细胞。移动医疗的快速发展要求能快速精确地进行血液检查,从而能有效实现疾病的早期发现和病因判断。本专利技术完成一套自动进行血细胞识别的方法,利用不同血细胞的透射和吸收光谱特性对其进行自动分类识别,能有效提高细胞识别速度和精度,并能迅速发现异常细胞,将能为临床的精确辅助诊断和快速病源发现提供良好的技术支持。高光谱图像一个主要特点是波段数多,波段间具有很强的相关性,所以各波段图像所提供的信息常常有重叠。为了消除冗余信息、减少数据量和计算时间,需要对高光谱图像进行特征提取。EMD能将信号分解成有限个本征模函数(IMF)和一个残差信号。EMD表现出来很好的时频特性,在高光谱数据特征提取上具有明显的潜力和优势。
技术实现思路
本专利技术的目的在于是通过学习相关技术基础,完成一套医学显微图像的人体血细胞快速识别系统。移动医疗的快速发展要求能快速精确地进行血液检查,从而能有效实现疾病的早期发现和病因判断。要求完成一套自动进行血细胞识别的方法,利用不同血细胞的透射和吸收光谱特性对其进行自动分类识别,能有效提高细胞识别速度和精度,并能迅速发现异常细胞,将能为临床的精确辅助诊断和快速病源发现提供良好的技术支持。高光谱成像在生物医学可视化方面是一种新技术,与生物医学显微镜相结合而产生的高光谱显微技术在国际上已经被成功的应用于医学领域。高光谱可以对被摄物体在紫外、可见光、近红外、甚至中红外波段等宽谱段范围进行成像,光谱分辨率能达到纳米级。细胞的病变会引起细胞组分如蛋白质、核酸、糖和水分等在含量、构型等方面的变化,由此引起光谱曲线在波形、峰强、波长等方面的改变。医院每天要产生上千万甚至更多的医学影像,而高光谱图像存在着很大的空间相关性,产生很多冗余信息。为了节省运算时间和提高计算精度,因此先对医学血细胞高光谱图像进行波段选择来减少数据量,降维后再对其进行EMD特征提取,然后用稀疏表示的方法对血细胞进行分类。本专利技术采用的技术方案为一种基于EMD特征提取和稀疏表示的细胞分类方法,该方法的实现过程如下:S1对医学血细胞的高光谱数据用OSP(正交子空间投影)进行波段选择。从血细胞图像所有波段中选择起主要作用的波段子集,剔除部分高冗余的波段。不仅能大大降低医学血细胞图像的数据维数,而且能比较完整地保留有用的信息,提高分类精度。S2采用EMD分解的方法提取血细胞高光谱图像特征。EMD能够自适应地从高频到低频提取信号的本质特征,EMD对血细胞的高光谱图像进行分解,通过多次的筛分过程,一方面消除信号中的骑波,另一方面平滑高低不平的振幅,得到一系列的从高频到低频的IMF,然后从IMF中提取合适的特征,进行分类。S3利用SRC分类器进行分类。SRC用训练样本稀疏线性地表示测试样本,并根据类别线性重构误差最小化分类。本专利技术的流程图如图1所示,实施步骤如下:步骤1、血细胞的高光谱数据量大,但是各波段间往往具有相关性,这造成数据的冗余,也就是常说的维数灾难。为了提高运算精度和节省运算时间先对数据用OSP方法对血细胞数据进行波段选择。波段选择的原则是:信息含量多、相关性小、光谱差异大、可分性好的波段就是应该选择的最佳波段。具体算法如下:定义B1和B2是血细胞光谱数据φ中的两个波段,每个波段有N个像素点。用B1和B2来估算第三个波段B。为了找到一个波段使它和B1和B2最不相似,一个关于B1和B2的正交子空间P被构造为:P=I-Z(ZTZ)-1ZT式中,I是一个N阶单位矩阵,Z是一个N×2矩阵,Z的第一列包含B1的所有像素,Z的第二列包含B2的所有像素。计算出y0=PTy,y包含B的所有像素,y0是B1和B2的正交子空间中的B的分量。产生最大正交分量||y0||的波段被认为是与B1和B2最不像似的波段,被选为B3。步骤2、利用EMD方法进行特征描述,提取血细胞的特征。EMD经验模式分解将复杂的信号分解为适宜于Hilbert变换的IMF函数分量,由于本征模函数IMF的本质是信号在不同频率范围内原信号的本质特征,原信号噪声的集合表示为残差形式,所以提取信号的本质特征通过保留每个IMF分量和丢弃残余量来实现,IMF必须满足下列基本条件:1)整个信号长度上的极大值点数、极小值点数与过零点的数目相等或相差为1。2)在任意时刻,由包络线定义的极大值和极小值的平均值为0。第一个条件很明显,它和传统的窄带的稳定高斯过程的要求一样;第二个条件是必要的,以此保证瞬时频率不会出现不期望的波动而诱导不对称的波形。EMD分解实质是对一个时间序列信号进行平稳化的处理过程,它将信号分解为一系列频率由高到低排列的IMF分量和一个余量之和,IMF的获得是一个不断循环迭代的过程,最后筛选出满足条件的IMF。该过程不断的从大尺度信号中剔除均值包络线,直到满足停止条件,筛选结束。对一个信号S(t)进行EMD分解的具体步骤如下:(1)外部初始化,令血细胞图像为r0(m,n)=f(m,n),j=1(2)提取第j个IMF函数:a)内部初始化hj,0(m,n)=rj-1(m,n),k=1;b)利用形态学算法或8邻域像素,找出hj,k-1(m,n)中的局部极大值和局部极小值点集;c)使用合适的二维曲面插值方法,分别对极大值点和极小值点进行包络拟合,插值计算出hj,k-1(m,n)的上包络面umax,k-1(m,n)和下包络面umin,k-1(m,n);d)确定上下包络的均值:meank-1(m,n)=[umax,k-1(m,n)+umin,k-1(m,n)]/2;e)从图像中减去均值,得到:hj,k本文档来自技高网
...

【技术保护点】
一种基于EMD特征提取和稀疏表示的细胞分类方法,S1对医学血细胞的高光谱数据用OSP进行波段选择;从血细胞图像所有波段中选择起主要作用的波段子集,剔除部分高冗余的波段;不仅能大大降低医学血细胞图像的数据维数,而且能比较完整地保留有用的信息,提高分类精度;S2采用EMD分解的方法提取血细胞高光谱图像特征;EMD能够自适应地从高频到低频提取信号的本质特征,EMD对血细胞的高光谱图像进行分解,通过多次的筛分过程,一方面消除信号中的骑波,另一方面平滑高低不平的振幅,得到一系列的从高频到低频的IMF,然后从IMF中提取合适的特征,进行分类;S3利用SRC分类器进行分类;SRC用训练样本稀疏线性地表示测试样本,并根据类别线性重构误差最小化分类;其特征在于:该方法的实施步骤如下,步骤1、血细胞的高光谱数据量大,但是各波段间往往具有相关性,这造成数据的冗余,也就是常说的维数灾难;为了提高运算精度和节省运算时间先对数据用OSP方法对血细胞数据进行波段选择;波段选择的原则是:信息含量多、相关性小、光谱差异大、可分性好的波段就是应该选择的最佳波段;具体算法如下:定义B1和B2是血细胞光谱数据φ中的两个波段,每个波段有N个像素点;用B1和B2来估算第三个波段B;为了找到一个波段使它和B1和B2最不相似,一个关于B1和B2的正交子空间P被构造为:P=I‑Z(ZTZ)‑1ZT式中,I是一个N阶单位矩阵,Z是一个N×2矩阵,Z的第一列包含B1的所有像素,Z的第二列包含B2的所有像素;计算出y0=PTy,y包含B的所有像素,y0是B1和B2的正交子空间中的B的分量;产生最大正交分量‖y0‖的波段被认为是与B1和B2最不像似的波段,被选为B3;步骤2、利用EMD方法进行特征描述,提取血细胞的特征;EMD经验模式分解将复杂的信号分解为适宜于Hilbert变换的IMF函数分量,由于本征模函数IMF的本质是信号在不同频率范围内原信号的本质特征,原信号噪声的集合表示为残差形式,所以提取信号的本质特征通过保留每个IMF分量和丢弃残余量来实现,IMF必须满足下列基本条件:1)整个信号长度上的极大值点数、极小值点数与过零点的数目相等或相差为1;2)在任意时刻,由包络线定义的极大值和极小值的平均值为0;第一个条件很明显,它和传统的窄带的稳定高斯过程的要求一样;第二个条件是必要的,以此保证瞬时频率不会出现不期望的波动而诱导不对称的波形;EMD分解实质是对一个时间序列信号进行平稳化的处理过程,它将信号分解为一系列频率由高到低排列的IMF分量和一个余量之和,IMF的获得是一个不断循环迭代的过程,最后筛选出满足条件的IMF;该过程不断的从大尺度信号中剔除均值包络线,直到满足停止条件,筛选结束;对一个信号S(t)进行EMD分解的具体步骤如下:(1)外部初始化,令血细胞图像为r0(m,n)=f(m,n),j=1(2)提取第j个IMF函数:a)内部初始化hj,0(m,n)=rj‑1(m,n),k=1;b)利用形态学算法或8邻域像素,找出hj,k‑1(m,n)中的局部极大值和局部极小值点集;c)使用合适的二维曲面插值方法,分别对极大值点和极小值点进行包络拟合,插值计算出hj,k‑1(m,n)的上包络面umax,k‑1(m,n)和下包络面umin,k‑1(m,n);d)确定上下包络的均值:meank‑1(m,n)=[umax,k‑1(m,n)+umin,k‑1(m,n)]/2;e)从图像中减去均值,得到:hj,k(m,n)=hj,k‑1(m,n)‑meank‑1(m,n)f)计算终止条件,若满足IMF条件则有cj(m,n)=hj,k(m,n)否则令k=k+1,转到步骤b(3)求残余量rj(m,n)=rj‑1(m,n)‑cj(m,n)若rj中仍有不少于两个的极值点或者分解所得的IMF数目未达到要求,则将rj看做新的数据,并继续从步骤2进行分解,j=j+1(4)最后得到的二维EMD分解的结果是:f(m,n)=Σj=1ncj(m,n)+rn(m,n)]]>二维EMD中IMF筛选停止的SD计算公式如下:SD=Σm=1MΣn=1N[|hj,k-1(m,n)-hj,k(m,n)|2hj,k-12(m,n)]]]>二维EMD的标准偏差SD的阈值η的经验值通常设在0.1‑0.3之间;步骤3、将血细胞光谱数据贴好标签后,选取部分数据作为训练数据,所有数据作为测试数据,利用SRC分类器对细胞进行分类;SRC的算法如下:SRC算法可用较少的数据捕获感兴趣目标的重要信息,即在样本数充足的情况下,每一类训练样本数据张成一个完备子空间,当该类样本中其他数据输入时,由该完备空间的数据线性表示出来;SRC对数据缺损不敏感,当所求系数足够稀疏时,特征空间的选取变得不再重要...

【技术特征摘要】
1.一种基于EMD特征提取和稀疏表示的细胞分类方法,S1对医学血细胞的高光谱数据用OSP进行波段选择;从血细胞图像所有波段中选择起主要作用的波段子集,剔除部分高冗余的波段;不仅能大大降低医学血细胞图像的数据维数,而且能比较完整地保留有用的信息,提高分类精度;S2采用EMD分解的方法提取血细胞高光谱图像特征;EMD能够自适应地从高频到低频提取信号的本质特征,EMD对血细胞的高光谱图像进行分解,通过多次的筛分过程,一方面消除信号中的骑波,另一方面平滑高低不平的振幅,得到一系列的从高频到低频的IMF,然后从IMF中提取合适的特征,进行分类;S3利用SRC分类器进行分类;SRC用训练样本稀疏线性地表示测试样本,并根据类别线性重构误差最小化分类;其特征在于:该方法的实施步骤如下,步骤1、血细胞的高光谱数据量大,但是各波段间往往具有相关性,这造成数据的冗余,也就是常说的维数灾难;为了提高运算精度和节省运算时间先对数据用OSP方法对血细胞数据进行波段选择;波段选择的原则是:信息含量多、相关性小、光谱差异大、可分性好的波段就是应该选择的最佳波段;具体算法如下:定义B1和B2是血细胞光谱数据φ中的两个波段,每个波段有N个像素点;用B1和B2来估算第三个波段B;为了找到一个波段使它和B1和B2最不相似,一个关于B1和B2的正交子空间P被构造为:P=I-Z(ZTZ)-1ZT式中,I是一个N阶单位矩阵,Z是一个N×2矩阵,Z的第一列包含B1的所有像素,Z的第二列包含B2的所有像素;计算出y0=PTy,y包含B的所有像素,y0是B1和B2的正交子空间中的B的分量;产生最大正交分量‖y0‖的波段被认为是与B1和B2最不像似的波段,被选为B3;步骤2、利用EMD方法进行特征描述,提取血细胞的特征;EMD经验模式分解将复杂的信号分解为适宜于Hilbert变换的IMF函数分量,由于本征模函数IMF的本质是信号在不同频率范围内原信号的本质特征,原信号噪声的集合表示为残差形式,所以提取信号的本质特征通过保留每个IMF分量和丢弃残余量来实现,IMF必须满足下列基本条件:1)整个信号长度上的极大值点数、极小值点数与过零点的数目相等或相差为1;2)在任意时刻,由包络线定义的极大值和极小值的平均值为0;第一个条件很明显,它和传统的窄带的稳定高斯过程的要求一样;第二个条件是必要的,以此保证瞬时频率不会出现不期望的波动而诱导不对称的波形;EMD分解实质是对一个时间序列信号进行平稳化的处理过程,它将信号分解为一系列频率由高到低排列的IMF分量和一个余量之和,IMF的获得是一个不断循环迭代的过程,最后筛选出满足条件的IMF;该过程不断的从大尺度信号中剔除均值包络线,直到满足停止条件,筛选结束;对一个信号S(t)进行EMD分解的具体步骤如下:(1)外部初始化,令血细胞图像为r0(m,n)=f(m,n),j=1(2)提取第j个IMF函数:a)内部初始化hj,0(m,n)=rj-1(m,n),k=1;b)利用形态学算法或8邻域像素,找出hj,k-1(m,n)中的局部极大值和局部极小值点集;c)使用合适的二维曲面插值方法,分别对极大值点和极小值点进行包络拟合,插值计算出hj,k-1(m,n)的上包络面umax,k-1(m,n)和下包络面umin,k-1(m,n);d)确定上下包络的均值:meank-1(m,n)=[umax,k-1(m,n)+umin,k-1(m,n)]/2;e)从图像中减去均值,得到:hj,k(m,n)=hj,k-1(m,n)-meank-1(m,n)f)计算终止条件,若满足IMF条件则有cj(m,n)=hj,k(m,n)否则令k=k+1,转到步骤b(3)求残余量rj(m,n)=rj-1(m,n)-cj(m,n)若rj中仍有不少于两个的极值点或者分解所得的IMF数目未达到要求,则将rj看做新的数据,并继续从步骤2进行分解,j=j+1(4)最后得到的二维EMD分解的结果是: f ( m , n ) = Σ j = 1 n c j ( m , n ) + r n ( m , n ) ]]>二维EMD中IMF筛选停止的SD计算公式如下: S D = Σ m = 1 M Σ n = 1 N [ | h j , k - 1 ( m , ...

【专利技术属性】
技术研发人员:李伟张秋实
申请(专利权)人:北京化工大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1