一种基于选取合适聚类数目的聚类算法的数字图像处理方法技术

技术编号:15691995 阅读:154 留言:0更新日期:2017-06-24 05:39
本发明专利技术涉及一种基于选取合适聚类数目的聚类算法的数字图像处理方法,具体步骤包括:(1)输入灰度图像;(2)设置需要迭代聚类数K的数目;(3)搜索初始聚类中心:使用分位数的概念寻找初始聚类中心;(4)按照标准的k‑means聚类步骤进行图像分割,输出的分割图像;(5)采用最优化准则选出最优分割结果。本发明专利技术提出了一个在分割图像中可以决定聚类数目的最优化准则。它采用了类内差异和类间差异的概念以较少的聚类数目可以获得最佳的分割结果。本发明专利技术具有足够的效率和稳定性,比传统的k‑means算法在运行时间上更有优势。

A digital image processing method based on the clustering algorithm to select the proper number of clusters

The invention relates to a clustering algorithm to select the appropriate number of clusters of the digital image processing method based on the specific steps include: (1) input gray image; (2) the number of iterations needed set the number of clusters K; (3) to search the initial clustering center: the use of the concept of quantile to find the initial cluster center; (4) image segmentation according to the K means standard clustering step, image segmentation output; (5) by using the optimization criterion to select the optimal segmentation results. The present invention proposes an optimization criterion for determining the number of clusters in a segmented image. It adopts the concepts of intra class difference and inter class difference, which can obtain the best segmentation result with less number of clusters. The invention has the advantages of efficiency and stability than k enough, the traditional means algorithm has more advantages in operation time.

【技术实现步骤摘要】
一种基于选取合适聚类数目的聚类算法的数字图像处理方法
本专利技术涉及一种基于选取合适聚类数目的聚类算法的数字图像处理方法,属于聚类算法分割

技术介绍
在图像处理领域中,图像分割对于图像的分类和处理是非常重要的。因此,我们需要将这些图像划分成不同的区域,并提取所感兴趣的对象。在不同的图像分割技术中,聚类是重要的方法之一,并且在灰度图像的图像分割上得到广泛的应用。目前有很多聚类算法:k-means聚类;Fuzzyc-means聚类;山峰聚类和ISODATA方法等。其中最常用的算法是k-means聚类算法。K-means算法是一种无监督聚类算法,它具有直观、快速和容易实现等特性。尽管这种算法是非常受欢迎的,它仍然具有一些缺陷。其中,最主要的是k-means聚类需要提前知道聚类数,这将降低它的鲁棒性和稳定性。图像分割就是将图像中有意义的特征或区域提取出来的一个过程。特别是在医疗领域,医学研究者需要从背景中提取感兴趣的区域。因此,我们需要将这些图像划分成不同的区域,并提取所感兴趣的对象。同时,在各区域内的像素点应具有较高的相似性,区域之间的像素点应具有较高的差异性。图像分割的应用非常广泛,它几乎出现在有关于图像处理的所有领域,是图像处理中的一个基础也是重要的步骤。在不同的图像分割技术中,聚类是重要的方法之一,并且在灰度图像的图像分割上得到广泛的应用。聚类是分组的一组物体进入相似地特征类的处理过程。它已在许多领域被广泛使用,包括在统计、机器学习、模式识别、数据挖掘和图像处理等。在数字图像处理中,分割在图像描述和分类中是必不可少的。该技术通常用于许多消费电子产品(即常规的数字图像),或在一个特定的应用领域,如医学数字图像。算法通常基于相似性和特殊性,其可分为不同的类别,如阈值、模板匹配、区域生长、边缘检测、并群集。聚类算法已经被应用在各种领域,如工程、计算机和数学数字图像分割技术。最近,聚类算法的应用已被进一步施加到医疗领域中,特别是在生物医学图像分析,其特征在于图像是由医学成像设备产生的。以前的研究证明,聚类算法能够分割和确定在医学图像中感兴趣的特定区域。在生物医学图像分割任务中,聚类算法通常被认为是适合从已知的解剖信息中分割出感兴趣的结构。基于最小化形式的目标函数的聚类方法中,最广泛使用的就是K-means聚类。K-means算法也被称为K均值算法,是一种得到最广泛使用的聚类算法。它将各个聚类子集内的所有数据样本的均值作为该聚类的代表点,算法的主要思想是通过迭代过程把数据集划分为不同的类别,使得评价聚类性能的准则函数达到最优,从而使生成的每个聚类内紧凑,并且类间是独立的。这一算法不适合处理离散型属性,但是对于连续型具有较好的聚类效果,用于图像分割具有直观、快速、易于实现的特点。尽管这种算法是非常受欢迎的,它仍然具有一些缺陷。首先,k-means聚类过程容易陷入局部极小。其次,它不适合用于处理具有离散属性的数据。另外,它还有可能忽略一些小的聚类。值得注意的是k-means聚类需要提前知道聚类数,这将降低它的鲁棒性和稳定性。
技术实现思路
专利技术概述针对现有技术的不足,本专利技术提供了一种基于选取合适聚类数目的聚类算法的数字图像处理方法;本专利技术介绍了一种最优化准则来解决聚类数目对最终分割图像的影响。我们基于类内像素差异和类间像素差异来定义一个公式。通过该标准,可以用尽量少的聚类数目得到较好的分割结果。通过客观的评估测试量度NUandF(I),我们验证了该标准性能的稳定性。此外,本专利技术还改进了传统k-means算法中确定初始聚类中心的方法,利用分位数策略代替了随机选择的方法。使用分位数来确定初始聚类中心可以使分割图像更稳定,同时可以节省运行时间。专利技术详述术语解释1、分位数,分位数即分位点,拿四分位数为例,即统计学中,把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数。在本专利技术中,设聚类数位K,即把要分割的图像的所有像素由小到大排列分成K等份,求出每等份的中心值作为初始聚类中心。2、K-means聚类,一种在数据集中寻找数据聚类的算法,让差异性度量的成本函数(目标函数)达到最小。本专利技术的技术方案如下:一种基于选取合适聚类数目的聚类算法的数字图像处理方法,具体步骤包括:(1)输入灰度图像;(2)设置需要迭代聚类数K的数目;K的初始值为2;众所周知,在传统的k-means算法中迭代聚类数K是未知的。实际上,对于大多数的数字图像和显微图像,把迭代聚类数K设置为2,这是不足以恰当的进行图像分割的。也有一些实验者根据自己的经验来选择k的值,例如,头部医学图像包括的区域为软组织,骨头,脂肪和背景区域,所以他们把k的值设定为4。为了确定k的最优值,本专利技术找到一种测量标准,自动地确定最优的k值。在进行聚类之前,设置k从2至16循环,以代替一个固定假设值。提供了更直观的趋势以帮助我们分析。(3)搜索初始聚类中心:使用分位数的概念寻找初始聚类中心;具体步骤包括:A、将步骤(1)输入的灰度图像中的所有像素按照灰度值进行升序排列,得到向量,即:所述灰度图像的大小m*m为一个矩阵,将该矩阵转换成1*m2的向量,再将1*m2的向量中的所有元素按从小到大的升序排列,得到所述向量;所述向量的分位数Pi通过式(Ⅰ)计算,i=1,2,...,K:B、通过步骤A计算得到K个分位数,包括P1,P2,...,Pi,P1,P2,...,Pi分别对应着步骤A所述向量,P1,P2,...,Pi即为步骤(1)输入的灰度图像的初始聚类中心;例如,K=4,计算得到四个分位点:P1,P2,P3,P4,P1,P2,P3,P4四个值的结果为:12.5,37.5,62.5,87.5。这些值对应着向量的初始聚类中心。根据传统K-均值聚类算法,需要从图像中随机选择k个点作为初始聚类中心。然后该算法根据最小欧氏距离将数据点分配到各个聚类中。通过一定次数的迭代,它最大限度地减少从每个对象到聚类中心的距离之和,直至这些质心不会再发生变化。但是,这种传统的方法效率低,运行时间比较久。而本专利技术寻找初始聚类中心是非常高效的,它相比随机寻找的方法节省了运行时间。在接下来的说明中,会进行对比测试来验证它的效率。(4)按照标准的k-means聚类步骤进行图像分割,输出的分割图像;(5)采用最优化准则选出最优分割结果,具体步骤包括:①通过式(Ⅱ)求取输出的分割图像的类内差异值Sin,类内差异值Sin是指在一个聚类中所有像素的像素值之间的标准偏差:式(Ⅱ)中,C1,C2,C3,......,Ci是指步骤(3)求取的初始聚类中心P1,P2,...,Pi对应的聚类,n是当前分割图像中像素的数量,x代表在聚类Ci中每个像素的像素值,是第i个类中所有像素的像素值的平均值;②通过式(Ⅲ)求取输出的分割图像的类间差异值Sout,类间差异值Sout是指i个初始聚类中心的像素值之间的标准偏差,其值越大越好。式(Ⅲ)中,K是指聚类数,Pi是指第i个初始聚类中心(的像素值),是所有初始聚类中心的平均像素值;③通过式(Ⅳ)求取最优化标准为G,如下所示:④根据以上步骤依次求取K为2、3、4、5、6、7、8、9、10、11、12、13、14、15、16时对应的最优化标准为G,根据求取的对应的最优化标本文档来自技高网
...
一种基于选取合适聚类数目的聚类算法的数字图像处理方法

【技术保护点】
一种基于选取合适聚类数目的聚类算法的数字图像处理方法,其特征在于,具体步骤包括:(1)输入灰度图像;(2)设置需要迭代聚类数K的数目;K的初始值为2;(3)搜索初始聚类中心:使用分位数的概念寻找初始聚类中心;具体步骤包括:A、将步骤(1)输入的灰度图像中的所有像素按照灰度值进行升序排列,得到向量,即:所述灰度图像的大小m*m为一个矩阵,将该矩阵转换成1*m

【技术特征摘要】
1.一种基于选取合适聚类数目的聚类算法的数字图像处理方法,其特征在于,具体步骤包括:(1)输入灰度图像;(2)设置需要迭代聚类数K的数目;K的初始值为2;(3)搜索初始聚类中心:使用分位数的概念寻找初始聚类中心;具体步骤包括:A、将步骤(1)输入的灰度图像中的所有像素按照灰度值进行升序排列,得到向量,即:所述灰度图像的大小m*m为一个矩阵,将该矩阵转换成1*m2的向量,再将1*m2的向量中的所有元素按从小到大的升序排列,得到所述向量;所述向量的分位数Pi通过式(Ⅰ)计算,i=1,2,...,K:B、通过步骤A计算得到K个分位数,包括P1,P2,...,Pi,P1,P2,...,Pi分别对应着步骤A所述向量,P1,P2,...,Pi即为步骤(1)输入的灰度图像的初始聚类中心;(4)按照标准的k-means聚类步骤进行图像分割,输出的分割图像;(5)采用最优化准则选出最优分割结果,具体步骤包括:①通过式(Ⅱ)求取输出的分割图像的类内差异值Sin,类内差异值Sin是指在一个聚类中所有像素的像素值之间的标准偏差:式(Ⅱ)中,C1,C2,C3,......,Ci是指步骤(3)求取的初始聚类中心P1,P2,...,Pi对应的聚类,n是当前分割图像中像素的数量,x代表在聚类Ci中每个像素的像素值,是第i个类中所有像素的像素值的平均值;②通过式(Ⅲ)...

【专利技术属性】
技术研发人员:董祥军裴佳伦陈维洋
申请(专利权)人:齐鲁工业大学
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1