【技术实现步骤摘要】
一种基于改进密度峰的图像聚类方法及系统
[0001]本专利技术涉及图像数据处理
,具体涉及一种基于改进密度峰的图像聚类方法及系统
。
技术介绍
[0002]聚类分析方法是一种无监督学习方法,是机器学习和数据挖掘领域的重要研究方向之一
。
近年来,聚类分析方法已成功应用于图像处理领域中,例如图像分割
、
图像识别
、
图像去噪,而实现上述图像处理功能的关键点在于对图像数据进行聚类
。
[0003]现有技术中在对图像数据进行聚类时,聚类的结果通常依赖于初始聚类中心的选择,不同的初始聚类中心会产生不同的聚类结果
。
密度峰值聚类是一种基于密度的聚类方法,可以解决上述问题
。
[0004]但密度峰值聚类算法存在一些缺陷:
[0005]首先,在密度不均匀的数据集上,该算法的聚类效果较差;
[0006]其次,决策图中选择聚类中心需要人工参与,这增加了算法的主观性:
[0007]此外,逐点式的分配策略容易引起一个样本点被错误分配将可能导致大量的样本点错误分配的类似“多米诺骨牌效应”的连锁反应;
[0008]这些缺陷使得密度峰值聚类算法在实际生产中很难发挥出很好的作用
。
技术实现思路
[0009]本专利技术实现一种利用密度峰聚类算法进行图像处理的方法,并克服密度峰聚类算法在密度不均匀数据集上聚类效果较差
、
需要人工参与和分配策略易出错的问题
...
【技术保护点】
【技术特征摘要】
1.
一种基于改进密度峰的图像聚类方法,其特征在于,包括以下步骤:步骤
1、
获取待聚类的图像数据;步骤
2、
计算每个图像数据的局部密度和距离;步骤
3、
根据局部密度和距离,将图像分成若干个簇;步骤
4、
利用层次聚类合并簇,得到最终的图像聚类结果
。2.
根据权利要求1所述基于改进密度峰的图像聚类方法,其特征在于:所述步骤1中,假设所有图像的像素均为
G
×
M
,将第1张图像进行灰度化处理,形成大小为
G
×
M
的矩阵
X1=
(x1,x2,...,x
M
)
,对剩余的
N
‑1张图像做相同的处理,形成大小为
N
×
M
的图像样本集
X
=
{X1,X2,
…
,X
N
}
,
X1,X2,
…
,X
N
表示样本点
。3.
根据权利要求2所述基于改进密度峰的图像聚类方法,其特征在于:所述步骤2中,根据步骤1得到的图像样本集
X
,首先计算每个样本点的
k
近邻集,进而获得每个样本的
k
互近邻集和非
k
互近邻集,依据每个样本点
k
互近邻集和非
k
互近邻集来计算局部密度和距离
。4.
根据权利要求3所述基于改进密度峰的图像聚类方法,其特征在于:所述步骤2包括以下步骤:步骤
2.1
:对于大小为
N
×
M
的图像样本集,记作
X
=
{X1,X2,
…
,X
N
}
,计算任意两个样本点
X
i
和
X
j
间的欧式距离:步骤
2.2
:根据步骤
2.1
计算得到的欧式距离值,计算每个样本点的
k
近邻集,
k
近邻集的定义如下:
KNN(X
i
)
=
{x
j
∈X|d(X
i
,X
j
)≤d(X
i
,X
k
)}
其中,
X
k
是
X
i
第
k
近的样本点;步骤
2.3
:根据
k
近邻集来计算每个样本点的
k
互近邻集和非
k
互近邻集,样本点
X
i
的
k
互近邻集
MNN(X
i
)
定义为:
MNN(X
i
)
=
{X
j
|X
j
∈KNN(X
i
),X
i
∈KNN(X
j
)}
样本点
X
i
的非
k
互近邻集
NMNN(X
i
)
定义为:步骤
2.4
:根据
k
互近邻集和非
k
互近邻集来计算每个样本点的局部密度,样本点
X
i
的局部密度定义为:步骤
2.5
:根据
k
互近邻集和非
k...
【专利技术属性】
技术研发人员:黄帆,孙丽萍,郑子昂,任威,罗永龙,
申请(专利权)人:安徽师范大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。