一种基于改进密度峰的图像聚类方法及系统技术方案

技术编号:39576603 阅读:15 留言:0更新日期:2023-12-03 19:27
本发明专利技术揭示了利用密度峰聚类算法进行图像处理的方法和系统,包括如下步骤:

【技术实现步骤摘要】
一种基于改进密度峰的图像聚类方法及系统


[0001]本专利技术涉及图像数据处理
,具体涉及一种基于改进密度峰的图像聚类方法及系统


技术介绍

[0002]聚类分析方法是一种无监督学习方法,是机器学习和数据挖掘领域的重要研究方向之一

近年来,聚类分析方法已成功应用于图像处理领域中,例如图像分割

图像识别

图像去噪,而实现上述图像处理功能的关键点在于对图像数据进行聚类

[0003]现有技术中在对图像数据进行聚类时,聚类的结果通常依赖于初始聚类中心的选择,不同的初始聚类中心会产生不同的聚类结果

密度峰值聚类是一种基于密度的聚类方法,可以解决上述问题

[0004]但密度峰值聚类算法存在一些缺陷:
[0005]首先,在密度不均匀的数据集上,该算法的聚类效果较差;
[0006]其次,决策图中选择聚类中心需要人工参与,这增加了算法的主观性:
[0007]此外,逐点式的分配策略容易引起一个样本点被错误分配将可能导致大量的样本点错误分配的类似“多米诺骨牌效应”的连锁反应;
[0008]这些缺陷使得密度峰值聚类算法在实际生产中很难发挥出很好的作用


技术实现思路

[0009]本专利技术实现一种利用密度峰聚类算法进行图像处理的方法,并克服密度峰聚类算法在密度不均匀数据集上聚类效果较差

需要人工参与和分配策略易出错的问题

[0010]为了实现上述目的,本专利技术采用的技术方案为:一种基于改进密度峰的图像聚类方法,包括以下步骤:
[0011]步骤
1、
获取待聚类的图像数据;
[0012]步骤
2、
计算每个图像数据的局部密度和距离;
[0013]步骤
3、
根据局部密度和距离,将图像分成若干个簇;
[0014]步骤
4、
利用层次聚类合并簇,得到最终的图像聚类结果

[0015]所述步骤1中,假设所有图像的像素均为
G
×
M
,将第1张图像进行灰度化处理,形成大小为
G
×
M
的矩阵
X1=
(x1,x2,...,x
M
)
,对剩余的
N
‑1张图像做相同的处理,形成大小为
N
×
M
的图像样本集
X

{X1,X2,

,X
N
}

X1,X2,

,X
N
表示样本点

[0016]所述步骤2中,根据步骤1得到的图像样本集
X
,首先计算每个样本点的
k
近邻集,进而获得每个样本的
k
互近邻集和非
k
互近邻集,依据每个样本点
k
互近邻集和非
k
互近邻集来计算局部密度和距离

[0017]所述步骤2包括以下步骤:
[0018]步骤
2.1
:对于大小为
N
×
M
的图像样本集,记作
X

{X1,X2,

,X
N
}
,计算任意两个样本点
X
i

X
j
间的欧式距离:
[0019][0020]步骤
2.2
:根据步骤
2.1
计算得到的欧式距离值,计算每个样本点的
k
近邻集,
k
近邻集的定义如下:
[0021]KNN(X
i
)

{x
j
∈X|d(X
i
,X
j
)≤d(X
i
,X
k
)}
[0022]其中,
X
k

X
i

k
近的样本点;
[0023]步骤
2.3
:根据
k
近邻集来计算每个样本点的
k
互近邻集和非
k
互近邻集,样本点
X
i

k
互近邻集
MNN(X
i
)
定义为:
[0024]MNN(X
i
)

{X
j
|X
j
∈KNN(X
i
),X
i
∈KNN(X
j
)}
[0025]样本点
X
i
的非
k
互近邻集
NMNN(X
i
)
定义为:
[0026][0027]步骤
2.4
:根据
k
互近邻集和非
k
互近邻集来计算每个样本点的局部密度,样本点
X
i
的局部密度定义为:
[0028][0029]步骤
2.5
:根据
k
互近邻集和非
k
互近邻集来计算每个样本点的距离,样本点
X
i
的距离定义为:
[0030][0031]其中,
[0032][0033]所述步骤3中,根据步骤2得到的局部密度和距离计算决策值,将决策值不为零的样本点定义聚类中心,再对剩余样本点进行分配

[0034]所述步骤3包括以下步骤:
[0035]步骤
3.1
:根据步骤1得到的局部密度和距离计算每个样本点的决策值,样本点
X
i
的决策值定义为:
[0036]γ
i

ρ
i
δ
i
[0037]步骤
3.2
:将决策值
γ
i
不为零的样本点记为聚类中心,假设聚类中心的个数为
m
,其中,
m>c

c
是样本的类别数,聚类中心记作
CL

{cl1,
cl2,


cl
m
}
[0038]步骤
3.3
:根据步骤
3.2
得到的聚类中心
CL

{cl1,
cl2,


cl
m
}
,按照原始密度本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于改进密度峰的图像聚类方法,其特征在于,包括以下步骤:步骤
1、
获取待聚类的图像数据;步骤
2、
计算每个图像数据的局部密度和距离;步骤
3、
根据局部密度和距离,将图像分成若干个簇;步骤
4、
利用层次聚类合并簇,得到最终的图像聚类结果
。2.
根据权利要求1所述基于改进密度峰的图像聚类方法,其特征在于:所述步骤1中,假设所有图像的像素均为
G
×
M
,将第1张图像进行灰度化处理,形成大小为
G
×
M
的矩阵
X1=
(x1,x2,...,x
M
)
,对剩余的
N
‑1张图像做相同的处理,形成大小为
N
×
M
的图像样本集
X

{X1,X2,

,X
N
}

X1,X2,

,X
N
表示样本点
。3.
根据权利要求2所述基于改进密度峰的图像聚类方法,其特征在于:所述步骤2中,根据步骤1得到的图像样本集
X
,首先计算每个样本点的
k
近邻集,进而获得每个样本的
k
互近邻集和非
k
互近邻集,依据每个样本点
k
互近邻集和非
k
互近邻集来计算局部密度和距离
。4.
根据权利要求3所述基于改进密度峰的图像聚类方法,其特征在于:所述步骤2包括以下步骤:步骤
2.1
:对于大小为
N
×
M
的图像样本集,记作
X

{X1,X2,

,X
N
}
,计算任意两个样本点
X
i

X
j
间的欧式距离:步骤
2.2
:根据步骤
2.1
计算得到的欧式距离值,计算每个样本点的
k
近邻集,
k
近邻集的定义如下:
KNN(X
i
)

{x
j
∈X|d(X
i
,X
j
)≤d(X
i
,X
k
)}
其中,
X
k

X
i

k
近的样本点;步骤
2.3
:根据
k
近邻集来计算每个样本点的
k
互近邻集和非
k
互近邻集,样本点
X
i

k
互近邻集
MNN(X
i
)
定义为:
MNN(X
i
)

{X
j
|X
j
∈KNN(X
i
),X
i
∈KNN(X
j
)}
样本点
X
i
的非
k
互近邻集
NMNN(X
i
)
定义为:步骤
2.4
:根据
k
互近邻集和非
k
互近邻集来计算每个样本点的局部密度,样本点
X
i
的局部密度定义为:步骤
2.5
:根据
k
互近邻集和非
k...

【专利技术属性】
技术研发人员:黄帆孙丽萍郑子昂任威罗永龙
申请(专利权)人:安徽师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1