本发明专利技术涉及一种聚类方法,尤其是一种基于量子粒子群优化改进的模糊C-均值聚类方法,属于数据挖掘和人工智能的技术领域。本发明专利技术在传统的模糊C-均值聚类算法中,首先利用新距离标准取代Euclidean标准,以提高传统聚类算法下的模糊精确度,同时通过AFCM算法单次快速分类替代随机分配初始聚类中心,来降低聚类算法对初始聚类中心的敏感度,最后在聚类过程中引入基于距离改进的QPSO(AQPSO)并行优化思想使其聚类算法具有较强的全局搜索能力、更高的收敛精度,保证收敛速度也明显改善了聚类效果。
【技术实现步骤摘要】
本专利技术涉及一种聚类方法,尤其是一种基于量子粒子群优化改进的模糊C-均值聚类方法,属于数据挖掘和人工智能的
技术介绍
传统的聚类方法属于硬划分方法,即所研究的对象“非此即彼”,而实际由于科学 技术、经济管理中的分类界限并不是很分明。为了使聚类结果更加符合实际要求,由Durm提出的模糊 C-均值(FCM)算法“Dunn JC. A fuzzy relative of the ISODATA process andits use in detecting compact well separated cluster · JCybemet,1974,v3:32 57,,是一种将硬C一均值聚类算法和模糊数学理论结合的经典聚类算法,它虽以某个隶属度隶属于某个类,使得类内误差平方和目标函数最小。但相关研究“J.C. Bezdek.Pattern Recognition with Fuzzy Objective Function Algorithm. Plenum Press, NewYork, 1981:10_16,,、“S. Ramathilagam,Yueh-Min Huang. Extended Gaussian kernelversion of fuzzy c-means in the problem of data analyzing. Expert Systems withApplications, 2011,38(4) : 3793-3805”表明此类算法易受聚类数目、初始点影响且极易陷入局部最小。为了克服上述缺点,近年来很多文献“SudhakarG. Effective image clusteringwith differential evolution technique. International Journal of Computer andCommunication Technology, 2010,2(1) : 11-19,,、“Thomas A. Runkler and ChristinaKatz,Fuzzy Clustering by Particle Swarm Optimization.IEEE InternationalConference on Fuzzy Systems,2006,601-608”结合各种常用群智能进化算法对模糊C-均值算法进行改进,并取得了不错的效果。粒子群(PSO)算法“Kennedy Jj Eberhart R C. Particle swarmoptimization. Proceeding of IEEE International Conference on NeuralNetworks, 1995,1942 948”是源于Eberhart博士和Kennedy博士对自然界中生物捕食现象的模拟而提出的一种新型的群体智能算法,是一种有效的全局寻优算法。PSO算法计算简单、易于实现,然而,Frans Van de Bergh “Bergh F V d. A new locally convergentparticle swarm optimizers. IEEE International Conference on systems, Manand Cybernetics, 2002”引入Solis和Wets关于随机性算法的收敛准则证明该算法在进化后期微粒的飞行速度缺乏有效的控制与约束,很容易飞越最优解,使得算法的收敛速度慢,精度差。针对这些缺点,Sun等人将量子力学的相关概念引入粒子进化过程,提出一种新的基于全局水平的参数控制方法的PSO算法模型,即量子行为粒子群优化(QPSO)uSun Jj Xu W B. A global search strategy of Quantum-behaved Particle WarmOptimization//Proceedings of IEEE Conference on Cybernetics and IntelligentSystems, 2004:111-116. ” 算法,并在许多领域“Sun,J.,Xuj W. -B.,Fengj B. : AdaptiveParameter Control for Quantum-behaved Particle Swarm Optimization on IndividualLevel. Proc. 2005IEEE International Conference on Systems, Man and Cybernetics.Piscataway, NJ (2005) 3049-3054”取得了优于PSO算法的效果。QPSO算法是利用分布式随机搜索特性提高全局优化能力,但在收敛速度上有所逊色。一个聚类分析过程的质量取决于度量标准的选择,许多经典的算法“K. S. Chuang et al, Fuzzy c-means clusteringwith spatial information for image segmentation, Comput. Med. Imaging Graph. (30)(2006) 9 - 15. ”、“C. H. Cheng, L. Y. Wei, Data spread-based entropy clustering methodusing adaptive learning, Exp. Syst. Appl. (36) (2009) 12357 - 12361. ” 中都是选择Euclidean标准,基于这种度量标准的聚类算法一般只能发现具有类似大小和密度的图形或球状聚类,得到的聚类的精确度也不高。许多学者开始致力于一种新的距离度量标准“WuKuo-lung, Yang Miin-shen. Alternative c-means clustering algorithms. PatternRecognition, 2002, 35:2267-2278”的研究,这种度量比Euclidean标准更具有健壮性,能处理具有不同大小和密度的图形或有噪声存在的环境数据,缩小聚类误差。 因此如何能够较好地克服模糊C-均值算法的缺点,在保证收敛速度的同时增强算法的全局搜索能力,提高聚类精度非常重要。
技术实现思路
本专利技术的目的是克服现有技术中存在的不足,提供一种基于量子粒子群优化改进的模糊C-均值聚类方法,其操作方便,在保证收敛速度的同时能提高聚类的精度。按照本专利技术提供的技术方案,一种基于量子粒子群优化改进的模糊C-均值聚类方法,其特征是,所述模糊C-均值聚类方法包括如下步骤步骤一、聚类参数设定给定所需的聚类类别C、粒子群规模N、最大迭代次数MAXTER,当前迭代次数t,收缩扩张系数α ;步骤二、种群的初始化定义距离标准d(xk, Vi) = ι-exp (_β | Ixk-ViI |2)(I)其中,#=-j|)1,且!=丄(Σχ*.) Ln μ J w * 1 ;利用单次AFCM算法进行快速分类,结合公式(I)得到目标函数J AF('\ ,(χ,ικν) =—胃(一到 1 —v* f)] >(2)本文档来自技高网...
【技术保护点】
一种基于量子粒子群优化改进的模糊C?均值聚类方法,其特征是,所述模糊C?均值聚类方法包括如下步骤:步骤一、聚类参数设定:给定所需的聚类类别c、粒子群规模N、最大迭代次数MAXTER,当前迭代次数t,收缩扩张系数α;步骤二、种群的初始化:定义距离标准d(xk,vi)=1?exp(?β||xk?vi||2)????????????????????????????(1)其中,β=[1n(Σk=1n||xk-x‾||)]-1,且x‾=1n(Σk=1nxk);利用单次AFCM算法进行快速分类,结合公式(1)得到目标函数JAFCM(X,U,V)=Σi=1cΣk=1nUikm[1-exp(-β||xk-vi||2)]---(2)其中,X={x1,x2,…xk,…xn}是给定的数据集,n为数据集中样本的个数,xk(xk1,xk2,…,xkd)表示具有d个属性的数据对象,聚类个数为c,聚类中心集合V={v1,v2,…,vc},其中vi(vi1,vi2,…,vid)表示第i个聚类中心,Uik表示第k个样本属于第i类的模糊隶属度,对于任意k,i和模糊加权指数m,使公式(2)达到最小值的必要条件为:Uik=1Σj=1c{[1-exp(-β||xk-vi||2)]/[1-exp(-β||xk-vj||2)]}1/m-1,1≤i≤c,1≤k≤n---(3)中心向量为:vi=Σk=1nUikm(exp(-β||xk-vi||2))xkΣk=1nUikm(exp(-β||xk-vi||2))---(4)利用公式(4)得到的聚类中心向量作为种群中的一个初始粒子,并重复进行N次,生成初始种群;步骤三、粒子的全局搜索:在一个d维的目标搜索空间中,QPSO算法由N个代表潜在问题解的粒子组成群体X(t)={X1(t),X2(t),…,XN(t)},在t时刻,第i个粒子位置为粒子没有速度向量,个体最优位置Pbest表示为pi(t)=(pi1(t),pi2(t),…,pid(t)),全局最优位置Gbest表示为G(t)=(G1(t),G2(t),…,Gj(t)…,Gd(t)),且G(t)=pg(t),其中g为粒子群体处于全局最优位置的下标,g∈{1,2,…,N};定义所有粒子个体的最优平均位置C(t),即C(t)=(C1(t),C2(t),...Cj(t),...Cd(t))=1NΣi=1Npi(t)=(1NΣi=1Npi1(t),1NΣi=1Npi2(t),...,1NΣi=1Npij(t),...,1NΣi=1Npid(t))---(6)粒子的个体最优位置Pbest由下述公式确定为pi(t)=Xi(t)f[Xi(t)]<f[pi(t-1)]pi(t-1)f[Xi(t)]≥f[pi(t-1)]---(7)其中,f[X]=JAFCM(X,U,V);整个粒子群的全局最优位置Gbest由下述公式确定为g=argMin1<i≤N{f[pi(t)]}---(8)G(t)=Pg(t)????????????????????????????????????????????????????(9)更新粒子时,首先得到粒子的个体最优位置Pbest及整个粒子群的全局最优位置Gbest,其次利用公式(2)更新所有粒子个体的适应度值,并将每一个粒子的当前个体位置适应度值与全局最优位置的适应度值比较;若每一个粒子的当前个体位置适应度值优于全局最优位置的适应度值,更新公式(9)中的G(t);令则粒子的进化方程为:Xi,j(t+1)=Pi,j(t)±α*|Cj(t)-Xi,j(t)|*ln(1ui,j(t)),ui,j(t)~U(0,1)---(11)其中,ui,j(t)为符合正态分布的辅助参数;Gj(t)表示粒子群体的全局最优位置;步骤四、输出聚类结果:重复上述粒子更新操作,如果当前的迭代次数达到预先设定的最大次数MAXTER,则停止迭代输出最佳聚类效果。FDA00001979308900016.jpg,FDA00001979308900025.jpg,FDA00001979308900027.jpg...
【技术特征摘要】
【专利技术属性】
技术研发人员:毛力,李引,
申请(专利权)人:江南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。