【技术实现步骤摘要】
一种基于层次聚类的SOM算法改进方法
[0001]本专利技术涉及SOM算法
,尤其涉及一种基于层次聚类的SOM算法改进方法。
技术介绍
[0002]聚类分析是将数据分组到子集的过程,集群中的每个项目与同一集群中的项目的相似程度要高于集群外部的其他项目。通常,距离度量如欧氏距离、曼哈顿距离被用来评估数据点之间的差异。聚类分析是机器学习和数据挖掘中最有用的任务之一,已被广泛应用于市场营销、银行、医药和电信等领域。它被广泛应用于降维、信息提取、密度近似和数据压缩等领域。
[0003]SOM方法的性能对随机分配的初始权重敏感。而且在大规模应用中,随机分配的初始值使它的速度非常慢。
技术实现思路
[0004]本专利技术提供了一种基于层次聚类的SOM算法改进方法,以解决现有技术中存在的聚类分析初始值敏感、收敛速度慢的问题,集群中的每个项目与同一集群中的项目的相似程度要高于集群外部的其他项目。通常,距离度量如欧氏距离、曼哈顿距离被用来评估数据点之间的差异。聚类分析是机器学习和数据挖掘中最有用的任务之一,已被广泛应用于市场营销、银行、医药和电信等领域。它被广泛应用于降维、信息提取、密度近似和数据压缩等领域。SOM方法的性能对随机分配的初始权重敏感。而且在大规模应用中,随机分配的初始值使它的速度非常慢。
[0005]为了达到上述目的,本专利技术提供如下技术方案:
[0006]一种基于层次聚类的SOM算法改进方法,包括:
[0007]S101:基于层次聚类法,确定SOM算法的初始权重 ...
【技术保护点】
【技术特征摘要】
1.一种基于层次聚类的SOM算法改进方法,其特征在于,包括:S101:基于层次聚类法,确定SOM算法的初始权重值;S102:基于初始权重值将SOM算法神经元数据进行初始化;S103:基于初始化后的SOM算法神经元数据,通过SOM算法获取对应的聚类方案。2.根据权利要求1所述的一种基于层次聚类的SOM算法改进方法,其特征在于,所述S101步骤包括:S1011:对数据进行初始化处理,获取对应的簇数q;S1012:基于重复中心点集合D的计算过程获取q=N
×
M;S1013:通过公式确定N
×
M个聚类中心,即D={{x1},{x2},...,{x
N
×
M
}},其中,N
×
M个聚类中心为层次聚类的储存结果,r表示第r个簇,1≤r≤N
×
M,k表示第r个簇的样本点的个数。3.根据权利要求2所述的一种基于层次聚类的SOM算法改进方法,其特征在于,所述S1013步骤之后包括:查询中心点集合D中最边缘的中心点L,从与L最相似到最不相似以及欧氏距离由近到远的方式将所有簇中心的D进行排序,其中D不变,将排序结果放入神经元集合θ中;将排序中心的属性值按顺序进行初始化,通过初始化形成映射神经元的权重值。4.根据权利要求1所述的一种基于层次聚类的SOM算法改进方法,其特征在于,所述S102步骤包括:S1021:基于SOM算法,将对应的权值进行初始化处理;S1022:基于欧氏距离,计算输出神经元和输入向量之间的距离,获取获胜神经元,所述获胜神经元为距离最短的输出神经元;S1023:通过更新神经元权重公式和高斯函数公式对优胜邻域内神经元调整权值大小,其中,学习率随迭代次数增加而减小,学习邻域缩小;S1024:查看学习率是否小于预设阈值,若小于预设阀值则结束检查。5.根据权利要求4所述的一种基于层次聚类的SOM算法改进方法,其特征在于,所述S1021步骤包括:通过顺序赋值将竞争层的神经元权重赋值为层次聚类中心点,对竞争层的神经元权重进行归一化处理,通过邻域函数公式和高斯函数公式建立优胜领域,通过优胜领域初始化学习率;所述邻域函数公式如下:h(t)=αGF所述高斯函数公式如下:其中,h(t)表示邻域函数,α表示学习率,GF表示高斯函数,表示邻域宽度参数,wui表示获胜神经元,cui表示输入神经元。6.根据权利要求4所述的一种基于层次聚类的SOM算法改进方法,其特征...
【专利技术属性】
技术研发人员:杨永全,管佩琪,魏志强,
申请(专利权)人:青岛海洋科学与技术国家实验室发展中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。