System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及一种基于改进聚类算法的建筑工程指标划分方法及系统,属于电数字数据处理。
技术介绍
1、建筑工程指标的划分问题是建筑领域的常见问题,涉及相关工程规范的制定,部分指标由于其抽象性或复杂性,往往存在指标区间划分的困难。该类问题的数据形式一般为:对于一个给定的多维度数据源,针对其中的指标维进行区间划分,其他维度的数据用于辅助指标的划分。该类问题的目的在于,对于一个衡量建筑或建筑群在某个方面的特性的指标,分析其取值对于该指标所衡量的特性的影响机制,以便对该指标划定合格阈值、优良标准等,最终提供给政府决策以制定相关法规。需要补充说明的是,该类型的问题会出现于但不局限于上述建筑工程领域,其他领域也有可能会面临此类问题。
2、针对上述对某个指标进行区间划分、给定合格阈值、优良标准这样的问题,此前常用的方法大致可以分为三类:
3、第一类方法为专家决策法。此类方法主要依靠专家的经验作出判断,通过征询多个专家的意见作出综合性的决策。由于多数指标的划分存在量化分析的困难,而该种方法简单易行,因此在重要性较低的指标上被大量采用。但专家决策法完全依赖于主经验决断,缺乏客观指导,存在显著弊端;
4、第二类方法为回归分析法。此类方法通过建立指标维度与辅助维度的函数关系,对指标的区间划分作出指导。该种方法引入了一定的量化计算,但存在较多局限性。首先回归方法一般采取线性回归,可能会存在较大误差;其次完成回归后无法直接对指标进行区间划分,仍然需要一定主观判断的介入。因此,回归分析法虽然相比专家决策发具有更高的客观性,
5、第三类方法为自然断点法。该种方法能够通过完全客观运算对指标进行划分,但仅限于一维数据,具有较低的问题适应能力。
6、综上所述,目前对于建筑工程指标划分问题,即多维数据源下的单一维度区间划分问题,并没有完全针对性的技术路径。本研究提出使用一种改进的聚类算法解决此类问题。
7、一般意义上的聚类是一种无监督的机器学习技术,其目的在于将研究对象的全集划分为内部样本点具有高度相似性的多个子集。主流的聚类算法包括但不限于k-means聚类算法、均值偏移聚类算法、dbscan聚类算法、层次聚类法等,其共同特点是利用数据在多维空间中的分布情况来划分类别,其分类结果均呈现为组团形式,无法满足以下特殊需求:从某一个指定的维度来看,该维度上每一类所对应的恰好收纳所有样本点的区间彼此分离不产生交叠。因此,目前没有用聚类算法解决多维数据源下指标划分问题的先例。本专利技术通过对常规聚类算法基本原理的改进,使得聚类思想能够应用于建筑工程指标的划分问题中,为建筑领域或其他具有类似需求的领域中的指标划分问题提供更为客观准确的方法。
技术实现思路
1、为了解决上述现有技术中存在的至少一个技术问题,本专利技术提供了一种基于改进聚类算法的建筑工程指标划分方法,所述方法包括以下步骤:
2、步骤1:确定待划分建筑工程指标及其划分参考特征,获取调研数据并汇总为多维特征矩阵;
3、步骤2:对所述多维特征矩阵进行初步聚类分析,确定待划分建筑工程指标的区间划分数;
4、步骤3:基于所述区间划分数,对所述多维特征矩阵的特征维进行变换,实现多维数据以待划分指标维为核心、以划分参考特征维为辅助的改进聚类;
5、步骤4:根据改进聚类方法所得结果,确定待划分指标的区间划分结果。
6、进一步地,步骤1:确定待划分建筑工程指标及其划分参考特征,获取调研数据并汇总为多维特征矩阵,包括:
7、对于某一需要按区间制定规范的建筑工程指标,确定一个或多个划分参考指标,用以辅助建筑工程指标的区间划分。广泛调研建成的建筑工程项目,汇总调研数据为一多维特征矩阵,清洗数据并对每一个特征维作无偏归一化处理。
8、进一步地,步骤2:对所述多维特征矩阵进行初步聚类分析,确定待划分建筑工程指标的区间划分数,包括:
9、对所述多维特征矩阵在不同分类数下多次运行适于问题的聚类算法。对于每一个分类数,取所有运行结果的轮廓系数的最高值作为该分类数对应的轮廓系数。在符合问题要求的分类数范围内,选取对应轮廓系数最高的分类数作为待划分指标的区间划分数。
10、进一步地,步骤3:基于所述区间划分数,对所述多维特征矩阵的特征维进行变换,实现多维数据以待划分指标维为核心、以划分参考特征维为辅助的改进聚类,包括:
11、步骤3-1:实现区间分离判断功能。该功能用于判断给定的聚类结果是否满足各类在待划分维度上所对应的收纳区间相互分离(以下简称为区间型聚类);
12、步骤3-2:对所述多维特征矩阵的特征维进行变换,包括对待划分指标维的线性变换、对划分参考特征维的自由变换。其中,对待划分指标维的线性变换是必要的,用于提高待划分指标维对于聚类的影响程度,其变换参数通过二分搜索客观确定;对划分参考特征维的自由变换是非必要的,自由变换包括线性变换和非线性变换,线性变换用于改变不同划分参考特征维对聚类的相对影响程度,非线性变换用于改变划分参考特征维的内部数据分布,其变换参数由决策者基于对问题的理解主观确定。若要施加对划分参考特征维的自由变换,应将其置于对待划分指标维的线性变换步骤前;
13、步骤3-3:基于变换后的多维特征矩阵,完成以待划分指标维为核心、以划分参考特征维为辅助的改进聚类。
14、进一步地,步骤3-1:实现区间分离判断功能,包括:
15、初始化每一类在指定维度上对应的收纳区间,其中区间右端点初始化为0,左端点初始化为一超过数据上限的值;
16、遍历所述样本数据,根据每一个样本点所属类别修改相应类所对应的收纳区间;
17、若样本点在指定维度上的数值大于所属类别收纳区间的右端点,则将右端点更新为样本点值;若样本点在指定维度上的数值小于所属类别收纳区间的左端点,则将左端点更新为样本点值;
18、判断各收纳区间是否存在交叠,若存在则确定聚类结果不满足区间型聚类,若不存在则确定聚类结果满足区间型聚类。其中,各收纳区间是否存在交叠的判断方法为:(1)对于任意两个区间,判断是否存在交叠的方法为:若第一个区间的左右端点值均大于等于第二个区间的右端点,或第一个区间的左右端点值均小于等于第二个区间的左端点,则认为这两个区间不存在交叠。(2)对于任意n个区间,判断是否存在交叠的方法为:将每个区间依次与其后面的区间作判断,若每个区间与其后面的所有区间两两不存在交叠,则认为这n个区间彼此不存在交叠。
19、进一步地,步骤3-2:对所述多维特征矩阵的特征维进行变换,包括对待划分指标维的线性变换和对划分参考特征维的自由变换,包括:
20、如需要,施加对划分参考特征维的自由变换,结合问题主观确定划分参考特征维的自由变换参数。
21、采用二分搜索确定待划分指标维的线性变换参数,即对该维度数据的缩放系数。具体搜索方法为:
2本文档来自技高网...
【技术保护点】
1.一种基于改进聚类算法的建筑工程指标划分方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的基于改进聚类算法的建筑工程指标划分方法,其特征在于,步骤1:确定待划分建筑工程指标及其划分参考指标,获取调研数据并汇总为多维特征矩阵,包括:
3.根据权利要求1所述的基于改进聚类算法的建筑工程指标划分方法,其特征在于,步骤2:对多维特征矩阵进行初步聚类分析,确定待划分建筑工程指标的区间划分数,包括:
4.根据权利要求1所述的基于改进聚类算法的建筑工程指标划分方法,其特征在于,步骤3:基于所述区间划分数,对多维特征矩阵的特征维进行变换,实现多维数据以待划分指标维为核心、以划分参考特征维为辅助的改进聚类,包括:
5.根据权利要求4所述的基于改进聚类算法的建筑工程指标划分方法,其特征在于,步骤3-1:实现区间分离判断功能,包括:
6.根据权利要求4所述的基于改进聚类算法的建筑工程指标划分方法,其特征在于,步骤3-2:对多维特征矩阵的特征维进行变换,包括:
7.根据权利要求1所述的基于改进聚类算法的建筑工程指标
8.一种基于改进聚类算法的建筑工程指标划分系统,其特征在于,用于实现权利要求1-7任意一项所述的基于改进聚类算法的建筑工程指标划分方法,
9.一种电子设备,其特征在于,包括:
10.一种计算机可读介质,其特征在于,可读介质上存储有计算机程序,其中,该程序被处理器执行时实现如权利要求1-7中任意一项所述的基于改进聚类算法的建筑工程指标划分方法。
...【技术特征摘要】
1.一种基于改进聚类算法的建筑工程指标划分方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的基于改进聚类算法的建筑工程指标划分方法,其特征在于,步骤1:确定待划分建筑工程指标及其划分参考指标,获取调研数据并汇总为多维特征矩阵,包括:
3.根据权利要求1所述的基于改进聚类算法的建筑工程指标划分方法,其特征在于,步骤2:对多维特征矩阵进行初步聚类分析,确定待划分建筑工程指标的区间划分数,包括:
4.根据权利要求1所述的基于改进聚类算法的建筑工程指标划分方法,其特征在于,步骤3:基于所述区间划分数,对多维特征矩阵的特征维进行变换,实现多维数据以待划分指标维为核心、以划分参考特征维为辅助的改进聚类,包括:
5.根据权利要求4所述的基于改进聚类算法的建筑工程指标划分方法,其...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。