当前位置: 首页 > 专利查询>湖南大学专利>正文

基于参数自适应聚类分析的供水管网漏损检测方法技术

技术编号:32192766 阅读:20 留言:0更新日期:2022-02-08 15:57
本发明专利技术提供一种基于参数自适应聚类分析的供水管网漏损检测方法,将每个检测矩阵构成一个数据集,基于稠密度和类距离构建决策函数确定聚类中心,对数据进行初始分类;求取每个类中所有数据点到中心线段的欧式距离,按照欧式距离从小到大排序,通过预设函数获取每个类的域半径,根据每个数据点到所有聚类中心轴的距离,对数据点进行重新分类;检测时,每采集到一组流量数据,传入相应时刻的检测矩阵,计算该组数据到检测矩阵中所有类的聚类中心轴的距离,将该距离与该类的域半径进行比对,实现管网漏损识别。本发明专利技术提供的基于参数自适应聚类分析的供水管网漏损检测方法的参数设定中采用自适应的函数进行选择,有利于在其他管网进行快速有效地部署。进行快速有效地部署。进行快速有效地部署。

【技术实现步骤摘要】
基于参数自适应聚类分析的供水管网漏损检测方法


[0001]本专利技术涉及供水管网
,具体涉及一种基于参数自适应聚类分析的供水管网漏损检测方法。

技术介绍

[0002]供水管网的漏损不仅会造成经济损失还会带来水污染问题。一般来讲,漏损检测分为漏损识别和定位两个步骤。有效及时的识别到漏损事件的发生有利于提高定位能力并减少人力成本。检测方法通常分为被动和主动两类,被动检测依赖于大量的人力借助水听器,相关仪等设备进行巡逻探查并且检测范围有限。主动检测则可通过管网中的信息采集设备进行实时监测,其中数据驱动的方法得到了大力地发展,通过对供水管网的历史数据进行分析来建立数据和漏损之间的关系模型以提高漏损识别效率。近些年,支持向量机模型(SVM)、人工神经网络模型(ANN)和卷积神经网络模型(CNN)等及其改进模型被大量应用于漏损识别,但是该类模型将漏损识别问题视为分类和回归问题,需要对整个管网数据有一个先验知识,因此不适用于所有的管网。同时,ANN和CNN模型因为参数过多需要不可忽略的时间消耗来进行参数优化操作。聚类算法因不需具备先验知识可以快速的适应于不同的管网。现有的聚类算法通过对输入输出的流量数据进行基于密度的聚类分析来提取数据中的异常值。但是,该方法在聚类分析过程中所用到的参数均来自人为经验设定和网格筛选,不利于在其他管网的部署。

技术实现思路

[0003]本专利技术公开了一种基于参数自适应聚类分析的供水管网漏损检测方法,参数设定中均采用自适应的函数进行选择,不需要人为进行经验数值的选择,有利于在其他管网进行快速有效地部署。
[0004]为实现上述目的,本专利技术的技术方案为:
[0005]一种基于参数自适应聚类分析的供水管网漏损检测方法,包括如下步骤:
[0006]S1:连续多天采集供水管网上节点的流量数据;
[0007]S2:对采集的流量数据进行重构,将重构的流量数据按照采样时间的不同存档到不同的检测矩阵,其中,所述检测矩阵的行数为检测时间,列数为节点的个数;
[0008]S3:将每个所述检测矩阵构成一个数据集,计算所述数据集中每个数据的稠密度和离群距离,将离群距离通过映射函数进行映射得到类距离,基于稠密度和类距离构建决策函数确定聚类中心,并对数据进行初始分类;
[0009]S4:求取每个类中所有数据点到中心线段的欧式距离,按照欧式距离从小到大排序,通过预设函数获取每个类的域半径,根据每个数据点到所有聚类中心轴的距离,对数据点进行重新分类,完成检测矩阵参数的获取;
[0010]S5:检测时,每采集到一组流量数据,则传入相应时刻的检测矩阵,计算该组数据到检测矩阵中所有类的聚类中心轴的距离,若距离小于或等于该类的域半径,则判断该组
数据属于检测矩阵中的某个类,说明该时刻没有发生管网漏损,若距离大于该类的域半径,则判断改组数据不属于检测检测矩阵中的某个类,说明该时刻发生管网漏损。
[0011]优选的,所述流量数据可以通过节点上设置流量计进行采样,采样的频率为5分钟,每天每个节点产生288个流量数据。
[0012]优选的,所述步骤S3具体包括如下步骤:
[0013]S31:计算数据集中各数据点的稠密度ρ和各数据点与高密度数据点的离群距离δ;
[0014]其中,稠密度ρ由高斯核函数求解,计算公式如下:
[0015][0016]离群距离δ表示数据集中任意数据点i到具有高局部密度的数据点j的距离,离群距离δ的计算公式:
[0017][0018]式中,d
ij
为点i和j之间的欧氏距离,d
c
为截断距离,v
i
是点i的稠密度在所有数据点稠密度按照从大到小排列所得序列中的排序位置;
[0019]S32:计算检测矩阵中各数据点的熵值,选择熵值最小时所对应的截断距离作为最优截断距离,熵值H的计算公式为:
[0020][0021]式中,Z表示归一化因子,
[0022]S33:将离群距离通过映射函数进行映射,得到类距离,结合稠密度和类距离构建决策函数来选取合适的聚类中心,其中类距离γ=δ

2d
c
,映射函数表示为:
[0023][0024]S34:采用一个可取的参数β统一类间距γ和稠密度ρ,基于决策函数选取大于参数β一个标准差的数据点作为聚类中心,并对数据进行初始分类;
[0025]所述决策函数表示为:
[0026][0027][0028][0029]其中,N为数据集中数据点的个数。
[0030]优选的,所述步骤S4具体为:
[0031]S41:使用主成分分析方法来获取每个类的中线线段方向
[0032]S42:求取每个类中心线段的长度,计算过程如下:
[0033][0034]其中,l
j
表示第j各类的中心线段长度值,表示第i个点到第j个类中心的向量,是类j的最大变化方向,则表示投影值,n
j
表示第j个类内的数据点个数;
[0035]S43:求取每个类中所有数据点到中心线段的欧氏距离,按照欧式距离从小到大排序。
[0036]形成多个有序数据点;
[0037]S44:通过预设函数,获取每个类的域半径r
j

[0038][0039]式中Q1表示多个有序数据点的第四分之一分位数,Q2表示中位数,Q3表示第四分之三分位数,IQR为四分位距;
[0040]S45:将所有到聚类中心轴距离小于域半径r
j
的数据点归于同一类中,对数据点进行重新分类,迭代更新,直至所述参数保持不变或迭代次数超过20次,完成所述检测矩阵所有聚类参数的获取。
[0041]与相关技术相比,本专利技术提供的基于参数自适应聚类分析的供水管网漏损检测方法在参数设定中均采用自适应的函数进行选择,不需要人为进行经验数值的选择,有利于在其他管网进行快速有效地部署。
【附图说明】
[0042]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图,其中:
[0043]图1为本专利技术提供的一种管网漏损识别方法的步骤流程图;
[0044]图2为某一节点在1月1日

4月30日的流量数据曲线,其中曲线a为了1月1日24小时内的流量数据曲线,曲线b为2月1日24小时内的流量数据曲线,曲线c为4月1日24小时内的流量数据曲线,曲线d表示该节点每天在早上8点时刻的流量数据。
【具体实施方式】
[0045]为了使本
的人员更好地理解本专利技术实施例中的技术方案,并使本专利技术的上述目的、特征和优点能够更加明显易懂,下面对本专利技术的具体实施方式作进一步的说明。
[0046]请结合参阅图1<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于参数自适应聚类分析的供水管网漏损检测方法,其特征在于,包括如下步骤:S1:连续多天采集供水管网上节点的流量数据;S2:对采集的流量数据进行重构,将重构的流量数据按照采样时间的不同存档到不同的检测矩阵,其中,所述检测矩阵的行数为检测时间,列数为节点的个数;S3:将每个所述检测矩阵构成一个数据集,计算所述数据集中每个数据的稠密度和离群距离,将离群距离通过映射函数进行映射得到类距离,基于稠密度和类距离构建决策函数确定聚类中心,并对数据进行初始分类;S4:求取每个类中所有数据点到中心线段的欧式距离,按照欧式距离从小到大排序,通过预设函数获取每个类的域半径,根据每个数据点到所有聚类中心轴的距离,对数据点进行重新分类,完成检测矩阵参数的获取;S5:检测时,每采集到一组流量数据,则传入相应时刻的检测矩阵,计算该组数据到检测矩阵中所有类的聚类中心轴的距离,若距离小于或等于该类的域半径,则判断该组数据属于检测矩阵中的某个类,说明该时刻没有发生管网漏损,若距离大于该类的域半径,则判断改组数据不属于检测检测矩阵中的某个类,说明该时刻发生管网漏损。2.根据权利要求1所述的基于参数自适应聚类分析的供水管网漏损检测方法,其特征在于,所述流量数据可以通过节点上设置流量计进行采样,采样的频率为5分钟,每天每个节点产生288个流量数据。3.根据权利要求1所述的基于参数自适应聚类分析的供水管网漏损检测方法,其特征在于,所述步骤S3具体包括如下步骤:S31:计算数据集中各数据点的稠密度ρ和各数据点与高密度数据点的离群距离δ;其中,稠密度ρ由高斯核函数求解,计算公式如下:离群距离δ表示数据集中任意数据点i到具有高局部密度的数据点j的距离,离群距离δ的计算公式:式中,d
ij
为点i和j之间的欧氏距离,d
c
为截...

【专利技术属性】
技术研发人员:张英杰孙庆帅李佳林
申请(专利权)人:湖南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1