一种基于决策树模型的地下管网运行能力评估方法技术

技术编号:32284472 阅读:33 留言:0更新日期:2022-02-12 19:52
本发明专利技术提供一种基于决策树模型的地下管网运行能力评估方法,包括步骤:S10、采集城市供水管线历史事故数据,所述事故数据包括事故类型数据、时间数据和事故点地域特征数据;S20、对所述事故数据进行处理,将其转化为巨量的决策树建模数据;S30、将建模数据随机分为训练集与测试集,用训练集数据进行决策树模型训练,采用二分交叉验证进行参数优化,用测试集数据进行决策树模型检验;S40、对检验结果数据进行lowess曲线拟合,获取分割值下的风险倍增率和风险数据占比。率和风险数据占比。率和风险数据占比。

【技术实现步骤摘要】
一种基于决策树模型的地下管网运行能力评估方法


[0001]本专利技术涉及城市地下管线运行保障
,具体涉及一种基于决策树模型的地下管网运行能力评估方法。

技术介绍

[0002]地下管线的安全运行是城市繁荣的根基。各类地下管线纵横分布,共存于地下空间。当某一管线发生故障或是故事,极易以各种破坏形式作用于其他管线,使各种危险因素互相作用、叠加乃至互相助长,从而引发重大灾害事故,给城市运行带来不利影响,甚至较大的灾害。
[0003]保障地下管线高效、安全运行,需要深入研究地下管线的事故成因和运行状态,以便在管线寿命期的前、中、后三个阶段,实现科学设计、合理使用和有效维护。地下管线事故的发生,既有管线系统自身的原因,也有自然环境变化的原因,还有人为的外力破坏原因。由于管线事故发生的影响因素较多,因此目前在微观层面通过机理进行事故原因分析的研究比较多。然而,各种因素的耦合作用,很难通过叠加来进行进一步研究,也就是说,通过因素分析和机理研究,探查多因素综合作用下的管线老化和损伤状态,从而对管线的整体运行状态进行科学评估,这一研究路径存在一定的局限性。

技术实现思路

[0004]本专利技术突破“原因

过程

结果”的研究路径,直接从结果数据切入,针对出现事故和未出现事故的管线,采集相关因素的数据,利用大数据分析方法,研究各种风险因素对管线事故发生概率的影响;并选定案例区域,基于数据对地下管线进行运行能力评估。
[0005]本专利技术提供一种基于决策树模型的地下管网运行能力评估方法,包括步骤:S10、采集城市供水管线历史事故数据,所述事故数据包括事故类型数据、时间数据和事故点地域特征数据;S20、对所述事故数据进行处理,将其转化为巨量的决策树建模数据;S30、将建模数据随机分为训练集与测试集,用训练集数据进行决策树模型训练,采用二分交叉验证进行参数优化,用测试集数据进行决策树模型检验;S40、对检验结果数据进行lowess曲线拟合,获取不同分割值下的风险倍增率和风险数据占比。
[0006]本专利技术另一方案中,所述决策树模型建立训练函数ctree(),参数包含决策树的深度maxdepth,节点最小样本量minsplit,叶子最小样本量minbusket。
[0007]本专利技术另一方案中,参数设置maxdepth=3、4、5、6或8;minsplit从100到800,跨度100;minbucket从50至minsplit的二分之一,跨度50。
[0008]本专利技术另一方案中,所述步骤S10包括859个事故点数据。
[0009]本专利技术另一方案中,所述步骤S20的巨量数据为约53万条数据。
[0010]本专利技术另一方案中,所述步骤S30中,训练集占66%,测试集占34%。
[0011]本专利技术另一方案中,所述步骤S30中,对数据进行50次随机划分。
[0012]本专利技术另一方案中,所述步骤S40中,对50次模型检验结果数据,进行的cut

off值
下风险倍增率的lowess曲线拟合。
[0013]本专利技术另一方案中,所述步骤S40中,在lowess曲线上均匀取100个数值作为cut

off值,获取不同cut

off值下的风险倍增率。
[0014]本专利技术另一方案中,所述步骤S40中,进行cut

off值下风险肯定数据占比的lowess曲线拟合,获取上述不同cut

off值下的风险肯定数据占比。
[0015]本专利技术从数据角度入手,通过采集大量事故数据,代入生存分析模型,探索数据视角下管线事故的整体事故概率测算,并对城市区域的管线事故概率分区原则、计算参数等进行探讨,从而建立供水管线运行能力评估模型。针对案例区域,进行供水管线的运行能力评估,计算供水管线的事故概率水平,探索降低事故概率、控制区域供水管线风险水平的具体措施,提高供水管线的管理效率。
附图说明
[0016]图1为本专利技术供水管网运行能力评估方法流程图;
[0017]图2(a)

(c)为本专利技术50组模型评估风险区;
[0018]图3为本专利技术决策树模型分析结果及风险安全区分级可视化表达。
具体实施方式
[0019]本专利技术某些实施例于后方将参照所附附图做更全面性地描述,其中一些但并非全部的实施例将被示出。实际上,本专利技术的各种实施例可以许多不同形式实现,而不应被解释为限于此数所阐述的实施例;相对地,提供这些实施例使得本专利技术满足适用的法律要求。
[0020]为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术进一步详细说明。
[0021]基于数据对供水管线运行能力评估,对于已有管线维护与新增管线设计,均有一定的实践意义。我国大部分城市的供水管线,相当一部分已经进入翻新维修的阶段,在较为宏观的层面上,确定不同特征区域的管线事故概率,进行管线运行能力评估,对管线管理的实践工作具有一定的指导作用。此外,随着城市的快速扩张,供水管线系统的范围日益增大,城市不同区域显现出各自较为明确的特征,例如管线材质、管龄、地面压力等,在这些区域进行管线运行能力评估,利于在管线新建和使用过程中降低管线事故概率。
[0022]本专利技术提供一种基于决策树模型的地下管网运行能力评估方法,如图1所示,包括步骤:
[0023]S10、采集城市供水管线历史事故数据,所述事故数据包括事故类型数据、时间数据和事故点地域特征数据;
[0024]S20、对所述事故数据进行处理,将其转化为巨量的决策树建模数据;
[0025]S30、将建模数据随机分为训练集与测试集,用训练集数据进行决策树模型训练,用测试集数据进行决策树模型检验;
[0026]S40、对检验结果数据进行lowess曲线拟合,获取不同分割cut

off值下的风险倍增率和风险数据占比。
[0027]本专利技术的一个具体实施例,以北京市供水管网的风险评估模型的构建为例。
[0028]S10、事故数据采集
[0029]本专利技术以北京网格化城市管理系统所记录的供水管线事故数据,2013年1月1日到2016年9月30日之间,五个城区在四环内的供水管线事故数据,共859次事故。
[0030]其中,按照城区分,北京市朝阳区133;北京市东城区264;北京市丰台区227;北京市海淀区133;北京市西城区102。
[0031]按照事故类型分为,跑、冒、滴、漏类事故534次,喷涌类事故325次。
[0032]S20、数据处理
[0033]基于859个事故点建立时空数据。
[0034]事故点所在区域的建设年代数据,采用临近小区的建设年代替代。无法确认唯一建设年代时,取时间平均值。
[0035]从地图上采集事故点周边的数据,包括两个方面,一是周边240米范围内的建本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于决策树模型的地下管网运行能力评估方法,包括步骤:S10、采集城市供水管线历史事故数据,所述事故数据包括事故类型数据、时间数据和事故点地域特征数据;S20、对所述事故数据进行处理,将其转化为巨量的决策树建模数据;S30、将建模数据随机分为训练集与测试集,用训练集数据进行决策树模型训练,采用二分交叉验证进行参数优化,用测试集数据进行决策树模型检验;S40、对检验结果数据进行lowess曲线拟合,获取不同分割值下的风险倍增率和风险数据占比。2.根据权利要求1所述的评估方法,其特征在于,所述决策树模型建立训练函数ctree(),参数包含决策树的深度maxdepth,节点最小样本量minsplit,叶子最小样本量minbusket。3.根据权利要求2所述的评估方法,其特征在于,参数设置maxdepth=3、4、5、6或8;minsplit从100到800,跨度100;minbucket从50至minsplit...

【专利技术属性】
技术研发人员:杨艳英郑建春尹萌萌朱伟钟少波杜娟娟
申请(专利权)人:北京城市系统工程研究中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1