一种基于机器学习的流域洪水响应相似性分析方法技术

技术编号:23854033 阅读:49 留言:0更新日期:2020-04-18 10:08
本发明专利技术公开了一种基于机器学习的流域洪水响应相似性分析方法,包括以下步骤:1)数据的收集、处理与保存;2)降雨场次自动划分;3)洪水场次自动划分;4)降雨洪水事件匹配关联;5)生成降雨洪水事件样本集合;6)生成降雨事件相似性矩阵;7)基于降雨相似性矩阵搜索洪水事件并分析相似性;8)流域洪水响应相似性评价。本发明专利技术区别于以往利用单一指数或模型参数对水文相似进行判断,能够充分利用降雨、径流数据所包含的信息,对洪水响应的相似性判断有更强的针对性。

A similarity analysis method of basin flood response based on machine learning

【技术实现步骤摘要】
一种基于机器学习的流域洪水响应相似性分析方法
本专利技术属于水利工程
,尤其涉及防洪预报
,具体为一种基于机器学习的流域洪水响应相似性分析方法。
技术介绍
目前,我国大江大河及其主要支流已经形成以堤防、水库和蓄滞洪区为主的防洪工程体系,防汛预警预报系统等非工程措施也逐步得到加强,基本能防御主要江河常遇洪水。然而对于5万多条中小河流,其分布广、数量多,自然地理、气候条件复杂多样,防洪能力总体落后,特别是近年来极端天气事件增多,中小流域暴雨事件增加,常常造成严重的洪涝灾害。中小河流洪水灾害造成的损失已成为我国洪涝灾害损失的主体。洪水预报是非工程措施的重要组成部分,能够有效提高流域和区域的防灾减灾能力。但对于缺少径流资料的中小河流,传统的经验方法往往不再适用,目前广为采取的洪水预报方法是依据相似性和区域化的预报模型参数移植方法。这一方法非常依赖对水文相似性的准确判断,然而目前针对水文相似性判断的水文特征指标、水文模型参数、统计指标等方法存在片面化、不确定性强、针对性差等问题。例如水文特征指标法中经常采用的径流系数、流量历时曲线、季节指数、基流指数等,通常只能片面的描述流域的水文特征,且这种相似性的判断往往更适合于中长期径流过程而非针对短时段洪水响应过程。通过水文模型参数的相似性来定义和判断水文相似性,这种定义方式的潜在假定是率定后的模型参数相似反映了降雨径流转换行为的相似。但是这种相似受到模型结构的影响,可能会存在一种模型结构的定义下是相似的,在其他模型结构的定义下却不相似的情况,而且概念性模型的参数不确定性以及异参同效问题也对这种定义的可靠性带来隐患。通过统计指标定义相似,这一类方法通常关注洪峰等洪水行为的一部分特征,如以无量纲的洪水频率曲线为水文相似的衡量标准,也存在片面性的问题。
技术实现思路
本专利技术的目的在于提出一种基于机器学习的流域洪水响应相似性分析方法,区别于以往利用单一指数或模型参数对水文相似进行判断,能够充分利用降雨、径流数据所包含的信息,对洪水响应的相似性判断有更强的针对性,从而更适合应用于洪水预报。本专利技术的目的是通过以下技术方案实现的:一种基于机器学习的流域洪水响应相似性分析方法:包括以下步骤:1)数据的收集、处理与保存:收集待分析流域出口水文站点的径流数据,获得流域出口流量时间序列;收集待分析流域内各个雨量站点的降雨数据,计算流域的面雨量,获得流域面雨量时间序列;收集的径流数据(洪水数据)及降雨数据需要覆盖10年或10年以上;对流域出口流量时间序列和流域面雨量时间序列进行等时段处理获得等时段流域出口流量时间序列数据和等时段流域面雨量时间序列数据保存至数据库中,并使用流域编码进行标识;2)降雨场次自动划分:根据流域编码依次读取数据库中各流域的流域面雨量时间序列,并将流域面雨量时间序列划分为独立的场次降雨,划分方法为:设定时间阈值,当降雨过程的间歇时间超过阈值则视为两次降水过程,不足阈值的则视为一次降水过程;3)洪水场次自动划分:根据流域编码依次读取数据库中各流域出口流量时间序列,以洪水的起涨和消落过程作为洪水事件的划分标准将其划分为独立的场次洪水;4)降雨洪水事件匹配关联:将步骤2)中获得的场次降雨与步骤3)中获得的场次洪水进行匹配关联,关联匹配方法为:以场次洪水的开始时间Ti1为基准,设定窗口,设开始时间向前的窗口大小为La,开始时间至洪水事件最后一个峰值的窗口大小为Lb,则最终确定的窗口大小Ln=La+Lb,若降雨事件的质心落入窗口中,则认为降雨事件与洪水事件为关联事件,视为一次雨洪事件;5)生成降雨洪水事件样本集合:按照步骤4)中的关联匹配方法,依次寻找多个场次洪水序列所关联的降雨事件,筛选掉无法找到关联事件的场次洪水事件,从而得到元素一一关联的降雨事件集合与洪水事件集合;6)生成降雨事件相似性矩阵:矩阵为主对角线元素为0的对称矩阵,矩阵大小为(n×n),n为降雨事件个数,矩阵的元素(i,j)为降雨事件i与降雨事件j的相似度,使用DTW距离作为相似性度量标准,距离越小则相似性越强;7)基于降雨相似性矩阵搜索洪水事件并分析相似性:7-1设定距离阈值Thdis,遍历搜索步骤6)中生成的降雨事件相似性矩阵中的每个元素,若元素(i,j)小于距离阈值Thdis,认为降雨事件i与降雨事件j相似;7-2寻找步骤5)所生成的集合中与降雨事件i所关联的洪水事件i以及降雨事件j所关联的洪水事件j,计算关联洪水事件i与洪水事件j的DTW距离,设定距离阈值Thdis′,若洪水事件的DTW距离小于阈值Thdis′,认为洪水事件i与洪水事件j相似;7-3查询事件i与事件j所发生流域的流域编码;7-4完成遍历搜索计算,对每个元素均进行步骤7-1~7-3的计算、查询并记录各降雨、洪水事件的关联流域编码及相似性;8)流域洪水响应相似性评价:生成流域相似性评价矩阵,该矩阵为对称矩阵,矩阵大小为(N×N),N为流域个数,矩阵元素(i,j)表示流域i与流域j的相似度;矩阵元素(i,j)值S的计算方法为:8-1当i=j时,S为流域i的相似性度量基准,基于步骤7)中对降雨相似性矩阵的搜索以及对洪水事件的相似性分析记录,设发生于流域i的降雨事件中相似事件个数为Nr,Nr个降雨事件所关联的洪水事件中有Nf个为相似事件,则S(i,i)=S(j,j)=Nf/Nr;8-2当i≠j时,S为流域i与流域j的相似性度量,基于步骤7)中对降雨相似性矩阵的搜索以及对洪水事件的相似性分析记录,若发生于流域i的降雨事件与发生于流域j的降雨事件中有Nr个为相似事件,Nr个降雨相似事件中有Nf个关联的洪水事件为相似事件,则S(i,j)=S(j,i)=Nf/Nr;8-3流域洪水响应相似性评价:搜索流域相似性评价矩阵的元素,对于流域i与流域j(i≠j),相似度为S(i,j),相似性度量基准为设定系数ρ,若S(i,j)>ρ·S′,则认为流域i与流域j具有相似的洪水响应。进一步的,步骤1)采用线性内插法进行等时段处理获得等时段流域出口流量时间序列数据;步骤1)采用根据降雨量累积曲线插值进行等时段处理获得等时段流域面雨量时间序列数据。进一步的,步骤1)采用泰森多边形法进行面雨量的计算,具体的计算方法为:将流域划分泰森多边形,根据站点对应的多边形面积占流域总面积的百分比计算雨量站的权重;设雨量站Ri对应的降雨时间序列为{Pi1,Pi2,Pi3,...,Pij}对应的多边形面积为AREAi,流域总面积为AREA,则流域面雨量时间序列{P1,P2,P3,...,Pj}的计算方法如式(1):其中m为流域内雨量站点个数,j为降雨时间序列的长度。进一步的,步骤3)中采用算法从连续时间序列中自动提取洪水事件,具体方法为:3-1基流分割,将径流序列中的基流部分和洪水部分划分开,通过数字滤波法得到流量过程的基流部分,如式(2)所示:式中,bt为时刻t的基流,Qt为时刻t的径流,β为滤波系数;通过本文档来自技高网
...

【技术保护点】
1.一种基于机器学习的流域洪水响应相似性分析方法,其特征在于:包括以下步骤:/n1)数据的收集、处理与保存:收集待分析流域出口水文站点的径流数据,获得流域出口流量时间序列;收集待分析流域内各个雨量站点的降雨数据,计算流域的面雨量,获得流域面雨量时间序列;收集的径流数据及降雨数据需要覆盖10年或10年以上;对流域出口流量时间序列和流域面雨量时间序列进行等时段处理获得等时段流域出口流量时间序列数据和等时段流域面雨量时间序列数据保存至数据库中,并使用流域编码进行标识;/n2)降雨场次自动划分:根据流域编码依次读取数据库中各流域的流域面雨量时间序列,并将流域面雨量时间序列划分为独立的场次降雨,划分方法为:设定时间阈值,当降雨过程的间歇时间超过阈值则视为两次降水过程,不足阈值的则视为一次降水过程;/n3)洪水场次自动划分:根据流域编码依次读取数据库中各流域出口流量时间序列,以洪水的起涨和消落过程作为洪水事件的划分标准将其划分为独立的场次洪水;/n4)降雨洪水事件匹配关联:将步骤2)中获得的场次降雨与步骤3)中获得的场次洪水进行匹配关联,关联匹配方法为:以场次洪水的开始时间T

【技术特征摘要】
1.一种基于机器学习的流域洪水响应相似性分析方法,其特征在于:包括以下步骤:
1)数据的收集、处理与保存:收集待分析流域出口水文站点的径流数据,获得流域出口流量时间序列;收集待分析流域内各个雨量站点的降雨数据,计算流域的面雨量,获得流域面雨量时间序列;收集的径流数据及降雨数据需要覆盖10年或10年以上;对流域出口流量时间序列和流域面雨量时间序列进行等时段处理获得等时段流域出口流量时间序列数据和等时段流域面雨量时间序列数据保存至数据库中,并使用流域编码进行标识;
2)降雨场次自动划分:根据流域编码依次读取数据库中各流域的流域面雨量时间序列,并将流域面雨量时间序列划分为独立的场次降雨,划分方法为:设定时间阈值,当降雨过程的间歇时间超过阈值则视为两次降水过程,不足阈值的则视为一次降水过程;
3)洪水场次自动划分:根据流域编码依次读取数据库中各流域出口流量时间序列,以洪水的起涨和消落过程作为洪水事件的划分标准将其划分为独立的场次洪水;
4)降雨洪水事件匹配关联:将步骤2)中获得的场次降雨与步骤3)中获得的场次洪水进行匹配关联,关联匹配方法为:以场次洪水的开始时间Ti1为基准,设定窗口,设开始时间向前的窗口大小为La,开始时间至洪水事件最后一个峰值的窗口大小为Lb,则最终确定的窗口大小Ln=La+Lb,若降雨事件的质心落入窗口中,则认为降雨事件与洪水事件为关联事件,视为一次雨洪事件;
5)生成降雨洪水事件样本集合:按照步骤4)中的关联匹配方法,依次寻找多个场次洪水序列所关联的降雨事件,筛选掉无法找到关联事件的场次洪水事件,从而得到元素一一关联的降雨事件集合与洪水事件集合;
6)生成降雨事件相似性矩阵:矩阵为主对角线元素为0的对称矩阵,矩阵大小为(n×n),n为降雨事件个数,矩阵的元素(i,j)为降雨事件i与降雨事件j的相似度,使用DTW距离作为相似性度量标准,距离越小则相似性越强;
7)基于降雨相似性矩阵搜索洪水事件并分析相似性:
7-1设定距离阈值Thdis,遍历搜索步骤6)中生成的降雨事件相似性矩阵中的每个元素,若元素(i,j)小于距离阈值Thdis,认为降雨事件i与降雨事件j相似;
7-2寻找步骤5)所生成的集合中与降雨事件i所关联的洪水事件i以及降雨事件j所关联的洪水事件j,计算关联洪水事件i与洪水事件j的DTW距离,设定距离阈值Thdis′,若洪水事件的DTW距离小于阈值Thdis′,认为洪水事件i与洪水事件j相似;
7-3查询事件i与事件j所发生流域的流域编码;
7-4完成遍历搜索计算,对每个元素均进行步骤7-1~7-3的计算、查询并记录各降雨、洪水事件的关联流域编码及相似性;
8)流域洪水响应相似性评价:生成流域相似性评价矩阵,该矩阵为对称矩阵,矩阵大小为(N×N),N为流域个数,矩阵元素(i,j)表示流域j与流域j的相似度;矩阵元素(i,j)值S的计算方法为:
8-1当i=j时,S为流域i的相似性度量基准,基于步骤7)中对降雨相似性矩阵的搜索以及对洪水事件的相似性分析记录,设发生于流域i的降雨事件中相似事件个数为Nr,Nr个降雨事件所关联的洪水事件中有Nf个为相似事件,则S(i,i)=S(j,j)=Nf/Nr;
8-2当i≠j时,S为流域i与流域j的相似性度量,基于步骤7)中对降雨相似性矩阵的搜索以及对洪水事件的相似性分析记录,若发生于流域i的降雨事件与发生于流域j的降雨事件中有Nr个为相似事件,Nr个降雨相似事件中有Nf个关联的洪水事件为相似事件,则S(i,j)=S(j,i)=Nf/Nr;
8-3流域洪水响应相似性评价:搜索流域相似性评价矩阵的元素,对于流域i与流域j(i≠j),相似度为S(i,j),相似性度量基准为设定系数ρ,若S(i,j)>ρ·S′,则认为流域i与流域j具有相似的洪水响应。


2.根据权利要求1所述的一种基于机器学习的流域洪水响应相似性分析方法,其特征在于:步骤1)采用线性内插法进行等时段处理获得等时段流域出口...

【专利技术属性】
技术研发人员:王帆
申请(专利权)人:中国水利水电科学研究院
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1