一种河道断面流量实时智能推求方法技术

技术编号:30805086 阅读:22 留言:0更新日期:2021-11-16 08:12
本发明专利技术提供了一种河道断面流量实时智能推求方法,包括建立水文要素标准化样本集、确定水文特征要素组合、将本断面历史水位流量关系线上所有流量点一一对应的所述水文特征要素组合建立数据仓库D、计算数据仓库D并分配至距离最短的聚类簇、在簇内求解与水文特征要素组合距离最短的水文特征要素组合样本点,通过分析和确定影响河道断面流量实时推求的水文特征要素组合,对水位历年变幅进行分级,为水资源监督管理和水旱灾害防御提供更及时和精确的流量数据支持。时和精确的流量数据支持。时和精确的流量数据支持。

【技术实现步骤摘要】
一种河道断面流量实时智能推求方法


[0001]本专利技术涉及水文测验
,尤其涉及一种河道断面流量实时智能推求方法。

技术介绍

[0002]水文资料是防汛抗旱、水利工程建设、水资源利用和保护、水生态治理和可持续发展等方面的基础性资料,在经济社会发展中具有重要作用。流量资料的计算或推求是水文资料收集中的核心和难点,近年来各类社会需求对其精度和时效性要求越来越高,也越来越迫切,水利部更是提出了水文资料整编“日清月结”甚至实时整编的要求,以满足社会各类需求。新中国成立以来,我国水利事业蓬勃发展,在河流上建设了大批水利工程或涉水工程。这些工程的建设为地方经济社会的发展发挥巨大的综合效益,如防洪、发电、航运、灌溉等,同时,这些工程的建设也显著改变了天然河道的水文情势、河段特点和水文测站(断面)特性,严重影响了水位流量关系的变化,给流量推求带来了极大困难和挑战。因此,合理利用新技术、新方法不断提高河道断面流量的精度和时效性,对进一步提升水文资料服务经济社会的水平、更大限度的满足社会各类需求具有重要意义。
[0003]目前,常规的河道流量推算或推求方法大多采用传统的水位流量关系线的方法,即采用水位与流量建立某种关系来推求流量,常用的有单一线法、单值化法、连时序法、连实测流量过程线法等,通过定线精度的控制,达到相关标准和规范的要求。这些计算方法属于传统的水文学方法,简单实用,易于理解,但是面临一些问题,主要体现在:

这些方法是由历史资料分析和建立的,分析过程往往带有很强的经验性。在当前实践生产中,这些方法虽然以软件程序化的形式实现了流量的实时推求,但宝贵的经验往往难以程序化,因此大部分测站的流量实时推求仍然需要人工定线或干预,自动化和智能化水平极低;

这些方法是水文前辈专家的经验性分析成果,是总结和概化而非全部实际情况的体现。实践中由于水文过程的复杂性,流量推求往往难以找到周全的方法,如精度较高的单值化法中,也常常有许多特殊水情的流量点未能参加关系线的建立,在以后出现类似水情时,流量推求仍然会有大的偏差。

这些方法绝大部分采用关系线的形式推求相应水位的流量,其具体做法的基本思路是关系线必须通过“点群中心”,线是点的概化,而非精确匹配,方法自身存在误差。

这些方法大多是采用事后定线,即用已经收集到的水文数据定线,难以满足流量实时推求的要求。在传统水文工作中,水文资料的整编每年一般2次,汛后1次,次年年初对上年资料进行整编。虽然水利部实施了水文资料整编“日清月结”,但由于整编的基础理论和方法并未有实质进步或提升,“日清月结”成果大部分仍然是按月的临时成果,正式成果仍然采用原有模式整编,时效性提升严重受限;

传统方法是建立在一定的测站(或断面)特性和河段特点的基础上,也就是说大多数传统方法对应的测站特性和河段特点应相对固定或变化不大,但实际当中,测站特性和河段特点作为河流的自然属性是经常发生变化,正如人们常说的“三十年河东、三十年河西”,加之受水利工程建设等人为活动影响,其变化更加复杂而缺乏规律性,导致采用传统方法进行流量推求时,常常发生较大偏差。
[0004]近年来,随着信息技术、物联网、大数据、云计算、数据挖掘以及人工智能等前言技
术的快速发展。2017年国务院发布《新一代人工智能发展规划》,标志着人工智能以上升为国家战略。利用人工智能技术的强大的数据处理、挖掘、分析与识别能力,可为水文行业各类数据处理带来革命性进步,实现河道流量与水文要素间的更精确匹配,得到精度更高,时效性更快的实时流量推求。

技术实现思路

[0005]本专利技术的目的在于针对上述现有技术的不足,提供了一种河道断面流量实时智能推求方法,显著提高河道断面流量实时整编或报汛精度。
[0006]为实现上述目的,本专利技术采用了如下技术方案:本专利技术提供了一种河道断面流量实时智能推求方法,S1、建立水文要素标准化样本集:收集历史水文资料,分析和识别可能影响河道断面流量推求的河道断面和断面所在河段的各类水文要素样本集U;考虑到各水文要素之间数值大小与量纲的不同,对所有流量点相应的水文要素原始数据X进行标准化处理,形成标准化变量,以消除变量间变异程度上的差异,标准化之后的水文要素样本集为;为一个n维向量,所述河道断面所有历史水位流量关系线上的流量点一一对应的作为新的样本集W;作为新的样本集W;作为新的样本集W;作为新的样本集W;作为新的样本集W;式中,Q为流量;X为流量对应的某一水文要素;m为X的均值;s为X标准差;n为水文要素的数量,N为历史水文资料中流量点的总个数;为流量对应的某一水文要素;为标准化后的水文要素变量;S2、确定水文特征要素组合:采用包装法建立水文要素特征子集模型,在所述样本集中选取不同的特征子集,利用历史水文数据,对所述特征子集进行机器学习的数据训练;以流量推求的准确度或误差最小作为衡量所述特征子集好坏的标准,每次选择多个特征组成所述特征子集,经过反复比较选出最好的所述特征子集,即为所述水文特征要素组合;实质为一个t维向量,t<n;S3、将断面历史水位流量关系线上所有流量点一一对应的所述水文特征要素组合建立数据仓库D,采用K均值聚类算法对D进行分类,将每个流量点对应的样本数据作为对象,随机假定K个质心,每个质心初始的代表一个簇的中心,形成K个聚类中心,聚类个数K的选择采用肘部法则;
S4、计算数据仓库D中每一个对象与各簇中心的距离,并赋予最近的簇,得到新的K个聚类 ,重新计算每个簇的水文特征要素组合样本的平均值,更新为新的簇中心,每一个对象到每一个聚类中心的距离度量采用欧式距离;为提高距离度量的适配性,在所述欧式距离中引入所述S2中得到的各水文特征要素的权重系数,得到加权后的所述欧式距离;类簇中心就是类簇内所有对象在各个维度加权后的均值C;加权后的均值C;加权后的均值C;式中,表示个类簇中第个对象,,表示第个聚类中心的质心,,表示第i个对象的第t个属性,,表示第j个聚类中心的第t个属性;表示第个聚类的中心;,表示第个类簇中对象的个数,;S5、不断重复所述S4,反复迭代进行分配点和更新类簇中心点的步骤,直至类簇中心点的变化很小,得到最终聚类,各类簇中心为,是一个与所述水文特征要素组合相同的n维向量,为确保流量推求精度不低于单次流量测验误差,C聚类中组与组之间的误差应不大于10%;S6、根据当前河道断面水位,提取当前所述水文特征要素组合的样本数据,是一个n维向量;逐一求解与最终聚类中各的欧式距离,以最短欧式距离d作为约束条件,确定归属最终聚类中的簇类S;遍历聚类中心,继续求解与欧式距离最短的所述水文特征要素组合;当最小且小于阈值时,相当于两个组合相似度U最高,视为匹配成功;否则,视为匹配失败;否则,视为匹配失败;其中,流量推求误差的阈值根据社会需求确定;Q
S
为距离最短水文特征要素组合对应的流量值;S7、若匹配成功,则根据相似度最高的所述水文特征要素组合找出对应的流量点数值,并建立与该河道断面传统流量实时推求方法结果优本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种河道断面流量实时智能推求方法,其特征在于:S1、建立水文要素标准化样本集:收集历史水文资料,分析和识别可能影响河道断面流量推求的河道断面和断面所在河段的各类水文要素样本集U;考虑到各水文要素之间数值大小与量纲的不同,对所有流量点相应的水文要素原始数据X进行标准化处理,形成标准化变量 ,以消除变量间变异程度上的差异,标准化之后的水文要素样本集为;为一个n维向量,所述河道断面所有历史水位流量关系线上的流量点一一对应的作为新的样本集W;作为新的样本集W;作为新的样本集W;作为新的样本集W;式中,Q为流量;X为流量对应的某一水文要素;m为X的均值;s为X标准差;n为水文要素的数量,N为历史水文资料中流量点的总个数;为流量对应的某一水文要素;为标准化后的水文要素变量;S2、确定水文特征要素组合 :采用包装法建立水文要素特征子集模型,在所述样本集中选取不同的特征子集,利用历史水文数据,对所述特征子集进行机器学习的数据训练;以流量推求误差最小作为衡量所述特征子集好坏的标准,每次选择多个特征组成所述特征子集,经过反复比较选出最好的所述特征子集,即为所述水文特征要素组合; 实质为一个t维向量,t<n;S3、将断面历史水位流量关系线上所有流量点一一对应的所述水文特征要素组合建立数据仓库D,采用K均值聚类算法对D进行分类,将每个流量点对应的样本数据作为对象,随机假定K个质心,每个质心初始的代表一个簇的中心,形成K个聚类中心,聚类个数K的选择采用肘部法则;S4、计算数据仓库D中每一个对象与各簇中心的距离,并赋予最近的簇,得到新的K个聚类 ,重新计算每个簇的水文特征要素组合样本的平均值,更新为新的簇中心,每一个对象到每一个聚类中心的距离度量采用欧式距离;为提高距离度量的适配性,在所述欧式距离中引入所述S2中得到的各水文特征要素的权重系数,得到加权后的所述欧式距离;类簇中心就是类簇内所有对象在各个维度加权后的均值C;后的均值C;
式中,表示个类簇中第个对象,,表示第个聚类中心的质心,,表示第i个对象的第t个属性,,表示第j个聚类中心的第t个属性;表示第个聚类的中心;,表示第个类簇中对象的个数,;S5、不断重复所述S4,反复迭代进行分配点和更新类簇中心点的步骤,直至类簇中心点的变化很小,得到最终聚类,各类簇中心为,是一个与所述水文特征要素组合相同的n维向量,为确保流量推求精度不低于单次流量测验误差,C聚类中组与组之间的误差应不大于10%;S6、根据当前河道断面水位,提取当前所述水文特征要素组合的样本数据,是一个n维向量;逐一求解与最终聚类中各聚类中心的欧式距离,以最短欧式距离d作为约束条件,确定归属最终聚类中的簇类S;遍历聚类中心,继续求解与欧式距离最短的所述水文特征要素组合;当最小且小于阈值时,相当于两个组合相似度U最高,视为匹配成功;否则,视为匹配失败;否则,视为匹配失败;其中,阈值根据社会需求的单次测验误差要求确定;Q
S
为距离最短水文特征要素组合对应的流量值;S7、若匹配成功,则根据相似度最高的所述水文特征要素组合找出对应的流量值,并建立与该河道断面传统流量实时推求方法结果优选模型;S8、若匹配不成功,将当前所述水文特征要素组合作为新的组合,与对应的流量点组成新的样本,纳入水文特征要素聚类数据仓库D中。2.根据权利要求1所述的一种河道断面流量实时智能推求方法,其特征在于,所述确定水文特征要素组合具体包括以下步骤:S21、建立Wrapper包装法模型,选择递归特征消除法作为所述Wrapper包装法模型中的算法;S22、选择所述递归特征消除法中的逐步回归子模型对模型进行机器学习和数据训练;反复的构建所述逐步回归子模型,自动从样本集W的训练集中逐个引入水文要素,所述引入水文要素的条件是偏回归平方...

【专利技术属性】
技术研发人员:梅军亚香天元赵昕张亭牟芸邓山陈瑜彬吴琼张莉朱子园
申请(专利权)人:长江水利委员会水文局
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1