System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及一种根石险情预测方法、装置、系统及存储介质,属于水伏器件变量与性能预测。
技术介绍
1、根石是防洪工程的主要构成部分,如果能在根石出现早期异常或者走失前兆时进行预测,将有效降低防洪工程损毁风险概率。
2、根石险情分析和判识目前存在以下不足和缺陷:
3、(1)判识技术智能化程度低。当前利用对监测设备设定报警阈值的方法判识根石险情,然而阈值报警难以分辨传感器受水流冲击出现的监测数据异常、缺失等非险情情况,需要管理人员进行反复的对比、赶赴现场开展调研,增加了河段管理人员的负担。
4、(2)险情判识决策能力不足。由于根石险情对防洪工程安全影响较大,因此一旦出现需要快速分析并提出对策。一直以来阈值法以及其他远程判识方法将全部异常均归结为根石险情,导致人力物力资源的浪费。
5、(3)传统方法通用性不高。不同地区的自然地理条件、监测要素数据类型、管理人员经验丰富程度等方面有所差别,传统方法在不同河段的分析预测效果无法发挥实际作用。
技术实现思路
1、本专利技术的目的在于提供一种根石险情预测方法、装置、系统及存储介质,能够提高根石险情预测的效率和准确率。
2、为达到上述目的,本专利技术提供如下技术方案:
3、第一方面,本专利技术提供一种根石险情预测方法,包括:
4、获取根石险情影响因素多源数据,并基于所述根石险情影响因素多源数据,构建特征数据集;
5、将所述特征数据集输入至预构建的根石险情
6、其中,所述根石险情影响因素多源数据包括结构化数据和非结构化数据;所述根石险情预测模型是基于极限梯度提升树算法构建的;在进行根石险情预测时,基于混淆矩阵,利用网格搜索法结合交叉验证法,对所述根石险情预测模型进行参数优化。
7、结合第一方面,进一步的,所述根石险情影响因素多源数据包括水文数据和监测设备工情工况数据;
8、所述水文数据包括根石所在区域的降水、水位、流量、紊流能;
9、所述监测设备工情工况数据包括根石传感器的功能模式、上报模式、偏移角度、检测周期、上报频率、报警角度、数据对接端口、通信信号强度、电压值;
10、其中,水位、流量、上报模式、偏移角度、检测周期、上报频率、报警角度、数据对接端口、通信信号强度、电压值为数值型数据;降水、紊流能为图像数据;功能模式为文本型数据。
11、结合第一方面,进一步的,基于所述根石险情影响因素多源数据,构建特征数据集包括:
12、对所述根石险情影响因素多源数据进行数据处理,获取特征数据;
13、由各所述特征数据共同构成特征数据集;
14、其中,对所述根石险情影响因素多源数据进行数据处理,获取特征数据包括:
15、对所述根石险情影响因素多源数据中的结构化数据和非结构化数据进行数据汇集、数据融合,将所述非结构化数据转化为结构化数据;
16、对所述结构化数据进行数据清洗,将所述结构化数据进行数据对齐,删除所述结构化数据中的缺失值、异常值,并对所述结构化数据进行特征编码,获取特征数据。
17、结合第一方面,进一步的,所述根石险情预测模型为:
18、;
19、其中,表示根石险情预测模型输入的第个特征数据集,表示根石险情预测模型输出的所对应的根石险情预测结果,表示根石险情预测模型中第个树对的根石险情分类结果,表示根石险情预测模型中树的总数;
20、每次预测时,所述根石险情预测模型基于所述特征数据集中特征数据对根石险情影响的重要性进行根石险情分类,获取根石险情分类结果;
21、其中,所述特征数据对根石险情影响的重要性的计算公式为:
22、;
23、其中,表示特征数据对根石险情影响的重要性,、表示根石险情预测模型左、右叶子节点中特征数据的一阶梯度,、表示根石险情预测模型左、右叶子节点中特征数据的二阶梯度,表示第一调节参数,表示计算复杂度控制变量。
24、结合第一方面,进一步的,在进行根石险情预测时,基于混淆矩阵,利用网格搜索法结合交叉验证法,对所述根石险情预测模型进行参数优化包括:
25、基于所述根石险情预测模型待优化的参数和预设参数范围,构建参数网格,并利用网格搜索法遍历所述参数网格中的每个点,其中,所述参数网格中的每个点对应一组参数组合;
26、基于交叉验证法,将所述特征数据集随机划分为个互斥子集,依次使用每个子集作为测试集,其余子集作为训练集,对所述根石险情预测模型进行次训练和测试,并基于混淆矩阵,对所述根石险情预测模型进行性能评价,获取每组参数组合所对应的根石险情预测模型的性能评价结果;
27、基于所述性能评价结果,获取所述根石险情预测模型的最优参数组合。
28、结合第一方面,进一步的,对所述根石险情预测模型进行训练时,所述根石险情预测模型的目标函数为:
29、;
30、其中,表示根石险情预测模型输出的所对应的根石险情预测结果,表示根石险情预测模型输入的第个特征数据,表示所对应的真实结果,表示损失函数,表示训练集中特征数据的总数,表示根石险情预测模型中第个树对的根石险情分类结果,表示正则项,表示根石险情预测模型中树的总数。
31、结合第一方面,进一步的,所述混淆矩阵为:
32、;
33、其中,、、表示根石险情真实结果为高时根石险情预测模型输出的根石险情预测结果为高、中、低的概率,、、表示根石险情真实结果为中时根石险情预测模型输出的根石险情预测结果为高、中、低的概率,、、表示根石险情真实结果为低时根石险情预测模型输出的根石险情预测结果为高、中、低的概率,其中,高表示根石位移大于预设阈值且持续变化、根石走失,中表示根石位移大于预设阈值且保持稳定、根石传感器异常,低表示根石位移小于或等于预设阈值且保持稳定;
34、所述根石险情预测模型的性能评价指标包括准确率、精确率、召回率和平衡f分数;
35、其中,所述准确率的计算公式为:
36、;
37、其中,表示根石险情预测模型的准确率;
38、所述精确率的计算公式为:
39、;
40、其中,表示根石险情预测模型的精确率;
41、所述召回率的计算公式为:
42、;
43、其中,表示根石险情预测模型的召回率;
44、所述平衡f分数的计算公式为:
45、;
46、其中,表示根石险情预测模型的平衡f分数,表示权重因子。
47、结合第一方面,进一步的,所述根石险情预测模型待优化的参数包括提升器类型、学习率、迭代次数、树的最大深度、子节点最小权重、分裂所需最小损失减少、子采样比例、列采样比例、线程数、l1正则化项系数、随机种子。
48本文档来自技高网...
【技术保护点】
1.一种根石险情预测方法,其特征在于,包括:
2.根据权利要求1所述的根石险情预测方法,其特征在于,所述根石险情影响因素多源数据包括水文数据和监测设备工情工况数据;
3.根据权利要求1所述的根石险情预测方法,其特征在于,基于所述根石险情影响因素多源数据,构建特征数据集包括:
4.根据权利要求1所述的根石险情预测方法,其特征在于,所述根石险情预测模型为:
5.根据权利要求1所述的根石险情预测方法,其特征在于,在进行根石险情预测时,基于混淆矩阵,利用网格搜索法结合交叉验证法,对所述根石险情预测模型进行参数优化包括:
6.根据权利要求5所述的根石险情预测方法,其特征在于,对所述根石险情预测模型进行训练时,所述根石险情预测模型的目标函数为:
7.根据权利要求5所述的根石险情预测方法,其特征在于,所述混淆矩阵为:
8.根据权利要求5所述的根石险情预测方法,其特征在于,所述根石险情预测模型待优化的参数包括提升器类型、学习率、迭代次数、树的最大深度、子节点最小权重、分裂所需最小损失减少、子采样比例、列采样比例、
9.一种根石险情预测装置,其特征在于,包括:
10.一种计算机系统,其特征在于,包括:
...【技术特征摘要】
1.一种根石险情预测方法,其特征在于,包括:
2.根据权利要求1所述的根石险情预测方法,其特征在于,所述根石险情影响因素多源数据包括水文数据和监测设备工情工况数据;
3.根据权利要求1所述的根石险情预测方法,其特征在于,基于所述根石险情影响因素多源数据,构建特征数据集包括:
4.根据权利要求1所述的根石险情预测方法,其特征在于,所述根石险情预测模型为:
5.根据权利要求1所述的根石险情预测方法,其特征在于,在进行根石险情预测时,基于混淆矩阵,利用网格搜索法结合交叉验证法,对所述根石险情预测模型进行参数优化包括:
...【专利技术属性】
技术研发人员:丁炜,金有杰,林艳燕,李绪鹏,陈季,王岩,吴亮,
申请(专利权)人:水利部南京水利水文自动化研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。