当前位置: 首页 > 专利查询>湖南大学专利>正文

基于相空间重构和基因表达式编程的日用水量预测方法技术

技术编号:32024282 阅读:14 留言:0更新日期:2022-01-22 18:49
本发明专利技术提供一种基于相空间重构和基因表达式编程的日用水量预测方法,包括如下步骤:采集供水管网的历史用水量数据,形成训练集;针对所述训练集中任意点,基于相空间重构方法计算互信息和虚假临近点获取最佳的延迟时间和嵌入维数,对训练集进行重构;用基因表达式编程模型对重构后的训练集进行训练,构建基于角度的收敛函数,训练直至收敛,最终得到用水量预测的函数式,利用所述函数式进行日用水量的预测。本发明专利技术提供的基于相空间重构和基因表达式编程的日用水量预测方法利用相空间重构方法有利于指导相关技术人员加强对供水系统的认知,同时可以快速的收敛到一个最优目标。同时可以快速的收敛到一个最优目标。

【技术实现步骤摘要】
基于相空间重构和基因表达式编程的日用水量预测方法


[0001]本专利技术涉及供水管网
,具体涉及一种基于相空间重构和基因表达式编程的日用水量预测方法。

技术介绍

[0002]用水量预测分为短期预测和中长期预测。中长期预测通常为月和年用水量预测,主要用于城市供水管网建设的优化。短期预测通常为时和日用水量预测,主要用来对供水系统进行优化配置。准确的日用水量预测可以提高供水系统的管理效率并降低调度成本节约资源。近些年,数据驱动的方法在用水量预测问题上得到了广泛应用。预测中,大量的算法除了需要历史用水量数据还要求有温度、人口、降水量等多个相关变量的历史数据,以提高模型准确率。但是,在实际应用中并非所有的水务公司都能按要求提供大量的多维数据,而用水量数据是最基本的保障。面对该问题,研究者提出了自回归综合移动平均模型(ARIMA)、人工神经网络(ANN)、支持向量机模型(SVM)、极限学习机模型(ELM)和长短期记忆网络模型(LSTM)等多种预测模型。但是这些模型大多数存在模型参数过多,训练耗时的问题,并且需要较高的采样频率。不适用于每日仅采集一个数据的管网用水量预测任务。因此,实有必要提供一种基于相空间重构和基因表达式编程的日用水量预测方法以解决上述问题。

技术实现思路

[0003]本专利技术公开了一种基于相空间重构和基因表达式编程的日用水量预测方法,利用相空间重构方法将一维数据映射到多维空间,增加数据的信息量,有利于更好的辨识系统,然后采用基因表达式编程模型得出一个确定的数学模型,有利于指导相关技术人员加强对供水系统的认知,同时可以快速的收敛到一个最优目标。
[0004]为实现上述目的,本专利技术的技术方案为:
[0005]一种基于相空间重构和基因表达式编程的日用水量预测方法,包括如下步骤:
[0006]S1:采集供水管网的历史用水量数据,形成训练集;
[0007]S2:针对所述训练集中任意点,基于相空间重构方法计算互信息和虚假临近点获取最佳的延迟时间和嵌入维数,对训练集进行重构;
[0008]S3:用基因表达式编程模型对重构后的训练集进行训练,构建基于角度的收敛函数,训练直至收敛,最终得到用水量预测的函数式,利用所述函数式进行日用水量的预测。
[0009]优选的,所述步骤S2包括如下步骤:
[0010]S21:历史用水量数据的时间序列为x=(x1,x2,

x
n
),n为历史用水量数据的采集天数,通过相空间重构得到m维相空间如下:
[0011][0012]其中,m为嵌入维数,τ为延迟时间;
[0013]S22:延迟时间τ通过互信息法获取,对于供水时间序列X,求解向量X
i
和X
i+τ
的互信息I
τ
,公式如下:
[0014][0015]其中,P(X
i
)和P(X
i+τ
)分别是向量X
i
和X
i+τ
的概率,P(X
i
,X
i+τ
)是向量X
i
和X
i+τ
联合分布概率,取互信息I
τ
第一个极小值所对应的τ为最佳延迟时间;
[0016]S23:嵌入维数m通过虚假邻近点法获取,m维空间中,相点X(i)与其邻近点X
η
(i)的距离表示为:
[0017]R
m
(i)=||X(i)

X
η
(i)||
[0018]当嵌入维数从m增加到(m+1)时,定义R来比较m维嵌入空间和(m+1)维嵌入空间的距离:
[0019][0020]当R>R
tol
=15时,则邻近点X
η
(i)为相点X(i)的虚假邻近点,当相点X(i)的虚假邻近点的比例小于1%时,得到有效的嵌入维数m,R
tol
表示阈值,其根据经验值获取,取R
tol
=15。
[0021]优选的,所述步骤S3包括如下步骤:
[0022]S31:确定终点符号集和函数符号集,终点符号集为:(a1,a2,

,a
m
),函数符号集为:
[0023]S32:利用终点符号集和函数符号集随机组合构成初始化种群,初始化群体为100个,基因头部长为8,每个染色体共计3个基因;
[0024]S33:计算种群中每个个体的适应度,采用基于角度的适应度函数评价个体,假设t时刻的真实值为Y
t
,预测值为Y
p
,则预测值与真实值的角度误差为:
[0025][0026]其中,表示t

1时刻到t时刻的向量,表示向量的模;
[0027]S34:保留角度误差θ值最小的三个最优个体进入下一代,其余个体进行变异,复制,选择及基因重组操作生成新的个体,与保存下来的三个最优个体构成新的种群;
[0028]S35:返回步骤S33,依次循环,直至迭代300次,选出θ值最小的个体作为适应度最
好的个体;
[0029]S36:对适应度最好的个体进行解析,最终得到用水量预测的函数式Y
p
=f(x),利用所述函数式进行日用水量的预测。
[0030]与相关技术相比,本专利技术提供的基于相空间重构和基因表达式编程的日用水量预测方法,利用相空间重构方法将一维数据映射到多维空间,增加数据的信息量,有利于更好的辨识系统,然后采用基因表达式编程模型得出一个确定的数学模型,有利于指导相关技术人员加强对供水系统的认知,同时可以快速的收敛到一个最优目标。
【具体实施方式】
[0031]为了使本
的人员更好地理解本专利技术实施例中的技术方案,并使本专利技术的上述目的、特征和优点能够更加明显易懂,下面对本专利技术的具体实施方式作进一步的说明。
[0032]本专利技术提供了一种基于相空间重构和基因表达式编程的日用水量预测方法,包括如下步骤:
[0033]S1:采集供水管网的历史用水量数据,形成训练集。
[0034]供水量的预测需要以历史用水量的数据作为基础,历史用水量以天为单位进行采集。可以理解的是,采样的时间越长,则越能全面的反应供水管网的用水规律,因此,在本实施方式中,采样的时长至少为3个月。
[0035]S2:针对所述训练集中任意点,基于相空间重构方法计算互信息和虚假临近点获取最佳的延迟时间和嵌入维数,对训练集进行重构。
[0036]由于收集到的历史用水量数据为一维数据,能够反映出的有效信息是有限的,很难从一维时间序列认识到整个供水系统的复杂性和全面性,因此本专利技术通过基于坐标延迟的相空间重构方法将一维数据重构成多维数据。基于坐标延迟的相空间重构方法的本质是通过一维的时间序列{(x
i
)}的不同延迟时间τ来构建多维的相空间矢量。...

【技术保护点】

【技术特征摘要】
1.一种基于相空间重构和基因表达式编程的日用水量预测方法,其特征在于,包括如下步骤:S1:采集供水管网的历史用水量数据,形成训练集;S2:针对所述训练集中任意点,基于相空间重构方法计算互信息和虚假临近点获取最佳的延迟时间和嵌入维数,对训练集进行重构;S3:用基因表达式编程模型对重构后的训练集进行训练,构建基于角度的收敛函数,训练直至收敛,最终得到用水量预测的函数式,利用所述函数式进行日用水量的预测。2.根据权利要求1所述的基于相空间重构和基因表达式编程的日用水量预测方法,其特征在于,所述步骤S2包括如下步骤:S21:历史用水量数据的时间序列为x=(x1,x2,

x
n
),n为历史用水量数据的采集天数,通过相空间重构得到m维相空间如下:其中,m为嵌入维数,τ为延迟时间;S22:延迟时间τ通过互信息法获取,对于供水时间序列X,求解向量X
i
和X
i+τ
的互信息I
τ
,公式如下:其中,P(X
i
)和P(X
i+τ
)分别是向量X
i
和X
i+τ
的概率,P(X
i
,X
i+τ
)是向量X
i
和X
i+τ
联合分布概率,取互信息I
τ
第一个极小值所对应的τ为最佳延迟时间;S23:嵌入维数m通过虚假邻近点法获取,m维空间中,相点X(i)与其邻近点X
η
(i)的距离表示为:R
m
(i)=||X(i)

【专利技术属性】
技术研发人员:张英杰孙庆帅李佳林
申请(专利权)人:湖南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1