当前位置: 首页 > 专利查询>福州大学专利>正文

一种基于STL-LSTM的地铁客流预测方法技术

技术编号:24171498 阅读:128 留言:0更新日期:2020-05-16 03:06
本发明专利技术涉及一种基于STL‑LSTM的地铁客流预测方法,首先,计算统计周期内的地铁客运量数据;使用STL加法模型对地铁客运量数据进行分解,得到3个分解序列;接着,设定LSTM参数,建立LSTM预测模型。对3个分解序列使用相同参数的LSTM模型进行训练,并进行测试集预测。然后,把3个分解序列的测试集预测结果相加得到地铁数据测试集的预测结果,计算平均相对误差;修改分解周期及时间步长,重复上述过程,平均相对误差基本稳定时停止修改;最后,用测试集平均相对误差最小的模型对得到的3个序列的预测步长后的客运量进行预测,将结果相加,得到最终预测结果。本发明专利技术可以提升对地铁客流预测的精度。

【技术实现步骤摘要】
一种基于STL-LSTM的地铁客流预测方法
本专利技术涉及地铁客流预测领域,特别是一种基于STL-LSTM的地铁客流预测方法。
技术介绍
地铁客流是地铁运营管理的重要依据,对地铁未来客流进行准确预测对地铁运营部门调整行车计划有着重要的意义。考虑到地铁客流有明显的周期性、趋势性和随机性,在建立预测模型时应予以体现。对时间序列进行分解能剔除周期因素的影响,反映时间序列真正的客观规律和趋势。近些年已经有很多研究人员对其展开深入研究。时间序列分解模型根据采取的策略不同,可以分为X11系列、X12系列、SABL、小波分析和EMD等。这些模型可以较好的对时间序列进行分解,对提升预测精度也有一定帮助,但上述模型并不能充分发挥地铁的客流特性。STL分解模型将时间序列分解为周期序列、趋势序列和随机序列,与地铁客流的周期性、趋势性和随机性相对应。目前已有一些学者对STL分解模型进行研究,也取得了一定的成果,但并没有将模型应用于地铁客流预测领域。STL将客流分解为周期序列、趋势序列和随机序列,但是地铁客流数据的趋势性不是很明显,地铁客流数据的周期性也是以周为主,STL对地铁客流数据的有效性还有待验证。
技术实现思路
有鉴于此,本专利技术的目的是提供一种基于STL-LSTM的地铁客流预测方法,可以提升对地铁客流预测的精度。本专利技术采用以下方案实现:一种基于STL-LSTM的地铁客流预测方法,包括以下步骤:步骤S1:从AFC地铁刷卡数据中获取统计周期内的地铁客运量,得到原始时间序列;>步骤S2:确定分解周期,使用STL加法模型对S1的地铁客运量数据进行分解,得到3个分解序列;步骤S3:设定神经元个数、学习率、误差值计算公式、训练次数、激活函数、抽样数量、输入维度、时间步长、预测步长以建立LSTM预测模型,设置三个分解序列的训练集和测试集的比例均为x:y,所述x,y皆为大于1且小于输入地铁客运量数据个数的整数;分别对S2得到的3个分解序列使用相同参数的LSTM模型输入训练集进行训练,并分别对它们的测试集进行预测;步骤S4:把3个分解序列的测试集的预测结果相加得到步骤S1地铁数据测试集的预测结果,计算平均相对误差;步骤S5:参数调整,修改步骤S2中的分解周期及步骤S3中的时间步长,重复步骤S2到步骤S4的过程,当平均相对误差前后相差0.01%时停止修改,用以寻找精度最高的参数组合;步骤S6:用测试集平均相对误差最小的模型对步骤S2得到的3个序列的预测步长后的客运量进行预测,将结果相加得到最终预测结果。进一步地,所述步骤S2具体包括以下步骤:步骤S21:确定分解周期:分解周期T为大于1的正整数,T∈(2,3,...,N),N<l,l为时间序列长度;步骤S22:使用STL加法模型分解出趋势项Tt:yt=Seasonalt+Tt+Randomt(1)其中,t为时刻,yt为t时刻的地铁客运量,Seasonalt、Tt、Randomt分别是t时刻的周期成分、趋势成分、随机成分;其中,Tt为趋势项,f为时间频率,l为时间序列长度,Tt是长度为l的趋势序列,当时刻t超出定义域时,值为NA,f为奇数时用公式(2)计算,f为偶数时用公式(3)计算;步骤S23:计算季节项:将原始序列减去趋势项:St=yt-Tt(4)将各个周期内相同频率下的值平均化,得到季节项figure:将figure中心化,得到中心化的长度为f的季节项figure;将长度为f的季节项扩展成长度为l的季节项Seasonal:Seasonalt=figuret%%f,其中%%为取余运算;(6)步骤S24:计算随机项Randomt:Randomt=yt-Tt-Seasonalt(7)其中,Xt表示t时刻的地铁客运量,Randomt表示t时刻的随机成分,Tt表示t时刻的趋势成分,Seasonalt表示t时刻的季节成分。通过步骤S22至步骤S24将地铁客运量y,分解成趋势序列T,周期序列Seasonal和随机序列Random。进一步地,所述步骤S3具体包括以下步骤:步骤S31:分别对3个序列的数据进行归一化,将数据变成0到1之间的小数;步骤S32:设定LSTM隐藏神经元个数,取值范围为大于1且小于训练集数据个数的整数;设定学习率,取值为0到1;设置抽样数量,所述抽样数量大小必须大于或等于1且小于或等于训练数据集中的样本数;训练次数为1和无穷大之间的整数值;设置误差计算公式和激活函数;设置输入维度即特征个数,时间步长即输入的长度和预测步长,输入时间步长个数据得到预测步长个的数据;步骤S33:设置训练集与测试集的比例为x:y,每个序列使用相同参数的LSTM进行时间序列曲线拟合,用训练集拟合的曲线预测测试集的地铁客运量,即输入测试集时间步长个数据,得到预测步长个地铁客运量,用滑动窗口的形式即每次往后移动一个数据预测测试集的所有数据;步骤S34:修改时间步长,重复步骤S32和步骤S33。进一步地,所述步骤S4涉及的测试集的平均相对误差计算公式如下:其中,表示Qi'是第i个预测客运量,Qi表示第i个实际客运量,n为测试集数据个数。进一步地,步骤S32中所述误差值计算包括选取均方误差MSE来计算:或选取平均绝对误差MAE来计算:进一步地,步骤S32中所述激活函数计算包括选择Logistic函数:或Tanh函数:与现有技术相比,本专利技术具有以下有益效果:本专利技术一方面是用STL分解模型将原始客流数据分解成周期序列、趋势序列和随机序列,提升了预测精度;另一方面是将STL分解与LSTM预测模型相结合,将地铁客运量数据分解后的数据,分别作为LSTM的输入,将3个序列的结果相加得到最后预测结果,拓宽了STL分解的应用领域。附图说明图1为本专利技术实施例的流程图。图2为本专利技术实施例的分解周期为2-4的分解结果图。图3为本专利技术实施例的分解周期与测试集平均误差变化情况图。图4为本专利技术实施例的测试集误差对比图。具体实施方式下面结合附图及实施例对本专利技术做进一步说明。应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。如图1所示,本实施例一种基于STL-LSTM的地铁客流预测方法,包括以下本文档来自技高网...

【技术保护点】
1.一种基于STL-LSTM的地铁客流预测方法,其特征在于:包括以下步骤:/n步骤S1:从AFC地铁刷卡数据中获取统计周期内的地铁客运量,得到原始时间序列;所述统计周期包括天或小时;/n步骤S2:确定分解周期,使用STL加法模型对步骤S1的地铁客运量数据进行分解,得到3个分解序列;/n步骤S3:设定神经元个数、学习率、误差值计算公式、训练次数、激活函数、抽样数量、输入维度、时间步长、预测步长以建立LSTM预测模型,设置三个分解序列的训练集和测试集的比例均为x:y,所述x,y皆为大于1且小于输入地铁客运量数据个数的整数;分别对步骤S2得到的3个分解序列使用相同参数的LSTM模型输入训练集进行训练,并分别对它们的测试集进行预测;/n步骤S4:把3个分解序列的测试集的预测结果相加得到步骤S1地铁数据测试集的预测结果,计算平均相对误差;/n步骤S5:参数调整,修改步骤S2中的分解周期及步骤S3中的时间步长,重复步骤S2到步骤S4的过程,当平均相对误差前后相差0.01%时停止修改,用以寻找精度最高的参数组合;/n步骤S6:用测试集平均相对误差最小的模型对步骤S2得到的3个序列的预测步长后的客运量进行预测,将结果相加得到最终预测结果。/n...

【技术特征摘要】
1.一种基于STL-LSTM的地铁客流预测方法,其特征在于:包括以下步骤:
步骤S1:从AFC地铁刷卡数据中获取统计周期内的地铁客运量,得到原始时间序列;所述统计周期包括天或小时;
步骤S2:确定分解周期,使用STL加法模型对步骤S1的地铁客运量数据进行分解,得到3个分解序列;
步骤S3:设定神经元个数、学习率、误差值计算公式、训练次数、激活函数、抽样数量、输入维度、时间步长、预测步长以建立LSTM预测模型,设置三个分解序列的训练集和测试集的比例均为x:y,所述x,y皆为大于1且小于输入地铁客运量数据个数的整数;分别对步骤S2得到的3个分解序列使用相同参数的LSTM模型输入训练集进行训练,并分别对它们的测试集进行预测;
步骤S4:把3个分解序列的测试集的预测结果相加得到步骤S1地铁数据测试集的预测结果,计算平均相对误差;
步骤S5:参数调整,修改步骤S2中的分解周期及步骤S3中的时间步长,重复步骤S2到步骤S4的过程,当平均相对误差前后相差0.01%时停止修改,用以寻找精度最高的参数组合;
步骤S6:用测试集平均相对误差最小的模型对步骤S2得到的3个序列的预测步长后的客运量进行预测,将结果相加得到最终预测结果。


2.根据权利要求1所述的一种基于STL-LSTM的地铁客流预测方法,其特征在于:所述步骤S2具体包括以下步骤:
步骤S21:确定分解周期:
分解周期T为大于1的正整数,T∈(2,3,...,N),N<l,l为时间序列长度;
步骤S22:使用STL加法模型分解出趋势项Tt:
yt=Seasonalt+Tt+Randomt(1)
其中,t为时刻,yt为t时刻的地铁客运量,Seasonalt、Tt、Randomt
分别是t时刻的周期成分、趋势成分、随机成分;






其中,Tt为趋势项,f为时间频率,l为时间序列长度,Tt是长度为l的趋势序列,当时刻t超出定义域时,值为NA,f为奇数时用公式(2)计算,f为偶数时用公式(3)计算;
步骤S23:计算季节项:
将原始序列减去趋势项:
St=yt-Tt(4)
将各个周期内相同频率下的值平均化,得到季节项figure:



将figure中心化,得到中心化的长度为f的季节项figure;
将长度为f的季节项扩展成长度为l的季节项S...

【专利技术属性】
技术研发人员:陈德旺张建华江世雄
申请(专利权)人:福州大学
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1