System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及交通运输领域,尤其涉及一种地铁站点客流的预测模型选取、预测方法及装置。
技术介绍
1、随着居民生活水平的不断提高,城市中道路交通的压力也越来越大,越来越多的人们选择地铁出现,地铁出行逐渐成为交通的主流选择之一。于此随之带来的是地铁客流量在不同时期具有变化大的特点,这对地铁的客流量预测提出了更高的要求。
2、目前对于地铁客流预测的研究主要集中在对整个车站群或或整个线路的客流进行全局预测,对于基于车站自身客流特征的精确预测研究尚不充分。然而,不同车站之间的客流规律和特征可能存在较大差异,因此仅仅依靠全局预测无法准确捕捉到各个车站的客流变化趋势和特点。此外,不同类型的车站在客流变化趋势上可能存在差异,因此某一种车站预测方法并不一定适用于所有类型的车站。综上所述,现有技术在基于车站自身客流特征的精确预测方面存在不足,需要进一步研究和开发新的方法和模型来解决这些问题。
技术实现思路
1、本专利技术提供了一种地铁站点客流的预测模型选取、预测方法及装置,以解决无法对每个地铁站点选用合适的客流预测模型,提高地铁站点客流预测准确度的技术问题。
2、为了解决上述技术问题,本专利技术实施例提供了一种地铁站点客流的预测模型选取方法,包括:
3、获取每个站点各个时段的进出客流表;
4、根据预设的聚类个数,将所述每个站点的进出客流表输入预设的k-means模型进行聚类,得到每种聚类个数对应的站点簇群;
5、根据所述每种聚类个数对应的站点
6、将所述每个站点簇的代表站点的进出站客流表依次输入至预设的若干个算法模型中,得到每个算法模型对每个站点簇的代表站点的客流预测结果;
7、使用预设的评估模型对所述每个预测结果进行评估,得到每个站点簇的代表站点的最优客流预测模型,并结合所述代表站点的所属站点簇,得到每个站点的最优客流预测模型。
8、可以理解的是,相对于现有技术,本专利技术通过k-means模型对每个地铁站点进行聚类,得到了站点簇群,对于站点簇群中的每个簇,属于同个簇的站点之间有着更为相似的客流特征,能够划分为同一类型的站点;之后通过轮廓系数得到了聚类效果最好的最优站点簇群,根据欧式距离求得最优站点簇群中每个簇的代表站点,代表站点可以最大化体现车站的特性和提高客流预测模型的适用性;接着将代表站点的进出客流数据输入至多个预测模型得到了多个预测结果,并用评估模型对预测结果进行评估;最后得到了最合适代表站点的客流预测模型;由于代表站点最大化的体现了所述站点类型的客流特征,因此能够将代表站点的最优客流预测模型作为代表站点所述簇中的其他站点的最优客流预测模型,得到了每个地铁站点的最优客流预测模型,进而避免了不同客流特征的车站共用一个客流预测模型,提高了地铁站点的客流预测准确度。
9、作为优选方案,所述获取每个站点各个时段的进出客流表,具体为:
10、获取地铁站点的出入站客流数据,对出入站客流数据进行客流特征和站点信息提取,其中,所述出入站客流数据包括:电子交通卡刷卡数据和电子交通卡扫码数据;根据预设的时间段划分规则,统计每个时间段下每个站点的进出客流量,得到初始进出客流表;对初始进出客流表进行数据清洗和归一化,得到所述每个站点各个时段的进出客流表;
11、通过对进出客流表的数据清洗,可以避免错误数据、缺失数据对后续客流预测模型造成不良影响;通过归一化处理,避免因为不同特征的数据取值范围差异过大,进而影响到后续基于距离的算法。
12、作为优选方案,所述根据所述每种聚类个数对应的站点簇群,结合轮廓系数和欧式距离得到最优站点簇群和最优站点簇群中每个站点簇的代表站点,具体为:
13、计算每种聚类个数对应的站点簇群的轮廓系数,根据轮廓系数最大原则选择最优的聚类个数和对应的最优站点簇群;其中,轮廓系数最大原则为:在进行聚类分析时,选择最优的聚类数使聚类结果的轮廓系数最大。
14、获取所述最优站点簇群中每个簇的中心点坐标,分别计算每个站点与所属簇的簇中心点坐标之间的欧式距离,选择每个站点簇中与对应的簇中心点坐标欧式距离最小的站点作为每个站点簇的代表站点。
15、通过轮廓系数和欧式距离,可以得到聚类效果更好的站点簇群,这样得到的站点簇群中的每个簇之中的站点,具有更为相似的客流特征,使得选取出来的代表站点更具有代表性,能够更好的代表同一类型站点进行客流预测。
16、作为优选方案,所述计算每种聚类个数对应的站点簇群的轮廓系数,具体为:
17、依次选取每种聚类个数对应的站点簇群,分别计算每个站点簇群中的每个站点的轮廓系数:
18、
19、其中,a(i)为站点i与同个站点簇中其他站点的平均距离,b(i)为站点i与最近邻站点簇中其他站点的平均距离,max{a(i),b(i)};
20、对属于同一个簇群的所有站点的轮廓系数进行相加求平均数,得到所述簇群的轮廓系数:
21、
22、其中,s为所述簇群的轮廓系数,n为所述簇群中的站点个数。
23、通过计算不同聚类个数下的每个车站站点簇群的轮廓系数,根据轮廓系数最大原则选出的最优站点簇群,具备了同一个簇中站点具有更为相似的客流特征和不同簇之间的站点具有较大差异性的客流特征的特点,能够更好的为选出每个站点簇的代表车站提供基础。
24、作为优选方案,所述计算每个站点与所属簇的簇中心点坐标之间的欧式距离,具体为:
25、获取每个站点和所属簇的簇中心点坐标在每个维度的数值,分别计算个站点与所属簇的簇中心点坐标之间的欧式距离:
26、
27、其中,a为所述站点,b为所述站点所属簇的簇中心点,xi为a站点在第i个维度的数值,yi为所述站点所属簇的簇中心点在第i个维度的数值。
28、通过计算每个簇中心点坐标与簇中各站点的欧式距离,根据欧式距离选出代表站点,可以更好的代表所述簇中的各个站点的客流特征,提高了代表站点在后续预测模型中的适用性。
29、作为优选方案,所述将所述每个站点簇的代表站点的进出站客流表依次输入至预设的若干个算法模型中,得到每个算法模型对每个站点簇的客流预测结果,具体为:
30、获取预设的若干个初始算法模型和所述每个站点簇的代表站点的进出站客流表,将进出站客流表划分为训练集和测试集,其中,所述若干个初始算法模型包括:决策树模型、bagging模型和随机森林模型;
31、将训练集数据分别输入至每个初始算法模型进行模型训练;训练完成之后,将测试集数据分别输入至每个训练完成的算法模型,得到所述述每个站点簇的代表站点的客流预测结果。
32、通过将代表站点的进出客流表输入多个预测模型,得到多个预测结果,能够使得最终得到的车站站点的最优预测模型更具备实用性和准确性。
33、作为本文档来自技高网...
【技术保护点】
1.一种地铁站点客流的预测模型选取方法,其特征在于,包括:
2.如权利要求1所述的一种地铁站点客流的预测模型选取方法,其特征在于,所述获取每个站点各个时段的进出客流表,具体为:
3.如权利要求1所述的一种地铁站点客流的预测模型选取方法,其特征在于,所述根据所述每种聚类个数对应的站点簇群,结合轮廓系数和欧式距离得到最优站点簇群和最优站点簇群中每个站点簇的代表站点,具体为:
4.如权利要求3所述的一种地铁站点客流的预测模型选取方法,其特征在于,所述计算每种聚类个数对应的站点簇群的轮廓系数,具体为:
5.如权利要求3所述的一种地铁站点客流的预测模型选取方法,其特征在于,所述计算每个站点与所属簇的簇中心点坐标之间的欧式距离,具体为:
6.如权利要求1所述的一种地铁站点客流的预测模型选取方法,其特征在于,所述将所述每个站点簇的代表站点的进出站客流表依次输入至预设的若干个算法模型中,得到每个算法模型对每个站点簇的客流预测结果,具体为:
7.如权利要求6所述的一种地铁站点客流的预测模型选取方法,其特征在于,所述将训练集数据
8.如权利要求1所述的一种地铁站点客流的预测模型选取方法,其特征在于,所述使用预设的评估模型对所述每个预测结果进行评估,得到每个站点簇的代表站点的最优客流预测模型,并结合所述代表站点的所属站点簇,得到每个站点的最优客流预测模型,具体为:
9.一种地铁站点客流的预测方法,其特征在于,包括:
10.一种地铁站点客流的预测模型的选取装置,其特征在于,包括:数据获取与处理模块、聚类模块、站点选取模块、预测模块和评估模块;
11.如权利要求10所述的一种地铁站点客流的预测模型的选取装置,其特征在于,所述数据获取与处理模块,包括:数据获取与处理单元;
12.如权利要求10所述的一种地铁站点客流的预测模型的选取装置,其特征在于,所述站点选取模块,包括:站点选取单元;
13.如权利要求10所述的一种地铁站点客流的预测模型的选取装置,其特征在于,所述站点选取单元,包括:轮廓系数计算子单元和欧式距离计算子单元;
14.如权利要求10所述的一种地铁站点客流的预测模型的选取装置,其特征在于,所述预测模块,包括:预测单元;
15.如权利要求14所述的一种地铁站点客流的预测模型的选取装置,其特征在于,所述预测单元,包括:模型训练子单元;
16.如权利要求10所述的一种地铁站点客流的预测模型的选取装置,其特征在于,所述评估模块,包括:评估单元、最优模型选取单元和站点模型确定单元;
17.一种地铁站点客流的预测装置,其特征在于,包括:数据处理模块、客流预测模块和如权利要求10至16任意一项所述的地铁站点客流的预测模型的选取装置;
...【技术特征摘要】
1.一种地铁站点客流的预测模型选取方法,其特征在于,包括:
2.如权利要求1所述的一种地铁站点客流的预测模型选取方法,其特征在于,所述获取每个站点各个时段的进出客流表,具体为:
3.如权利要求1所述的一种地铁站点客流的预测模型选取方法,其特征在于,所述根据所述每种聚类个数对应的站点簇群,结合轮廓系数和欧式距离得到最优站点簇群和最优站点簇群中每个站点簇的代表站点,具体为:
4.如权利要求3所述的一种地铁站点客流的预测模型选取方法,其特征在于,所述计算每种聚类个数对应的站点簇群的轮廓系数,具体为:
5.如权利要求3所述的一种地铁站点客流的预测模型选取方法,其特征在于,所述计算每个站点与所属簇的簇中心点坐标之间的欧式距离,具体为:
6.如权利要求1所述的一种地铁站点客流的预测模型选取方法,其特征在于,所述将所述每个站点簇的代表站点的进出站客流表依次输入至预设的若干个算法模型中,得到每个算法模型对每个站点簇的客流预测结果,具体为:
7.如权利要求6所述的一种地铁站点客流的预测模型选取方法,其特征在于,所述将训练集数据分别输入至每个初始算法模型进行模型训练,具体为:
8.如权利要求1所述的一种地铁站点客流的预测模型选取方法,其特征在于,所述使用预设的评估模型对所述每个预测结果进行评估,得到每个站点簇的代表站点的最优客流预测模型,并结合所述代表站点的所...
【专利技术属性】
技术研发人员:周小辉,周永才,魏鹏灿,刘飘,陈绍其,何建兵,
申请(专利权)人:广东岭南通股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。