本发明专利技术公开了一种基于多源数据融合的公共自行车租借预测方法。本发明专利技术首先将公共自行车租/还记录、天气、温度、节假日等历史数据经过数据清洗和预处理,获得训练数据集。使用聚类算法对数据集进行分类,划分公共自行车的不同租借模式;将分类后的数据集构建贝叶斯分类器,用于根据未来某天的节假日、天气、气温情况预测当天所属的租借模式;为不同模式的数据集分别训练各模式对应的自适应粒子群神经网络模型。最后,通过贝叶斯分类器预测某天的租借模式挑选对应的粒子群神经网络模型来预测公共自行车的租借规律。本发明专利技术预测精度高、运算速度快,能够为用户租还车提供参考依据,减少公共自行车站点不平衡状态持续时间,提高用户满意度。
【技术实现步骤摘要】
本专利技术属于城市智能公共交通系统
,涉及一种基于多源数据融合的公共 自行车租借预测方法,特别是对各公共自行车站点内不同时段自行车租借数量进行预测的 方法。
技术介绍
公共自行车系统作为城市公共交通的一部分,具有无污染、机动性强等优点,可 以有效地缓解城市交通压力,减少二氧化碳排放,改善城市环境。由于市民出行的流动性 和潮汐性,在某些时间段会出现无自行车可借、无空位可还的问题。城市智能交通系统 (Intelligent Transportation System,简称ITS)是将先进的信息技术、通讯技术、传感技 术、控制技术以及计算机技术等有效地集成运用于整个交通运输管理体系,而建立起的一 种在大范围内、全方位发挥作用的,实时、准确、高效的综合运输和管理系统。可以用于解决 城市公共交通领域出现的诸多问题。 公共自行车租借数量预测是城市智能交通系统的一部分,其目的是准确地预测各 公共自行车站点不同时间段内自行车租借数量,从而提前展开调度措施,有效解决"租/还 车难"问题。 目前,国内外在此领域的研宄较少,且大部分是针对机动车领域的预测。在这些研 宄中,提出的主要方法包括:历史平均模型,自回归模型,多元回归模型,非参数回归模型, 卡尔曼滤波模型,神经网络模型,支持向量机模型等。但是由于公共自行车的特殊性,这些 方法对于该领域的预测并不是很适合。历史平均模型和回归分析模型均假设交通流量是遵 循严格的周期性,而公共自行车租借存在着不确定性、非线性、非周期性的特点。卡尔曼滤 波模型在较短时间间隔的交通流量预测上并不是很适合。支持向量机模型在使用大量真实 数据进行交通流量预测时表现较差。而神经网络模型根据输入输出进行建模,是一种并行 的计算模型,运算速度较快,并且拥有很好的非线性映射能力和自学性、自适应的能力。但 是传统的神经网络模型也存在着收敛速度慢、容易陷入局部最优的缺点。
技术实现思路
本专利技术的目的是为了克服单一预测模型的不足,提出一种基于多源数据融合的公 共自行车租借预测方法。本专利技术对传统方法进行了改进和融合,在聚类分析的基础上使用 朴素贝叶斯分类算法进行租借模式预测,对不同的租借模式分别训练各自的自适应粒子群 神经网络模型,并使用这些模型预测不同租借模式下的公共自行车的租借数量,提高租借 预测精确度。 本专利技术解决其技术问题采用的技术方案的具体步骤如下: 本专利技术具体包括如下步骤: 步骤⑴数据采集与处理: 读取公共自行车系统中存储的用户租车记录,计算各站点每隔时间段time剩余 公共自行车数量,建立向量Ndate= ,M为时间段总数;从互联网上获 取历史天气状况、气温和节假日情况,建立环境属性向量S = (S1, S2, ...,Si, ...,SJ,Si = ,L为数据样本集中样本的个数;M、L、i和j均为正整数,其中j < M, i < L ; 所述的用户租车记录包括租借时间、租借站点、租借车粧号、还车时间、还车站点、 还车车粧号; rij表示第j个时间段time该站点内剩余自行车数量; Si表示第i天的环境属性; d表示当天的节假日属性,d的取值为【主权项】1. ,其特征在于包括如下步骤: 步骤(1)数据采集与处理: 读取公共自行车系统中存储的用户租车记录,计算各站点每隔时间段time剩余公共 自行车数量,建立向量Ndate= ;从互联网上获取历史天气状况、气温 和节假日情况,建立环境属性向量S= {Si,S2,. . .,Si,. . .,SJ,Si= ,L为数据样本 集中样本的个数;M、L、i和j均为正整数,其中j彡M,i彡L; 所述的用户租车记录包括租借时间、租借站点、租借车粧号、还车时间、还车站点、还车 车粧号; rij表示第j个时间段time该站点内剩余自行车数量; Si表示第i天的环境属性;d表示当天的节假日属性,d的取值为w表示天气状况,w的取值为t表示气温,t的取值为步骤(2)K-means聚类: Ndate=作为待分类的数据样本集中的一个数据元组;从数据样 本集中随机选取k个点作为初始类中心,分别用yuy2,...,yk表示类cuc2,...,ck的类 中心;其中,k为正整数; K-means聚类算法包括如下步骤: 2-1.计算其余的数据元组队与类中心yk的距离,将其余的数据元组&分到与其距离 最短的类中; 2-2.重新计算各类的新的类中心 2-3.重复步骤2-1和步骤2-2,直到各数据元组所属类别都不再变化; 步骤(3)构建贝叶斯分类器:使用k-means聚类算法对数据样本集进行分类后,得到k个类,数据样本集中的每个数据元组都将得到一个类标号;贝叶斯分类法基于贝叶斯定 理:计算P(X),P〇l)和P(X|H); 步骤(4)自适应粒子群神经网络模型训练 使用分类后的数据样本训练各类别所属的自适应粒子群神经网络模型,设定神经网络 的输入层单元个数为n,隐含层单元个数为P,输出层单元个数为q;则神经网络中需要调整 的权值个数N=nXp+pXq,用需要调整的权值个数N表示问题空间的维度;用向量Xi= 表示神经网络所有权值的一个可能取值,也表示粒子群优化算法中粒子 的位置;粒子群神经网络模型训练步骤如下: 4-1.初始化粒子群种群中各粒子的位置和速度,粒子的位置和速度位于之间, 即随机生成G个向量Xi=, 1彡i彡G作为粒子的位置,Xi介于之 间;再随机生成G个向量Vi=,G+1彡i彡2XG作为粒子的速度,Vi介于 之间;设定最大迭代次数itermax,当前迭代次数k= 1 ; 4-2.计算各粒子的适应度值,存储各粒子当前的位置为自身最优值Pbi,存储所有粒子 中适应度值最小的位置为全局最优值Pbg; 4-3.判断k是否达到最大迭代次数itermax,若是,转到步骤4-7,否则转到4-4 ; 4-4.更新各粒子速度和位置,计算各粒子新的适应度值;若第i个粒子的当前适应度 值优于Pbi,则更新Pbi;若当前粒子群的最优位置优于Pbg,则更新Pbg;设置k=k+1 ; 4-5.根据惯性权重计算公式更新惯性权重《 ; 4-6.若全局最优位置Pbg在10次迭代中没有变化,则转到步骤4-7,否则转到步骤4-4 ; 4-7.输出Pbg作为训练好的粒子群神经网络的权值; 步骤(5)租借模式预测:根据输入的待预测环境属性向量SPM和计算得到的P(H),P(X|H)的值,计算出该数据元组属于各类别的概率,输出后验概率最大的类别; 步骤(6)公共自行车租借预测 根据步骤(5)租借模式预测中输出的类别,选择相应的自适应粒子群神经网络模型, 将前n个时间段的剩余公共自行车数量输入该模型,输出即为预测的公共自行车数量。2. 如权利要求1所述的,其特征在 于步骤(2)中所述计算公式如下: 2-1中队与类中心yk的距离计算公式如下:2-2中新的类中心计算公式如下:为类ck的新的类中心; |nk|为类ck中数据元组的个数; Nki为类ck中的第i个数据元组。3. 如权利要求1所述的,其特征在 于步骤(3)中使用的计算公式及变量含义如下:ctTI为数据样本集T中属于类ck的样本数; L为数据样本集T中的样本总数; P(X本文档来自技高网...
【技术保护点】
一种基于多源数据融合的公共自行车租借预测方法,其特征在于包括如下步骤:步骤(1)数据采集与处理:读取公共自行车系统中存储的用户租车记录,计算各站点每隔时间段time剩余公共自行车数量,建立向量Ndate=[n1,n2,...,nj,...,nM];从互联网上获取历史天气状况、气温和节假日情况,建立环境属性向量S={S1,S2,...,Si,...,SL},Si=[d,w,t],L为数据样本集中样本的个数;M、L、i和j均为正整数,其中j≤M,i≤L;所述的用户租车记录包括租借时间、租借站点、租借车桩号、还车时间、还车站点、还车车桩号;nj表示第j个时间段time该站点内剩余自行车数量;Si表示第i天的环境属性;d表示当天的节假日属性,d的取值为w表示天气状况,w的取值为t表示气温,t的取值为步骤(2)K‑means聚类:Ndate=[n1,n2,...,nj,...,nM]作为待分类的数据样本集中的一个数据元组;从数据样本集中随机选取k个点作为初始类中心,分别用μ1,μ2,...,μk表示类c1,c2,...,ck的类中心;其中,k为正整数;K‑means聚类算法包括如下步骤:2‑1.计算其余的数据元组Ni与类中心μk的距离,将其余的数据元组Ni分到与其距离最短的类中;2‑2.重新计算各类的新的类中心μk*;2‑3.重复步骤2‑1和步骤2‑2,直到各数据元组所属类别都不再变化;步骤(3)构建贝叶斯分类器:使用k‑means聚类算法对数据样本集进行分类后,得到k个类,数据样本集中的每个数据元组都将得到一个类标号;贝叶斯分类法基于贝叶斯定理:P(H|X)=P(X|H)P(H)P(X)]]>计算P(X),P(H)和P(X|H);步骤(4)自适应粒子群神经网络模型训练使用分类后的数据样本训练各类别所属的自适应粒子群神经网络模型,设定神经网络的输入层单元个数为n,隐含层单元个数为p,输出层单元个数为q;则神经网络中需要调整的权值个数N=n×p+p×q,用需要调整的权值个数N表示问题空间的维度;用向量Xi=[xi1,xi2,...,xiN]表示神经网络所有权值的一个可能取值,也表示粒子群优化算法中粒子的位置;粒子群神经网络模型训练步骤如下:4‑1.初始化粒子群种群中各粒子的位置和速度,粒子的位置和速度位于[0,1]之间,即随机生成G个向量Xi=[xi1,xi2,...,xiN],1≤i≤G作为粒子的位置,xi介于[0,1]之间;再随机生成G个向量Vi=[vi1,vi2,...,viN],G+1≤i≤2×G作为粒子的速度,vi介于[0,1]之间;设定最大迭代次数itermax,当前迭代次数k=1;4‑2.计算各粒子的适应度值,存储各粒子当前的位置为自身最优值Pbi,存储所有粒子中适应度值最小的位置为全局最优值Pbg;4‑3.判断k是否达到最大迭代次数itermax,若是,转到步骤4‑7,否则转到4‑4;4‑4.更新各粒子速度和位置,计算各粒子新的适应度值;若第i个粒子的当前适应度值优于Pbi,则更新Pbi;若当前粒子群的最优位置优于Pbg,则更新Pbg;设置k=k+1;4‑5.根据惯性权重计算公式更新惯性权重ω;4‑6.若全局最优位置Pbg在10次迭代中没有变化,则转到步骤4‑7,否则转到步骤4‑4;4‑7.输出Pbg作为训练好的粒子群神经网络的权值;步骤(5)租借模式预测:根据输入的待预测环境属性向量Spre和计算得到的P(H),P(X|H)的值,计算出该数据元组属于各类别的概率,输出后验概率最大的类别;步骤(6)公共自行车租借预测根据步骤(5)租借模式预测中输出的类别,选择相应的自适应粒子群神经网络模型,将前n个时间段的剩余公共自行车数量输入该模型,输出即为预测的公共自行车数量。...
【技术特征摘要】
【专利技术属性】
技术研发人员:林菲,范为迪,余日泰,徐海涛,
申请(专利权)人:杭州电子科技大学,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。