一种融合公交数据和POI数据的两段式乘客人群出行目的分析方法技术

技术编号:23892360 阅读:22 留言:0更新日期:2020-04-22 06:59
本发明专利技术提供一种融合公交数据和POI数据的两段式乘客人群出行目的分析方法,目的是通过结合公交数据和POI数据,解决识别公交乘客人群出行目的的问题,提出了一种新颖且合理有效的乘客人群出行目的分析方法。本发明专利技术主要包括两个阶段,在第一阶段中,首先对公交数据和POI数据进行提取、清洗和转换,并将站点信息转换为POI向量,最后采用聚类的方法分析公交乘客的出行目的;在第二阶段中,首先通过刷卡数据和智能卡数据进行结合,提取乘客的人口统计学信息,然后计算乘客的乘车距离,并将第一阶段的出行目的作为乘客人群聚类的特征,最终使用聚类算法对乘车人群聚类,并分析每个簇中的出行目的,以达到对不同乘车人群的不同出行目的的分析的效果。本发明专利技术使用于公交乘客人群出行目的的分析。

【技术实现步骤摘要】
一种融合公交数据和POI数据的两段式乘客人群出行目的分析方法
本专利技术涉及公交信息数据和POI数据处理
,尤其涉及一种融合公交数据和POI数据的两段式乘客人群出行目的分析方法。
技术介绍
城市公共交通是我国城市经济发展的载体基础,乘坐公共交通出行是我国城市居民不可或缺的活动,而随着我国城市化的快速发展,城市经济得到了不断进步,无论是工作场所、娱乐场所或是满足人们日常需求的场所也与日俱增,城市居民的出行目的也日益丰富起来。而能否完整全面细致的掌握城市居民的出行目的,关乎着相关部门能否合理的做出线路调整、班次调整等决策。传统的出行目的的调查往往是相关部门投入大量的人力和物力,通过人工调查问卷等方式进行统计,如居民乘坐公交的出行时间、乘坐地点、出行目的、出行频率等信息。这种调查方法,不但需要耗费大量的资源,而且居民的参与度无法掌控,如在高峰时段的公交乘客往往因为工作压力展现出较低的参与度,而散时调查的公交乘客则面临乘客量不稳定且调查对象不全面的问题。随着大数据的发展,越来越多的数据得以保存,而基于定位的POI数据也变得丰富且易获取起来,这为我们基于数据分析出行行为提供了最直接的帮助。而现今对于出行目的的分析技术大多是基于出租车、私家车等GPS数据进行的,对于基于公交数据的出行目的分析技术较少;而通过公交数据和POI数据的结合,能够合理有效的发掘居民乘坐公交的出行目的,同时结合时间、人口统计学等信息,能够有效的分析出不同人群在不同时段的不同出行目的。
技术实现思路
本专利技术的目的在于解决现今对于处理公交出行的乘客的出行目的技术的不足,进而提供一种基于公交数据和POI数据的两段式乘客人群出行目的分析方法。本方法融合公交数据中的静态站点信息、公交刷卡数据、公交运营数据中的到离站数据、智能卡数据以及网络可获取到的POI(pointofinterest)数据,通过两段式分析方法对公交乘客人群出行目的进行分析;在第一阶段中,首先对数据的清洗转换,并将站点信息转换为POI向量,以此形成样本特征,最后采用聚类的方法分析公交乘客的出行目的;在第二阶段中,首先通过刷卡数据和智能卡数据进行结合,提取乘客的人口统计学信息,然后计算乘客的乘车距离,并将第一阶段的出行目的作为乘客人群聚类的特征,最终使用聚类算法对乘车人群聚类,并分析每个簇中的出行目的,以达到对不同乘车人群的不同出行目的的分析的效果。实现本专利技术目的的技术方案是:一种基于公交数据和POI数据的公交乘客出行目的分析方法,包括如下步骤:第一阶段,融合公交数据和POI数据的乘客出行目的分析:Step1.1:公交数据提取,包括公交刷卡数据的提取和公交静态站点数据的提取;Step1.2:站点附近POI数据提取;Step1.3:样本数据特征构成,包括POI数据与公交站点数据的转换,上车时段转换;Step1.4:使用聚类算法对出行目的聚类第二阶段,融合公交数据和POI数据的两段式公交乘客人群出行目的分析:Step2.1:提取公交卡人口统计学信息Step2.2:提取样本特征并进行转换Step2.3:使用聚类算法对出行人群进行统计,并分析不同公交乘客人群的不同出行目的进一步的,所述第一阶段,融合公交数据和POI数据的乘客出行目的分析中的Step1.1中公交数据提取,包括公交刷卡数据的提取和公交静态站点数据的提取;其中具体刷卡数据所需要提取的数据包括:乘客上车时间,乘客上车站点和乘客下车站点;具体提取的方法如下:(1.1.1)乘客上车时间可以通过刷卡数据中的刷卡时间直接获取,即Taboard=Ts,其中Ts表示原始数据中的刷卡时间,Taboard表示获取到的乘客上车时间;(1.1.2)乘客上车站点通过刷卡数据和车辆进出站数据联合提取,其方法为:其中,CarIDaboard为刷卡数据中的刷卡车辆ID,CarIDoperation为车辆进出站数据中运营的车辆ID,CTin为车辆进出站数据中进站时间,CTout为车辆进出站数据中出站时间,Stationaboard为乘客上车站点,CStationin为车辆进出站数据中的进站站点;上述方法具体解释为,通过刷卡数据获取到该次刷卡的车辆ID,通过车辆ID获取该趟次车辆进出站的时间,若刷卡时间介于该车辆进出某站点时进出站时间,则认为上车站点为该车辆进站的站点,以此获取乘客的上车站点;(1.1.3)对于上下车均刷卡的公交系统,下车站点可通过刷卡数据直接获取,而对于仅上车刷卡的公交系统,已在权利要求1中假设完成推测,若乘客存在换乘行为,则认为最后的下车点为下车目的点,以此方法获取乘客的下车站点Stationalight;进一步的,所述第一阶段,融合公交数据和POI数据的乘客出行目的分析中的Step1.2中站点附近POI数据提取。其具体过程如下:对于需要分析的每一个站点,获取每个站点附近的POI数据进一步的,所述第一阶段,融合公交数据和POI数据的乘客出行目的分析中的Step1.3中样本数据特征构成,包括POI数据与公交站点数据的转换,上车时段转换;具体过程为:(1.3.1)上车时段转换的具体过程为:利用步骤一中获取到乘客上车时间Taboard,将乘车时段按小时划分为:[4:00,7:00),[7:00,9:00),[9:00,12:00),[12:00,14:00),[14:00,17:00),[17:00,19:00),[19:00,23:00),对于不同的时段分别用1~7数字代替,当Taboard中的时分秒在对应的时间段时,将Taboard转换为对应的数字,表示不同的时间段特征t;对于Taboard中的日期转换,通过日期所属是否为工作日,将日期转换为日期特征d;最终通过上述方法完成上车时间段特征的转换,Tt=[t,d]其中Tt为二维向量;(1.3.2)转换POI数据为POI向量,具体方法为,将POI所属的大类分为餐饮服务,购物服务,生活服务,休闲娱乐服务,医疗服务,住宿服务,住宅区,科教服务,交通服务和公司企业10类,分别统计每个站点附近的POI所属类型的个数,形成该站点的10维POI向量Vecpoi;(1.3.3)整合形成数据样本,具体方法为,数据样本中特征包括乘客上车时段、乘客上车站点POI向量,乘客下车POI向量;其中乘客上下车POI向量通过步骤一中获取的乘客上下车站点与上述公交站点附近POI数据转换的POI向量进行结合,将乘客上下车站点转换为乘客上下车站点POI向量;最终形成的样本特征为{Tt,VecPoiaboard,VecPoialight};其中Tt为乘客上车时段,VecPoiaboard为10维的上车站点POI向量,VecPoialight为10维的下车站点POI向量;进一步的,所述第一阶段,融合公交数据和POI数据的乘客出行目的分析中的Step1.4中使用聚类算法对出行目的聚类,其具体过程为:聚类方法包括但不仅包括K-means、DBSCAN等聚类算法本文档来自技高网...

【技术保护点】
1.一种融合公交数据和POI数据的两段式乘客人群出行目的分析方法,其特征在于,首先假定乘客的公交下车站点已知,且公交数据包括刷卡数据、智能卡相关信息数据和车辆进出站数据,所述方法具体过程为:/n第一阶段,融合公交数据和POI数据的乘客出行目的分析:/nStep1.1:公交数据提取,包括公交刷卡数据的提取和公交静态站点数据的提取;/nStep1.2:站点附近POI数据提取;/nStep1.3:样本数据特征构成,包括POI数据与公交站点数据的转换,上车时段转换;/nStep1.4:使用聚类算法对出行目的聚类/n第二阶段,融合公交数据和POI数据的两段式公交乘客人群出行目的分析:/nStep2.1:提取公交卡人口统计学信息/nStep2.2:提取样本特征并进行转换/nStep2.3:使用聚类算法对出行人群进行统计,并分析不同公交乘客人群的不同出行目的。/n

【技术特征摘要】
1.一种融合公交数据和POI数据的两段式乘客人群出行目的分析方法,其特征在于,首先假定乘客的公交下车站点已知,且公交数据包括刷卡数据、智能卡相关信息数据和车辆进出站数据,所述方法具体过程为:
第一阶段,融合公交数据和POI数据的乘客出行目的分析:
Step1.1:公交数据提取,包括公交刷卡数据的提取和公交静态站点数据的提取;
Step1.2:站点附近POI数据提取;
Step1.3:样本数据特征构成,包括POI数据与公交站点数据的转换,上车时段转换;
Step1.4:使用聚类算法对出行目的聚类
第二阶段,融合公交数据和POI数据的两段式公交乘客人群出行目的分析:
Step2.1:提取公交卡人口统计学信息
Step2.2:提取样本特征并进行转换
Step2.3:使用聚类算法对出行人群进行统计,并分析不同公交乘客人群的不同出行目的。


2.根据权利要求1所述一种融合公交数据和POI数据的两段式乘客人群出行目的分析方法,其特征在于:所述第一阶段,融合公交数据和POI数据的乘客出行目的分析中的Step1.1中公交数据提取,包括公交刷卡数据的提取和公交静态站点数据的提取;其中具体刷卡数据所需要提取的数据包括:乘客上车时间,乘客上车站点和乘客下车站点;具体提取的方法如下:
2.1)乘客上车时间可以通过刷卡数据中的刷卡时间直接获取,即Taboard=Ts,其中Ts表示原始数据中的刷卡时间,Taboard表示获取到的乘客上车时间
2.2)乘客上车站点通过刷卡数据和车辆进出站数据联合提取,其方法为:



其中,CarIDaboard为刷卡数据中的刷卡车辆ID,CarIDoperation为车辆进出站数据中运营的车辆ID,CTin为车辆进出站数据中进站时间,CTout为车辆进出站数据中出站时间,Stationaboard为乘客上车站点,CStationin为车辆进出站数据中的进站站点;上述方法具体解释为,通过刷卡数据获取到该次刷卡的车辆ID,通过车辆ID获取该趟次车辆进出站的时间,若刷卡时间介于该车辆进出某站点时进出站时间,则认为上车站点为该车辆进站的站点,以此获取乘客的上车站点;
2.3)对于上下车均刷卡的公交系统,下车站点可通过刷卡数据直接获取,而对于仅上车刷卡的公交系统,已在权利要求1中假设完成推测,若乘客存在换乘行为,则认为最后的下车点为下车目的点,以此方法获取乘客的下车站点Stationalight。


3.根据权利要求1所述一种融合公交数据和POI数据的两段式乘客人群出行目的分析方法,其特征在于:所述第一阶段,融合公交数据和POI数据的乘客出行目的分析中的Step1.2中站点附近POI数据提取;具体过程为:对于需要分析的每一个站点,获取每个站点附近的POI数据。


4.根据权利要求1所述一种融合公交数据和POI数据的两段式乘客人群出行目的分析方法,其特征在于:所述第一阶段,融合公交数据和POI数据的乘客出行目的分析中的Step1.3中样本数据特征构成,包括POI数据与公交站点数据的转换,上车时段转换;具体过程为:
4.1)上车时段转换的具体过程为:利用步骤一中获取到乘客上车时间Taboard,将乘车时段按小时划分为:[4:00,7:00),[7:00,9:00),[9:00,12:00),[12:00,14:00),[14:00,17:00),[17:00,19:00),[19:00,23:00),对于不同的时段分别用1~7数字代替,当Taboard中的时分秒在对应的时间段时,将Taboard转换为对应的数字,表示不同的时间段特征t;对于Taboard中的日期转换,通过日期所属是否为工作日,将日期转换为日期特征d;最终通过上述方法完成上车时间段特征的转换,Tt=[t,d]其中Tt为二维向量;
4.2)转换POI数据为POI向量,具体方法为,将POI所属的大类分为餐饮服务,购物服务,生活服务,休闲娱乐服务,医疗服务,住宿服务,住宅区,科教服务,交通服务和公司企业10类,分别统计每个站点附近的POI所属类型的个数,形成该站点的10维POI向量Vecpoi;
4....

【专利技术属性】
技术研发人员:范汇涛李红宇李刚
申请(专利权)人:南京智慧交通信息有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1