本发明专利技术提出一种基于多源数据的城市公共开放空间的拥挤度预测方法。采用了包括微信用户数量数据、POI数据、点评数据、区域属性数据、气象数据和时间属性数据等城市多源数据来确定空间中每个小区域的时空特征。并利用分格采样累加法从微信用户数量图数据中获得一个区域在不同历史时段内的人流量指数。从而将历史人流量指数和时空特征放入模糊神经网络模型中实现人流量指数预测。最后通过聚类和比较的方法将预测的人流量指数转化为拥挤度。该发明专利技术成功的通过开放的城市多源数据实现了拥挤度预测。解决了传统的拥挤度预测方法过度依赖硬件设备而造成预测成本过高,以及单一数据源无法准确预测的技术难题。从而在降低预测经济成本的同时提升了预测精度。
【技术实现步骤摘要】
本专利技术属于城市计算
技术介绍
城镇化率的提高和人口的增加导致城市公共开放空间的需求量增加,并且城市公共开放空间的拥挤度也会提升。而这会带来城市公共安全和交通秩序的隐患。因此,预测城市公共开放空间的人流拥挤度是十分必要的。但由于人流的方向具有随机性和分散性,所以空间中的人流量很难准确的统计,其拥挤度难以合理的划分和预测。日本的BABHITACHIIND公司公开了一种通过摄像头的视频图像分析的方法来评估人流的拥挤程度(JP2007180709A)。但该方法无法实现预测且严重依赖于昂贵的摄像头硬件,普及性较差。针对这个问题,合肥城市云数据中心有限公司公开了一种基于Wifi定位和云数据处理技术的人流量预测方法(CN104573859)。它通过Wifi热点获取用户的定位数据,并用户定位数据通过坐标匹配的方法匹配到相应的城市道路坐标上并预测出下个时间段的人流量。尽管该专利技术实现了人流量的评估预测,但是并不能反应出人流的拥挤程度。为此,杭州华为数字技术有限公司公开了一种测量人群拥挤度的方法、装置与系统(CN104540168)。它通过对现场接入点的信号强度的采集,获得统计参数,并将该参数与人群拥挤度对应关系表匹配来评估空间内人群的拥挤度。该专利技术解决了拥挤度的评估问题,但人流量的计算评估依赖于可发射信号的硬件装置,需要佩戴专门的硬件并且经济性较差。最近,重庆邮电大学公开了一种基于移动网络信令数据的人流拥挤预测技术(CN105512772),它根据一个目标区域的周边区域人流量转移和离开概率来预测目标区域的人流量,并根据划分好的拥挤等级来评估拥挤度。尽管该技术方法实现了不依赖于硬件设备的人流拥挤度评估和预测,但它基于的手机信令数据不是一种实时公开的数据,同时拥挤的等级划分也较为主观,从而造成通用性较差的问题。综上所述的方法都存在硬件投入较大或只依赖于单一数据源分析预测,从而造成技术方法的经济性和通用性差的问题。
技术实现思路
本专利技术的目的是针对现有技术的不足,全新的提出一种基于多源数据的城市公共开放空间的拥挤度预测方法。本专利技术的目的是通过以下技术方案来实现的:本专利技术全新的提出了一种基于多源数据的城市公共开放空间的拥挤度预测方法,其特征在于,该方法表征为:第一大步骤,将空间划分为多个小区域,每个区域是200m×200m。将一天划分为四个时段(0:00-6:00,6:00-12:00,12:00-18:00,18:00-0:00)。第二大步骤,从兴趣点数据、大众点评数据、空间属性数据、地图数据提取出每个区域的3个空间特征:区域周边功能设施数量、周边功能设置受欢迎程度、区域出入口数量。同时,从气象数据和时间属性数据提取出每个区域在不同时段的3个时间特征:是否假日,当前时段温度,是否降雨。同时,利用分格采样累加法从微信用户数量变化图数据中获得一个区域在不同历史时段内的人流量指数。在该步骤中,总共提取17个参数。3个空间特征包含的具体参数为13个:一个区域周边500米范围内的6种功能设施的数量即⑴写字楼数量、⑵商店数量、⑶餐馆数量、⑷宾馆数量、⑸地铁站数量、⑹公交车站数量;一个区域周边500米范围内的这6种功能设施在大众点评网上的评论总数即⑺写字楼的评论总数、⑻商店的评论总数、⑼餐馆的评论总数、⑽宾馆的评论总数、⑾地铁站的评论总数、⑿公交车站的评论总数、⒀该区域的出入口数量。3个时间特征包含的具体参数为3个:⒁摄氏温度、⒂降雨量(mm)、⒃假日与否(假日是1,工作日是0)。以及参数⒄不同区域在不同历史时段内的人流量指数。在该步骤中,基于利用分格采样累加法抽取历史人流量指数:从微信用户数量变化图数据中获取每个小空间区域在不同历史时段的人流量指数。它包括三个小步骤,首先将每天的微信用户数量变化图放置在X轴和Y轴中,X轴表示时间,Y轴表示人流量。并将该数量变化图划分为96×96个小格子,即在X轴平均取96个点。Y轴平均取96个点。其次,X轴上每个点对应的Y轴的值是当前时间的人流量指数,取X轴上96个点对应的人流量指数值。最后,在X轴上按照顺序依次取4个点,对应的Y值累加即表示1小时内的人流量指数。根据此法,从X轴取的96个点对应的Y值按照每隔4个点逐个累加,可以得到一天24小时的人流量指数。第三大步骤,将第二大步骤中抽取的时空特征和历史人流量指数包含的17个参数的依次输入到经典的模糊神经网络模型中所对应的各个变量,实现模型的训练和人流量指数预测。在经典的模糊神经网络模型中,首先,将已收集到的参数⑴至⒃的历史数据值输入到模糊神经网络模型的输入层X1至X16,以及参数⒄对应的历史数据值输入到解模糊层y,实现模型的训练和建立;其次,输入需要预测时段的参数⑴至⒃的数据值到输入层X1至X16,通过建立好的模型进行计算,最终得出y的预测值即预测的人流量指数。在该模型中的隶属函数层、规则层、解模糊层都是模糊神经网络这个经典模型的固定计算过程部分,只需要将选定好的参数输入并得到最终结果即可,不必关心中间的运算过程。经典的模糊神经网络模型的原理和数学表达如下(已属于现有技术)。(1)输入层:xi,i=1,2,…n其中,xi就是第i个输入。N=17,即第二大步骤中提取17个参数。(2)隶属函数层:μ2ij(xi)=exp[-(xi-wik)2/σ2ik],i=1,2,…n;k=1,2,…H,H个模糊规则,本方法中H=10。(已属于现有技术)(3)规则层:μk=Пniμ2ij(xi)k=1,2,…H。(已属于现有技术)(4)解模糊层:y=ΣHk=1μkvk/ΣHk=1μky即为输出。(已属于现有技术)同时,将第二大步骤中获得的历史人流量指数,通过经典的K均值聚类算法划分为4类,每一类代表一种拥挤度等级,按照每类的平均人流量指数从小到大分别为稀疏、不拥挤、拥挤和非常拥挤。在经典的K均值聚类算法中的公式步骤等是该模型固定的计算过程,只需要将不同时段的历史人流量指数作为待聚类样本集合X输入到模型中即可,不必关心中间的运算过程。经典的K均值聚类算法的原理和数学表达如下。设含n个待聚类样本集合X={x1,x2,…x3本文档来自技高网...
【技术保护点】
一种基于多源数据的城市公共开放空间的拥挤度预测方法,其特征在于,包括如下步骤:(1)空间和时段划分:将一个城市公共开放空间划分为多个小的空间区域,每个区域是200m×200m,并且把一天平均划分为4个时间段,分别是0:00‑6:00,6:00‑12:00,12:00‑18:00,18:00‑0:00,每个时间段包含6个小时。(2)区域时空特征抽取与表达:从地图数据、兴趣点数据、兴趣点评论数据、区域属性数据抽取内容来表达每个区域的空间特征,从气象数据和时间属性数据抽取内容来表达每个区域的时间特征。(3)基于分格采样累加法抽取历史人流量指数:利用分格采样累加法,从微信用户数量变化图数据中获取每个小空间区域在不同历史时段的人流量指数。(4)人流量指数的预测:分时段输入区域的时空特征和历史人流量指数,通过模糊神经网络模型实现人流量指数的预测。(5)基于聚类比较预测评估拥挤度:利用K均值聚类法将历史的人流量指数转化为四个拥挤度等级,将预测的人流量指数与四个拥挤度等级比较,得到预测拥挤度。
【技术特征摘要】
1.一种基于多源数据的城市公共开放空间的拥挤度预测方法,其特征在于,包括如下步骤:(1)空间和时段划分:将一个城市公共开放空间划分为多个小的空间区域,每个区域是200m×200m,并且把一天平均划分为4个时间段,分别是0:00-6:00,6:00-12:00,12:00-18:00,18:00-0:00,每个时间段包含6个小时。(2)区域时空特征抽取与表达:从地图数据、兴趣点数据、兴趣点评论数据、区域属性数据抽取内容来表达每个区域的空间特征,从气象数据和时间属性数据抽取内容来表达每个区域的时间特征。(3)基于分格采样累加法抽取历史人流量指数:利用分格采样累加法,从微信用户数量变化图数据中获取每个小空间区域在不同历史时段的人流量指数。(4)人流量指数的预测:分时段输入区域的时空特征和历史人流量指数,通过模糊神经网络模型实现人流量指数的预测。(5)基于聚类比较预测评估拥挤度:利用K均值聚类法将历史的人流量指数转化为四个拥挤度等级,将预测的人流量指数与四个拥挤度等级比较,得到预测拥挤度。2.根据权利要求1所述的区域时空特征的表达方法,其特征在于,所述的从地图数据、兴趣点数据、兴趣点评论数据、区域属性数据抽取的内容包括:该区域周边500米范围内的六种功能设施的数量即写字楼数量、超市和商店数量、餐馆数量、宾馆数量、地铁站数量、公交车站数量,该区域周边500米范围内所有的六种功能设施在大众点评网上的评论总数,以及该区域的出入口数量。所述的从气象数据...
【专利技术属性】
技术研发人员:单曙兵,曹布阳,
申请(专利权)人:同济大学,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。