一种基于多因子聚合模型的景区畅游度预测范式方法技术

技术编号:29404423 阅读:29 留言:0更新日期:2021-07-23 22:42
本发明专利技术公开了一种基于多因子聚合模型的景区畅游度预测范式方法,该方法包括客流量预测模型与畅游度模型构建,其中模型涉及了斯皮尔曼相关系数,ARIMA(p,d,q)模型,AHP方法评估,min‑max归一化处理等一系列的数学模型来预测景区的畅游度情况。本发明专利技术的目的是通过满足游客和管理两方面的需求,来改善游客旅游体验、转变景区服务观念,加快旅游智慧化建设。游客方面,游客通过获取景区畅游度信息,选择最恰当的出行时间和最合适的景点出游,从而获得较高满意度;景区管理方面,通过畅游度信息的发布,及时向游客推荐最佳游览路线,避免游客集中部分景点,来提升景区服务水平和知名度,该方式通过旅游大数据建立多种模型来综合考虑景区畅游度,应用前景广阔。

【技术实现步骤摘要】
一种基于多因子聚合模型的景区畅游度预测范式方法
本专利技术涉及互联网大数据旅游服务领域,具体来说,涉及一种基于多因子聚合模型的景区畅游度预测范式方法。
技术介绍
随着社会生活水平的日益改善,人们的生活方式也不仅仅限于普通的衣、食、住、行。在物质方面得到提升的同时精神方面也追求一个质的飞跃,因此近些年旅游业也井喷式的发展,与此同时各景区的服务质量也需要同步的提升,提高有客户的旅游体验,特别是节假日的时间段,各个地区的景区游客常常出现较严重的拥堵跟滞留现象等问题。因此为解决上述的问题现提出景区畅游度模型,该模型的目的是通过满足游客和管理两方面的需求,来改善游客旅游体验、转变景区服务观念,加快旅游智慧化建设。游客方面,游客通过获取景区畅游度信息,选择最恰当的出行时间和最合适的景点出游,从而获得较高满意度;景区管理方面,通过畅游度信息的发布,及时的向游客推荐最佳路线,避免游客集中部分景点,来提升景区服务水平和知名度。
技术实现思路
本专利技术的目的是克服上述背景中的不足之处,提出一种基于多因子聚合模型的景区畅游度预测范式方法。该方法包括如下步骤:步骤S1:获取游客畅游景区影响因素;步骤S2:建立游客畅游度数据集;步骤S3:构建游客多因子聚合模型;步骤S4:输出未来短期客流量预测数据;步骤S5:构建景区畅游度模型;步骤S6:畅游度指数结果输出。优选地,所述步骤S1中游客畅游景区影响因素包括景区开放性、游客舒适度、道路通畅度和设施完善度。优选地,所述步骤S2中游客畅游度数据集包括省内重点景区动态信息、天气预报信息、空气质量指数信息、PM2.5实时浓度信息、景区类型、景区游客量、道路拥挤度、高速卡口车流量、景区停车场停车余位、景区厕所密度和景区饭店密度信息。所述步骤S3中构建游客多因子聚合模型主要包括如下步骤:步骤S31:统计收集样本景区每小时客流量历史数据;步骤S32:出游状态信息结果输出;步骤S33:计算斯皮尔曼(Spearman)相关系数ρ;步骤S34:采用ARIMA(p,d,q)模型预测未来一周每小时的客流量值。优选地,所述多因子聚合模型步骤S31中样本景区每小时客流量历史数据的时间周期为T-T0,其中T代表当前时刻,T0代表1周前的此时刻。优选地,所述多因子聚合模型步骤S32中出游状态信息结合了天气预报信息、空气质量指数信息、PM2.5实时浓度信息、气象预警和出游景点匹配性,具体结果包括适宜、较适宜、一般、较不宜、不适宜,并分别赋值为1、0.75、0.5、0.25、0。优选地,所述多因子聚合模型步骤S33中斯皮尔曼(Spearman)相关系数ρ包括各景点的历史客流量和出游状态值,相关系数ρ的计算方式为:其中n数值为84,i代表其中的一个景点,xi代表景点i客流量,代表样本景点客流量均值,yi代表景区i出游状态,代表样本景区出游状态均值;基于各景点的历史客流量和出游状态值,采用Spearman方法计算每个月周一至周日内两者相关性ρ值(调整系数),得到12*7=84个观察样本。所述多因子聚合模型步骤S34中ARIMA(p,d,q)模型具体为:其中,L是滞后算子,d为整数且大于0,i代表景点数,p代表自回归项数,Φ代表自回归系数多项式,q代表滑动平均项数,θ代表滑动平均系数多项式,εt代表零均值白噪声序列。首先,对历史客流量的时间序列进行平稳性分析,若为非平稳数据则需进行d阶差分,化为平稳非白噪声序列。其次,计算自相关系数ACF(AutocorrelationFunction)和偏自相关系数PACF(PartialAutocorrelationFunction),判断最佳阶层p和阶数q;最后,回归分析并验证结果;经过回归分析,计算客流量预测值;同时观察ARIMA(AutoregressiveIntegratedMovingAveragemode)模型下的残差是否服从正态分布,并检验残差是否(自)相关。优选地,所述多因子聚合模型步骤S34中预测的结果为:未来一周每小时客流量ξ1=未来一周每小时的客流量预测值*(1+ρ),其中,调整系数ρ是根据客流量与出游状态值两者相关系数进行确定。预测景区未来一小时客流状态ξ2=1-未来一周每小时的客流量/日承载最大客流量,其中,ξ≦0.2对应报警状态,0.2<ξ≦0.4对应拥挤状态,0.4<ξ≦0.6对应适中状态,0.6<ξ≦1对应舒适状态。所述步骤S5中景区畅游度模型评价指标包括游客舒适度、道路通畅度和设施完善度;其中景区闭园情况下的畅游度定义为0,景区开园情况下的畅游度模型构建包括如下步骤:步骤S51:采用AHP方法构建游客舒适度、道路畅通度和设施完善度各维度指数分项指标;步骤S52:对分项指标进行min-max归一化处理;步骤S53:采用主成分分析法(PCA)确认各分项指标权重;步骤S54:综合评估畅游度指数。优选地,所述步骤S52中分项指标min-max归一化处理方法如下:X*=(Xi-Xmin)/(Xmax-Xmin)其中,Xi表示实际值,Xmin和Xmax为对应的极小值和极大值,x*取值范围介于0至1之间。优选地,所述步骤S53中主成分分析法(PCA)具体定义如下:假设存在P个景区观察点R=(x1,x2,…,xp)T,每个样本景点涵盖i个特征xp=(x1,x2,…,xi),xi对应是特定观察点的分项指标;对样本矩阵R进行变换,求出相关系数矩阵,变换方法为标准化:标准化其中,均值方差求解相关系数矩阵为R=[rij]P*P,其中,其中,xij代表景区对应的观察特征指标,∑代表求和运算,zij代表标准化后的z值;根据矩阵特征方程|R-λIP|=0,解出特征值λ和特征向量IP,得到主成分:j取1,2,...,n,并分析各指标的方差贡献率,若利用率达85%以上,确定权重Wi值。倘若方差贡献率不满足条件,指标间相关性较弱,那么需通过熵值法重新计算各维度权重大小。根据标准化后的指标数据计算出信息熵:然后确定指标的权重大小:最终,综合评价结果如下:景区畅游度指数=游客舒适度*W1+道路通畅度*W2+设施完善度*W3优选地,所述步骤S6中畅游度指数结果输出主要包括如下结果:a、客流量预测:未来一周每小时客流量=未来一周每小时的客流量预测值*(1+ρ)b、畅游度指数:景区畅游度指数=游客舒适度*W1+道路通畅度*W2+设施完善度*W3。本专利技术的有益效果在于:(1)从游客方面来说,游客通过获取景区畅游度信息,选择最恰当的出行时间和最合适的景点出游,从而获得较高满意度。(2)从景区管理方面来说,通过畅游度信息的发布,及时的向游客推荐最佳路线,避免游客集中部分景点,来提升景区服务水平和知名度。本文档来自技高网...

【技术保护点】
1.一种基于多因子聚合模型的景区畅游度预测范式方法,其特征在于,所述方法包括如下步骤:/n步骤S1:获取游客畅游景区影响因素;/n步骤S2:建立游客畅游度数据集;/n步骤S3:构建游客多因子聚合模型;/n步骤S4:输出未来短期客流量预测数据;/n步骤S5:构建景区畅游度模型;/n步骤S6:畅游度指数结果输出。/n

【技术特征摘要】
1.一种基于多因子聚合模型的景区畅游度预测范式方法,其特征在于,所述方法包括如下步骤:
步骤S1:获取游客畅游景区影响因素;
步骤S2:建立游客畅游度数据集;
步骤S3:构建游客多因子聚合模型;
步骤S4:输出未来短期客流量预测数据;
步骤S5:构建景区畅游度模型;
步骤S6:畅游度指数结果输出。


2.根据权利要求1所述的一种基于多因子聚合模型的景区畅游度预测范式方法,其特征在于,所述步骤S1中游客畅游景区影响因素包括景区开放性、游客舒适度、道路通畅度和设施完善度。


3.根据权利要求1所述的一种基于多因子聚合模型的景区畅游度预测范式方法,其特征在于,所述步骤S2中游客畅游度数据集包括省内重点景区动态信息、天气预报信息、空气质量指数信息、PM2.5实时浓度信息、景区类型、景区游客量、道路拥挤度、高速卡口车流量、景区停车场停车余位、景区厕所密度和景区饭店密度信息。


4.根据权利要求1所述的一种基于多因子聚合模型的景区畅游度预测范式方法,其特征在于,所述步骤S3中构建游客多因子聚合模型主要包括如下步骤:
步骤S31:统计收集样本景区每小时客流量历史数据;
步骤S32:出游状态信息结果输出;
步骤S33:计算斯皮尔曼(Spearman)相关系数ρ;
步骤S34:采用ARIMA(p,d,q)模型预测未来一周每小时的客流量值。


5.根据权利要求4所述的一种基于多因子聚合模型的景区畅游度预测范式方法,其特征在于:所述多因子聚合模型步骤S31中样本景区每小时客流量历史数据的时间周期为T-T0,其中T代表当前时刻,T0代表1周前的此时刻。


6.根据权利要求4所述的一种基于多因子聚合模型的景区畅游度预测范式方法,其特征在于:所述多因子聚合模型步骤S32中出游状态信息结合了天气预报信息、空气质量指数信息、PM2.5实时浓度信息、气象预警和出游景点匹配性,具体出游状态结果包括适宜、较适宜、一般、较不宜、不适宜,并分别赋值为1、0.75、0.5、0.25、0。


7.根据权利要求4所述的一种基于多因子聚合模型的景区畅游度预测范式方法,其特征在于:所述多因子聚合模型步骤S33中斯皮尔曼(Spearman)相关系数ρ包括各景点的历史客流量和出游状态值,相关系数ρ的计算方式如下:



其中n数值为84,i代表其中的一个景点,xi代表景点i客流量,代表样本景点客流量均值,yi代表景区i出游状态,代表样本景区出游状态均值,Σ代表求和运算;基于各景点的历史客流量和出游状态值,采用Spearman方法计算每个月周一至周日内两者相关性ρ值(调整系数),得到84个观察样本,数值84由每年的12个月乘以每周的七天相乘计算所得。


8.根据权利要求4所述的一种基于多因子聚合模型的景区畅游度预测范式方法,其特征在于:所述多因子聚合模型步骤S34中ARIMA(p,d,q)模型具体为:



其中,L代表滞后算子,d为整数且大于0,i代表景点数,p代表自回归项数,Xt代表景区客流量,Φ代表自回归系数多项式,q代表滑动平均项数,θ代表滑动平均系数多项式,εt代表零均值白噪声序列;
首先,对历史客流量的时间序列进行平稳性分析,若为非平稳数据则需进行d阶差分,化为平稳非白噪声序列;其次,计算自相关系数ACF和偏自相关系数PACF,判断最佳阶层p和阶数q;最后,回归分析并验证结果;经过回归分析,计算客流量预测值...

【专利技术属性】
技术研发人员:杨荣平宋佳维
申请(专利权)人:江苏唱游数据技术有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1