System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于KNN回归模型的多维度民航客流量预测方法技术_技高网

一种基于KNN回归模型的多维度民航客流量预测方法技术

技术编号:41750429 阅读:17 留言:0更新日期:2024-06-21 21:35
本发明专利技术涉及客流量预测,具体涉及一种基于KNN回归模型的多维度民航客流量预测方法,收集历史航班数据,对历史航班数据进行数据清洗;对处理后的历史航班数据进行特征选择,并构建训练数据集和验证数据集;基于KNN回归模型构建客流量预测模型,并确定K值;利用训练数据集对客流量预测模型进行模型训练,并利用验证数据集对训练好的客流量预测模型进行模型评估;对客流量预测模型进行模型部署,并对新航班数据进行客流量预测,得到客流量预测结果;对客流量预测结果与对应的实际客流量数据进行误差分析;本发明专利技术提供的技术方案能够有效克服现有技术所存在的不能有效整合多维度特征来对客流量进行精准、快速预测的缺陷。

【技术实现步骤摘要】

本专利技术涉及客流量预测,具体涉及一种基于knn回归模型的多维度民航客流量预测方法。


技术介绍

1、航空业作为全球交通网络的重要组成部分,其运营管理的效率和效果直接影响着航空公司的盈利能力和市场竞争力。航班客流量预测作为运营管理的关键环节,对于航空公司制定航班计划、优化资源配置、制定营销策略等工作具有决定性作用。然而,传统的客流量预测方法主要基于历史数据和简单的统计分析,依赖于有限的特征集,如历史客流量、票价水平、航班频率等,这些方法在面对市场波动、季节性变化、经济环境变动等复杂因素时,往往难以提供足够准确的预测结果。

2、随着大数据和机器学习技术的发展,越来越多的研究开始探索如何利用更丰富的数据资源和先进的算法来提高客流量预测的准确性。这些研究强调了多维度特征的重要性,包括但不限于航班的计划运力、通航点的吸引力、票价的动态变化、竞飞航司的竞争策略、班期的安排及节假日、特殊事件等季节性因素的影响,这些多维度特征的综合考量,对于构建更为精准的客流量预测模型至关重要。

3、然而,现有的多维度客流量预测模型在实际应用中仍面临挑战,如平衡特征选择的复杂性与模型训练的计算成本,以及模型泛化能力的局限性等。因此,迫切需要一种能够有效整合多维度特征、具有良好泛化能力且计算效率高的客流量预测方法,以满足航空公司在快速变化的市场环境中对客流量进行精准预测的需求。


技术实现思路

1、(一)解决的技术问题

2、针对现有技术所存在的上述缺点,本专利技术提供了一种基于knn回归模型的多维度民航客流量预测方法,能够有效克服现有技术所存在的不能有效整合多维度特征来对客流量进行精准、快速预测的缺陷。

3、(二)技术方案

4、为实现以上目的,本专利技术通过以下技术方案予以实现:

5、一种基于knn回归模型的多维度民航客流量预测方法,包括以下步骤:

6、s1、收集历史航班数据,对历史航班数据进行数据清洗;

7、s2、对处理后的历史航班数据进行特征选择,并构建训练数据集和验证数据集;

8、s3、基于knn回归模型构建客流量预测模型,并确定k值;

9、s4、利用训练数据集对客流量预测模型进行模型训练,并利用验证数据集对训练好的客流量预测模型进行模型评估;

10、s5、对客流量预测模型进行模型部署,并对新航班数据进行客流量预测,得到客流量预测结果;

11、s6、对客流量预测结果与对应的实际客流量数据进行误差分析,根据误差分析结果对客流量预测模型进行模型调整;

12、s7、根据新的市场信息定期更新训练数据集和验证数据集,利用更新后的训练数据集和验证数据集对客流量预测模型进行模型重训练,以实现客流量预测模型的持续学习。

13、优选地,s1中收集历史航班数据,对历史航班数据进行数据清洗,包括:

14、利用集成api的数据收集系统,从航空公司数据库、航空数据服务公司、政府公开数据渠道收集历史航班数据;

15、对不同来源的历史航班数据进行自动去重、文本清洗、缺失值填充、异常值检测、数据格式统一,并记录数据来源和时间戳;

16、其中,历史航班数据包括航班信息、票价信息、通航点信息、竞飞航司信息、航司计划航班量、航班计划运力、假期安排、客流量数据;

17、利用正则表达式和数据验证规则进行文本清洗,采用均值填充、中位数填充或基于模型的预测填充方法进行缺失值填充,采用箱线图分析或z值评分方法进行异常值检测。

18、优选地,s2中对处理后的历史航班数据进行特征选择,并构建训练数据集和验证数据集,包括:

19、利用相关性分析和统计显著性测试来识别与客流量高度相关的特征,通过递归式特征消除rfe或基于树的模型对特征进行重要性排序,并进行特征转换和新特征构建得到特征数据;

20、结合客流量数据和对应的特征数据,构建训练数据集和验证数据集。

21、优选地,所述进行特征转换和新特征构建得到特征数据,包括:

22、对于连续特征,采用min-max标准化方法进行特征转换;对于分类特征,采用独热编码或标签编码方法进行特征转换;

23、对于票价信息,通过计算滑动平均、移动标准差的统计量构建新特征;对于竞飞航司信息,通过计算竞飞航司比例指标构建新特征。

24、优选地,s3中基于knn回归模型构建客流量预测模型,并确定k值,包括:

25、设置客流量预测模型的初始模型参数,采用网格搜索结合交叉验证确定最优k值;

26、其中,采用下式确定最优k值:

27、

28、上式中,k为最优k值,k1、k2、…、km为候选k值,mse(n)为第n折交叉验证集的均方误差,m为折数。

29、优选地,s4中利用训练数据集对客流量预测模型进行模型训练,包括:

30、将欧几里得距离作为默认距离度量,利用训练数据集对客流量预测模型进行模型训练;

31、其中,采用下式确定样本数据的预测值:

32、

33、上式中,为训练数据集中第i个样本数据的预测值,yj为第i个样本数据最近邻第j个样本数据对应的标签值,k为最优k值。

34、优选地,s4中利用验证数据集对训练好的客流量预测模型进行模型评估,包括:

35、将验证数据集输入训练好的客流量预测模型,通过计算准确率、召回率、精确率、f1分数、均方误差mse、均方根误差rmse和平均绝对误差mae,并通过可视化工具来评估模型性能;

36、其中,采用下式计算验证数据集的均方误差mse:

37、

38、上式中,b为验证数据集中样本数据数量,为验证数据集中第a个样本数据的预测值,ya为验证数据集中第a个样本数据对应的标签值。

39、优选地,s5中对客流量预测模型进行模型部署,并对新航班数据进行客流量预测,得到客流量预测结果,包括:

40、将客流量预测模型部署至云端或本地服务器,实时采集新航班数据,并利用客流量预测模型对新航班数据进行客流量预测,得到客流量预测结果;

41、其中,采用下式表示客流量预测模型对新航班数据进行客流量预测:

42、

43、上式中,为客流量预测结果,knnregressor为knn回归器,x为新航班数据对应的特征向量。

44、优选地,s6中对客流量预测结果与对应的实际客流量数据进行误差分析,根据误差分析结果对客流量预测模型进行模型调整,包括:

45、对客流量预测结果与对应的实际客流量数据进行误差分析,根据误差分析结果调整k值、特征权重或引入新的特征。

46、优选地,s7中根据新的市场信息定期更新训练数据集和验证数据集,利用更新后的训练数据集和验证数据集对客流量预测模型进行模型重训练,以实现客流量预测模型的持续学习,包括:...

【技术保护点】

1.一种基于KNN回归模型的多维度民航客流量预测方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于KNN回归模型的多维度民航客流量预测方法,其特征在于:S1中收集历史航班数据,对历史航班数据进行数据清洗,包括:

3.根据权利要求2所述的基于KNN回归模型的多维度民航客流量预测方法,其特征在于:S2中对处理后的历史航班数据进行特征选择,并构建训练数据集和验证数据集,包括:

4.根据权利要求3所述的基于KNN回归模型的多维度民航客流量预测方法,其特征在于:所述进行特征转换和新特征构建得到特征数据,包括:

5.根据权利要求3所述的基于KNN回归模型的多维度民航客流量预测方法,其特征在于:S3中基于KNN回归模型构建客流量预测模型,并确定K值,包括:

6.根据权利要求5所述的基于KNN回归模型的多维度民航客流量预测方法,其特征在于:S4中利用训练数据集对客流量预测模型进行模型训练,包括:

7.根据权利要求6所述的基于KNN回归模型的多维度民航客流量预测方法,其特征在于:S4中利用验证数据集对训练好的客流量预测模型进行模型评估,包括:

8.根据权利要求7所述的基于KNN回归模型的多维度民航客流量预测方法,其特征在于:S5中对客流量预测模型进行模型部署,并对新航班数据进行客流量预测,得到客流量预测结果,包括:

9.根据权利要求8所述的基于KNN回归模型的多维度民航客流量预测方法,其特征在于:S6中对客流量预测结果与对应的实际客流量数据进行误差分析,根据误差分析结果对客流量预测模型进行模型调整,包括:

10.根据权利要求9所述的基于KNN回归模型的多维度民航客流量预测方法,其特征在于:S7中根据新的市场信息定期更新训练数据集和验证数据集,利用更新后的训练数据集和验证数据集对客流量预测模型进行模型重训练,以实现客流量预测模型的持续学习,包括:

...

【技术特征摘要】

1.一种基于knn回归模型的多维度民航客流量预测方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于knn回归模型的多维度民航客流量预测方法,其特征在于:s1中收集历史航班数据,对历史航班数据进行数据清洗,包括:

3.根据权利要求2所述的基于knn回归模型的多维度民航客流量预测方法,其特征在于:s2中对处理后的历史航班数据进行特征选择,并构建训练数据集和验证数据集,包括:

4.根据权利要求3所述的基于knn回归模型的多维度民航客流量预测方法,其特征在于:所述进行特征转换和新特征构建得到特征数据,包括:

5.根据权利要求3所述的基于knn回归模型的多维度民航客流量预测方法,其特征在于:s3中基于knn回归模型构建客流量预测模型,并确定k值,包括:

6.根据权利要求5所述的基于knn回归模型的多维度民航客流量预测方法,其特征在于:s4中利用训练数据集对客流量预...

【专利技术属性】
技术研发人员:葛强房亮张韬郑洪峰王洪让周士杨
申请(专利权)人:飞友科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1