车站广告媒体资源价值及收益预测回归方法及预测模型技术

技术编号:23767760 阅读:21 留言:0更新日期:2020-04-11 20:46
本发明专利技术实施例提供了一种车站广告媒体资源价值及收益预测回归方法及预测模型。通过从不同数据源获取高铁车站的生产经营数据对回归预测模型进行训练,在训练过程中采用训练和测试相结合,并通过交叉验证的方式寻找最优的回归算法,并进一步对回归算法进行参数调优,才能够建立一套科学可行的铁路经营数据分析与评估预测模型,对铁路媒体广告的经营与发展提供更加有效的支撑,从而解决现有技术中对车站广告媒体资源价值及收益的预测缺乏科学方法体系的问题。

Regression method and prediction model for the value and income of advertising media resources in stations

【技术实现步骤摘要】
车站广告媒体资源价值及收益预测回归方法及预测模型
本专利技术涉及人工智能
,尤其涉及一种车站广告媒体资源价值及收益的回归预测模型的训练方法、车站广告媒体资源价值及收益的回归预测方法。
技术介绍
中国高铁营业里程2018年底达到2.9万公里,成为世界上运营里程最长、运输密度最高、场景最复杂、客流量最大的国家。高铁广告媒体当下正经历着前所未有的发展空间和机遇,蕴含着巨大的经济价值潜力,特别是高铁乘客群体规模快速增长,新媒体类型日趋多元,其广告学意义上的传播效应是巨大的。而当前高铁媒体经营价值收入评估因分局经营,各自为政,还停留在以经营单位内有限的招商历史数据和相关业务管理人员决策为依据,辅以传统抽样调查评估方法为手段,未形成全路局媒体业务大数据为依据的科学、综合、有效的方法和技术支撑体系。
技术实现思路
有鉴于此,本专利技术实施例提供了一种车站广告媒体资源价值及收益的回归预测模型的训练方法、车站广告媒体资源价值及收益的回归预测方法,用以解决现有技术中对车站广告媒体资源价值及收益的预测缺乏科学方法体系的问题。一方面,本专利技术实施例提供了一种车站广告媒体资源价值及收益的回归预测模型的训练方法,包括:从多个数据源获取与车站广告媒体资源价值及收益相关的原始数据;对所述原始数据进行预处理,以得到数据样本集;从所述数据样本集中选取训练样本集和测试样本集;分别利用所述训练样本集和所述测试样本集对所述回归预测模型中的各个回归算法进行训练测试和交叉验证,以得到各个回归算法的模型评价参数指标;比较各个所述模型评价参数指标确定基于所述数据样本集的最优回归预测模型;基于所述最优回归预测模型中的回归算法进行参数调优,以得到训练好的回归预测模型。在一个可能的设计中,对所述原始数据进行预处理,以得到数据样本集之后还包括:根据不同的业务需求从所述数据样本集中提取数据特征集;从所述数据样本集中选取训练样本集和测试样本集包括:从所述数据特征集中选取训练样本集和测试样本集。在一个可能的设计中,从所述数据样本集中选取训练样本集和测试样本集包括:设定所述测试样本集占所述数据样本集的百分比;依照所述百分比从所述数据样本集中任意选取数据样本作为当前的测试样本集,并将其余的数据样本作为当前的训练样本集;从所述数据样本集中还未被选取为测试样本集的数据样本中,依照所述百分比任意选取数据样本作为下次的测试样本集,并将其余的数据样本作为下次的训练样本集,直至所述数据样本集中所有数据样本都已被选取为测试样本集。在一个可能的设计中,分别利用所述训练样本集和所述测试样本集对所述回归预测模型中的各个回归算法进行训练测试和交叉验证,以得到各个回归算法的模型评价参数指标包括:将本次选取的训练样本集对所述回归预测模型中的各个回归算法进行训练,并将对应的测试样本集对训练后的各个回归算法进行测试;将下次选取的训练样本集对所述回归预测模型中的回归算法进行训练,并将对应的测试样本集对训练后的回归算法进行测试,直至遍历所有测试样本集对回归算法的测试,从而得到回归算法的模型评价参数指标。在一个可能的设计中,所述模型评价参数指标包括:方差得分、平均绝对误差、均方差以及判定系数r2。在一个可能的设计中,所述数据源包括:全路媒体管理系统、第三方数据源、客运售票系统、全路媒体上刊及巡检系统以及客运旅客用户画像系统中的任一种或多种数据源。另一方面,本专利技术实施例还提供了一种车站广告媒体资源价值及收益的回归预测方法,包括:从多个数据源获取待预测车站的实际经营参数;将所述实际经营参数输入训练好的回归预测模型,以对所述待预测车站的媒体经营收入进行回归预测;其中,所述训练好的回归预测模型是采用上述车站广告媒体资源价值及收益的回归预测模型的训练方法训练得到。在一个可能的设计中,在所述从多个数据源获取待预测车站的实际经营参数之后还包括:根据业务需求设置动态可配置参数;基于所述动态可配置参数对所述实际经营参数进行调整,以得到调整经营参数。在一个可能的设计中,将所述实际经营参数输入训练好的回归预测模型,以对所述待预测车站的经营收入进行回归预测,包括:将所述调整经营参数输入训练好的回归预测模型,以对所述待预测车站的经营收入进行回归预测。又一方面,本专利技术实施例提供了一种车站广告媒体资源价值及收益的回归预测模型的训练装置,包括:原始数据获取模块,用于从多个数据源获取与车站广告媒体资源价值及收益相关的原始数据;数据预处理模块,用于对所述原始数据进行预处理,以得到数据样本集;样本集选取模块,用于从所述数据样本集中选取训练样本集和测试样本集;训练处理模块,用于分别利用所述训练样本集和所述测试样本集对所述回归预测模型中的回归算法进行训练测试和交叉验证,以得到回归算法的模型评价参数指标;参数指标比较模块,用于比较各个所述模型评价参数指标确定基于所述数据样本集的最优回归预测模型;参数调优模块,用于基于所述最优回归预测模型中的回归算法进行参数调优,以得到训练好的回归预测模型。再一方面,本专利技术实施例还提供了一种车站广告媒体资源价值及收益的回归预测装置,包括:经营参数获取模块,用于从多个数据源获取待预测车站的实际经营参数;回归预测处理模块,用于将所述实际经营参数输入训练好的回归预测模型,以对所述待预测车站的媒体经营收入进行回归预测;其中,所述训练好的回归预测模型是采用上述车站广告媒体资源价值及收益的回归预测模型的训练装置训练得到。与现有技术相比,本技术方案至少具有如下有益效果:根据本专利技术实施例提供的车站广告媒体资源价值及收益的回归预测模型的训练方法,从多个数据源获取与车站广告媒体资源价值及收益相关的原始数据,并对原始数据进行预处理以得到适于回归预测模型训练使用的数据样本集。在利用数据样本集对回归预测模型进行训练过程中,先设定测试样本集占数据样本集的百分比,然后从数据样本集依照设定的百分比选取数据样本作为当前的测试样本集,将其余部分的数据样本作为当前的训练样本集,利用测试样本集对经过训练样本集训练后的回归算法进行测试;进而再从数据样本集中还未被选取为测试样本集的数据样本中,再依照该百分比选取数据样本作为下次的测试样本集,并将其余的数据样本作为下次的训练样本集,以此类推,直至所述数据样本集中所有数据样本都已被选取为测试样本集,从而实现对各个回归算法的交叉验证,从而得到各个回归算法的模型评价参数指标。也就是说,选取的训练样本集会有重复,而每次选取的测试样本集在历次的交叉验证中是无重复的,且遍历所有的数据样本集。然后,比较各个模型评价参数指标确定基于所述数据样本集的最优回归预测模型,再根据最优回归预测模型中的回归算法进行参数调优,以得到训练好的回归预测模型。从而可以利用训练好的回归预测模型对待预测车站的经营收入进行回归预测,为媒体招商及后期优化提供数据支撑。【附图说明】为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发本文档来自技高网...

【技术保护点】
1.一种车站广告媒体资源价值及收益的回归预测模型的训练方法,其特征在于,所述训练方法包括:/n从多个数据源获取与车站广告媒体资源价值及收益相关的原始数据;/n对所述原始数据进行预处理,以得到数据样本集;/n从所述数据样本集中选取训练样本集和测试样本集;/n分别利用所述训练样本集和所述测试样本集对所述回归预测模型中的回归算法进行训练测试和交叉验证,以得到回归算法的模型评价参数指标;/n比较各个所述模型评价参数指标确定基于所述数据样本集的最优回归预测模型;/n基于所述最优回归预测模型中的回归算法进行参数调优,以得到训练好的回归预测模型。/n

【技术特征摘要】
1.一种车站广告媒体资源价值及收益的回归预测模型的训练方法,其特征在于,所述训练方法包括:
从多个数据源获取与车站广告媒体资源价值及收益相关的原始数据;
对所述原始数据进行预处理,以得到数据样本集;
从所述数据样本集中选取训练样本集和测试样本集;
分别利用所述训练样本集和所述测试样本集对所述回归预测模型中的回归算法进行训练测试和交叉验证,以得到回归算法的模型评价参数指标;
比较各个所述模型评价参数指标确定基于所述数据样本集的最优回归预测模型;
基于所述最优回归预测模型中的回归算法进行参数调优,以得到训练好的回归预测模型。


2.如权利要求1所述的训练方法,其特征在于,对所述原始数据进行预处理,以得到数据样本集之后还包括:
根据不同的业务需求从所述数据样本集中提取数据特征集;
所述从所述数据样本集中选取训练样本集和测试样本集包括:
从所述数据特征集中选取训练样本集和测试样本集。


3.如权利要求1所述的训练方法,其特征在于,所述从所述数据样本集中选取训练样本集和测试样本集包括:
设定所述测试样本集占所述数据样本集的百分比;
依照所述百分比从所述数据样本集中任意选取数据样本作为当前的测试样本集,并将其余的数据样本作为当前的训练样本集;
从所述数据样本集中还未被选取为测试样本集的数据样本中,依照所述百分比任意选取数据样本作为下次的测试样本集,并将其余的数据样本作为下次的训练样本集,直至所述数据样本集中所有数据样本都已被选取为测试样本集。


4.如权利要求3所述的训练方法,其特征在于,所述分别利用所述训练样本集和所述测试样本集对所述回归预测模型中的回归算法进行训练测试和交叉验证,以得到回归算法的模型评价参数指标包括:
将当前选取的训练样本集对所述回归预测模型中的回归算法进行训练,并将对应的测试样本集对训练后的回归算法进行测试;
将下次选取的训练样本集对所述回归预测模型中的回归算法进行训练,并将对应的测试样本集对训练后的回归算法进行测试,直至遍历所有测试样本集对回归算法的测试,从而得到回归算法的模型评价参数指标。


5.如权利要求1所述的训练方法,其特征在于,所述模型评价参数指标包括:方差得分、平均绝对误差、均方差以及判定系数r2。


6.如权利要求1所述的训练方法,其特征在于,所述数据源包括:全路媒体管理系统、第三方数据源、客运售票系统、全路媒体上刊及巡检系统以及客运旅客用户画像系统中的任一种或多种数据源。


7.一种车站广告媒体资源价值及收益的回归预测方法,其特征在于,包括:
从多个数据源获取待预测车站的实际经营参数;
将所述实际经营参数输入训练好的回归预测模型,以对所述待预测车站的媒体经营收入进行回归预测;
其中,所述训练好的回归预测模型是采用权利要求1~6中任一项所述的车站广告媒体资源价值及收益的回归预测模型的训练方法训练得到。


8.如权利要求7所述的回归预测方法,其特征在于,在所述从多个数据源获取待预测车站的实际经营参数之后还包括:
根据业务需求设置动态可配置参数;
基于所述动态可配置参数对所述实际经营参数进行调整,以得到调整经营参数。


9.如权利要求8所述的回归预测方法,其特征在于,将所述实际经营参数输入训练好的回归预测模型,以对所述待预测车站的媒体经营收入进行回归预测包括:
将所述调整经营参数输入训练好的回归预测模型,以对所述待预测车站的媒体经...

【专利技术属性】
技术研发人员:许娜吴刚单杏花陈靖付睿杨琳卢迪宋卿赵亚涛赵小强
申请(专利权)人:中国铁道科学研究院集团有限公司电子计算技术研究所北京经纬信息技术有限公司中铁程科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1