当前位置: 首页 > 专利查询>中国铁道科学研究院集团有限公司电子计算技术研究所专利>正文

车站广告媒体资源价值及收益预测回归方法及预测模型技术

技术编号：23767760 阅读：21 留言：0更新日期：2020-04-11 20:46

本发明专利技术实施例提供了一种车站广告媒体资源价值及收益预测回归方法及预测模型。通过从不同数据源获取高铁车站的生产经营数据对回归预测模型进行训练，在训练过程中采用训练和测试相结合，并通过交叉验证的方式寻找最优的回归算法，并进一步对回归算法进行参数调优，才能够建立一套科学可行的铁路经营数据分析与评估预测模型，对铁路媒体广告的经营与发展提供更加有效的支撑，从而解决现有技术中对车站广告媒体资源价值及收益的预测缺乏科学方法体系的问题。

Regression method and prediction model for the value and income of advertising media resources in stations

全部详细技术资料下载

【技术实现步骤摘要】
车站广告媒体资源价值及收益预测回归方法及预测模型
本专利技术涉及人工智能
，尤其涉及一种车站广告媒体资源价值及收益的回归预测模型的训练方法、车站广告媒体资源价值及收益的回归预测方法。
技术介绍
中国高铁营业里程2018年底达到2.9万公里，成为世界上运营里程最长、运输密度最高、场景最复杂、客流量最大的国家。高铁广告媒体当下正经历着前所未有的发展空间和机遇，蕴含着巨大的经济价值潜力，特别是高铁乘客群体规模快速增长，新媒体类型日趋多元，其广告学意义上的传播效应是巨大的。而当前高铁媒体经营价值收入评估因分局经营，各自为政，还停留在以经营单位内有限的招商历史数据和相关业务管理人员决策为依据，辅以传统抽样调查评估方法为手段，未形成全路局媒体业务大数据为依据的科学、综合、有效的方法和技术支撑体系。
技术实现思路
有鉴于此，本专利技术实施例提供了一种车站广告媒体资源价值及收益的回归预测模型的训练方法、车站广告媒体资源价值及收益的回归预测方法，用以解决现有技术中对车站广告媒体资源价值及收益的预测缺乏科学方法体系的问题。一方面，本专利技术实施例提供了一种车站广告媒体资源价值及收益的回归预测模型的训练方法，包括：从多个数据源获取与车站广告媒体资源价值及收益相关的原始数据；对所述原始数据进行预处理，以得到数据样本集；从所述数据样本集中选取训练样本集和测试样本集；分别利用所述训练样本集和所述测试样本集对所述回归预测模型中的各个回归算法进行训练测试和交叉验证，以得到各个回归算法的模型评价参...

【技术保护点】
1.一种车站广告媒体资源价值及收益的回归预测模型的训练方法，其特征在于，所述训练方法包括：/n从多个数据源获取与车站广告媒体资源价值及收益相关的原始数据；/n对所述原始数据进行预处理，以得到数据样本集；/n从所述数据样本集中选取训练样本集和测试样本集；/n分别利用所述训练样本集和所述测试样本集对所述回归预测模型中的回归算法进行训练测试和交叉验证，以得到回归算法的模型评价参数指标；/n比较各个所述模型评价参数指标确定基于所述数据样本集的最优回归预测模型；/n基于所述最优回归预测模型中的回归算法进行参数调优，以得到训练好的回归预测模型。/n

【技术特征摘要】
1.一种车站广告媒体资源价值及收益的回归预测模型的训练方法，其特征在于，所述训练方法包括：
从多个数据源获取与车站广告媒体资源价值及收益相关的原始数据；
对所述原始数据进行预处理，以得到数据样本集；
从所述数据样本集中选取训练样本集和测试样本集；
分别利用所述训练样本集和所述测试样本集对所述回归预测模型中的回归算法进行训练测试和交叉验证，以得到回归算法的模型评价参数指标；
比较各个所述模型评价参数指标确定基于所述数据样本集的最优回归预测模型；
基于所述最优回归预测模型中的回归算法进行参数调优，以得到训练好的回归预测模型。

2.如权利要求1所述的训练方法，其特征在于，对所述原始数据进行预处理，以得到数据样本集之后还包括：
根据不同的业务需求从所述数据样本集中提取数据特征集；
所述从所述数据样本集中选取训练样本集和测试样本集包括：
从所述数据特征集中选取训练样本集和测试样本集。

3.如权利要求1所述的训练方法，其特征在于，所述从所述数据样本集中选取训练样本集和测试样本集包括：
设定所述测试样本集占所述数据样本集的百分比；
依照所述百分比从所述数据样本集中任意选取数据样本作为当前的测试样本集，并将其余的数据样本作为当前的训练样本集；
从所述数据样本集中还未被选取为测试样本集的数据样本中，依照所述百分比任意选取数据样本作为下次的测试样本集，并将其余的数据样本作为下次的训练样本集，直至所述数据样本集中所有数据样本都已被选取为测试样本集。

4.如权利要求3所述的训练方法，其特征在于，所述分别利用所述训练样本集和所述测试样本集对所述回归预测模型中的回归算法进行训练测试和交叉验证，以得到回归算法的模型评价参数指标包括：
将当前选取的训练样本集对所述回归预测模型中的回归算法进行训练，并将对应的测试样本集对训练后的回归算法进行测试；
将下次选取的训练样本集对所述回归预测模型中的回归算法进行训练，并将对应的测试样本集对训练后的回归算法进行测试，直至遍历所有测试样本集对回归算法的测试，从而得到回归算法的模型评价参数指标。

5.如权利要求1所述的训练方法，其特征在于，所述模型评价参数指标包括：方差得分、平均绝对误差、均方差以及判定系数r2。

6.如权利要求1所述的训练方法，其特征在于，所述数据源包括：全路媒体管理系统、第三方数据源、客运售票系统、全路媒体上刊及巡检系统以及客运旅客用户画像系统中的任一种或多种数据源。

7.一种车站广告媒体资源价值及收益的回归预测方法，其特征在于，包括：
从多个数据源获取待预测车站的实际经营参数；
将所述实际经营参数输入训练好的回归预测模型，以对所述待预测车站的媒体经营收入进行回归预测；
其中，所述训练好的回归预测模型是采用权利要求1～6中任一项所述的车站广告媒体资源价值及收益的回归预测模型的训练方法训练得到。

8.如权利要求7所述的回归预测方法，其特征在于，在所述从多个数据源获取待预测车站的实际经营参数之后还包括：
根据业务需求设置动态可配置参数；
基于所述动态可配置参数对所述实际经营参数进行调整，以得到调整经营参数。

9.如权利要求8所述的回归预测方法，其特征在于，将所述实际经营参数输入训练好的回归预测模型，以对所述待预测车站的媒体经营收入进行回归预测包括：
将所述调整经营参数输入训练好的回归预测模型，以对所述待预测车站的媒体经...

【专利技术属性】
技术研发人员：许娜，吴刚，单杏花，陈靖，付睿，杨琳，卢迪，宋卿，赵亚涛，赵小强，
申请(专利权)人：中国铁道科学研究院集团有限公司电子计算技术研究所，北京经纬信息技术有限公司，中铁程科技有限责任公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人