一种滞留规则库构建方法及数据滞留分析方法技术

技术编号:21771602 阅读:34 留言:0更新日期:2019-08-03 21:32
本发明专利技术公开了一种滞留规则库构建方法,包括以下步骤:获取一时间段内各收费点的车流信息和时间信息,所述车流信息包括总车流量、非现金车流量和ETC车流量;获取一时间段中星期一至星期天的各收费点的平均车流信息,将车流信息与平均车流信息分别比对以得到相对变化率,将相对变化率迭加车流信息以生成基础数据库;对基础数据库进行分类算法分析以得到滞留规则库。本发明专利技术还公开了一种数据滞留分析方法。本发明专利技术的滞留规则库构建方法通过构建有效的判断规则为联合电服省却了不少非常复杂的应对ETC数据滞留的额外工作与业务,而且还会为相关的ETC车道收费系统开发商省却了大量的赔偿资金。

A Method of Constructing Retention Rule Base and Data Retention Analysis

【技术实现步骤摘要】
一种滞留规则库构建方法及数据滞留分析方法
本专利技术涉及一种数据处理
,尤其涉及一种滞留规则库构建方法及数据滞留分析方法。
技术介绍
目前,广东省电子标签的套装用户接近900多万,达到全国的1/9左右。因此,这带来了非现金车辆与ETC车辆的通行次数大幅度提高,二者在总车流量中所占的比例也得到大幅度提高,目前非现金支付与ETC支付的通行次数所占比例在广东省分别达到了高速公路车辆总体通行次数的45%与34%左右,ETC车辆的通行次数占到了非现金车辆的76%左右。广东联合电子服务股份有限公司(以下简称:联合电服),作为广东省高速公路联网收费的清分结算机构,承担着将所有高速公路的每一笔车辆通行收费记录,按照业务逻辑规则准确地、及时地拆分给相关的每一条高速公路公司,如果有跨省通行车辆的话,还要将跨省交易记录进行省间结算。清分结算的及时性、准确性要求,使得每条高速公路公司都要将生成的车辆收费通行记录及时地传送到联合电服。否则,一旦发生通行记录数据滞留在高速公路公司的收费系统,会严重地影响到给联合电服清分结算工作的准确性与及时性,还会带来非常复杂的后续处理工作,并且还会给相关的高速公路业主公司造成损失。但在实际中,广东省高速公路发生过多起ETC车道的收费数据滞留在ETC车道,没有上传到联合电服。原因在于,首先,高速公路车道收费系统采用的是脱机的交易方式;其次,数据上传采用的是收费车道、收费站、路段中心、联合电服这四级的逐级上传。第三,MTC车道与ETC车道的开发商通常是不同的,ETC车道的出口流水由ETC车道上传到收费站的ETC数据库,然后再由ETC数据库发送到收费站数据库。这就存在着如果ETC车道的收费流水上传环节发生了故障,就会造成收费站数据库、高速公路路段中心数据库中有可能收不到ETC收费流水,进而这些流水也不会上传到联合电服。因此,如何使用海量数据挖掘与分析技术,在全省一个月高达1.7亿条左右的海量车辆通行收费记录中进行数据挖掘与分析,有效地、准确地、及时地挖掘分析出哪些ETC车道存在着数据滞留,并建立一套后续处理机制来进行排查,变得非常紧迫与需要。
技术实现思路
为了克服现有技术的不足,本专利技术的目的之一在于提供一种滞留规则库构建方法,其能滞留规则库构建的技术问题。本专利技术的目的之二在于提供一种电子设备,其能滞留规则库构建的技术问题。本专利技术的目的之三在于提供一种计算机可读存储介质,其能滞留规则库构建的技术问题。本专利技术的目的之四在于提供一种数据滞留分析方法,其能解决数据滞留判断的技术问题。本专利技术的目的之五在于提供一种计算机可读存储介质,其能解决数据滞留判断的技术问题。本专利技术的目的之一采用如下技术方案实现:一种滞留规则库构建方法,包括以下步骤:第一获取步骤:获取一时间段内各收费点的车流信息和时间信息,所述车流信息包括总车流量、非现金车流量和ETC车流量,所述时间信息为车流信息所对应的星期;第二获取步骤:获取一时间段中星期一至星期天的各收费点的平均车流信息,所述平均车流信息包括平均总车流量、平均非现金车流量和平均ETC车流量;计算步骤:将车流信息与平均车流信息分别比对以得到相对变化率,将相对变化率迭加车流信息以生成基础数据库;分类挖掘步骤:对基础数据库进行分类算法分析以得到滞留规则库。进一步地,在所述得到相对变化率之后还包括如下步骤:根据平均车流信息查询滞留数据文件,对查询到的数据增加数据滞留标识,并增加数据滞留标识后的数据存储至基础数据库中。进一步地,在所述第一获取步骤中,所述一时间段为三个月。进一步地,在聚类步骤之后还包括回归验证步骤:对滞留规则库进行数据验证,并输出验证结果。进一步地,在所述聚类步骤中,通过决策树分类算法来对基础数据库进行数据挖掘以生成滞留规则库,在第一获取步骤和第二获取步骤中,所述收费点为各收费站和/或各收费站工班。本专利技术的目的之二采用如下技术方案实现:一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本专利技术目的之一中任意一项所述的一种滞留规则库构建方法。本专利技术的目的之三采用如下技术方案实现:一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如本专利技术目的之一中任意一项所述的一种滞留规则库构建方法。本专利技术的目的之四采用如下技术方案实现:一种数据滞留分析方法,包括如下步骤:每隔预设时间获取一时间段内各收费点的车流信息和时间信息,所述车流信息包括总车流量、非现金车流量和ETC车流量,所述时间信息为车流信息所对应的星期;获取一时间段中星期一至星期天的各收费点的平均车流信息,所述平均车流信息包括平均总车流量、平均非现金车流量和平均ETC车流量;将车流信息与平均车流信息分别比对以得到相对变化率;根据得到的相对变化率将其与滞留规则库中的规则进行比对,以判断对应数据是否为滞留数据,如果是,则进行输出预警结果数据。进一步地,所述预设时间为一周,所述一时间段为一个月。本专利技术的目的之五采用如下技术方案实现:一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如本专利技术目的之三中任意一项所述的一种数据滞留分析方法。相比现有技术,本专利技术的有益效果在于:本专利技术的滞留规则库构建方法通过构建有效的判断规则为联合电服省却了不少非常复杂的应对ETC数据滞留的额外工作与业务,而且还会为相关的ETC车道收费系统开发商省却了大量的赔偿资金。附图说明图1为实施例一的滞留规则库构建方法的流程图;图2为实施例一的滞留规则库构建方法的具体流程图;图3为实施例四的滞留数据分析方法的流程图。具体实施方式下面,结合附图以及具体实施方式,对本专利技术做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。实施例一目前,业界并没有发现ETC数据滞留的有效解决方法。经过对广东省高速公路近二年高达40亿条左右的海量车辆通行收费记录,进行大量的专业的数据统计与分析、数据挖掘,同时也进行了大量的算法研究与实现,不仅发现了ETC收费记录中的终端机交易序列号的跳变规律,也发现了广东省高速公路车流量存在的内在模式。通过对车流量周期性数据挖掘来进行内在模式的确定,从自主开发的车流量周期性判断模型数据获取系统的生成结果数据,建立数据挖掘模型,这里使用了聚类分析中的两种算法,K-Means算法和TwoStep算法对输入数据进行处理,挖掘出高速公路车辆通行收费数据中的隐含的内在模式。这样的内在模式具体是车流量在周一到周日之间会存在有明显的差异化,聚类结果能够发现出这样的趋势,故而在进行设计的时候,对其进行分类处理就显得尤其重要,如果不进行分类,则无法形成有效的判断条件。当发现有这样的内在模式之后,则可以开始设置对应的条件来进行数据模型的构建。并且,广东省高速公路的ETC车道中,61%以上的ETC车道使用2张以上的PSAM卡,有的甚至于一条ETC使用了6张PSAM,但是只有每一张PSAM卡对应生成的ETC收费记录中的终端机交易序列号理论上是连续的,所以如果有1张或者1张以上的PSAM卡生成的ETC流水出现一直不上传的情况,那么是无法用终端机交易序列号理论上的连续性来进行ETC数据滞留计算的。如本文档来自技高网
...

【技术保护点】
1.一种滞留规则库构建方法,其特征在于,包括以下步骤:第一获取步骤:获取一时间段内各收费点的车流信息和时间信息,所述车流信息包括总车流量、非现金车流量和ETC车流量,所述时间信息为车流信息所对应的星期;第二获取步骤:获取一时间段中星期一至星期天的各收费点的平均车流信息,所述平均车流信息包括平均总车流量、平均非现金车流量和平均ETC车流量;计算步骤:将车流信息与平均车流信息分别比对以得到相对变化率,将相对变化率迭加车流信息以生成基础数据库;分类挖掘步骤:对基础数据库进行分类算法分析以得到滞留规则库。

【技术特征摘要】
1.一种滞留规则库构建方法,其特征在于,包括以下步骤:第一获取步骤:获取一时间段内各收费点的车流信息和时间信息,所述车流信息包括总车流量、非现金车流量和ETC车流量,所述时间信息为车流信息所对应的星期;第二获取步骤:获取一时间段中星期一至星期天的各收费点的平均车流信息,所述平均车流信息包括平均总车流量、平均非现金车流量和平均ETC车流量;计算步骤:将车流信息与平均车流信息分别比对以得到相对变化率,将相对变化率迭加车流信息以生成基础数据库;分类挖掘步骤:对基础数据库进行分类算法分析以得到滞留规则库。2.如权利要求1所述的一种滞留规则库构建方法,其特征在于,在所述得到相对变化率之后还包括如下步骤:根据平均车流信息查询滞留数据文件,对查询到的数据增加数据滞留标识,并增加数据滞留标识后的数据存储至基础数据库中。3.如权利要求1所述的一种滞留规则库构建方法,其特征在于,在所述第一获取步骤中,所述一时间段为三个月。4.如权利要求1所述的一种滞留规则库构建方法,其特征在于,在分类挖掘步骤之后还包括回归验证步骤:对滞留规则库进行数据验证,并输出验证结果。5.如权利要求1所述的一种滞留规则库构建方法,其特征在于,在所述分类挖掘步骤中,通过决策树分类算法来对基础数据库进行数据挖掘以生成滞留规则库,在第一获取步骤和第二...

【专利技术属性】
技术研发人员:马根峰陈喆郑泽波黄小明
申请(专利权)人:广东联合电子服务股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1