The invention discloses a method for identifying traffic abnormal sections based on quality control of vehicle electronic label data, including preliminary data detection and quality control based on error data, redundant data, data quality control based on traffic flow evolution law, and identification of highway traffic abnormal sections based on effective data sets. Firstly, four types of error data in the original vehicle tag data are identified and eliminated to obtain the preliminary screening data set. Secondly, two kinds of redundant data in the preliminary screening data are eliminated to obtain the correct data set. Then the traffic anomaly data in the correct data set is repaired to obtain the valid data set. Finally, with the help of the properties of license plate number, traffic flow and passing time in the effective data set, the identification of abnormal sections of expressway traffic and the optimization design of toll collection system are carried out, which avoids the interference of noise data and ensures the rationality of the scheme.
【技术实现步骤摘要】
基于车载电子标签数据质量控制的交通异常区段识别方法
本专利技术属于智能交通领域,涉及一种基于车载电子标签数据质量控制的交通异常区段识别方法。
技术介绍
随着城市的不断发展,机动车数量逐年攀升,对有限的城市空间造成了巨大的交通压力,国内外各大城市均不同程度地面临着交通运行效率低下、交通事故频发等交通问题,而解决交通问题需以高质量的动态交通数据作为支撑。而车载电子标签技术作为一种无线通信技术,作为当前进行动态交通数据采集的重要途径,在获取交通数据方面具有造价低、识别快的特征,车载电子标签技术通过无线电讯号识别特定车辆并读写相关数据,无需识别系统与目标间建立机械或者光学接触即可实现车辆的自动辨识与追踪,可便捷地获取大量的交通数据。但受异常交通状况、不良天气及仪器故障等诸多因素影响,车载电子标签技术进行数据采集时易出现标签写入信息错误、传输通讯过程故障及数据重复采集等现象,导致采集的数据存在错误、冗余和异常,需借助异常数据识别修复提高数据质量。目前,数据的质量控制方法主要有三类:1)基于阈值判别法的错误数据识别;2)基于移动平均及历史数据的缺损数据识别;3)基于数据平滑及回归分析的异常数据识别。虽然前人就异常数据进行了充足的研究,但研究多集中于异常数据的识别,较少涉及数据的修复,在实际操作中进行数据修复仅是借助重复扫描以确认是否为元数据错误,对非元数据错误采用重复读取的方法进行修正,对错误数据仅进行简单的剔除。此外,数据的识别及修复具有严格的适用性,不同数据类型的识别修复方法也千差万别,目前在车载电子标签数据的质量控制方法上仍缺乏一套完整的、能够直接指导数据使用者 ...
【技术保护点】
1.一种基于车载电子标签数据质量控制的交通异常区段识别方法,其特征在于,该方法包括以下步骤:1)识别首位汉字异常数据、字符异常数据、汉字数量异常数据及后五位位数不足数据四类错误数据,对原始车载电子标签数据中的错误数据进行剔除,获取初步筛选数据集;2)识别重复数据、相似数据两类冗余数据,对初步筛选数据集中的冗余数据进行剔除,获取正确数据集;3)在正确数据集基础上,将固定时间汇集度下的流量转换为单位小时的标准流量,获取基站标准流量数据集;4)在标准流量数据集基础上,根据图基平滑法识别异常流量数据,并依据多元线性回归对异常流量数据进行修复;5)依据有效数据集中的过车时间、车牌号、流量数据,进行高速公路交通异常区段识别。
【技术特征摘要】
2018.12.03 CN 20181146796031.一种基于车载电子标签数据质量控制的交通异常区段识别方法,其特征在于,该方法包括以下步骤:1)识别首位汉字异常数据、字符异常数据、汉字数量异常数据及后五位位数不足数据四类错误数据,对原始车载电子标签数据中的错误数据进行剔除,获取初步筛选数据集;2)识别重复数据、相似数据两类冗余数据,对初步筛选数据集中的冗余数据进行剔除,获取正确数据集;3)在正确数据集基础上,将固定时间汇集度下的流量转换为单位小时的标准流量,获取基站标准流量数据集;4)在标准流量数据集基础上,根据图基平滑法识别异常流量数据,并依据多元线性回归对异常流量数据进行修复;5)依据有效数据集中的过车时间、车牌号、流量数据,进行高速公路交通异常区段识别。2.根据权利要求1所述的一种基于车载电子标签数据质量控制的交通异常区段识别方法,其特征在于,所述步骤1)中的原始电子标签数据是指车辆驶过电子标签基站时,后台数据管理系统以固定的时间汇集度记录的过车数据,每条数据包括过车时间、车牌号、流量、车道编号。3.根据权利要求1所述的一种基于车载电子标签数据质量控制的交通异常区段识别方法,其特征在于,所述步骤1)中错误数据检测方法如下:1.1)对于原始车载电子标签数据中的某条车辆数据,判断其车牌号字符长度是否等于8,若不等于8,则进入1.2),否则进入1.3);1.2)判断字符长度是否大于8,若大于8则标记为“汉字数量异常数据”,进入1.5),若小于8则标记为“后五位位数不足数据”,进入1.5);1.3)判断车牌首汉字是否异常,若首汉字异常则将其标记为“首汉字异常数据”,进入1.5),否则进入1.4);1.4)判断车牌中是否包括特殊字符,若有则标记为“字符异常数据”,进入1.5),否则标记为“正确数据”,进入1.5);1.5)判断是否遍历所有原始电子标签数据,若未遍历则返回步骤1.1)对下一条数据进行判别,否则输出剔除“首汉字异常数据、字符异常数据、汉字数量异常数据、后五位位数不足数据”后的数据,并作为初步筛选数据集。4.根据权利要求1、2或3所述的一种基于车载电子标签数据质量控制的交通异常区段识别方法,其特征在于,所述步骤2)中冗余数据检测方法如下:2.1)将初步筛选数据集所包括的N个不同车牌号标记为P1,P2…PN,并将相同车牌号的过车数据按时间序列排...
【专利技术属性】
技术研发人员:李立志,陈学钢,张力,
申请(专利权)人:江苏瑞福智能科技有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。