当前位置: 首页 > 专利查询>清华大学专利>正文

一种用于事故分析与安全评价的平衡采样方法技术

技术编号:12297338 阅读:162 留言:0更新日期:2015-11-11 08:41
本发明专利技术公开了属于安全性评价技术领域的一种用于事故分析与安全评价的平衡采样方法,具体选择某种事故类型,采集相关数据,导入处理系统进行预处理,建立事故分析与安全评价数据集;建立分析模型,进行参数估计及收敛性判断,包括平衡采样事故样本、计数模型求解、重采样参数估计、收敛性判断;最后输出模型结果,针对显著因素分析提出改进建议。本发明专利技术涉及交通事故等偶发事件的预测及评价;采用平衡采样方法能够有效解决采用非平衡数据集的零膨胀问题;保障参数估计结果的稳定性与有效性,提高模型精度,减小参数估计误差,挖掘更多与事故发生相关的显著因素,有效指导实践应用。

【技术实现步骤摘要】

本专利技术属于安全性评价
特别涉及一种用于事故分析与安全评价的平衡采样方法,具体涉及交通事故等偶发事件的预测及评价,具体采用平衡采样方法对非平衡数据集进行概率回归模型的参数估计与影响因素分析。
技术介绍
交通安全是全球范围内与人类健康和发展息息相关的问题,目前多以发生事故的数据为基础,利用计数模型建立事故风险和伤亡程度评估模型,分析影响事故发生及其严重程度的显著因素,进行安全评价,进而提出交通安全改善建议。计数模型是一种概率回归模型,包括泊松模型、负二项分布模型等,在建模过程中,需要大量的事故数据作为观测样本,进而求解模型中的未知参数。根据现有交通理论,交通流量、交通控制与管理方案、天气等都是影响事故发生的重要因素,为研究上述因素对事故的影响,需要较细时间粒度的数据,实际中多以小时为单位,建立时间离散的事故分析数据集。但由于事故数据获取的局限性及其偶发性,时间离散的数据集中常常出现大量事故数为零的样本,由此出现事故数据的零膨胀问题(也称零堆积问题,指在现有的时空划分方法下,数据包含过量的零),导致数据集严重失衡,使得模型参数估计的准确性和可靠性不足(Shankaretal.,1997;Washingtonetal.,2011),不能有效指导交通安全工程实践。为解决事故数据零膨胀问题,Miaou(1994年),LeeandMannering(2002年),Shankar(2003年),HuangandChin(2010年)等人,提出了一类零膨胀计数模型(zero-inflatedcountdatamodels),这类模型假设道路有两种安全状态(即事故数为0的两种情况),一种是绝对安全,一种是相对安全,这种模型相比于传统计数模型有更好的拟合性。但是Lord等人在2005和2007年的研究中分别指出,绝对安全的道路是不存在的,应该利用合理的时空划分解决数据中零过量的问题,但Lord并没有给出合理划分时间、空间的方法。虽然后继研究者进一步提出各类解决零膨胀问题的方法,但都无法改变非平衡数据集带来的局限性。
技术实现思路
本专利技术的目的是提供一种用于事故分析与安全评价的平衡采样方法,其特征在于,包括如下步骤:步骤1、选择某种待分析的事故类型,并采集该种事故历年相关事故数据,导入处理系统进行预处理,建立事故分析与安全评价数据集;步骤2、根据步骤1得到的事故分析与安全评价数据集建立分析模型,进行参数估计及收敛性判断;其中包括平衡采样事故样本、计数模型求解、重采样参数估计和收敛性判断;步骤3、输出模型结果,针对显著因素,分析提出改进建议。所述步骤1中,选择某种待分析的事故类型包括交通事故、工农业生产中发生的事故和自然灾害;采集相关数据,并进行预处理,包括:步骤101、采集搜集各类数据,建立包含交通流量、道路设计参数、交通控制与管理要素和天气条件的交通事故数据集;步骤102、针对每个道路实体,每个单位时间,以事故数量为回归模型的事故数Y为因变量,以可能影响事故发生的因素为自变量X,建立包含交通流量、道路设计参数、交通控制与管理要素和天气条件等影响因素的交通事故数据集,共得到M条数据;步骤103、检查多个影响因素X的多重共线性问题,删除多余的共线性变量。所述步骤2中采用平衡采样方法多次抽取平衡数据集,并采用概率回归模型求解多组模型参数,进而进行参数估计及收敛性判断,具体做法包括:步骤201、按照每条道路单位时间内事故数量是否为零,将全部数据分为2类,一类是事故非零数据,一类是事故数为零数据;在所有M条数据中,非零数据记为K条;步骤202、从(M-K)条事故为零的样本中随机抽取K条数据,即比例为1:1地将K条事故为零数据和K条事故非零数据组成新的数据集合B;B含有2K条数据,且B中事故为零与事故非零样本数平衡;步骤203、基于数据集合B,采用计数模型建立交通安全评估方程Y=f(βX)),求解模型参数β的一组解;其中Y为事故数;步骤204、重复采样,重复步骤202和203多次,直至结果收敛;步骤205、基于多组模型参数估计结果,计算参数β的标准差(或称为估计误差)、置信区间和显著水平。所述步骤3输出模型结果,包括:步骤301、根据计算参数β的标准差(或称为估计误差)、置信区间和显著水平的情况,筛选对事故发生影响显著的自变量X,称这些自变量X为显著因素;步骤302、分析显著因素X对事故数Y的影响;步骤303、根据步骤302的分析,推出安全改进措施对策与建议。本专利技术的有益效果是:1.平衡采样样本,采用平衡采样方法,能够有效解决计数模型所采用非平衡数据集的零膨胀问题。且不依赖对研究对象的前提假设,有效避免了现存零膨胀计数模型的基本假设不合理问题。2.收敛模型参数,重复采样并求解多次,直到模型参数能够很好的收敛,保障参数估计结果的稳定性与有效性。3.提高模型精度,改进模型的精度,参数估计误差更小。4.挖掘显著因素,可以挖掘更多与事故发生相关的显著因素,有效指导实践应用。附图说明图1用于事故分析与安全评价的平衡采样方法的工作流程示意图。具体实施方式步骤1、选择某种待分析的事故类型,并采集该种事故历年相关事故数据,导入处理系统进行预处理,建立事故分析与安全评价数据集;步骤2、根据步骤1得到的事故分析与安全评价数据集建立分析模型,进行参数估计及收敛性判断;其中包括平衡采样事故样本、计数模型求解、重采样参数估计、收敛性判断;步骤3、输出模型结果,针对显著因素,分析提出改进建议。实施例针对上述的三大步骤,以某大城市道路交通事故分析为例,对本专利技术予以说明。所述步骤1中,安全分析相关数据采集与预处理包括:步骤101、采集搜集各类数据,建立包含交通流量、道路设计参数、交通控制与管理要素和天气条件的交通事故数据集;步骤102、针对每个道路实体,每个单位时间,以事故数量为回归模型的(因变量)事故数Y,以可能影响事故发生的因素为自变量X,建立包含交通流量、道路设计参数、交通控制与管理要素、天气条件的交通事故数据集,共得到2,230,314条数据;特征如表1所示:步骤103、检查多个影响因素X的多重共线性问题,删除多余的共线性变量。表1模型数据汇总情况所述步骤2中采用平衡采样方法多次抽取平衡数据集,并采用概率回归模型求解多组模型参数,进而进行参数估计及收敛性判断,具体做法包括:步骤201、按照每条道路单位本文档来自技高网
...
一种用于事故分析与安全评价的平衡采样方法

【技术保护点】
一种用于事故分析与安全评价的平衡采样方法,其特征在于,包括如下步骤:步骤1、选择某种待分析的事故类型,并采集该种事故历年相关事故数据,导入处理系统进行预处理,建立事故分析与安全评价数据集;步骤2、根据步骤1得到的事故分析与安全评价数据集建立分析模型,进行参数估计及收敛性判断;其中包括平衡采样事故样本、计数模型求解、重采样参数估计、收敛性判断;步骤3、输出模型结果,针对显著因素,分析提出改进建议。

【技术特征摘要】
1.一种用于事故分析与安全评价的平衡采样方法,其特征在于,包括如下步
骤:
步骤1、选择某种待分析的事故类型,并采集该种事故历年相关事故数据,
导入处理系统进行预处理,建立事故分析与安全评价数据集;
步骤2、根据步骤1得到的事故分析与安全评价数据集建立分析模型,进行
参数估计及收敛性判断;其中包括平衡采样事故样本、计数模型求解、重采样参
数估计、收敛性判断;
步骤3、输出模型结果,针对显著因素,分析提出改进建议。
2.根据权利要求1所述用于事故分析与安全评价的平衡采样方法,其特征在
于,所述步骤1中,选择某种待分析的事故类型包括交通事故、工农业生产中发
生的事故和自然灾害;并采集相关数据,进行预处理,包括:
步骤101、采集搜集各类数据,建立包含交通流量、道路设计参数、交通控
制与管理要素和天气条件的交通事故数据集;
步骤102、针对每个道路实体,每个单位时间,以事故数量为回归模型的因
变量Y,以可能影响事故发生的因素为自变量X,建立包含交通流量、道路设计
参数、交通控制与管理要素、天气条件等影响因素的交通事故数据集,共得到M
条数据;
步骤103、检查多个影响因素X的多重共线性问题,删除多余的共线性变量。
3.根据权利要求1所述用于事故分析与安全评价的平衡采样方法,其特征在
于,所述步骤2中采用...

【专利技术属性】
技术研发人员:裴欣李力李兴山张佐姚丹亚张毅
申请(专利权)人:清华大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1