基于优化随机森林的车载容迟网数据报文转发方法技术

技术编号:34128691 阅读:10 留言:0更新日期:2022-07-14 14:51
本发明专利技术公开了一种基于优化随机森林的车载容迟网数据报文转发方法:首先基于历史训练集生成多棵以车辆节点投递等级为预测目标的分类回归决策树,建立初始随机森林模型。然后,通过决策权重和相似性两个指标优化随机森林模型。在数据报文转发过程中当携带数据报文的车辆节点与该报文的目的车辆节点相遇,则将报文直接转发给目的车辆节点;否则,当前车辆节点利用优化的随机森林模型预测自身的投递等级,并请求相遇车辆节点返回其投递等级。若相遇车辆节点的投递等级更高,则将报文转发给相遇车辆节点;否则,当前车辆节点保留该报文。本发明专利技术考虑了随机森林模型的泛化能力和准确性,提高了车载容迟网数据报文转发的投递率,同时减少了网络开销。减少了网络开销。减少了网络开销。

【技术实现步骤摘要】
基于优化随机森林的车载容迟网数据报文转发方法


[0001]本专利技术涉及基于优化随机森林的车载容迟网数据报文转发方法,属于车载容迟网络中路由协议的领域。

技术介绍

[0002]车载容迟网络(Vehicular Delay Tolerant Networks,VDTNs)是一种将延迟容忍网络应用到车联网中的一种新型网络结构,通过车辆节点的移动、相遇带来的机会进行数据的“存储

携带

转发”(store

carry

forward)的路由模式来实现通信。在传统的网络中,通常都是依赖于一些基础设施,所以针对这种类型的网络研究都是基于确定的端到端的连接假设。然而在动态环境中是无法保证网络是贯穿始终的端到端的连接。因此,通过利用延迟容忍网络(DTN,Delay

Tolerant Network,或Disruption

Tolerant Network)解决了在极端情况下缺乏端到端的连接下的通信问题。在实际应用,车载容迟网络能有效解决道路拥塞管理、交通事故传播等,这些应用场景通常具有传输延迟大、传输率低、网络拥塞、排队时间长等特点。
[0003]目前已有的典型算法包括Epidemic、Spray and Wait和Prophet等。Epidemic是基于泛洪策略的路由算法,每个车辆节点都将报文副本传递给相遇的所有邻居节点,可以最大化的提升成功的投递率,但是在实际环境下,消息泛洪往往会导致网络拥塞。Spray and Wait路由算法则通过限制消息副本的数目来解决消息泛洪问题,但与此同时,该算法的投递率等性能指标也有所降低。Prophet路由算法则利用节点相遇的历史信息估计不同节点与消息目的节点之间的相遇概率,根据相遇概率决定消息转发策略。然而,在VDTN中,车辆的移动通常具有特定的模式,例如公交车遵循固定的路线和时刻表,私家车的移动倾向于有规律的轨迹,出租车的移动行为则体现了人流的热区等。而Prophet路由算法并没有很好地考虑车辆的这些移动模式。近几年随着机器学习的兴起,许多机器学习中的算法都被应用到DTN路由算法,比如决策树、强化学习、朴素贝叶斯分类器等。然而,决策树泛化能力差,而且并不够稳定,小部分数据的变化会导致生成结构相差较大的树形结构。强化学习则收敛速度较慢,并导致额外的网络路由开销。虽然朴素贝叶斯分类器简单高效,但是它的条件独立性假设使其无法表达出属性间的依赖关系,从而降低了分类的准确率。而本专利分别从分类性能和多样性两个衡量标准出发,对随机森林进行优化。首先,从分类性能出发,根据每棵树的分类错误率以及在森林中的表现分别给予局部和全局惩罚,从而挑选出在森林中准确率高的的树,使其拥有较高的决策权重。其次,再根据多样性评判指标

不合度量来评判决策树的相似度,继而挑选出相似度较低的决策树,不仅保证了泛化能力同时还提高了准确率,因此路由决策是基于优化的随机森林模型,可以进一步提高容迟网的性能。

技术实现思路

[0004]专利技术目的:本专利技术目的提供一种基于优化随机森林的车载容迟网数据报文转发方法,该方法着重考虑了泛化能力和准确率,相较于现有算法,能够有效提高网络性能。
[0005]技术方案:本专利技术为实现上述专利技术目的,采用如下技术方案:一种基于优化随机森林的车载容迟网数据报文转发方法,该方法包括如下步骤:
[0006]步骤1、获取每个车载容迟网络车辆节点的历史数据表,并对车辆属性进行划分;
[0007]步骤2、根据每个车载容迟网络车辆节点的属性建立训练集,并根据训练集建立初始随机森林模型;
[0008]步骤3、根据每棵决策树的权重和相似度对随机森林模型进行优化;
[0009]步骤4、当携带数据报文的车辆节点与其他车辆节点相遇时,若相遇车辆节点为数据报文的目的车辆节点时,此时数据报文直接被投递到相遇车辆节点;如果相遇的车辆节点不是目的车辆节点时,进入步骤5;
[0010]步骤5、利用优化后的随机森林模型预测当前车辆节点的投递等级x
8,当前
和相遇车辆节点投递等级x
8,相遇

[0011]步骤6、若x
8,当前
>x
8,相遇
,则当前携带数据报文的车辆节点会继续携带报文,转到步骤4;否则,当前携带数据报文的节点将数据报文转发给相遇节点,由相遇节点继续转发报文,本次转发结束。
[0012]进一步的,步骤1的具体方法如下:
[0013]每个车载容迟网络车辆节点均维护一张数据报文转发历史数据表,根据实际路线中车辆轨迹特点进行属性的划分,其属性包括:区域码x1、时间戳x2、平均接触时间间隔x3、运动方向x4、速度x5、平均时延x6、距离x7和投递等级x8;其中,区域码是对地理区域的编码,即将整个网络的地理区域以10m
×
10m的大小划分为不同的网格,对每个网格赋予一个唯一的区域码,用于记录数据报文转发时车辆节点所处的位置;时间戳是对时间段的编码,即将一天24小时以10分钟为间隔单位依次离散化编码,用于记录数据报文转发的时间;平均接触时间间隔是在数据报文转发前1小时内该车辆节点与其他车辆节点相遇的平均间隔时间,并以1分钟为单位依次离散化编码;运动方向是车辆节点在数据报文转发时的运动方向,划分为东、西、南、北、东南、东北、西南、西北8个运动方向;速度是车辆节点在数据报文转发时的行驶速度,以历史数据集为依据,并以20km/h为单位依次离散化编码;平均时延表示数据报文从源车辆节点转发到目的车辆节点所经过的平均时间,以2000s为单位依次离散化编码;行驶距离是车辆节点自上次转发数据报文后到本次数据报文转发时行驶的距离,以8km为单位依次离散化编码;投递等级是车辆节点转发数据报文的能力,用该车辆节点已成功转发数据报文数量来表示,并以100为单位依次离散化编码,并且根据每个车载容迟网络车辆节点获得区域码x1、时间戳x2、平均接触时间间隔x3、运动方向x4、速度x5、平均时延x6、距离x7和投递等级x8作为一个数据样本。
[0014]进一步的,步骤2的具体方法如下:
[0015]步骤2.1:将所有车载网络车辆节点对应的样本形成数据集合M,按均匀分布随机地将历史数据集M中80%的样本划分为训练数据集F,20%样本划分为测试数据集D;
[0016]步骤2.2:通过自助重采样技术,从训练数据集F中有放回地重复随机抽取70%的数据,生成以属性x1到x7作为内部节点,投递等级x8为预测目标的分类回归决策树,也即CART树;
[0017]步骤2.3:重复上述步骤2.2,最后组成T棵决策树的初始随机森林,T>=100。
[0018]进一步的,步骤3的具体方法如下:
[0019]设测试数据集的样本数量为|D|,对于第i个样本,i∈[1,|D|],其投递等级标签为c
i
,c
i
∈[1,C],C为最大投递等级数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于优化随机森林的车载容迟网数据报文转发方法,其特征在于,该方法包括如下步骤:步骤1、获取每个车载容迟网络车辆节点的历史数据表,并对车辆属性进行划分;步骤2、根据每个车载容迟网络车辆节点的属性建立训练集,并根据训练集建立初始随机森林模型;步骤3、根据每棵决策树的权重和相似度对随机森林模型进行优化;步骤4、当携带数据报文的车辆节点与其他车辆节点相遇时,若相遇车辆节点为数据报文的目的车辆节点时,此时数据报文直接被投递到相遇车辆节点;如果相遇的车辆节点不是目的车辆节点时,进入步骤5;步骤5、利用优化后的随机森林模型预测当前车辆节点的投递等级x
8,当前
和相遇车辆节点投递等级x
8,相遇
;步骤6、若x
8,当前
>x
8,相遇
,则当前携带数据报文的车辆节点会继续携带报文,转到步骤4;否则,当前携带数据报文的节点将数据报文转发给相遇节点,由相遇节点继续转发报文,本次转发结束。2.根据权利要求1所述的一种基于优化随机森林的车载容迟网数据报文转发方法,其特征在于,步骤1的具体方法如下:每个车载容迟网络车辆节点均维护一张数据报文转发历史数据表,根据实际路线中车辆轨迹特点进行属性的划分,其属性包括:区域码x1、时间戳x2、平均接触时间间隔x3、运动方向x4、速度x5、平均时延x6、距离x7和投递等级x8;其中,区域码是对地理区域的编码,即将整个网络的地理区域以10m
×
10m的大小划分为不同的网格,对每个网格赋予一个唯一的区域码,用于记录数据报文转发时车辆节点所处的位置;时间戳是对时间段的编码,即将一天24小时以10分钟为间隔单位依次离散化编码,用于记录数据报文转发的时间;平均接触时间间隔是在数据报文转发前1小时内该车辆节点与其他车辆节点相遇的平均间隔时间,并以1分钟为单位依次离散化编码;运动方向是车辆节点在数据报文转发时的运动方向,划分为东、西、南、北、东南、东北、西南、西北8个运动方向;速度是车辆节点在数据报文转发时的行驶速度,以历史数据集为依据,并以20km/h为单位依次离散化编码;平均时延表示数据报文从源车辆节点转发到目的车辆节点所经过的平均时间,以2000s为单位依次离散化编码;行驶距离是车辆节点自上次转发数据报文后到本次数据报文转发时行驶的距离,以8km为单位依次离散化编码;投递等级是车辆节点转发数据报文的能力,用该车辆节点已成功转发数据报文数量来表示,并以100为单位依次离散化编码,并且根据每个车载容迟网络车辆节点获得区域码x1、时间戳x2、平均接触时间间隔x3、运动方向x4、速度x5、平均时延x6、距离x7和投递等级x8作为一个数据样本。3.根据权利要求2所述的一种基于优化随机森林的车载容迟网数据报文转发方法,其特征在于,步骤2的具体方法如下:步骤2.1:将所有车载网络车辆节点对应的样本形成数据集合M,按均匀分布随机地将历史数据集M中80%的样本划分为训练数据集F,20%样本划分为测试数据集D;步骤2.2:通过自助重采样技术,从训练数据集F中有放回地重复随机抽取70%的数据,生成以属性x1到x7作为内部节点,投递等级x8为预测目标的分类回归决策树,也即CART树;步骤2.3:重复上述步骤2.2,最后组成T棵决策树的初始随机森林,T>=100。
4.根据权利要求3所述的一种基于优化随机森林的车载容迟网数据报文转发方法,其特征在于,步骤3的具体方...

【专利技术属性】
技术研发人员:吴家皋芮琦刘林峰
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1