本发明专利技术属于智能网联车安全技术领域,公开了一种车辆检测数据增强训练方法、系统、车辆及存储介质,收集车辆行驶时的CAN总线数据;接收更新检测模型和实时检测异常;车辆行驶数据和检测结果,用户选择不上传或者脱敏后上传至云端;对收集到的各车辆数据进行预处理合并后,判断模型所需数据量是否足够,如果不足则先进行数据增强,使用增强后的数据训练检测模型;最后,周期性将检测模型从云端发布到车载检测模块。本发明专利技术采用数据增强后的样本集合训练出的检测模型,其相同测评数据集上的检测率要明显优于数据增强前小样本数据集训练的模型。对要使用真车数据研究的其他领域也具有借鉴作用。鉴作用。鉴作用。
【技术实现步骤摘要】
一种车辆检测数据增强训练方法、系统、车辆及存储介质
[0001]本专利技术属于智能网联车安全
,尤其涉及一种车辆检测数据增强训练方法、系统、车辆及存储介质。
技术介绍
[0002]目前,车辆网联技术发展迅速,然而,联网后的车辆攻击面扩大,通过网络对车辆进行攻击成为可能。智能网联车遭受到诸多远程安全威胁,尤其是对于车辆各个ECU和CAN总线的攻击,如窃听,重放,泛洪等。车辆安全关系到驾驶者、行人等的生命安全,要求比一般互联网电脑终端要求高很多,车联网安全相关研究成为学界和产业界的热点。但是,车辆作为一种特殊的终端,其研究数据采集需要在车辆行驶时候进行。目前常用做法是通过诊断接口OBD
‑Ⅱ
进行采集。这是一种有线短距离连接,只能采集自己车辆信息。现有的实验数据几乎都是这种方式采集的研究人员自己车辆在特定驾驶路线上的驾驶信息,且绝大部分都是正常驾驶信息,受攻击时的驾驶数据极少。因为对车辆的攻击容易造成不可预知的威胁,甚至威胁驾驶人员、乘客等的生命,研究中难以像传统入侵检测研究一样模拟攻击车辆以收集攻击时的数据。可以看到即便是真车收集正常驾驶数据,由于收集困难,限于相关研究者的驾驶数据,目前公开可供车辆入侵检测的真车数据集有OTIDS数据集,Car
‑
Hacking Dataset大约300万条共1.42G数据,且车型局限于桑塔纳,起亚秀尔,雪佛兰等较少车型,相对全世界超过7亿台车辆保有量,每日产生超10w辆需要检测的车辆数据来说杯水车薪,真车数据集严重缺乏,影响研究人员对于车辆行驶安全的研究。
[0003]通过上述分析,现有技术存在的问题及缺陷为:
[0004]1)传统入侵检测研究显示,在样本足够的情况下,攻击识别率可以达到接近99%,但在样本个数缺乏的情况下部分攻击识别率甚至低于50%。可见若没有足够多的数据集用于检测模型训练会导致模型识别率低,无法有效进行入侵检测。作为防护手段的车辆入侵检测研究中,使用人工智能算法的越来越多,但是普遍遇见真车数据采集艰难,模型训练的真车数据数量不足的问题,导致训练出的车辆入侵检测模型的检测效果难以满足要求。
[0005]2)以上问题不仅仅出现在车辆入侵检测领域,车辆防护其他研究领域例如:态势感知、应急响应等也需要真车行驶数据支持。目前只有自动驾驶方面,有百度、谷歌几家大的人工智能大厂进行大量真车数据采集,但是这种采集更多是行驶中的路面情况、周围环境等图像数据。跟本文研究的车辆内部跟引擎、刹车、转向等运行在CAN总线上的驾驶命令涉及的数据完全不同,也无法使用。
[0006]解决以上问题及缺陷的难度为:
[0007]车辆不同于计算机、手机等终端,其安全关系到交通参与者的生命安全,传统信息安全中采用模拟攻击提取检测研究数据的方法在车辆安全研究中行不通。且车辆安全属于前沿交叉学科,懂信息安全的研究者很多对车辆构造不清楚,而懂车辆构造的研究者又缺乏信息安全方面知识。导致车辆安全,特别是涉及到车内网、车辆驾驶操作安全的问题的解决困难,不易找到切实可行的解决方案。
[0008]解决以上问题及缺陷的意义为:
[0009]车辆的智能化趋势不可避免,终极目标就是无人驾驶。但是由于涉及到交通参与者的生命安全,如果其安全不能保障,那么绝不会被用户接受,也不可能获得国家相关机构的认可。因此智能车辆必须保障驾驶员和乘客的安全。其中经由移动互联网对智能车辆发动的远程攻击的防护又是其中的重中之重。这方面研究均存在真车数据不足的问题。本专利技术提出的方案虽然以车辆的入侵检测为切入点。但是其采集设备和数据增强方法可以广泛适用于车辆安全与防护研究的其他研究点,具有明显的研究意义和实践价值。
技术实现思路
[0010]针对现有技术存在的问题,本专利技术提供了一种车辆检测数据增强训练方法、系统、车辆及存储介质。尤其涉及一种车云架构的车辆人工智能检测数据增强训练方法、装置及系统。
[0011]本专利技术是这样实现的,一种车辆检测数据增强训练方法,包括:
[0012]从车辆总线上进行数据捕获与存储,截取到数据报文;
[0013]对截取到的数据报文格式化后进行检测;检测通过则让命令顺利执行上传;不通过,则阻止命令执行上传;同时对检测结果进行记录存储;
[0014]根据存储情况和车
‑
云之间链路稳定情况,上传捕获的车辆驾驶数据和相应检测结果;按接收到的时间顺序对上传的车辆驾驶数据和相应检测结果进行存储;
[0015]对存储的车辆驾驶数据进行合并,判断数据规模是否满足训练要求,如果不满足则进入数据增强环节,将周期内收集到的数据进行预处理,转换为用于生成对抗网络的车辆数据点阵格式;将生成的车辆数据点阵作为生成对抗网络中的样本数据,并随机生成待训练数据集;
[0016]将所述样本数据、待训练数据集一起让判别器进行判别,根据所述判别结果和损失函数不断对生成器和判别器进行调整,在所述样本数据、待训练数据集达到纳什均衡时,生成器生成的数据就是符合原有样本特征的新数据;
[0017]将生成的所述新数据集和原有数据集合并为增强数据集,用增强后的数据集训练检测模型。检测模型可以根据情况选择不同模型,本专利技术以Softmax模型为例;并将更新后的检测模型分发到各车辆车载终端。
[0018]进一步,所述截取到的数据报文包含:
[0019]1)时间戳,精确度为毫秒;
[0020]2)CANID:十六进制的汽车总线报文标识符;
[0021]3)数据:捕获到的CAN总线报文的数据部分;
[0022]4)数据字节个数:记录本时间段从CAN总线数捕获到的数据字节长度。
[0023]进一步,所述进行数据捕获时,数据收集模块根据TBOX本身存储空间,及时删除已上传数据或者重要性较低的数据;采取先到先删除加异常标签判断策略;所谓先到先删除,就是按时间顺序把存储时间最久的最先删除,但是有异常标签的例外。
[0024]当TBOX存储空间剩余不足20%时,从保存最久的数据报文开始删除;内含检测异常标签的不删除。
[0025]进一步,所述总线数据和相应检测结果前须先探测网络链路是否稳定并对要传输
的数据做必要分割,具体包括:
[0026](1)在上传下载数据前均进行网络链路稳定性探测;探测方法为发送5个带900字节数据的请求报文给TSP(车辆远程服务提供商)云端,计算收到应答报文个数和平均往返时间;根据实际经验设定阈值:收到应答报文不少于3个且平均往返时间不高于50ms为链路稳定,进行传输;
[0027](2)每次传输的数据报文不超过1KB,且云端对接收到的数据报文须进行确认:即在传输一段周期内存储的CAN总线数据与检测结果时,如果数据超过1kB还需分割为不超过1KB的数据报文分次发送。
[0028]进一步,所述将周期内收集到的数据进行预处理的包括:
[0029]1)提取一个时间窗口内的所有的CAN总线数据,根据所取得的CANID,CAN总线本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种车辆检测数据增强训练方法,其特征在于,所述车辆检测数据增强训练方法包括:从车辆总线上进行数据捕获与存储,截取到数据报文;对截取到的数据报文格式化后进行检测;检测通过则让命令顺利执行上传;不通过,则阻止命令执行上传;同时对检测结果进行记录存储;根据存储情况和车
‑
云之间链路稳定情况,上传捕获的车辆驾驶数据和相应检测结果;按接收到的时间顺序对上传的车辆驾驶数据和相应检测结果进行存储;对存储的车辆驾驶数据进行合并,判断数据规模是否满足训练要求,如果不满足则进入数据增强环节,将周期内收集到的数据进行预处理,转换为用于生成对抗网络的车辆数据点阵格式;将生成的车辆数据点阵作为生成对抗网络中的样本数据,并随机生成待训练数据集;将所述样本数据、待训练数据集一起让判别器进行判别,根据所述判别结果和损失函数不断对生成器和判别器进行调整,在所述样本数据、待训练数据集达到纳什均衡时,生成器生成的数据就是符合原有样本特征的新数据;将生成的所述新数据集和原有数据集合并为增强数据集,用增强后的数据集训练检测模型;并将更新后的检测模型分发到各车辆车载终端。2.如权利要求1所述的车辆检测数据增强训练方法,其特征在于,所述截取到的数据报文包含:1)时间戳,精确度为毫秒;2)CANID:十六进制的汽车总线报文标识符;3)数据:捕获到的CAN总线报文的数据部分;4)数据字节个数:记录本时间段从CAN总线数捕获到的数据字节长度。3.如权利要求1所述的车辆检测数据增强训练方法,其特征在于,所述进行数据捕获时,数据收集模块根据TBOX本身存储空间,及时删除已上传数据或者重要性较低的数据;采取先到先删除加异常标签判断策略;当TBOX存储空间剩余不足20%时,从保存最久的数据报文开始删除;内含检测异常标签的不删除。4.如权利要求1所述的车辆检测数据增强训练方法,其特征在于,所述总线数据和相应检测结果前须先探测网络链路是否稳定并对要传输的数据做必要分割,具体包括:(1)在上传下载数据前均进行网络链路稳定性探测;探测方法为发送5个带900字节数据的请求报文给TSP云端,计算收到应答报文个数和平均往返时间;根据实际经验设定阈值:收到应答报文不少于3个且平均往返时间不高于50ms为链路稳定,进行传输;(2)每次传输的数据报文不超过1KB,且云端对接收到的数据报文须进行确认;在传输一段周期内存储的CAN总线数据与检测结果时,如果数据超过1kB,则被分割为不超过1KB的数据报文分次发送。5.如权利要求1所述的车辆检测数据增强训练方法,其特征在于,所述将周期内收集到的数据进行预处理的包括:1)提取一个时间窗口内的所有的CAN总线数据...
【专利技术属性】
技术研发人员:王娟,刘盈江,赵阳,石磊,赵军,
申请(专利权)人:成都信息工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。