一种车辆检测数据增强训练方法、系统、车辆及存储介质技术方案

技术编号：29049245 阅读：33 留言：0更新日期：2021-06-26 06:09

本发明专利技术属于智能网联车安全技术领域，公开了一种车辆检测数据增强训练方法、系统、车辆及存储介质，收集车辆行驶时的CAN总线数据；接收更新检测模型和实时检测异常；车辆行驶数据和检测结果，用户选择不上传或者脱敏后上传至云端；对收集到的各车辆数据进行预处理合并后，判断模型所需数据量是否足够，如果不足则先进行数据增强，使用增强后的数据训练检测模型；最后，周期性将检测模型从云端发布到车载检测模块。本发明专利技术采用数据增强后的样本集合训练出的检测模型，其相同测评数据集上的检测率要明显优于数据增强前小样本数据集训练的模型。对要使用真车数据研究的其他领域也具有借鉴作用。鉴作用。鉴作用。

全部详细技术资料下载

【技术实现步骤摘要】
一种车辆检测数据增强训练方法、系统、车辆及存储介质

[0001]本专利技术属于智能网联车安全
，尤其涉及一种车辆检测数据增强训练方法、系统、车辆及存储介质。

技术介绍

[0002]目前，车辆网联技术发展迅速，然而，联网后的车辆攻击面扩大，通过网络对车辆进行攻击成为可能。智能网联车遭受到诸多远程安全威胁，尤其是对于车辆各个ECU和CAN总线的攻击，如窃听，重放，泛洪等。车辆安全关系到驾驶者、行人等的生命安全，要求比一般互联网电脑终端要求高很多，车联网安全相关研究成为学界和产业界的热点。但是，车辆作为一种特殊的终端，其研究数据采集需要在车辆行驶时候进行。目前常用做法是通过诊断接口OBD
‑Ⅱ
进行采集。这是一种有线短距离连接，只能采集自己车辆信息。现有的实验数据几乎都是这种方式采集的研究人员自己车辆在特定驾驶路线上的驾驶信息，且绝大部分都是正常驾驶信息，受攻击时的驾驶数据极少。因为对车辆的攻击容易造成不可预知的威胁，甚至威胁驾驶人员、乘客等的生命，研究中难以像传统入侵检测研究一样模拟攻击车辆以收集攻击时的数据。可以看到即便是真车收集正常驾驶数据，由于收集困难，限于相关研究者的驾驶数据，目前公开可供车辆入侵检测的真车数据集有OTIDS数据集，Car
‑
Hacking Dataset大约300万条共1.42G数据，且车型局限于桑塔纳，起亚秀尔，雪佛兰等较少车型，相对全世界超过7亿台车辆保有量，每日产生超10w辆需要检测的车辆数据来说杯水车薪，真车数据集严重缺乏，影响研究人员对于车辆行驶...

【技术保护点】

【技术特征摘要】
1.一种车辆检测数据增强训练方法，其特征在于，所述车辆检测数据增强训练方法包括：从车辆总线上进行数据捕获与存储，截取到数据报文；对截取到的数据报文格式化后进行检测；检测通过则让命令顺利执行上传；不通过，则阻止命令执行上传；同时对检测结果进行记录存储；根据存储情况和车
‑
云之间链路稳定情况，上传捕获的车辆驾驶数据和相应检测结果；按接收到的时间顺序对上传的车辆驾驶数据和相应检测结果进行存储；对存储的车辆驾驶数据进行合并，判断数据规模是否满足训练要求，如果不满足则进入数据增强环节，将周期内收集到的数据进行预处理，转换为用于生成对抗网络的车辆数据点阵格式；将生成的车辆数据点阵作为生成对抗网络中的样本数据，并随机生成待训练数据集；将所述样本数据、待训练数据集一起让判别器进行判别，根据所述判别结果和损失函数不断对生成器和判别器进行调整，在所述样本数据、待训练数据集达到纳什均衡时，生成器生成的数据就是符合原有样本特征的新数据；将生成的所述新数据集和原有数据集合并为增强数据集，用增强后的数据集训练检测模型；并将更新后的检测模型分发到各车辆车载终端。2.如权利要求1所述的车辆检测数据增强训练方法，其特征在于，所述截取到的数据报文包含：1)时间戳，精确度为毫秒；2)CANID：十六进制的汽车总线报文标识符；3)数据：捕获到的CAN总线报文的数据部分；4)数据字节个数：记录本时间段从CAN总线数捕获到的数据字节长度。3.如权利要求1所述的车辆检测数据增强训练方法，其特征在于，所述进行数据捕获时，数据收集模块根据TBOX本身存储空间，及时删除已上传数据或者重要性较低的数据；采取先到先删除加异常标签判断策略；当TBOX存储空间剩余不足20％时，从保存最久的数据报文开始删除；内含检测异常标签的不删除。4.如权利要求1所述的车辆检测数据增强训练方法，其特征在于，所述总线数据和相应检测结果前须先探测网络链路是否稳定并对要传输的数据做必要分割，具体包括：(1)在上传下载数据前均进行网络链路稳定性探测；探测方法为发送5个带900字节数据的请求报文给TSP云端，计算收到应答报文个数和平均往返时间；根据实际经验设定阈值：收到应答报文不少于3个且平均往返时间不高于50ms为链路稳定，进行传输；(2)每次传输的数据报文不超过1KB，且云端对接收到的数据报文须进行确认；在传输一段周期内存储的CAN总线数据与检测结果时，如果数据超过1kB,则被分割为不超过1KB的数据报文分次发送。5.如权利要求1所述的车辆检测数据增强训练方法，其特征在于，所述将周期内收集到的数据进行预处理的包括：1)提取一个时间窗口内的所有的CAN总线数据...

【专利技术属性】
技术研发人员：王娟，刘盈江，赵阳，石磊，赵军，
申请(专利权)人：成都信息工程大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人