模型训练方法、信息确定方法和设备技术

技术编号:37088407 阅读:21 留言:0更新日期:2023-03-29 20:03
本申请实施例公开了一种模型训练方法,该方法包括:获取样本设备的样本流量数据;其中,样本流量数据表征样本设备的数据传输情况;基于样本流量数据确定样本设备的设备特征;其中,设备特征表征样本设备中产生的流量数据的特征;基于设备特征对初始分类模型进行模型训练,得到目标分类模型。本申请实施例还公开了一种模型训练设备、信息确定方法和设备。信息确定方法和设备。信息确定方法和设备。

【技术实现步骤摘要】
模型训练方法、信息确定方法和设备


[0001]本申请涉及计算机
,尤其涉及一种模型训练方法、信息确定方法和设备。

技术介绍

[0002]一般,会根据厂商、产品型号、设备用途等信息生成物联网设备的标识、以对物联网设备进行识别和管控。但是,随着物联网技术的蓬勃发展,涌现出了很多没有标识的设备(即未知设备),那么如何对未知设备进行识别与管控就成为了本领域的难题。一般,会采用设备的流量信息来对神经网络模型进行模型训练得到分类模型,从而采用分类模型确定未知设备的标识;然而,上述直接通过流量信息进行模型训练的方法的模型准确率低。

技术实现思路

[0003]为解决上述技术问题,本申请实施例期望提供一种模型训练方法、信息确定方法和设备,解决了相关技术中直接通过流量信息进行模型训练的方法的模型准确率低的问题。
[0004]本申请的技术方案是这样实现的:
[0005]一种模型训练方法,所述方法包括:
[0006]获取样本设备的样本流量数据;其中,所述样本流量数据表征所述样本设备的数据传输情况;
[0007]基于所述样本流量数据确定所述样本设备的设备特征;其中,所述设备特征为所述样本设备中产生的流量数据的特征;
[0008]基于所述设备特征对初始分类模型进行模型训练,得到目标分类模型。
[0009]上述方案中,所述获取样本设备的样本流量数据,包括:
[0010]获取所述样本设备的第一流量数据;其中,所述第一流量数据包括地址信息;
[0011]对所述第一流量数据进行异常检测,得到检测结果;
[0012]从所述第一流量数据中确定所述检测结果为正常的流量数据,得到第二流量数据;
[0013]去除所述第二流量数据中的地址数据,得到样本流量数据。
[0014]上述方案中,所述基于所述样本流量数据确定所述样本设备的设备特征,包括:
[0015]基于目标数据格式对所述样本流量数据的数据格式进行转换,得到第三流量数据;
[0016]基于目标标识符对所述第三流量数据进行处理,得到多个目标子流量数据;
[0017]基于所述多个目标子流量数据构建所述样本设备对应的灰度信息;其中,所述设备特征包括所述灰度信息。
[0018]上述方案中,所述基于目标标识符对所述第三流量数据进行处理,得到多个目标子流量数据,包括:
[0019]对所述第三流量数据进行分析,确定所述目标标识符;
[0020]基于所述目标标识符依次对所述第三流量数据进行划分,得到多个第一子流量数据;
[0021]确定第一子流量数据的目标数量;
[0022]基于所述目标数量、第一数量阈值以及所述多个第一子流量数据,确定所述多个目标子流量数据。
[0023]上述方案中,所述基于所述目标数量、第一数量阈值以及所述多个第一子流量数据,确定所述多个目标子流量数据,包括:
[0024]在确定所述目标数量满足所述第一数量阈值的情况下,基于第一子流量数据的划分顺序从所述多个第一子流量数据中确定所述第一数量阈值个第一子流量数据,得到所述多个目标子流量数据;
[0025]在确定所述目标数量不满足所述第一数量阈值的情况下,基于所述目标数量和所述第一数量阈值确定目标数值;
[0026]基于所述多个第一子流量数据和所述目标数值个第二子流量数据,得到所述多个目标子流量数据;其中,所述第二子流量数据的值为目标字符。
[0027]上述方案中,所述基于所述多个目标子流量数据构建所述样本设备对应的灰度信息,包括:
[0028]对每一目标子流量数据的值进行转换,得到所述每一目标子流量数据对应的多个灰度值;
[0029]基于所述每一目标子流量数据对应的多个灰度值,构建所述灰度信息。
[0030]上述方案中,所述基于所述每一目标子流量数据对应的多个灰度值,构建所述灰度信息,包括:
[0031]从所述每一目标子流量数据对应的多个灰度值中确定第二数量阈值个目标灰度值;
[0032]按照目标子流量数据的确定顺序,基于所述每一目标子流量数据对应的目标灰度值构建所述灰度信息。
[0033]上述方案中,所述基于所述设备特征,对初始分类模型进行模型训练得到目标分类模型,包括:
[0034]基于目标特征提取模型,构建用于进行无监督模型训练的初始分类模型;其中,所述目标特征提取模型用于对设备特征进行无监督学习;
[0035]基于所述设备特征,对所述初始分类模型进行模型训练得到所述目标分类模型。
[0036]一种信息确定方法,所述方法包括:
[0037]获取待处理设备的目标流量数据;
[0038]采用所述目标分类模型对所述目标流量数据进行处理,得到所述待处理设备的设备类别;其中,所述目标分类模型是基于根据样本设备的样本流量数据确定的设备特征对初始分类模型进行模型训练后得到的;所述样本流量数据表征所述样本设备的数据传输情况;所述设备特征为所述样本设备中产生的流量数据的特征。
[0039]一种模型训练装置,所述装置包括:
[0040]第一获取单元,用于获取样本设备的样本流量数据;其中,所述样本流量数据表征所述样本设备的数据传输情况;
[0041]第一处理单元,用于基于所述样本流量数据确定所述样本设备的设备特征;其中,所述设备特征为所述样本设备中产生的流量数据的特征;
[0042]所述第一处理单元,还用于基于所述设备特征对初始分类模型进行模型训练,得到目标分类模型;
[0043]一种信息确定装置,所述装置包括:
[0044]第二获取单元,用于获取待处理设备的目标流量数据;
[0045]第二处理单元,用于采用所述目标分类模型对所述目标流量数据进行处理,得到所述待处理设备的设备类别;其中,所述目标分类模型是基于根据样本设备的样本流量数据确定的设备特征对初始分类模型进行模型训练后得到的;所述样本流量数据表征所述样本设备的数据传输情况;所述设备特征为所述样本设备中产生的流量数据的特征。
[0046]一种模型训练设备,其特征在于,所述设备包括:第一处理器、第一存储器和第一通信总线;
[0047]所述第一通信总线用于实现所述第一处理器和所述第一存储器之间的通信连接;
[0048]所述第一处理器用于执行所述第一存储器中的模型训练程序,以实现上述的模型训练方法的步骤。
[0049]一种信息确定设备,所述设备包括:第二处理器、第二存储器和第二通信总线;
[0050]所述第二通信总线用于实现所述第二处理器和所述第二存储器之间的通信连接;
[0051]所述第二处理器用于执行所述第二存储器中的信息确定程序,以实现上述的信息确定方法的步骤。
[0052]一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述的模型训练方法或信息确定方法的步骤。...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:获取样本设备的样本流量数据;其中,所述样本流量数据表征所述样本设备的数据传输情况;基于所述样本流量数据确定所述样本设备的设备特征;其中,所述设备特征为所述样本设备中产生的流量数据的特征;基于所述设备特征对初始分类模型进行模型训练,得到目标分类模型。2.根据权利要求1所述的方法,其特征在于,所述获取样本设备的样本流量数据,包括:获取所述样本设备的第一流量数据;其中,所述第一流量数据包括地址信息;对所述第一流量数据进行异常检测,得到检测结果;从所述第一流量数据中确定所述检测结果为正常的流量数据,得到第二流量数据;去除所述第二流量数据中的地址数据,得到样本流量数据。3.根据权利要求1所述的方法,其特征在于,所述基于所述样本流量数据确定所述样本设备的设备特征,包括:基于目标数据格式对所述样本流量数据的数据格式进行转换,得到第三流量数据;基于目标标识符对所述第三流量数据进行处理,得到多个目标子流量数据;基于所述多个目标子流量数据构建所述样本设备对应的灰度信息;其中,所述设备特征包括所述灰度信息。4.根据权利要求3所述的方法,其特征在于,所述基于目标标识符对所述第三流量数据进行处理,得到多个目标子流量数据,包括:对所述第三流量数据进行分析,确定所述目标标识符;基于所述目标标识符依次对所述第三流量数据进行划分,得到多个第一子流量数据;确定第一子流量数据的目标数量;基于所述目标数量、第一数量阈值以及所述多个第一子流量数据,确定所述多个目标子流量数据。5.根据权利要求4所述的方法,其特征在于,所述基于所述目标数量、第一数量阈值以及所述多个第一子流量数据,确定所述多个目标子流量数据,包括:在确定所述目标数量满足所述第一数量阈值的情况下,基于第一子流量数据的划分顺序从所述多个第一子流量数据中确定所述第一数量阈值个第一子流量数据,得到所述多个目标子流量数据;在确定所述目标数量不满足所述第一数量阈值的情况下,基于所述目标数量和所述第一数量阈值确定目...

【专利技术属性】
技术研发人员:李春辉黄子恒张星关雪松葛继声
申请(专利权)人:深信服科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1