一种设备识别方法、装置、设备及可读存储介质制造方法及图纸

技术编号:35729132 阅读:17 留言:0更新日期:2022-11-26 18:28
本发明专利技术公开了一种设备识别方法、装置、设备及可读存储介质,应用于物联网技术领域,该方法包括:对获取的各未识别设备的设备数据进行分词,获取未识别设备各自对应的分词数据;对分词数据进行向量化,获取未识别设备各自对应的向量化数据;对向量化数据进行聚类,得到各未识别设备各自对应的聚类类别;获取每个聚类类别各自对应的设备标识信息,并利用设备标识信息标记各聚类类各自对应的全部未识别设备;本发明专利技术通过对分词数据进行向量化,获取未识别设备各自对应的向量化数据,能够将分词数据向量化为物联网设备领域专有词向量,使得物联网设备特征更加准确全面,从而提高后续聚类标记的准确性,实现对物联网设备的自动全面梳理。理。理。

【技术实现步骤摘要】
一种设备识别方法、装置、设备及可读存储介质


[0001]本专利技术涉及物联网
,特别涉及一种设备识别方法、装置、设备及可读存储介质。

技术介绍

[0002]随着现代社会科技的发展,物联网应用在各行业得到了越来越多的部署。同时,物联网设备安全风险逐年升高,物联网设备的安全不容忽视。目前在对物联网设备的筛查中发现,有大量物联网设备直接暴露在互联网上,其中路由器和视频监控设备的数量最多;容易被网络爬虫和恶意攻击者发现。更严重的是,这些设备中有相当大的比例存在弱口令、已知漏洞等风险,可能被恶意代码感染成为僵尸主机。一方面,这些被感染的设备会继续感染其他的设备,组成大规模的物联网僵尸网络;另一方面,它们接受并执行来自命令和控制服务器的指令,发动大规模DDoS(分布式拒绝服务,Distributed Denial of Service)攻击,对互联网上的业务造成很严重的破坏和影响。如果能够对暴露在外的物联网资产进行归纳梳理并分析,对于发现物联网设备的安全问题是具有重要意义的。
[0003]目前,对于物联网设备资产的梳理大多靠人工进行梳理,非常费时费力,且梳理不够全面;而现有利用互联网技术替代人工的方式来进行物联网设备资产梳理的方案,由于物联网设备资产数量庞大,难以快速准确的对物联网设备进行识别标记。因此,如何能够快速准确地识别标记物联网设备,实现对物联网设备的自动全面梳理,是现今急需解决的问题。

技术实现思路

[0004]本专利技术的目的是提供一种设备识别方法、装置、设备及可读存储介质,以快速准确地识别标记物联网设备,实现对物联网设备的自动全面梳理。
[0005]为解决上述技术问题,本专利技术提供一种设备识别方法,包括:
[0006]对获取的各未识别设备的设备数据进行分词,获取所述未识别设备各自对应的分词数据;
[0007]对所述分词数据进行向量化,获取所述未识别设备各自对应的向量化数据;
[0008]对所述向量化数据进行聚类,得到各所述未识别设备各自对应的聚类类别;
[0009]获取每个所述聚类类别各自对应的设备标识信息,并利用所述设备标识信息标记各所述聚类类各自对应的全部未识别设备。
[0010]可选的,所述对所述向量化数据进行聚类,得到各所述未识别设备各自对应的聚类类别,包括:
[0011]利用第一聚类算法对所述向量化数据进行初次聚类,获取各所述未识别设备各自对应的初次聚类结果;
[0012]利用第二聚类算法对各所述初次聚类结果对应的向量化数据进行二次聚类,获取各所述未识别设备各自对应的聚类类别。
[0013]可选的,所述利用第一聚类算法对所述向量化数据进行初次聚类,获取各所述未识别设备各自对应的初次聚类结果,包括:
[0014]根据所述向量化数据,利用手肘法和滑动窗口法,确定K

均值算法的K值;其中,所述K值为所述初次聚类结果的数量。
[0015]可选的,所述获取每个所述聚类类别各自对应的设备标识信息,包括:
[0016]根据当前聚类类别中的目标未识别设备的聚类数据,从预设规则库中查找获取所述目标未识别设备对应的设备标识信息;其中,当前聚类类别为任一所述聚类类别,所述目标未识别设备为当前聚类类别对应的任一未识别设备;
[0017]将所述目标未识别设备对应的设备标识信息确定为当前聚类类别对应的设备标识信息。
[0018]可选的,所述对所述分词数据进行向量化,获取所述未识别设备各自对应的向量化数据,包括:
[0019]利用预设词向量模型对所述分词数据进行向量化,获取所述未识别设备各自对应的向量化数据。
[0020]可选的,所述对所述向量化数据进行聚类,得到各所述未识别设备各自对应的聚类类别之后,还包括:
[0021]根据各所述聚类类别各自对应的未识别设备的设备数据,生成各所述聚类类别各自对应的设备指纹;其中,所述设备指纹包括网络协议版本信息、网络协议状态码信息、头部关键字段信息、头部关键字段对应值信息和主体信息中的至少一项。
[0022]可选的,所述对所述向量化数据进行聚类,得到各所述未识别设备各自对应的聚类类别之后,还包括:
[0023]根据各所述聚类类别各自对应的未识别设备的设备数据,统计各所述聚类类别对应的指纹特征;其中,所述指纹特征为每个所述聚类类别各自对应的设备数据中数量最多的预设数量的字段;
[0024]各所述聚类类别对应的指纹特征和设备指纹存储到指纹数据库。
[0025]本专利技术还提供了一种设备识别装置,包括:
[0026]分词模块,用于对获取的各未识别设备的设备数据进行分词,获取所述未识别设备各自对应的分词数据;
[0027]向量化模块,用于对所述分词数据进行向量化,获取所述未识别设备各自对应的向量化数据;
[0028]聚类模块,用于对所述向量化数据进行聚类,得到各所述未识别设备各自对应的聚类类别;
[0029]标记模块,用于获取每个所述聚类类别各自对应的设备标识信息,并利用所述设备标识信息标记各所述聚类类各自对应的全部未识别设备。
[0030]本专利技术还提供了一种设备识别设备,包括:
[0031]存储器,用于存储计算机程序;
[0032]处理器,用于执行所述计算机程序时实现如上述所述的设备识别方法的步骤。
[0033]此外,本专利技术还提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述的设备识别方法的步骤。
[0034]本专利技术所提供的一种设备识别方法,包括:对获取的各未识别设备的设备数据进行分词,获取未识别设备各自对应的分词数据;对分词数据进行向量化,获取未识别设备各自对应的向量化数据;对向量化数据进行聚类,得到各未识别设备各自对应的聚类类别;获取每个聚类类别各自对应的设备标识信息,并利用设备标识信息标记各聚类类各自对应的全部未识别设备;
[0035]可见,本专利技术通过对分词数据进行向量化,获取未识别设备各自对应的向量化数据,能够将分词数据向量化为物联网设备领域专有词向量,使得物联网设备特征更加准确全面,从而提高后续聚类的准确性,能够快速准确地识别标记物联网设备,实现对物联网设备的自动全面梳理。此外,本专利技术还提供了一种设备识别装置、设备及可读存储介质,同样具有上述有益效果。
附图说明
[0036]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0037]图1为本专利技术实施例所提供的一种设备识别方法的流程图;
[0038]图2为本专利技术实施例所提供的另一种设备识别方法的流程示意图;
[0039]图3为本专利技术实施例所提供的一种设备识别装置的结构框图;
[0040]图4为本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种设备识别方法,其特征在于,包括:对获取的各未识别设备的设备数据进行分词,获取所述未识别设备各自对应的分词数据;对所述分词数据进行向量化,获取所述未识别设备各自对应的向量化数据;对所述向量化数据进行聚类,得到各所述未识别设备各自对应的聚类类别;获取每个所述聚类类别各自对应的设备标识信息,并利用所述设备标识信息标记各所述聚类类各自对应的全部未识别设备。2.根据权利要求1所述的设备识别方法,其特征在于,所述对所述向量化数据进行聚类,得到各所述未识别设备各自对应的聚类类别,包括:利用第一聚类算法对所述向量化数据进行初次聚类,获取各所述未识别设备各自对应的初次聚类结果;利用第二聚类算法对各所述初次聚类结果对应的向量化数据进行二次聚类,获取各所述未识别设备各自对应的聚类类别。3.根据权利要求2所述的设备识别方法,其特征在于,所述利用第一聚类算法对所述向量化数据进行初次聚类,获取各所述未识别设备各自对应的初次聚类结果,包括:根据所述向量化数据,利用手肘法和滑动窗口法,确定K

均值算法的K值;其中,所述K值为所述初次聚类结果的数量。4.根据权利要求1所述的设备识别方法,其特征在于,所述获取每个所述聚类类别各自对应的设备标识信息,包括:根据当前聚类类别中的目标未识别设备的聚类数据,从预设规则库中查找获取所述目标未识别设备对应的设备标识信息;其中,当前聚类类别为任一所述聚类类别,所述目标未识别设备为当前聚类类别对应的任一未识别设备;将所述目标未识别设备对应的设备标识信息确定为当前聚类类别对应的设备标识信息。5.根据权利要求1所述的设备识别方法,其特征在于,所述对所述分词数据进行向量化,获取所述未识别设备各自对应的向量化数据,包括:利用预设词向量模型对所述分词数据进...

【专利技术属性】
技术研发人员:黄子恒张星关雪松张志良
申请(专利权)人:深信服科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1