恶意网址的分类方法、装置、计算机设备和可读存储介质制造方法及图纸

技术编号：26791156 阅读：15 留言：0更新日期：2020-12-22 17:06

本发明专利技术提供了一种恶意网址的分类方法、装置、计算机设备和可读存储介质。该恶意网址的分类方法包括：获取目标网址对应的网络资源；提取网络资源中的静态资源和动态资源；通过预设的第一分类模型分类静态资源，以得到目标网址对应的第一分类信息；通过预设的第二分类模型分类动态资源，以得到目标网址对应的第二分类信息；以及根据第一分类信息和第二分类信息确定目标网址所属的恶意网址类别。通过本发明专利技术，能够提升分类准确性。

全部详细技术资料下载

【技术实现步骤摘要】
恶意网址的分类方法、装置、计算机设备和可读存储介质
本专利技术涉及人工智能和网络安全
，尤其涉及一种恶意网址的分类方法、装置、计算机设备和可读存储介质。
技术介绍
域名、ip、URL等均对应互联网中不同的网络资源,为了鉴定其中的不安全资源，传统做法是对该网络资源进行爬虫抓取后，根据其网络资源中的ip地域、域名后缀以及爬取到的文本或源码片段等，依赖人工经验制定人工规则，通过规则来识别和分类恶意网址。而基于人工规则的分类引擎，对人工经验的依赖大，分类准确性低。
技术实现思路
本专利技术的目的是提供一种恶意网址的分类方法、装置、计算机设备和可读存储介质，用于解决现有技术中的上述技术问题。一方面，为实现上述目的，本专利技术提供了一种恶意网址的分类方法。该恶意网址的分类方法包括：获取目标网址对应的网络资源；提取所述网络资源中的静态资源和动态资源；通过预设的第一分类模型分类所述静态资源，以得到所述目标网址对应的第一分类信息；通过预设的第二分类模型分类所述动态资源，以得到所述目标网址对应的第二分类信息；以及根据所述第一分类信息和所述第二分类信息确定所述目标网址所属的恶意网址类别。进一步地，所述静态资源包括页面head标签内的meta字段、页面标题和/或页面body标签内的文字，所述第一分类模型为文本分类模型，通过预设的第一分类模型分类所述静态资源，以得到所述目标网址对应的第一分类信息的步骤包括：根据所述静态资源构建词序列；将所述词序列输入所述文本分类模型，其中，所述文本分类...

【技术保护点】
1.一种恶意网址的分类方法，其特征在于，包括：/n获取目标网址对应的网络资源；/n提取所述网络资源中的静态资源和动态资源；/n通过预设的第一分类模型分类所述静态资源，以得到所述目标网址对应的第一分类信息；/n通过预设的第二分类模型分类所述动态资源，以得到所述目标网址对应的第二分类信息；以及/n根据所述第一分类信息和所述第二分类信息确定所述目标网址所属的恶意网址类别。/n

【技术特征摘要】
1.一种恶意网址的分类方法，其特征在于，包括：
获取目标网址对应的网络资源；
提取所述网络资源中的静态资源和动态资源；
通过预设的第一分类模型分类所述静态资源，以得到所述目标网址对应的第一分类信息；
通过预设的第二分类模型分类所述动态资源，以得到所述目标网址对应的第二分类信息；以及
根据所述第一分类信息和所述第二分类信息确定所述目标网址所属的恶意网址类别。

2.根据权利要求1所述的恶意网址的分类方法，其特征在于，
所述静态资源包括页面head标签内的meta字段、页面标题和/或页面body标签内的文字，所述第一分类模型为文本分类模型，
通过预设的第一分类模型分类所述静态资源，以得到所述目标网址对应的第一分类信息的步骤包括：
根据所述静态资源构建词序列；
将所述词序列输入所述文本分类模型，其中，所述文本分类模型用于根据所述词序列确定所述第一分类信息。

3.根据权利要求2所述的恶意网址的分类方法，其特征在于，
根据所述静态资源构建词序列的步骤包括：
将所述静态资源划分为至少两个文本类；
对所述文本类进行分词得到词序列；
所述文本分类模型包括第一卷积层、第一池化层和第一全连接层，所述第一卷积层包括至少两个串联的文本卷积核，将所述词序列输入所述文本分类模型的步骤包括：
将每个所述文本类对应的所述词序列作为一维向量输入至第一个文本卷积核；
将最后一个所述文本卷积核的输出输入至所述第一池化层；
将所述第一池化层的输出输入至所述第一全连接层，其中，所述第一全连接层输出所述第一分类信息。

4.根据权利要求3所述的恶意网址的分类方法，其特征在于，将所述静态资源划分为至少两个文本类的步骤包括：
将所述页面标题划分为标题文本类，将所述meta字段划分为头文本类，将所述页面body标签内的文字划分为内容文本类。

5.根据权利要求1所述的恶意网址的分类方法，其特征在于，
所述动态资源包括页面加载的脚本程序和/或css资源文件，所述第二分类模型为二进制分类模型，
通过预设的第二分类模型分类所述动态资源，以得到所述目标网址对应的第二分类信息的步骤包括：
根据所述动态资源构建二进制片段序列；
将所述二进制片段序列输入所述二进制分类模型，其中，所述二进制分类模型用于根据所述二进制片段序列确定所述第二分类信息。

6.根据权利要求5所...

【专利技术属性】
技术研发人员：陈劲，
申请(专利权)人：奇安信科技集团股份有限公司，网神信息技术北京股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人