System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于超图神经网络模型的不良域名识别方法和装置制造方法及图纸_技高网

一种基于超图神经网络模型的不良域名识别方法和装置制造方法及图纸

技术编号:44432097 阅读:0 留言:0更新日期:2025-02-28 18:43
本发明专利技术属于信息技术领域,涉及一种基于超图神经网络模型的不良域名识别方法和装置。该方法的步骤包括:获取域名数据,将域名数据划分为训练集和测试集;为训练集和测试集构建超图;搭建超图神经网络模型;利用训练集对超图神经网络模型进行训练;利用训练完成的超图神经网络模型对测试集进行不良域名识别。本发明专利技术通过特定的超边构造规则能够更准确的体现域名间的多元关联关系,采用的注意力机制及残差卷积能够提高最终分类结果的准确性。

【技术实现步骤摘要】

本专利技术属于信息,具体涉及一种基于超图神经网络模型的不良域名识别方法和装置


技术介绍

1、域名是重要的互联网基础设施,是人们访问互联网的入口,对互联网的正常运行具有重要支撑作用。不良域名是指应用于违法违规内容的网站和app的域名,不良域名的治理是网络空间治理的重要组成部分。随着科学技术的发展,一方面,域名注册变得更为便捷,这在一定程度上为不法分子提供了便利;另一方面,不法分子通过技术升级对不良域名的使用更加隐蔽,这些都增加了不良域名的识别难度。

2、图神经网络在节点分类问题上取得了显著的成绩,在不良域名识别上也有相关应用。当前有关域名识别在图神经网络上的应用主要集中在简单图上,但由于域名间具有复杂的多元关系(关联ip、所属注册商等),其并非是简单的成对关系,简单图难以捕捉数据之间的高阶关联,因此相较于一般图结构,超图能够更准确的建模域名间的关系。


技术实现思路

1、本专利技术针对上述问题,提供一种基于超图神经网络模型的不良域名识别方法和装置。

2、本专利技术采用的技术方案如下:

3、一种基于超图神经网络模型的不良域名识别方法,包括以下步骤:

4、获取域名数据,将域名数据划分为训练集和测试集;

5、为训练集和测试集构建超图;

6、搭建超图神经网络模型;

7、利用训练集对超图神经网络模型进行训练;

8、利用训练完成的超图神经网络模型对测试集进行不良域名识别。

9、进一步地,所述将域名数据划分为训练集和测试集,其中训练集为已知不良域名和域名白名单中的域名,测试集为不含标签的域名。

10、进一步地,所述超图包含节点集合和超边集合;所述节点集合为测试集或训练集的全部域名;所述超边集合中的超边的建立方法是:基于域名的解析ip、ip所属asn码、域名注册商、域名注册主体,计算两域名间的关联强度,若关联强度大于设定的阈值,则两域名间存在超边,否则两域名间不存在超边。

11、进一步地,所述两域名间的关联强度采用下式计算:

12、cor(v1,v2)=ω1|asn(ip(v1)∩ip(v2))|+ω2ia(v1,v2)+ω3ib(v1,v2)

13、其中,cor(v1,v2)为两域名间的关联强度,v1和v2为节点集合v中的任意两个域名节点,ip(v1)、ip(v2)分别为v1和v2的解析ip集合,asn(ip(v1)∩ip(v2))为域名v1和v2的共有解析ip所属的asn集合,ω1、ω2、ω3为设定的权重系数;ia(x)为示性函数,若x∈a,则ia(x)=1,否则ia(x)=0,事件a为属于同一注册者,事件b为属于同一注册商;若cor(v1,v2)大于设定的阈值u,则生成对应的超边,否则两域名节点间不存在超边。

14、进一步地,所述超图神经网络模型包含节点嵌入模块、自注意力更新模块、卷积模块、分类模块;节点嵌入模块用于进行节点嵌入以得到初始输入特征;自注意力更新模块采用自注意力机制对超图的关联矩阵进行更新以挖掘节点间的影响关系;卷积模块不断更新节点特征,得到最终的节点特征,将其作为分类模块的输入特征;将分类模块的预测结果与真实标签通过梯度下降算法计算交叉熵损失函数,并通过反向传播优化学习相关参数,将不良域名识别问题转换为二分类问题,从而训练得到最优的不良域名分类模型。

15、进一步地,所述自注意力更新模块得到的更新后的关联矩阵如下:

16、

17、其中,是域名节点vi的特征,是包含该域名节点的超边ej的特征,σ是激活函数,sim是计算超边和节点间相似性的函数,w是可学习的权重矩阵。

18、进一步地,所述卷积模块的超图卷积传播过程如下:

19、

20、其中αl、βl是超参数,dv是节点度矩阵,是经注意力机制更新后的关联矩阵,de是超边度矩阵,x(l)表示第l层的输入特征,x(0)表示初始输入特征,i是单位矩阵,w(l)是第l层的可学习权重矩阵。

21、第二方面,本专利技术提供一种基于超图神经网络模型的不良域名识别装置,其包括:

22、域名数据获取模块,用于获取域名数据,将域名数据划分为训练集和测试集;

23、超图构建模块,用于为训练集和测试集构建超图;

24、超图神经网络模型搭建模块,用于搭建超图神经网络模型;

25、超图神经网络模型训练模块,用于利用训练集对超图神经网络模型进行训练;

26、不良域名识别模块,用于利用训练完成的超图神经网络模型对测试集进行不良域名识别。

27、第三方面,本专利技术提供一种计算机设备,其包括存储器和处理器,所述存储器存储计算机程序,所述计算机程序被配置为由所述处理器执行,所述计算机程序包括用于执行本专利技术方法中各步骤的指令。

28、第四方面,本专利技术提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,所述计算机程序被计算机执行时,实现本专利技术方法的各个步骤。

29、由于采用了以上的方案,本专利技术具有以下优点:

30、1)通过特定的超边构造规则,能够更准确的体现域名间的多元关联关系。

31、2)采用注意力机制及残差卷积,能够在一定程度上提高最终分类结果的准确性。

本文档来自技高网...

【技术保护点】

1.一种基于超图神经网络模型的不良域名识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述将域名数据划分为训练集和测试集,其中训练集为已知不良域名和域名白名单中的域名,测试集为不含标签的域名。

3.根据权利要求1所述的方法,其特征在于,所述超图包含节点集合和超边集合;所述节点集合为测试集或训练集的全部域名;所述超边集合中的超边的建立方法是:基于域名的解析IP、IP所属ASN码、域名注册商、域名注册主体,计算两域名间的关联强度,若关联强度大于设定的阈值,则两域名间存在超边,否则两域名间不存在超边。

4.根据权利要求3所述的方法,其特征在于,所述两域名间的关联强度采用下式计算:

5.根据权利要求1所述的方法,其特征在于,所述超图神经网络模型包含节点嵌入模块、自注意力更新模块、卷积模块、分类模块;节点嵌入模块用于进行节点嵌入以得到初始输入特征;自注意力更新模块采用自注意力机制对超图的关联矩阵进行更新以挖掘节点间的影响关系;卷积模块不断更新节点特征,得到最终的节点特征,将其作为分类模块的输入特征;将分类模块的预测结果与真实标签通过梯度下降算法计算交叉熵损失函数,并通过反向传播优化学习相关参数,将不良域名识别问题转换为二分类问题,从而训练得到最优的不良域名分类模型。

6.根据权利要求5所述的方法,其特征在于,所述自注意力更新模块得到的更新后的关联矩阵如下:

7.根据权利要求6所述的方法,其特征在于,所述卷积模块的超图卷积传播过程如下:

8.一种基于超图神经网络模型的不良域名识别装置,其特征在于,包括:

9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器存储计算机程序,所述计算机程序被配置为由所述处理器执行,所述计算机程序包括用于执行权利要求1~7中任一项所述方法的指令。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机程序,所述计算机程序被计算机执行时,实现权利要求1~7中任一项所述的方法。

...

【技术特征摘要】

1.一种基于超图神经网络模型的不良域名识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述将域名数据划分为训练集和测试集,其中训练集为已知不良域名和域名白名单中的域名,测试集为不含标签的域名。

3.根据权利要求1所述的方法,其特征在于,所述超图包含节点集合和超边集合;所述节点集合为测试集或训练集的全部域名;所述超边集合中的超边的建立方法是:基于域名的解析ip、ip所属asn码、域名注册商、域名注册主体,计算两域名间的关联强度,若关联强度大于设定的阈值,则两域名间存在超边,否则两域名间不存在超边。

4.根据权利要求3所述的方法,其特征在于,所述两域名间的关联强度采用下式计算:

5.根据权利要求1所述的方法,其特征在于,所述超图神经网络模型包含节点嵌入模块、自注意力更新模块、卷积模块、分类模块;节点嵌入模块用于进行节点嵌入以得到初始输入特征;自注意力更新模块采用自注意力机制对超图的关联矩阵进行更新以挖掘节点...

【专利技术属性】
技术研发人员:马永征张中献马中胜王鹤子贺智谋董科军
申请(专利权)人:中国互联网络信息中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1