System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种网页检测方法及电子设备技术_技高网

一种网页检测方法及电子设备技术

技术编号:40667235 阅读:6 留言:0更新日期:2024-03-18 19:02
本申请提供了一种网页检测方法及电子设备,网页检测方法包括:获取目标链接;基于黑名单和白名单,确定目标链接的评估系数;基于目标链接的属性信息,确定目标链接的第一评估分值;在评估系数满足目标条件时,对目标链接对应的目标网页的网页内容进行评估,确定目标网页的第二评估分值;基于评估系数、第一评估分值以及第二评估分值,确定目标网页是否被执行目标操作。本申请基于黑名单、白名单、目标链接的属性信息以及目标网页的网页内容,来确定目标网页是否被篡改,通过从多个维度对目标网页进行检测,避免了通过关键词识别被篡改网页导致的局限性较大的问题,实现了提高通用性的目的,还提高了检测结果的准确性,确保了目标网页的有效性。

【技术实现步骤摘要】

本申请涉及网页安全,特别涉及一种网页检测方法及电子设备


技术介绍

1、据国家互联网应急中心监测数据显示,2022年上半年我国境内遭受篡改的网站数量为30706个(其中被篡改的政府网站为166个)。可见,网站篡改事件占据着web安全事件中较大的比重,其也是直接影响用户网站使用体验和损害政府、企事业单位公众形象的安全事件。

2、目前,通过预置关键词来识别被篡改的网页,但该方式过于单一,其只能识别已有关键词的相关网页,应用范围存在较大的局限性,并且,仅根据预置关键词来进行识别容易产生误判的情况。


技术实现思路

1、有鉴于此,本申请实施例的目的在于提供一种网页检测方法及电子设备,不仅能够提高通用性,还能够提高检测的准确性。

2、第一方面,本申请实施例提供了一种网页检测方法,包括:

3、获取目标链接;

4、基于黑名单和白名单,确定所述目标链接的评估系数;

5、基于所述目标链接的属性信息,确定所述目标链接的第一评估分值;

6、在所述评估系数满足目标条件时,对所述目标链接对应的目标网页的网页内容进行评估,确定所述目标网页的第二评估分值;

7、基于所述评估系数、所述第一评估分值以及所述第二评估分值,确定所述目标网页是否被执行目标操作。

8、在一种可能的实施方式中,所述基于黑名单和白名单,确定所述目标链接的评估系数,包括:

9、在所述目标链接落入所述黑名单的情况下,确定所述黑名单对应的第一系数为所述目标链接的评估系数;

10、在所述目标链接落入所述白名单的情况下,确定所述白名单对应的第二系数为所述目标链接的评估系数;

11、在所述目标链接未落入所述黑名单和所述白名单的情况下,确定所述第三系数为所述目标链接的评估系数。

12、在一种可能的实施方式中,所述基于所述目标链接的属性信息,确定所述目标链接的第一评估分值,包括:

13、确定所述目标链接在跳转网页中的目标位置、所述目标链接对应的目标锚文本以及与所述跳转网页存在关联关系的网页的目标数量;

14、基于所述目标位置、所述目标锚文本以及所述目标数量,确定所述第一评估分值。

15、在一种可能的实施方式中,所述对所述目标链接对应的目标网页的网页内容进行评估,确定所述目标网页的第二评估分值,包括:

16、获取所述目标链接对应的目标网页;

17、通过网页分类模型,将所述目标网页的网页内容划分为第一类内容、第二类内容以及第三类内容;

18、基于所述第一类内容、所述第二类内容以及所述第三类内容,确定第一相似性评分;

19、在所述第一相似性评分小于预设阈值的情况下,将所述第一相似性评分确定为所述目标网页的第二评估分值。

20、在一种可能的实施方式中,所述对所述目标链接对应的目标网页的网页内容进行评估,确定所述目标网页的第二评估分值,包括:

21、获取所述目标链接对应的目标网页;

22、通过网页分类模型,将所述目标网页的网页内容划分为第一类内容、第二类内容以及第三类内容;

23、基于所述第一类内容、所述第二类内容以及所述第三类内容,确定第一相似性评分;

24、在所述第一相似性评分大于或等于预设阈值的情况下,基于所述第一类内容、所述第二类内容以及所述第三类内容中的至少一个与所述目标网页的备案信息,确定第二相似性评分;

25、基于所述第二相似性评分,确定所述目标网页的第二评估分值。

26、在一种可能的实施方式中,所述基于所述第二相似性评分,确定所述目标网页的第二评估分值,包括:

27、确定所述第一类内容、所述第二类内容以及所述第三类内容中的至少一个与所述目标网页的备案信息之间的相似性;

28、基于所述相似性以及所述相似性对应的可信系数,所述确定第二相似性评分。

29、在一种可能的实施方式中,所述基于所述评估系数、所述第一评估分值以及所述第二评估分值,确定所述目标网页是否被执行目标操作,包括:

30、对所述评估系数、所述第一评估分值以及所述第二评估分值进行计算,得到所述目标网页的最终评分;

31、在所述最终评分小于指定评分的情况下,确定所述目标网页被执行目标操作。

32、第二方面,本申请实施例还提供了一种电子设备,包括:

33、获取模块,其配置为获取目标链接;

34、第一确定模块,其配置为基于黑名单和白名单,确定所述目标链接的评估系数;

35、第二确定模块,其配置为基于所述目标链接的属性信息,确定所述目标链接的第一评估分值;

36、第三确定模块,其配置为在所述评估系数满足目标条件时,对所述目标链接对应的目标网页的网页内容进行评估,确定所述目标网页的第二评估分值;

37、第四确定模块,其配置为基于所述评估系数、所述第一评估分值以及所述第二评估分值,确定所述目标网页是否被执行目标操作。

38、在一种可能的实施方式中,所述第一确定模块具体配置为:

39、在所述目标链接落入所述黑名单的情况下,确定所述黑名单对应的第一系数为所述目标链接的评估系数;

40、在所述目标链接落入所述白名单的情况下,确定所述白名单对应的第二系数为所述目标链接的评估系数;

41、在所述目标链接未落入所述黑名单和所述白名单的情况下,确定所述第三系数为所述目标链接的评估系数。

42、在一种可能的实施方式中,所述第二确定模块具体配置为:

43、确定所述目标链接在跳转网页中的目标位置、所述目标链接对应的目标锚文本以及与所述跳转网页存在关联关系的网页的目标数量;

44、基于所述目标位置、所述目标锚文本以及所述目标数量,确定所述第一评估分值。

45、本申请实施例基于黑名单、白名单、目标链接的属性信息以及目标网页的网页内容,来确定目标网页是否被篡改,通过从多个维度对目标网页进行检测,避免了通过关键词识别被篡改网页导致的局限性较大的问题,实现了提高通用性的目的,同时,还提高了检测结果的准确性,确保了目标网页的有效性。

46、为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

本文档来自技高网...

【技术保护点】

1.一种网页检测方法,其特征在于,包括:

2.根据权利要求1所述的网页检测方法,其特征在于,所述基于黑名单和白名单,确定所述目标链接的评估系数,包括:

3.根据权利要求1所述的网页检测方法,其特征在于,所述基于所述目标链接的属性信息,确定所述目标链接的第一评估分值,包括:

4.根据权利要求1所述的网页检测方法,其特征在于,所述对所述目标链接对应的目标网页的网页内容进行评估,确定所述目标网页的第二评估分值,包括:

5.根据权利要求1所述的网页检测方法,其特征在于,所述对所述目标链接对应的目标网页的网页内容进行评估,确定所述目标网页的第二评估分值,包括:

6.根据权利要求5所述的网页检测方法,其特征在于,所述基于所述第二相似性评分,确定所述目标网页的第二评估分值,包括:

7.根据权利要求1所述的网页检测方法,其特征在于,所述基于所述评估系数、所述第一评估分值以及所述第二评估分值,确定所述目标网页是否被执行目标操作,包括:

8.一种电子设备,其特征在于,包括:

9.根据权利要求8所述的电子设备,其特征在于,所述第一确定模块具体配置为:

10.根据权利要求8所述的电子设备,其特征在于,所述第二确定模块具体配置为:

...

【技术特征摘要】

1.一种网页检测方法,其特征在于,包括:

2.根据权利要求1所述的网页检测方法,其特征在于,所述基于黑名单和白名单,确定所述目标链接的评估系数,包括:

3.根据权利要求1所述的网页检测方法,其特征在于,所述基于所述目标链接的属性信息,确定所述目标链接的第一评估分值,包括:

4.根据权利要求1所述的网页检测方法,其特征在于,所述对所述目标链接对应的目标网页的网页内容进行评估,确定所述目标网页的第二评估分值,包括:

5.根据权利要求1所述的网页检测方法,其特征在于,所述对所述目标链接对应的目标网页的网页内容进行评估...

【专利技术属性】
技术研发人员:唐宝元
申请(专利权)人:北京天融信网络安全技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1