System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 网站图片篡改检测方法、计算机装置、介质、产品制造方法及图纸_技高网

网站图片篡改检测方法、计算机装置、介质、产品制造方法及图纸

技术编号:44420238 阅读:0 留言:0更新日期:2025-02-28 18:36
本申请公开了一种网站图片篡改检测方法、计算机装置、介质、产品。其中,方法包括:对网页图片进行预处理,获得目标图片;判断目标图片中是否包含文本信息,若否,获取目标图片与非法图片库的图片相似度,若图片相似度大于第一阈值,触发图片篡改预警,反之,不触发图片篡改预警;若目标图片中包含文本信息,确定文本内容;获取文本内容与敏感词库的语义相似度;若语义相似度大于第二阈值,触发图片篡改预警;若语义相似度不大于第二阈值,不触发图片篡改预警。该方法能够有效检测网站图片中的非法和敏感内容,对每张图片均能进行全面、精确的检测,保护网站的安全和合规性。

【技术实现步骤摘要】

本公开涉及计算机,尤其涉及一种网站图片篡改检测方法、计算机装置、介质、产品


技术介绍

1、在网页篡改中,篡改网站中的图片是一种常见的攻击手段,现有技术中公开的检测方法主要包括:从网页源代码中提取出图片文件,从图片中提取文字内容,对于提取出的文本内容,使用预定义的敏感词库进行匹配,识别出包含非法或敏感词汇的图片,监控网站的访问行为,检测是否有异常的图片上传、下载或替换行为,例如,短时间内大量图片被替换或访问频率异常等。

2、尽管上述方法在一定程度上可以检测出被篡改的图片,但仍存在以下几个主要问题:1)对于没有文本字样的非法图片,现有的技术无法提取有效的文本内容,导致无法通过敏感词检测来识别这些图片;2)即使是高度准确的图像分类模型,也可能误将正常图片识别为非法图片,尤其是在图片内容不明确或存在噪声时,对于新型或未知的非法图片,模型可能无法准确识别,导致漏报;3)对于大型网站或图片数量庞大的情况,图片提取、内容分析和检测过程会非常耗时,影响检测效率;4)攻击者可能通过技术手段(如图片加密、隐写术等)绕过现有检测机制,或者通过图片的微小修改来逃避检测。

3、现有技术中针对篡改网站图片的检测方法虽然在一定程度上有效,但仍存在无法识别无文本的非法图片、误报与漏报、检测效率低以及对抗性攻击等问题。


技术实现思路

1、有鉴于此,本公开实施例提供了一种网站图片篡改检测方法、计算机装置、介质、产品,能够现有技术中存在的检测精准度差、效率低、误报率与漏报率高等问题。

<p>2、第一方面,本公开实施例提供了一种网站图片篡改检测方法,具体包括以下内容:

3、对获取的网页图片进行预处理,获得目标图片;

4、判断所述目标图片中是否包含文本信息,若否,获取所述目标图片与非法图片库的图片相似度,若所述图片相似度大于第一阈值,触发图片篡改预警;

5、若所述图片相似度不大于第一阈值,不触发图片篡改预警;

6、若所述目标图片中包含文本信息,确定文本内容;

7、获取所述文本内容与敏感词库的语义相似度;

8、若所述语义相似度大于第二阈值,触发图片篡改预警;

9、若所述语义相似度不大于第二阈值,不触发图片篡改预警。

10、可选的,所述对获取的网页图片进行预处理,获得目标图片,包括:

11、对所述网页图片进行归一化处理,获得预设尺寸的样本图片;

12、对所述样本图片进行数据增强,并对增强后的所述样本图片进行分辨率处理,获得预设分辨率的目标图。

13、可选的,所述获取所述目标图片与非法图片库的图片相似度,包括:

14、提取所述目标图片的实际图片特征,所述实际图片特征包括第一颜色特征向量、第一形状特征向量;

15、提取所述非法图片库中每张图片的样本图片特征,所述样本图片特征包括第二颜色特征向量、第二形状特征向量;

16、基于预设距离公式对所述第一形状特征向量、所述第二形状特征向量进行分析,获得第一相似度;

17、基于预设转换公式对所述第一相似度进行转换,获得第一转换值;

18、基于所述第一颜色特征向量获取第一像素信息;

19、基于所述第二颜色特征向量获取第二像素信息;

20、基于所述第一像素信息、所述第二像素信息获得第二相似度;

21、基于所述第一转换值、所述第二相似度,获得图片相似度。

22、可选的,所述基于所述第一像素信息、所述第二像素信息获得第二相似度,包括:

23、基于所述第一像素信息,获取所述目标图片中所有像素点的第一频次信息;每个像素点的所述第一频次信息均包括第一红色通道频次、第一绿色通道频次、第一蓝色通道频次;

24、基于所有的所述第一频次信息,获得第一红色通道类频次集、第一绿色通道类频次集、第一蓝色通道类频次集;

25、基于所述第二像素信息,获取所述非法图片库中每张图片所有像素点的第二频次信息;每个像素点的所述第二频次信息均包括第二红色通道频次、第二绿色通道频次、第二蓝色通道频次;

26、基于所有的所述第二频次信息,获得第二红色通道类频次集、第二绿色通道类频次集、第二蓝色通道类频次集;

27、基于所述第一红色通道类频次集、所述第二红色通道类频次集,获得第一通道相似度;

28、基于所述第一绿色通道类频次集、所述第二绿色通道类频次集,获得第二通道相似度;

29、基于所述第一蓝色通道类频次集、所述第二蓝色通道类频次集,获得第三通道相似度;

30、基于所述第一通道相似度、所述第二通道相似度、所述第三通道相似度获得所述第二相似度。

31、可选的,所述基于所述第一红色通道类频次集、所述第二红色通道类频次集,获得第一通道相似度,包括:

32、基于所述第一红色通道类频次集、所述第二红色通道类频次集,获得第一通道向量比对集,所述第一通道向量比对信息包含所有像素点的红色通道比对信息;

33、基于所述第一通道向量比对集,获取第一有效集;所述第一有效集包括所述第一红色通道类频次集、所述第二红色通道类频次集中位置相同的像素点集合;

34、基于所述第一有效集获得第一通道相似度;

35、所述第一通道相似度为所述第一有效集与红色通道像素点总数的比值。

36、可选的,所述基于所述第一绿色通道类频次集、所述第二绿色通道类频次集,获得第二通道相似度,包括:

37、基于所述第一绿色通道类频次集、所述第二绿色通道类频次集,获得第二通道向量比对集,所述第二通道向量比对信息包含所有像素点的绿色通道比对信息;

38、基于所述第二通道向量比对集,获取第二有效集;所述第二有效集包括所述第一绿色通道类频次集、所述第二绿色通道类频次集中位置相同的像素点集合;

39、基于所述第二有效集获得第二通道相似度;

40、所述第二通道相似度为所述第二有效集与绿色通道像素点总数的比值。

41、可选的,所述基于所述第一蓝色通道类频次集、所述第二蓝色通道类频次集,获得第三通道相似度,包括:

42、基于所述第一蓝色通道类频次集、所述第二蓝色通道类频次集,获得第三通道向量比对集,所述第三通道向量比对信息包含所有像素点的蓝色通道比对信息;

43、基于所述第三通道向量比对集,获取第三有效集;所述第三有效集包括所述第一蓝色通道类频次集、所述第二蓝色通道类频次集中位置相同的像素点集合;

44、基于所述第三有效集获得第三通道相似度;

45、所述第三通道相似度为所述第三有效集与蓝色通道像素点总数的比值。

46、可选的,所述第一相似度为d(a,b):其中,ai为第一形状特征向量,bi为第二形状特征向量;

47、所述第一转换值为simshape(x,y):

48本文档来自技高网...

【技术保护点】

1.一种网站图片篡改检测方法,其特征在于,包括:

2.根据权利要求1所述的网站图片篡改检测方法,其特征在于,所述对获取的网页图片进行预处理,获得目标图片,包括:

3.根据权利要求1所述的网站图片篡改检测方法,其特征在于,所述获取所述目标图片与非法图片库的图片相似度,包括:

4.根据权利要求3所述的网站图片篡改检测方法,其特征在于,所述基于所述第一像素信息、所述第二像素信息获得第二相似度,包括:

5.根据权利要求4所述的网站图片篡改检测方法,其特征在于,所述基于所述第一红色通道类频次集、所述第二红色通道类频次集,获得第一通道相似度,包括:

6.根据权利要求5所述的网站图片篡改检测方法,其特征在于,所述基于所述第一绿色通道类频次集、所述第二绿色通道类频次集,获得第二通道相似度,包括:

7.根据权利要求6所述的网站图片篡改检测方法,其特征在于,所述基于所述第一蓝色通道类频次集、所述第二蓝色通道类频次集,获得第三通道相似度,包括:

8.根据权利要求7所述的网站图片篡改检测方法,其特征在于,所述第一相似度为d(A,B):其中,Ai为第一形状特征向量,Bi为第二形状特征向量;

9.根据权利要求1所述的网站图片篡改检测方法,其特征在于,所述获取所述文本内容与敏感词库的语义相似度,包括:

10.一种计算机装置,其特征在于,所述计算机装置包括:

11.一种计算机可读存储介质,其特征在于,该计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行权利要求1-9任一所述的网站图片篡改检测方法。

12.一种计算机程序产品,包括计算机指令,其特征在于,该计算机指令被处理器执行时实现权利要求1-9任一项所述方法的步骤。

...

【技术特征摘要】

1.一种网站图片篡改检测方法,其特征在于,包括:

2.根据权利要求1所述的网站图片篡改检测方法,其特征在于,所述对获取的网页图片进行预处理,获得目标图片,包括:

3.根据权利要求1所述的网站图片篡改检测方法,其特征在于,所述获取所述目标图片与非法图片库的图片相似度,包括:

4.根据权利要求3所述的网站图片篡改检测方法,其特征在于,所述基于所述第一像素信息、所述第二像素信息获得第二相似度,包括:

5.根据权利要求4所述的网站图片篡改检测方法,其特征在于,所述基于所述第一红色通道类频次集、所述第二红色通道类频次集,获得第一通道相似度,包括:

6.根据权利要求5所述的网站图片篡改检测方法,其特征在于,所述基于所述第一绿色通道类频次集、所述第二绿色通道类频次集,获得第二通道相似度,包括:

7.根据权利要...

【专利技术属性】
技术研发人员:孙春兰
申请(专利权)人:北京天融信网络安全技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1