一种基于网站指纹的仿冒网站检测方法及装置制造方法及图纸

技术编号:36860234 阅读:18 留言:0更新日期:2023-03-15 18:24
本申请实施例提供一种基于网站指纹的仿冒网站检测方法及装置,网络安全技术领域。该方法包括:获取原网站的网站指纹和待检测网站的网站指纹;根据网站指纹进行划分,获得高权重指纹和低权重指纹;根据原网站的高权重指纹、低权重指纹、技术组件指纹中的一种或多种和待检测网站的权重组合指纹、高权重指纹、低权重指纹、技术组件指纹中的一种或多种进行匹配并计算对应的权重占比值,获得相似度分值;判断相似度分值是否大于预设阈值;若大于预设阈值,检测原网站的基础信息和待检测网站的基础信息是否相同,若不相同,判定待检测网站是仿冒网站;若相同,判定待检测网站不是仿冒网站;若小于等于预设阈值,则判定待检测网站不是仿冒网站。是仿冒网站。是仿冒网站。

【技术实现步骤摘要】
一种基于网站指纹的仿冒网站检测方法及装置


[0001]本申请涉及网络安全
,具体而言,涉及一种基于网站指纹的仿冒网站检测方法及装置。

技术介绍

[0002]目前,随着计算机网络技术的飞速发展,网站数量成指数级别增长,网站已成为日常信息获取、企业、学校业务在线办理和网络购物不可或缺的途径之一。同时计算机网络的安全问题也变得日益复杂与突出。特别是企业与金融机构网站,一直是不法分子攻击的重点目标。如何快速检测出仿冒网站,成为亟需解决的安全问题。
[0003]现有技术中,现有仿冒网站检测技术是通过对比网站之间三个维度上的相似性综合判定是否为仿冒网站,具体为通过对网站内容分词、网站截图以及网站URL(uniformresource locator,统一资源定位器)三个维度分别计算与原网站的相似度得分后、集成汇总计算出最终的一个网站相似值,将集成汇总后计算的相似度值与预设的相似度阈值进行比较,超过阈值则判断待检测网站是原网站的仿冒站点;但是,现有仿冒网站检测技术还存在以下问题:网页截图比对的方式消耗较多的存储与计算资源;分词需要实时处理,无法提前预处理分词影响检测效率;URL相似性比对的方式漏报高;对比维度少,其中一个维度分数相似分值低则会导致判断错误。

技术实现思路

[0004]本申请实施例的目的在于提供一种基于网站指纹的仿冒网站检测方法、装置、电子设备及计算机可读存储介质,可以实现提高仿冒网站的检测效率和检测准确性的技术效果。
[0005]第一方面,本申请实施例提供了一种基于网站指纹的仿冒网站检测方法,包括:获取原网站的网站指纹和待检测网站的网站指纹,所述网站指纹包括关键词指纹、原生指纹、衍生指纹、技术组件指纹中的一种或多种;根据所述关键词指纹、所述原生指纹、所述衍生指纹中的一种或多种进行划分,获得高权重指纹和低权重指纹;根据所述原网站的高权重指纹、低权重指纹、技术组件指纹中的一种或多种和所述待检测网站的权重组合指纹、高权重指纹、低权重指纹、技术组件指纹中的一种或多种进行匹配并计算对应的权重占比值,获得相似度分值;判断所述相似度分值是否大于预设阈值;若大于预设阈值,检测原网站的基础信息和待检测网站的基础信息是否相同,若不相同,判定所述待检测网站是仿冒网站;若相同,判定所述待检测网站不是仿冒网站;若小于等于预设阈值,则判定所述待检测网站不是仿冒网站。
[0006]在上述实现过程中,该基于网站指纹的仿冒网站检测方法通过获取原网站以及待检测网站的关键词指纹、原生指纹、衍生指纹、技术组件指纹,基于两者指纹进行综合处理、
获得相似度分值,进而基于相似度分值和原网站的基础信息、待检测网站的基础信息进行综合判断,判定待检测网站是否为仿冒网站;从而,该方法通过网站指纹的多维度信息以及对比网站的基础信息的组合方式检测仿冒网站,从多维度对比网站指纹信息,提升了相似网站检出的准确度,又通过对比网站基础信息进一步判定相似网站是否为仿冒网站,相对于现有的检测方案本方法对于仿冒网站的检出准确度大大提升;同时,所有网站指纹都可以根据标签提取网站源码对应位置生成网站指纹,提取流程通用快速;从而,该方法可以实现提高仿冒网站的检测效率和检测准确性的技术效果。
[0007]进一步地,在根据所述关键词指纹、所述原生指纹、所述衍生指纹中的一种或多种进行划分,获得高权重指纹和低权重指纹的步骤之后,所述方法还包括:根据预设条件筛选所述高权重指纹中的部分指纹和所述低权重指纹中的部分指纹,获得权重组合指纹;将所述原网站的权重组合指纹与所述待检测网站的权重组合指纹进行匹配判断是否命中,若匹配命中,则跳转至所述检测原网站的基础信息和待检测网站的基础信息是否相同的步骤。
[0008]在上述实现过程中,权重组合指纹是根据分析当前原网站的特征,将高、低权重指纹中部分指纹根据网站分析的实际情况组合起来的;作为一个权重组合指纹,权重组合指纹为原网站独一无二的特征,该权重组合指纹可信度为100%,即待检测网站一旦命中原网站的权重组合指纹,则直接判定该待检测网站为疑似仿冒网站,从而提高对仿冒网站的检测效率。
[0009]进一步地,所述关键词指纹包括网站源码的词汇、短句、网页源码片段中的一种或多种组合;所述原生指纹包括网站响应的header、html源码、网页title、icon图标、网页footer、网页引用js的url、网页dom树、robots页面源码、网页源码提取的备案编号、网站ssl证书提取的网站证书使用者信息中的一种或多种;所述衍生指纹包括html源码hash、icon图标hash、网页footer部分hash、网页引用的js的hash、网页dom树hash 中的一种或多种。
[0010]进一步地,所述技术组件指纹通过预设web指纹扫描器检测网站应用获得,其中所述技术组件指纹包括检测网站使用的web服务器、前端框架、后端框架、服务器操作系统、服务端语言、内容管理系统、数据库、中间件中的一种或多种。
[0011]进一步地,所述高权重指纹包括icon图标hash、网页dom树hash、html源码hash、关键词指纹中的一种或多种;所述低权重指纹包括:网页title、网页源码提取的备案编号、网站证书使用者信息、网页引用js的url、网页引用js的hash、网页footer、网页footer部分hash中的一种或多种。
[0012]进一步地,所述高权重指纹、所述低权重指纹、所述技术组件指纹在相似度分值中的权重分别为60%、30%、10%;在根据所述原网站的高权重指纹、低权重指纹、技术组件指纹中的一种或多种和所述待检测网站的权重组合指纹、高权重指纹、低权重指纹、技术组件指纹中的一种或多种进行匹配并计算对应的权重占比值,获得相似度分值的步骤之前,所述方法还包括:
当原网站存在权重指纹取值为空时,则剔除该权重指纹取值的相似度对比。
[0013]在上述实现过程中,当原网站存在权重指纹取值为空时,则剔除该指纹维度的相似度对比,从而避免空值计算,提高相似度分值的准确率。
[0014]第二方面,本申请实施例提供了一种基于网站指纹的仿冒网站检测装置,包括:指纹获取模块,用于获取原网站的网站指纹和待检测网站的网站指纹,所述网站指纹包括关键词指纹、原生指纹、衍生指纹、技术组件指纹中的一种或多种;指纹划分模块,用于根据所述关键词指纹、所述原生指纹、所述衍生指纹中的一种或多种进行划分,获得高权重指纹和低权重指纹;相似度计算模块,用于根据所述原网站的高权重指纹、低权重指纹、技术组件指纹中的一种或多种和所述待检测网站的权重组合指纹、高权重指纹、低权重指纹、技术组件指纹中的一种或多种进行匹配并计算对应的权重占比值,获得相似度分值;判断模块,用于判断所述相似度分值是否大于预设阈值;若大于预设阈值,检测原网站的基础信息和待检测网站的基础信息是否相同,若不相同,判定所述待检测网站是仿冒网站;若相同,判定所述待检测网站不是仿冒网站;若小于等于预设阈值,则判定所述待检测网站不是仿冒网站。
[0015]进一步地,所述基于网站指纹本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于网站指纹的仿冒网站检测方法,其特征在于,包括:获取原网站的网站指纹和待检测网站的网站指纹,所述网站指纹包括关键词指纹、原生指纹、衍生指纹、技术组件指纹中的一种或多种;根据所述关键词指纹、所述原生指纹、所述衍生指纹中的一种或多种进行划分,获得高权重指纹和低权重指纹;根据所述原网站的高权重指纹、低权重指纹、技术组件指纹中的一种或多种和所述待检测网站的权重组合指纹、高权重指纹、低权重指纹、技术组件指纹中的一种或多种进行匹配并计算对应的权重占比值,获得相似度分值;判断所述相似度分值是否大于预设阈值;若大于预设阈值,检测原网站的基础信息和待检测网站的基础信息是否相同,若不相同,判定所述待检测网站是仿冒网站;若相同,判定所述待检测网站不是仿冒网站;若小于等于预设阈值,则判定所述待检测网站不是仿冒网站。2.根据权利要求1所述的基于网站指纹的仿冒网站检测方法,其特征在于,在根据所述关键词指纹、所述原生指纹、所述衍生指纹中的一种或多种进行划分,获得高权重指纹和低权重指纹的步骤之后,所述方法还包括:根据预设条件筛选所述高权重指纹中的部分指纹和所述低权重指纹中的部分指纹,获得权重组合指纹;将所述原网站的权重组合指纹与所述待检测网站的权重组合指纹进行匹配判断是否命中,若匹配命中,则跳转至所述检测原网站的基础信息和待检测网站的基础信息是否相同的步骤。3.根据权利要求1所述的基于网站指纹的仿冒网站检测方法,其特征在于,所述关键词指纹包括网站源码的词汇、短句、网页源码片段中的一种或多种组合;所述原生指纹包括网站响应的header、html源码、网页title、icon图标、网页footer、网页引用js的url、网页dom树、robots页面源码、网页源码提取的备案编号、网站ssl证书提取的网站证书使用者信息中的一种或多种;所述衍生指纹包括html源码hash、icon图标hash、网页footer部分hash、网页引用的js的hash、网页dom树hash 中的一种或多种。4.根据权利要求1或3所述的基于网站指纹的仿冒网站检测方法,其特征在于,所述技术组件指纹通过预设web指纹扫描器检测网站应用获得,其中所述技术组件指纹包括检测网站使用的web服务器、前端框架、后端框架、服务器操作系统、服务端语言、内容管理系统、数据库、中间件中的一种或多种。5.根据权利要求3所述的基于网站指纹的仿冒网站检测方法,其特征在于,所述高权重指纹包括icon图标hash、网页dom树hash、html源码hash、关键词指纹中的一种或多种;所述低权重指纹包括:网页title、网页源...

【专利技术属性】
技术研发人员:汪树蕾唐御钦武浩薛锋樊兴华
申请(专利权)人:北京微步在线科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1