本发明专利技术公开了一种网站类型的检测方法及装置,该方法包括:向网站服务器发送用于获取目标网站信息的请求,所述请求包括:目标网站标识;接收所述网站服务器根据所述目标网站标识发送的响应消息,所述响应消息包括:与所述目标网站标识对应的目标网站的至少一个组件信息;识别所述至少一个组件信息中各组件信息的特征,将识别的特征与多个预设网站中对应的特征进行匹配,根据匹配结果以及所述特征的预设权重值获取所述目标网站与所述预设网站相匹配的特征的相似指数,根据所述相似指数检测所述目标网站的网站类型。通过对目标网站的网站类型进行综合评分,提高了识别目标网站的网站类型的准确度。
【技术实现步骤摘要】
本专利技术涉及互联网信息安全
,具体涉及一种网站类型的检测方法及装置。
技术介绍
随着互联网迅速发展,互联网上的用户也越来越多,用户一般通过各种终端连接到互联网中。在互联网上提供的应用也越来越多,诸如网上购物和网上银行之类的核心应用也开始被互联网用户广泛使用,恶意信息盗取者会在互联网中设置诸如木马、病毒之类的恶意软件侵入用户终端,以获取利益。目前,一般是针对不同的网站类型选择网站防护技术,以确保有效的对网站进行防护。由于一些恶意信息盗取者在攻击或者窃取用户终端的信息时,为了防止用户容易的识别出网站的类型对其进行攻击,一般对网站的插件进行修改,比如对开源框架进行了修改,对网站的程序进行了修改,使用户根据现有方法并不能够精确识别出某个网站的真实类型,识别准确率较低,因此,恶意信息盗取者依然会对网站安全构成威胁。
技术实现思路
针对现有技术中的缺陷,本专利技术提供一种网站类型的检测方法及装置,提高了网站类型识别的准确度。第一方面,本专利技术提供一种网站类型的检测装置,包括:发送模块,用于向网站服务器发送用于获取目标网站信息的请求,所述请求包括:目标网站标识;接收模块,用于接收所述网站服务器根据所述目标网站标识发送的响应消息,所述响应消息包括:与所述目标网站标识对应的目标网站的至少一个组件信息;特征识别模块,用于识别所述至少一个组件信息中各组件信息的特征;特征匹配模块,用于将识别的特征与多个预设网站中对应的特征进行匹配;类型检测模块,用于根据匹配结果以及预设权重值获取所述目标网站与所述预设网站相匹配的特征的相似指数,根据所述相似指数检测所述目标网站的网站类型,所述权重值为该匹配结果对应组件信息的特征的权重值。可选的,所述特征匹配模块,用于比较所述识别的特征与各预设网站中对应的特征,在所述识别的特征与预设网站中对应的特征相同时,将所述特征作为匹配成功的特征;所述类型检测模块,用于根据所述匹配成功组件信息的的特征以及该匹配成功的特征的预设权重值获取所述目标网站与所述预设网站相匹配的特征的相似指数。可选的,所述类型检测模块,还用于:将各匹配成功的组件信息的特征的预设权重值相加,并将相加后的权重值作为所述目标网站与所述预设网站相匹配的特征的相似指数。可选的,所述类型检测模块,还用于:将所述相似指数与预设相似指数进行比较,在所述相似指数大于所述预设相似指数时,将该相似指数对应的网站类型作为目标网站的网站类型;或者,所述类型检测模块,还用于将所述相似指数与预设相似指数进行比较,若所述相似指数大于所述预设相似指数,且大于所述预设相似指数的相似指数为两个以上,则将最大相似指数对应的网站类型作为目标网站的类型。可选的,所述目标网站标识包括:目标网站的域名或IP地址。可选的,所述各组件信息的特征,包括:页面MD5值、页面特征码、URI探测信息、HTML标记信息、和/或正则表达式标记信息。第二方面,本专利技术还提供了一种网站类型的检测方法,包括:向网站服务器发送用于获取目标网站信息的请求,所述请求包括:目标网站标识;接收所述网站服务器根据所述目标网站标识发送的响应消息,所述响应消息包括:与所述目标网站标识对应的目标网站的至少一个组件信息;识别所述至少一个组件信息中各组件信息的特征,将识别的特征与多个预设网站中对应的特征进行匹配,根据匹配结果以及预设权重值获取所述目标网站与所述预设网站相匹配的特征的相似指数,根据所述相似指数检测所述目标网站的网站类型,所述权重值为该匹配结果对应组件信息的特征的权重值。可选的,所述将识别的特征与多个预设网站中对应的特征进行匹配,根据匹配结果以及预设权重值获取所述目标网站与所述预设网站相匹配的特征的相似指数,包括:比较所述识别的特征与各预设网站中对应的特征,在所述识别的特征与预设网站中对应的特征相同时,将所述特征作为匹配成功的特征;根据所述匹配成功的特征以及该匹配成功的组件信息的特征的预设权重值获取所述目标网站与所述预设网站相匹配的特征的相似指数。可选的,所述根据所述匹配成功的特征以及该匹配成功的组件信息的特征的预设权重值获取所述目标网站与所述预设网站相匹配的特征的相似指数,包括:将各匹配成功的组件信息的特征的预设权重值相加,并将相加后的权重值作为所述目标网站与所述预设网站相匹配的特征的相似指数。可选的,所述根据所述相似指数检测所述目标网站的网站类型,包括:将所述相似指数与预设相似指数进行比较,若所述相似指数大于所述预设相似指数,则将该相似指数对应的网站类型作为目标网站的网站类型;或者,将所述相似指数与预设相似指数进行比较,若所述相似指数大于所述预设相似指数,且大于所述预设相似指数的相似指数为两个以上,则将最大相似指数对应的网站类型作为目标网站的类型。可选的,所述目标网站标识包括:目标网站的域名或IP地址。可选的,所述各组件信息的特征,包括:页面MD5值、页面特征码、URI探测信息、HTML标记信息、和/或正则表达式标记信息。由上述技术方案可知,本专利技术提供的一种网站类型的检测方法及装置,该方法向网站服务器发送获取目标网站信息的请求,并接收网站服务器发送的目标网站的至少一个组件信息,通过将组件信息中的特征与预设网站的特征进行匹配,并将匹配特征的权重值相加,以获取目标网站与预设网站的特征的相似指数,然后根据该相似指数检测目标网站的网站类型。通过对目标网站的网站类型进行综合评分,提高了识别目标网站的网站类型的准确度。【附图说明】图1为本专利技术一实施例提供的网站类型的检测方法的流程示意图;图2为本专利技术另一实施例提供的网站类型的检测方法的流程示意图;图3为本专利技术一实施例提供的网站类型的检测装置的结构示意图。【具体实施方式】下面结合附图,对专利技术的【具体实施方式】作进一步描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。图1示出了本专利技术一实施例提供的一种网站类型的检测方法的流程示意图,如图1所示,该方法包括如下步骤:101、向网站服务器发送用于获取目标网站信息的请求,所述请求包括:目标网站标识。上述目标网站包括Dedecms、Phpcms等类型的网站,具体可以分为门户网站、论坛、社区、博客、电子商务网站、企事业网站等。目标网站标识可以理解为:网站的域名或IP地址,该网站域名可以由特殊性标志符组成,可以包括文字、字母、图画、三维动画甚至音乐等。102、接收所述网站服务器根据所述目标网站标识发送的响应消息,所述响应消息包括:与所述目标网站标识对应的目标网站的至少一个组件信息。网站服务器中存储有目标网站标识,通过该标识可以获取与该标识对应的网站域名,并通过网站域名获取目标网站的至少一个组件信息。该组件信息可以包括:网站页面标题、翻页信息,或者是页面结构化的内容,例如:具体版块的内容、列表的内容、内容页的具体内容等。103、识别所述至少一个组件信息中各组件信息的特征,将识别的特征与多个预设网站中对应的特征进行匹配,根据匹配结果以及预设权重值获取所述目标网站与所述预设网站相匹配的特征的相似指数,根据所述相似指数检测所述目标网站的网站类型,所述权重值为该匹配结果对应组件信息的特征的权重值。上述预设网站中包含了多种类型网站的特征,相应的,上述步骤103可以理解为将识别的目标网站的组本文档来自技高网...
【技术保护点】
一种网站类型的检测装置,其特征在于,包括:发送模块,用于向网站服务器发送用于获取目标网站信息的请求,所述请求包括:目标网站标识;接收模块,用于接收所述网站服务器根据所述目标网站标识发送的响应消息,所述响应消息包括:与所述目标网站标识对应的目标网站的至少一个组件信息;特征识别模块,用于识别所述至少一个组件信息中各组件信息的特征;特征匹配模块,用于将识别的特征与多个预设网站中对应的特征进行匹配;类型检测模块,用于根据匹配结果以及预设权重值获取所述目标网站与所述预设网站相匹配的特征的相似指数,根据所述相似指数检测所述目标网站的网站类型,所述权重值为该匹配结果对应组件信息的特征的权重值。
【技术特征摘要】
【专利技术属性】
技术研发人员:王鹏,
申请(专利权)人:北京奇虎科技有限公司,北京奇安信科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。