本发明专利技术公开了一种检测网页安全的方法及装置,属于计算机技术领域。所述方法包括:根据待检测网页的页面信息确定所述待检测网页的网页类型,并获取所述待检测网页的域名信息;将所述待检测网页的域名信息与钓鱼网页或非钓鱼网页的域名特征进行匹配,所述钓鱼网页或非钓鱼网页的网页类型与所述待检测网页的网页类型一致;根据匹配结果判断所述待检测网页是否为钓鱼网页。由于恶意欺诈类钓鱼网页的域名具有明显特征,本发明专利技术通过获取待检测网页的域名信息,将该域名信息与钓鱼网页或非钓鱼网页的域名特征进行匹配,根据匹配结果判断待检测网页是否为钓鱼网页,不仅能够实现恶意欺诈类钓鱼网页的检测,还可提高检测该类钓鱼网页的准确性。
【技术实现步骤摘要】
本专利技术涉及信息安全
,特别涉及一种检测网页安全的方法及装置。
技术介绍
随着网络的普及,钓鱼网页近年来在全球频繁出现,严重地影响了在线金融服务、电子商务的发展。其中,钓鱼网页通常分为仿冒类、非法类和恶意欺诈类等几种类型,如何准确、有效地检测出钓鱼网页,成为了保护用户网络安全的关键。现有技术在检测网页安全时,采用的一种方式是基于钓鱼网页与合法网页的相似度来检测钓鱼网页,另一种方式是基于钓鱼网页的特征来检测钓鱼网页,还有一种方式是基于网页文本信息使用分类器检测色情网页。在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下问题由于恶意欺诈类钓鱼网页与合法网页在页面结构和文字上无法区分,基于钓鱼网页与合法网页的相似度检测方式不适用于恶意欺诈类钓鱼网页的检测,而基于页面特征的检测方式和基于分类的检测方式也均无法准确检测出恶意欺诈类钓鱼网页。
技术实现思路
为了准确地检测出恶意欺诈类钓鱼网页,本专利技术实施例提供了一种检测网页安全的方法及装置。所述技术方案如下—方面,提供了一种检测网页安全的方法,所述方法包括根据待检测网页的页面信息确定所述待检测网页的网页类型,并获取所述待检测网页的域名信息;将所述待检测网页的域名信息与钓鱼网页或非钓鱼网页的域名特征进行匹配,所述钓鱼网页或非钓鱼网页的网页类型与所述待检测网页的网页类型一致;根据匹配结果判断所述待检测网页是否为钓鱼网页。可选地,所述根据待检测网页的页面信息确定所述待检测网页的网页类型之前,还包括收集网页类型与所述待检测网页的网页类型一致的非钓鱼网页的域名,得到白域名集合;判断所述待检测网页的域名是否在所述白域名集合中;如果是,则判断所述待检测网页为非钓鱼网页;如果否,则继续执行根据待检测网页的页面信息确定所述待检测网页的网页类型的后续检测步骤。可选地,所述根据待检测网页的页面信息确定所述待检测网页的网页类型之前,还包括 收集网页类型与所述待检测网页的网页类型一致的钓鱼网页的域名,得到黑域名集合;判断所述待检测网页的域名是否在所述黑域名集合中;如果是,则判断所述待检测网页为钓鱼网页;如果否,则继续执行根据待检测网页的页面信息确定所述待检测网页的网页类型的后续检测步骤进一步地,所述将所述待检测网页的域名信息与钓鱼网页或非钓鱼网页的域名特征进行匹配之前,还包括收集网页类型与所述待检测网页的网页类型一致的钓鱼网页或非钓鱼网页的域名特征,并设置门限值;所述根据匹配结果判断所述待检测网页是否为钓鱼网页,具体包括如果所述待检测网页的域名信息与钓鱼网页的域名特征匹配的数量达到设置的所述门限值,则判断所述待检测网页为钓鱼网页;或者,如果所述待检测网页的域名信息与非钓鱼网页的域名特征匹配的数量达到设置的所述门限值,则判断所述待检测网页为非钓鱼网页。可选地,所述收集网页类型与所述待检测网页的网页类型一致的钓鱼网页或非钓鱼网页的域名特征之后,还包括周期性收集网页类型与所述待检测网页的网页类型一致的钓鱼网页或非钓鱼网页的域名特征,并根据收集到的域名特征的数量调整设置的所述门限值。另一方面,还提供了一种检测网页安全的装置,所述装置包括确定模块,用于根据待检测网页的页面信息确定所述待检测网页的网页类型;获取模块,用于获取所述待检测网页的域名信息;匹配模块,用于将所述获取模块获取到的待检测网页的域名信息与钓鱼网页或非钓鱼网页的域名特征进行匹配,所述钓鱼网页或非钓鱼网页的网页类型与所述确定模块确定的所述待检测网页的网页类型一致;第一判断模块,用于根据所述匹配模块得到的匹配结果判断所述待检测网页是否为钓鱼网页。可选地,所述装置还包括第一收集模块,用于收集网页类型与所述待检测网页的网页类型一致的非钓鱼网页的域名,得到白域名集合;第二判断模块,用于判断所述待检测网页的域名是否在所述第一收集模块得到的白域名集合中;如果是,则判断所述待检测网页为非钓鱼网页;如果否,则所述确定模块继续执行根据待检测网页的页面信息确定所述待检测网页的网页类型的后续检测步骤。可选地,所述装置还包括第二收集模块,用于收集网页类型与所述待检测网页的网页类型一致的钓鱼网页的域名,得到黑域名集合;第三判断模块,用于判断所述待检测网页的域名是否在所述第二收集模块得到的黑域名集合中;如果是,则判断所述待检测网页为钓鱼网页;如果否,则所述确定模块继续执行根据待检测网页的页面信息确定所述待检测网页的网页类型的后续检测步骤。进一步地,所述装置还包括第三收集模块,用于收集网页类型与所述待检测网页的网页类型一致的钓鱼网页或非钓鱼网页的域名特征,并设置门限值; 所述第一判断模块,具体用于如果所述待检测网页的域名信息与钓鱼网页的域名特征匹配的数量达到设置的所述门限值,则判断所述待检测网页为钓鱼网页;或者,如果所述待检测网页的域名信息与非钓鱼网页的域名特征匹配的数量达到设置的所述门限值,则判断所述待检测网页为非钓鱼网页。可选地,所述第三收集模块,还用于周期性收集网页类型与所述待检测网页的网页类型一致的钓鱼网页或非钓鱼网页的域名特征,并根据收集到的域名特征的数量调整所述预设门限值。本专利技术实施例提供的技术方案带来的有益效果是由于恶意欺诈类钓鱼网页的域名具有明显特征,因而通过获取待检测网页的域名信息,将该域名信息与钓鱼网页或非钓鱼网页的域名特征进行匹配,根据匹配结果判断待检测网页是否为钓鱼网页,不仅能够检测出恶意欺诈类钓鱼网页,实现网页安全的检测,还可提高检测该类钓鱼网页的准确性。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图I是本专利技术实施例一提供的一种检测网页安全的方法流程图;图2是本专利技术实施例二提供的一种检测网页安全的方法流程图;图3是本专利技术实施例三提供的一种检测网页安全的方法流程图;图4是本专利技术实施例四提供的一种检测网页安全的装置结构示意图;图5是本专利技术实施例四提供的另一种检测网页安全的装置结构示意图;图6是本专利技术实施例四提供的又一种检测网页安全的装置结构示意图;图7是本专利技术实施例四提供的再一种检测网页安全的装置结构示意图。具体实施例方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。实施例一本实施例提供了一种检测网页安全的方法,参见图I,本实施例提供的方法流程具体如下101 :根据待检测网页的页面信息确定待检测网页的网页类型,并获取该待检测网页的域名信息;可选地,根据待检测网页的页面信息确定待检测网页的网页类型之前,还包括收集网页类型与待检测网页的网页类型一致的非钓鱼网页的域名,得到白域名集合;判断待检测网页的域名是否在白域名集合中;如果是,则判断待检测网页为非钓鱼网页;如果否,则继续执行根据待检测网页的页面信息确定待检测网页的网页类型的后续检测步骤。可选地,根据待 检测网页的页面信息确定待检测网页的网页类型之前,还包括收集网页类型与待检测网页的网页类型一致的钓鱼网页的域名,得到黑域名集合;判断待检测网页的域名是否在黑域名集合中;如果是,则判断待检测网页为钓鱼网页;如果否,则继续执行根据待检测网页的页本文档来自技高网...
【技术保护点】
【技术特征摘要】
【专利技术属性】
技术研发人员:罗焱,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。