识别钓鱼网站的方法及装置制造方法及图纸

技术编号：12903901 阅读：57 留言：0更新日期：2016-02-24 12:51

本发明专利技术公开了一种识别钓鱼网站的方法及装置，涉及互联网安全领域，为解决因IP地址被屏蔽而导致的无法识别钓鱼网站的问题而发明专利技术。本发明专利技术的方法包括：获取已知钓鱼网站的URL作为样本URL；根据样本URL的特征信息训练检测模型；使用检测模型对未知URL的特征信息进行匹配，获得未知URL的检测结果。本发明专利技术主要应用于第三方安全机构向互联网用户提供网络安全保障服务的过程中。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及互联网安全领域，尤其涉及一种识别钓鱼网站的方法及装置。
技术介绍
钓鱼网站通常是指伪装成银行网站或电子商务网站、用以窃取用户提交的私人信息的网站。不法分子利用各种手段仿冒真实网站的统一资源定位符(Uniform ResourceLocator，简称URL)及页面内容，诱导用户访问仿冒的页面内容，以此来骗取用户输入的银行帐号、密码等私人信息。钓鱼网站的出现严重影响了在线金融服务的发展，破坏了公众使用互联网的信心。因此对钓鱼网站进行有效识别就成为互联网安全领域中的一项重要工作。现有识别钓鱼网站的方式为:通过未知URL向目标网站请求页面内容，获取并识别页面内容中的特征向量，根据特征向量的特点判断目标网站是否为钓鱼网站。例如，对页面内容中文字、图片、输入框、控件等对象的位置、尺寸、样式风格进行识别，判断该页面内容是否与正规的银行或电子商务网站的页面内容相似。如果相似则可确定该目标网站为钓鱼网站，该未知URL为钓鱼URL。现有方式需要以获取目标网站的页面内容为前提，但是实际应用中部分钓鱼网站具有针对安全检测的防御机制。这些钓鱼网站可以通过页面请求方的网间协议(InternetProtocol，简称IP)地址识别出请求方的身份。如果请求方身份为互联网安全机构，那么钓鱼网站就会对请求方的IP地址进行屏蔽，使得请求方无法获得钓鱼网站的页面内容，从而也就无法基于页面内容对钓鱼网站进行有效识别。
技术实现思路
本专利技术提供了一种识别钓鱼网站的方法及装置，能够解决因IP地址被屏蔽而导致的无法识别钓鱼网站的问题。为解决上述问题，一方面，本专利技术提供了一...

【技术保护点】
一种识别钓鱼网站的方法，其特征在于，所述方法包括：获取已知钓鱼网站的统一资源定位符URL作为样本URL；根据所述样本URL的特征信息训练检测模型；使用所述检测模型对未知URL的特征信息进行匹配，获得所述未知URL的检测结果。

【技术特征摘要】

【专利技术属性】
技术研发人员：李晓波，尹露，杨晶，
申请(专利权)人：北京奇虎科技有限公司，奇智软件北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人