基于特征向量模型识别钓鱼网页的方法及装置制造方法及图纸

技术编号：10806719 阅读：136 留言：0更新日期：2014-12-24 13:11

本发明专利技术公开了一种基于特征向量模型识别钓鱼网页的方法及装置，特征向量模型是根据大量样本网页的站点特征信息获取样本网页的特征向量，并对样本网页的特征向量组成的矩阵进行训练得到的，通过特征向量模型将样本空间划分多个特征空间；方法包括：提取浏览器所打开第一网页的URL，根据URL得到第一网页所属站点的站点特征信息；根据第一网页的站点特征信息，确定第一网页的特征向量；将第一网页的特征向量输入到特征向量模型中，得到第一网页所属的特征空间，根据第一网页所属的特征空间识别第一网页是否为钓鱼网页。本发明专利技术无需提前下载该第一网页，从而规避了钓鱼作者对钓鱼网站所设的防护，通过自动的方式对第一网页进行识别，节省了人力资源。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种基于特征向量模型识别钓鱼网页的方法及装置，特征向量模型是根据大量样本网页的站点特征信息获取样本网页的特征向量，并对样本网页的特征向量组成的矩阵进行训练得到的，通过特征向量模型将样本空间划分多个特征空间；方法包括：提取浏览器所打开第一网页的URL，根据URL得到第一网页所属站点的站点特征信息；根据第一网页的站点特征信息，确定第一网页的特征向量；将第一网页的特征向量输入到特征向量模型中，得到第一网页所属的特征空间，根据第一网页所属的特征空间识别第一网页是否为钓鱼网页。本专利技术无需提前下载该第一网页，从而规避了钓鱼作者对钓鱼网站所设的防护，通过自动的方式对第一网页进行识别，节省了人力资源。【专利说明】基于特征向量模型识别钓鱼网页的方法及装置
本专利技术涉及互联网
，具体涉及一种基于特征向量模型识别钓鱼网页的方法及装置。
技术介绍
随着互联网的发展，基于WEB的应用日益普及，人们通过浏览器可以查询银行账户、网上购物、电子商务、查询信息、获取知识、进行娱乐等，WEB为人们提供了方便和快捷的交互方式。然而，人们在上网冲浪浏览网页的同时，经常会遭遇到恶意网站的侵袭，导致计算机被病毒、木马等感染。恶意网站，例如钓鱼网站、或者是欺诈，仿冒网站等，主要是通过仿冒真实网站的 URL地址或是网页内容，伪装成银行及电子商务等类型的网站，或是利用真实网站服务器程序上的漏洞，在该网站的某些网页中插入危险的网页代码，以此来骗取用户银行或信用卡账号、密码等私人资料。恶意网页中包含着许多敏感的特征，例如...

【技术保护点】
一种基于特征向量模型识别钓鱼网页的方法，所述特征向量模型是根据大量样本网页的站点特征信息获取各个样本网页的特征向量，并对各个样本网页的特征向量组成的矩阵进行训练得到的，通过所述特征向量模型将样本空间划分多个特征空间；所述方法包括：提取浏览器所打开第一网页的URL，根据所述URL得到所述第一网页所属站点的站点特征信息；根据所述第一网页的站点特征信息，确定所述第一网页的特征向量；将所述第一网页的特征向量输入到所述特征向量模型中，得到所述第一网页所属的特征空间，根据所述第一网页所属的特征空间识别第一网页是否为钓鱼网页。

【技术特征摘要】

【专利技术属性】
技术研发人员：李晓波，尹露，杨晶，郭峰，
申请(专利权)人：北京奇虎科技有限公司，奇智软件北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人