本发明专利技术实施例公开了一种网址安全性检测方法、装置及服务器,其中的方法可包括:根据客户端上报的网址,从所述网址对应的网页文件中获取JS代码文本;采用预设的编码算法将所述JS代码文本转换为待检测编码;分析所述待检测编码以确定所述网址的安全性。采用本发明专利技术,可对网址安全性进行快速检测,保护客户端的网络安全。
【技术实现步骤摘要】
—种网址安全性检测方法、装置及服务器
本专利技术涉及互联网
,具体涉及网络安全
,尤其涉及一种网址安全性检测方法、装置及服务器。
技术介绍
网址指网页(或网站)地址,可以为URL(Uniform Resourse Locator,统一资源定位符)。根据网址的安全性划分,网址可分为安全网址和恶意网址;安全网址指正规网站的地址,例如:各大银行的官方网址、各购物网站的官方网址等等;恶意网址指各类欺诈、仿冒、钓鱼和挂马等网页地址,例如:仿冒各类正规网站的恶意网址等等,客户端访问恶意网址可能造成客户端隐私信息泄漏、木马病毒感染等危害。随着互联网技术的发展,如何对网址安全性进行检测,以保护客户端的网络安全,成为亟待解决的问题。
技术实现思路
本专利技术实施例所要解决的技术问题在于,提供一种网址安全性检测方法、装置及服务器,可对网址安全性进行快速检测,保护客户端的网络安全。 为了解决上述技术问题,本专利技术实施例第一方面提供了一种网址安全性检测方法,可包括: 根据客户端上报的网址,从所述网址对应的网页文件中获取JS (JavaScript,一种客户端脚本语言)代码文本; 采用预设的编码算法将所述JS代码文本转换为待检测编码; 分析所述待检测编码以确定所述网址的安全性。 基于第一方面,在第一种实施方式中,所述根据客户端上报的网址,从所述网址对应的网页文件中获取JS代码文本,可包括: 根据客户端上报的网址,下载所述网址对应的网页文件; 解析所述网页文件,获取所述网页文件的源代码文本; 从所述网页文件的源代码文本中提取JS代码文本。 基于第一方面或第一方面的第一种实施方式,在第二种实施方式中,所述预设的编码算法为Simhash (—种局部敏感哈希算法)算法;所述采用预设的编码算法将所述JS代码文本转换为待检测编码,包括: 对所述JS代码文本进行分词处理,获得至少一个特征代码; 采用Hash算法对各特征代码进行编码计算,获得各特征代码的Hash编码; 对各特征代码的Hash编码进行加权处理,获得各特征代码的权值序列; 将所述各特征代码的权值序列进行合并处理,获得所述JS代码文本对应的权值序列串; 对所述JS代码文本对应的权值序列串进行降维处理,生成所述JS代码文本对应的Simhash编码; 将所述JS代码文本对应的Simhash编码确定为待检测编码。 基于第一方面的第二种实施方式,在第三种实施方式中,所述分析所述待检测编码以确定所述网址的安全性,包括: 判断恶意样本编码库中是否存在与所述待检测编码相似的恶意样本编码,所述恶意样本编码库中包括至少一个恶意样本编码,所述恶意样本编码为Simhash编码; 若判断所述恶意样本编码库中存在与所述待检测编码相似的恶意样本编码,则确定所述网址为恶意网址。 基于第一方面的第三种实施方式,在第四种实施方式中,所述判断恶意样本编码库中是否存在与所述待检测编码相似的恶意样本编码,包括: 将所述待检测编码与所述恶意样本编码库中的各恶意样本编码进行二进制位比较; 若所述恶意样本编码库中任一恶意样本编码与所述待检测编码具有差异二进制位,且差异二进制位的数量小于预设阈值,则判断所述恶意样本编码库中存在与所述待检测编码相似的恶意样本编码。 本专利技术第二方面提供了一种网址安全性检测装置,可包括: 文本获取模块,用于根据客户端上报的网址,从所述网址对应的网页文件中获取JS代码文本; 编码模块,用于采用预设的编码算法将所述JS代码文本转换为待检测编码; 安全检测模块,用于分析所述待检测编码以确定所述网址的安全性。 基于第二方面,在第一种实施方式中,所述文本获取模块包括: 下载单元,用于根据客户端上报的网址,下载所述网址对应的网页文件; 解析单元,用于解析所述网页文件,获取所述网页文件的源代码文本; 文本提取单元,用于从所述网页文件的源代码文本中提取JS代码文本。 基于第二方面或第二方面的第一种实施方式,在第二种实施方式中,所述编码模块包括: 分词处理单元,用于对所述JS代码文本进行分词处理,获得至少一个特征代码; 编码计算单元,用于采用Hash算法对各特征代码进行编码计算,获得各特征代码的Hash编码; 加权单元,用于对各特征代码的Hash编码进行加权处理,获得各特征代码的权值序列; 合并单元,用于将所述各特征代码的权值序列进行合并处理,获得所述JS代码文本对应的权值序列串; 降维处理单元,用于对所述JS代码文本的权值序列串进行降维处理,生成所述JS代码文本对应的Simhash编码; 编码确定单元,用于将所述JS代码文本对应的Simhash编码确定为待检测编码; 其中,所述预设的编码算法为Simhash算法。 基于第二方面的第二种实施方式,在第三种实施方式中,所述安全检测模块包括: 判断单元,用于判断恶意样本编码库中是否存在与所述待检测编码相似的恶意样本编码,所述恶意样本编码库中包括至少一个恶意样本编码,所述恶意样本编码为Simhash编码; 安全性确定单元,用于当判断所述恶意样本编码库中存在与所述待检测编码相似的恶意样本编码时,确定所述网址为恶意网址。 基于第二方面的第三种实施方式,在第四种实施方式中,所述判断单元包括: 比较子单元,用于将所述待检测编码与所述恶意样本编码库中的各恶意样本编码进行二进制位比较; 判断子单元,用于当所述恶意样本编码库中任一恶意样本编码与所述待检测编码具有差异二进制位,且差异二进制位的数量小于预设阈值时,判断所述恶意样本编码库中存在与所述待检测编码相似的恶意样本编码。 本专利技术第三方面还提供了一种服务器,可包括上述第二方面所述的网址安全性检测装置。 实施本专利技术实施例,具有如下有益效果: 通过对客户端上报的网址对应的网页文件中的JS代码文本进行编码及分析,既能够实现网址安全性的检测,又能够避免恶意网址通过JS代码加密封装所造成的检测失误,有效提升网址安全性检测的准确性,有效地保护客户端的网络安全。 【附图说明】 为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。 图1为本专利技术实施例提供的一种网址安全性检测方法的流程图; 图2为本专利技术实施例提供的另一种网址安全性检测方法流程图; 图3为本专利技术实施例提供的一种网址安全性检测装置的结构示意图; 图4为本专利技术实施例提供的一种文本获取模块的结构示意图; 图5为本专利技术实施例提供的一种编码模块的结构示意图; 图6为本专利技术实施例提供的一种安全检测模块的结构示意图; 图7为本专利技术实施例提供的一种判断单元的结构示意图; 图8为本专利技术实施例提供的一种服务器的结构示意图。 【具体实施方式】 下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性本文档来自技高网...
【技术保护点】
一种网址安全性检测方法,其特征在于,包括:根据客户端上报的网址,从所述网址对应的网页文件中获取JS代码文本;采用预设的编码算法将所述JS代码文本转换为待检测编码;分析所述待检测编码以确定所述网址的安全性。
【技术特征摘要】
1.一种网址安全性检测方法,其特征在于,包括: 根据客户端上报的网址,从所述网址对应的网页文件中获取JS代码文本; 采用预设的编码算法将所述JS代码文本转换为待检测编码; 分析所述待检测编码以确定所述网址的安全性。2.如权利要求1所述的方法,其特征在于,所述根据客户端上报的网址,从所述网址对应的网页文件中获取JS代码文本,包括: 根据客户端上报的网址,下载所述网址对应的网页文件; 解析所述网页文件,获取所述网页文件的源代码文本; 从所述网页文件的源代码文本中提取JS代码文本。3.如权利要求1或2所述的方法,其特征在于,所述预设的编码算法为Simhash算法; 所述采用预设的编码算法将所述JS代码文本转换为待检测编码,包括: 对所述JS代码文本进行分词处理,获得至少一个特征代码; 采用Hash算法对各特征代码进行编码计算,获得各特征代码的Hash编码; 对各特征代码的Hash编码进行加权处理,获得各特征代码的权值序列; 将所述各特征代码的权值序列进行合并处理,获得所述JS代码文本对应的权值序列串; 对所述JS代码文本对应的权值序列串进行降维处理,生成所述JS代码文本对应的Simhash 编码; 将所述JS代码文本对应的Simhash编码确定为待检测编码。4.如权利要求3所述的方法,其特征在于,所述分析所述待检测编码以确定所述网址的安全性,包括: 判断恶意样本编码库中是否存在与所述待检测编码相似的恶意样本编码,所述恶意样本编码库中包括至少一个恶意样本编码,所述恶意样本编码为Simhash编码; 若判断所述恶意样本编码库中存在与所述待检测编码相似的恶意样本编码,则确定所述网址为恶意网址。5.如权利要求4所述的方法,其特征在于,所述判断恶意样本编码库中是否存在与所述待检测编码相似的恶意样本编码,包括: 将所述待检测编码与所述恶意样本编码库中的各恶意样本编码进行二进制位比较;若所述恶意样本编码库中任一恶意样本编码与所述待检测编码具有差异二进制位,且差异二进制位的数量小于预设阈值,则判断所述恶意样本编码库中存在与所述待检测编码相似的恶意样本编码。6.一种网址安全性检测装置,其特征在于,包括: 文本获取模块,用于根据客户端...
【专利技术属性】
技术研发人员:张辉,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。