网站访问异常的检测方法及装置制造方法及图纸

技术编号:15273179 阅读:90 留言:0更新日期:2017-05-04 13:19
本发明专利技术公开了一种网站访问异常的检测方法及装置。其中,该方法包括:获取记录的访问网站的客户端的一个或多个特征信息,其中,一个或多个特征信息用于描述客户端的属性;获取每个客户端的每个特征信息在预设时间段的信息增益率;比较每个客户端的每个特征信息在预设时间段的信息增益率与对应的预设信息增益率阈值,得到每个客户端的每个特征信息的比较结果;根据比较结果确定网站是否发生访问异常。本发明专利技术解决了现有技术中网站访问异常检测不准确的技术问题,实现了准确、简便的检测网站是否发生访问异常的技术效果。

Method and device for detecting abnormal access of website

The invention discloses a method and a device for detecting abnormal access to a website. Among them, the method includes: one or more feature information, access to records of the client to access the site in which one or more feature information used to describe the properties of client information; every feature of each client in a preset period of time the information gain rate; comparison of each client information in each feature information gain rate a preset period of time with the corresponding preset information gain rate threshold, comparing the results obtained for each feature information of each client; according to the comparison results determine whether the site access exception. The invention solves the technical problem that the abnormal detection of the website access in the prior art is inaccurate, and realizes the technical effect of accurately and conveniently detecting whether the web site has abnormal access.

【技术实现步骤摘要】

本专利技术涉及互联网领域,具体而言,涉及一种网站访问异常的检测方法及装置
技术介绍
一般在访问网站时,网站会记录访问者的客户端信息。其中,客户端信息包括:浏览器类型、屏幕分辨率、地理信息等。在网站运行或维护的过程中,通过全部或部分有价值的客户端信息,能够判断网站是否发生访问异常。目前,通过客户端信息判断网站是否发生访问异常的方法主要有统计学分析法和机器学习法。其中,统计学分析法因受单个客户端异常信息的影响较大,存在检测结果准确率较低的问题;机器学习法需要解决凸二次规划问题,并因时间复杂度较高、数据量较大及耗时较长,存在获取检测结果难度较高的问题。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种网站访问异常的检测方法及装置,以至少解决现有技术中网站访问异常检测不准确的技术问题。根据本专利技术实施例的一个方面,提供了一种网站访问异常的检测方法,该检测方法包括:获取记录的访问网站的客户端的一个或多个特征信息,其中,上述一个或多个特征信息用于描述客户端的属性;获取每个客户端的每个特征信息在预设时间段的信息增益率;比较每个客户端的每个特征信息在预设时间段的信息增益率与对应的预设信息增益率阈值,得到每个客户端的每个特征信息的比较结果;根据比较结果确定上述网站是否发生访问异常。进一步地,比较每个客户端的每个特征信息在预设时间段的信息增益率与对应的预设信息增益率阈值,得到每个客户端的每个特征信息的比较结果包括:若上述特征信息在预设时间段的信息增益率大于对应的上述预设信息增益率阈值,则得到第一比较参数,其中,上述第一比较参数用于指示上述特征信息异常;以及若上述特征信息在预设时间段的信息增益率不大于对应的上述预设信息增益率阈值,则得到第二比较参数,其中,上述第二比较参数用于指示上述特征信息正常。进一步地,根据比较结果确定上述网站是否发生访问异常包括:对访问上述网站的全部上述客户端的各个特征信息的信息增益率的比较结果进行汇总;统计汇总得到的上述一个或多个特征信息中预设的一个或多个特征信息的信息增益率的比较结果,得到统计结果;判断上述统计结果是否大于预设数值;若上述统计结果大于上述预设数值,则确定上述网站发生访问异常,若上述统计结果不大于上述预设数值,则确定上述网站未发生访问异常。进一步地,统计汇总得到的上述一个或多个特征信息中预设的一个或多个特征信息的信息增益率的比较结果,得到统计结果包括:对上述预设的一个或多个特征信息的信息增益率的比较结果对应的参数值进行求和计算,得到计算结果;获取上述预设的一个或多个特征信息的特征个数;计算上述计算结果与上述特征个数的比值,得到上述统计结果。进一步地,获取每个客户端的每个特征信息在预设时间段的信息增益率包括:获取每个客户端的每个特征信息在上述预设时间段的熵值和每个客户端的每个特征信息在历史时间段的熵值;通过得到每个客户端的每个特征信息在上述预设时间段的信息增益率,其中,上述G为每个客户端的每个特征信息在上述预设时间段的信息增益率,上述S1为每个客户端的每个特征信息在上述预设时间段的熵值,上述S2为每个客户端的每个特征信息在上述历史时间段的熵值。根据本专利技术实施例的另一方面,还提供了一种网站访问异常的检测装置,该检测装置包括:第一获取模块,用于获取记录的访问网站的客户端的一个或多个特征信息,其中,上述一个或多个特征信息用于描述客户端的属性;第二获取模块,用于获取每个客户端的每个特征信息在预设时间段的信息增益率;比较模块,用于比较每个客户端的每个特征信息在预设时间段的信息增益率与对应的预设信息增益率阈值,得到每个客户端的每个特征信息的比较结果;确定模块,用于根据上述比较结果确定上述网站是否发生访问异常。进一步地,上述比较模块包括:第一获取子模块,用于若上述特征信息在预设时间段的信息增益率大于对应的上述预设信息增益率阈值,则得到第一比较参数,其中,上述第一比较参数用于指示上述特征信息异常;以及第二获取子模块,用于若上述特征信息在预设时间段的信息增益率不大于对应的上述预设信息增益率阈值,则得到第二比较参数,其中,上述第二比较参数用于指示上述特征信息正常。进一步地,上述确定模块包括:汇总子模块,用于对访问上述网站的全部上述客户端的各个上述特征信息的信息增益率的比较结果进行汇总;统计子模块,用于统计汇总得到的上述一个或多个特征信息中预设的一个或多个特征信息的信息增益率的比较结果,得到统计结果;判断子模块,用于判断上述统计结果是否大于预设数值;确定子模块,用于若上述统计结果大于上述预设数值,则确定上述网站发生访问异常,若上述统计结果不大于上述预设数值,则确定上述网站未发生访问异常。进一步地,上述统计子模块包括:第一计算子模块,用于对上述预设的一个或多个特征信息的信息增益率的比较结果对应的参数值进行求和计算,得到计算结果;第三获取子模块,用于获取上述预设的一个或多个特征信息的特征个数;第二计算子模块,用于计算上述计算结果与上述特征个数的比值,得到上述统计结果。进一步地,上述第二获取模块包括:第四获取子模块,用于获取每个客户端的每个特征信息在上述预设时间段的熵值和每个客户端的每个特征信息在历史时间段的熵值;第五获取子模块,用于通过得到每个客户端的每个特征信息在上述预设时间段的信息增益率,其中,上述G为每个客户端的每个特征信息在上述预设时间段的信息增益率,上述S1为每个客户端的每个特征信息在上述预设时间段的熵值,上述S2为每个客户端的每个特征信息在上述历史时间段的熵值。在本专利技术实施例中,采用获取记录的访问网站的客户端的一个或多个特征信息以及获取每个客户端的每个特征信息在预设时间段的信息增益率的方式,通过比较每个客户端的每个特征信息在预设时间段的信息增益率与对应的预设信息增益率阈值,达到了根据各个特征信息的比较结果确定网站是否发生访问异常的目的,从而实现了准确、简便的检测网站是否发生访问异常的技术效果,进而解决了现有技术中网站访问异常检测不准确的技术问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种可选地网站访问异常的检测方法的流程图;图2是根据本专利技术实施例的一种可选的网站访问异常的检测装置的示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的本文档来自技高网
...
网站访问异常的检测方法及装置

【技术保护点】
一种网站访问异常的检测方法,其特征在于,包括:获取记录的访问网站的客户端的一个或多个特征信息,其中,所述一个或多个特征信息用于描述客户端的属性;获取每个客户端的每个特征信息在预设时间段的信息增益率;比较所述每个客户端的每个特征信息在预设时间段的信息增益率与对应的预设信息增益率阈值,得到所述每个客户端的每个特征信息的比较结果;根据所述比较结果确定所述网站是否发生访问异常。

【技术特征摘要】
1.一种网站访问异常的检测方法,其特征在于,包括:获取记录的访问网站的客户端的一个或多个特征信息,其中,所述一个或多个特征信息用于描述客户端的属性;获取每个客户端的每个特征信息在预设时间段的信息增益率;比较所述每个客户端的每个特征信息在预设时间段的信息增益率与对应的预设信息增益率阈值,得到所述每个客户端的每个特征信息的比较结果;根据所述比较结果确定所述网站是否发生访问异常。2.根据权利要求1所述的检测方法,其特征在于,比较所述每个客户端的每个特征信息在预设时间段的信息增益率与对应的预设信息增益率阈值,得到所述每个客户端的每个特征信息的比较结果包括:若所述特征信息在预设时间段的信息增益率大于对应的所述预设信息增益率阈值,则得到第一比较参数,其中,所述第一比较参数用于指示所述特征信息异常;以及若所述特征信息在预设时间段的信息增益率不大于对应的所述预设信息增益率阈值,则得到第二比较参数,其中,所述第二比较参数用于指示所述特征信息正常。3.根据权利要求1所述的检测方法,其特征在于,根据所述比较结果确定所述网站是否发生访问异常包括:对访问所述网站的全部所述客户端的各个特征信息的信息增益率的比较结果进行汇总;统计汇总得到的所述一个或多个特征信息中预设的一个或多个特征信息的信息增益率的比较结果,得到统计结果;判断所述统计结果是否大于预设数值;若所述统计结果大于所述预设数值,则确定所述网站发生访问异常,若所述统计结果不大于所述预设数值,则确定所述网站未发生访问异常。4.根据权利要求3所述的检测方法,其特征在于,统计汇总得到的所述一个或多个特征信息中预设的一个或多个特征信息的信息增益率的比较结果,得到统计结果包括:对所述预设的一个或多个特征信息的信息增益率的比较结果对应的参数值进行求和计算,得到计算结果;获取所述预设的一个或多个特征信息的特征个数;计算所述计算结果与所述特征个数的比值,得到所述统计结果。5.根据权利要求1所述的检测方法,其特征在于,获取每个客户端的每个特征信息在预设时间段的信息增益率包括:获取所述每个客户端的每个特征信息在所述预设时间段的熵值和所述每个客户端的每个特征信息在历史时间段的熵值;通过得到所述每个客户端的每个特征信息在所述预设时间段的信息增益率,其中,所述G为所述每个客户端的每个特征信息在所述预设时间段的信息增益率,所述S1为所述每个客户端的每个特征信息在所述预设时间段的熵值,所述S2为所述每个客户端的每个特征信息在所述历史时间段的熵值。6.一种网站访...

【专利技术属性】
技术研发人员:祁国晟裴松年
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1