本发明专利技术提供了一种网页访问数据的处理方法和装置。其中,该处理方法包括:确定与第一时间段对应的历史数据;根据历史数据确定第一时间段的第一访问数据和第一访问数据的置信区间;从数据库中提取第一时间段的第二访问数据,其中,第二访问数据为记录的用户终端访问网页的数据;判断第二访问数据是否在第一访问数据的置信区间内;若第二访问数据不在第一访问数据的置信区间内,判断出记录的第二访问数据出现异常;若第二访问数据在第一访问数据的置信区间内,判断出记录的第二访问数据正常。通过本发明专利技术实施例,解决了现有技术中无法判断用户访问数据是否出现异常的问题,实现了准确且及时地判断异常用户访问数据的效果。
【技术实现步骤摘要】
【专利摘要】本专利技术提供了一种网页访问数据的处理方法和装置。其中,该处理方法包括:确定与第一时间段对应的历史数据;根据历史数据确定第一时间段的第一访问数据和第一访问数据的置信区间;从数据库中提取第一时间段的第二访问数据,其中,第二访问数据为记录的用户终端访问网页的数据;判断第二访问数据是否在第一访问数据的置信区间内;若第二访问数据不在第一访问数据的置信区间内,判断出记录的第二访问数据出现异常;若第二访问数据在第一访问数据的置信区间内,判断出记录的第二访问数据正常。通过本专利技术实施例,解决了现有技术中无法判断用户访问数据是否出现异常的问题,实现了准确且及时地判断异常用户访问数据的效果。【专利说明】网页访问数据的处理方法和装置
本专利技术涉及数据处理领域,具体而言,涉及一种网页访问数据的处理方法和装置。
技术介绍
随着互联网的普及和发展,通过互联网了解信息和进行交易的人越来越多,在互 联网上得到的用户访问数据也随之日渐庞大。越来越多的产品提供方开始利用互联网这个 平台进行产品的宣传、交易和维护,这就导致对互联网数据的处理和呈现的需求一路飙升。 数据提供方可以通过各种图、表的方式展示用户访问历史数据的变化情况,现有的展示方 法重点在于如何更快、更好得向数据需求方提供和展示数据,以尽可能协助他们掌握和了 解产品的历史表现。但有时仅仅对数据进行展示是不够的,展示数据只能让数据需求方看 到静态的数据历史表现,无法及时判断数据是否出现异常,因此无法对异常数据进行及时 预警以尽早采取措施。 现有技术中,由于用户访问互联网时产生的当天的用户访问数据,只能在第二天 才能看到,在第二天查看前一天最新产生的用户访问数据时,无法判断该最新产生的用户 访问数据是否出现异常,如用户访问数据的减少可能是由于网站出现问题,导致数据丢失, 如果未能及时发现该异常数据并对网站进行检查与修复,则可能导致数据一直丢失,并且 丢失的数据无法再次找回。 如上所述,现有的数据展示方法的侧重点在于更快、更好得整合和展现数据,以协 助客户掌握和了解产品的历史表现,具体用到的方法仅限于描述性的统计方法,如:多维数 据表、折线图、柱形图、饼形图、气泡图、面积图等,这些数据展示方法均无法及时判断数据 是否出现异常,在某种程度上造成了最佳决策机会的错失。 针对现有技术中无法判断用户访问数据是否出现异常的问题,目前尚未提出有效 的解决方案。
技术实现思路
本专利技术的主要目的在于提供一种网页访问数据的处理方法和装置,以解决现有技 术中无法判断用户访问数据是否出现异常的问题。 为了实现上述目的,根据本专利技术的一个方面,提供了一种网页访问数据的处理方 法。 根据本专利技术的处理方法包括:确定与第一时间段对应的历史数据,其中,第一时间 段为请求分析的时间段;根据历史数据确定第一时间段的第一访问数据和第一访问数据的 置信区间;从数据库中提取第一时间段的第二访问数据,其中,第二访问数据为记录的用户 终端访问网页的数据;判断第二访问数据是否在第一访问数据的置信区间内;若第二访问 数据不在第一访问数据的置信区间内,判断出记录的第二访问数据出现异常;若第二访问 数据在第一访问数据的置信区间内,判断出记录的第二访问数据正常。 进一步地,在判断出记录的第二访问数据出现异常之后,处理方法还包括:获取置 信区间的端点;使用置信区间的端点、第一访问数据以及第二访问数据计算第二访问数据 的偏移值。 进一步地,使用置信区间的端点、第一访问数据以及第二访问数据计算第二访问 数据的偏移值包括:按照如下公式计算偏移值D,其中,公式为Z) = H X100%,A为第二 β - L· 访问数据,B为置信区间的端点,C为第一访问数据。 进一步地,确定与第一时间段对应的历史数据包括:获取第一时间段对应的第二 时间段;从数据库中提取第二时间段的历史数据,其中,第二时间段的截止时刻早于第一时 间段的起始时刻;根据历史数据确定第一时间段的第一访问数据和第一访问数据的置信区 间包括:使用霍尔特温特斯模型对历史数据进行拟合处理得到第一时间段的第一访问数 据;读取预先获取的修正值;计算第一访问数据与修正值的差得到第一值,并计算第一访 问数据与修正值的和得到第二值;使用第一值和第二值确定置信区间,其中,第一值和第二 值为置信区间的端点。 进一步地,在从数据库中提取第一时间段的第二访问数据之后,处理方法还包括: 将置信区间、历史数据和第二访问数据展示在折线图上。 进一步地,在判断出记录的第二访问数据出现异常之后,处理方法还包括:生成第 二访问数据出现异常的异常信息。 为了实现上述目的,根据本专利技术的另一方面,提供了一种网页访问数据的处理装 置。 根据本专利技术的处理装置包括:第一确定模块,用于确定与第一时间段对应的历史 数据,其中,第一时间段为请求分析的时间段;第二确定模块,用于根据历史数据确定第一 时间段的第一访问数据和第一访问数据的置信区间;提取模块,用于从数据库中提取第一 时间段的第二访问数据,其中,第二访问数据为记录的用户终端访问网页的数据;判断模 块,用于判断第二访问数据是否在第一访问数据的置信区间内;第三确定模块,用于在第二 访问数据不在第一访问数据的置信区间内的情况下,确定记录的第二访问数据出现异常; 第四确定模块,用于在第二访问数据在第一访问数据的置信区间内的情况下,确定记录的 第二访问数据正常。 进一步地,处理装置还包括:第一获取模块,用于在判断出记录的第二访问数据出 现异常之后,获取置信区间的端点;第一计算模块,用于使用置信区间的端点、第一访问数 据以及第二访问数据计算第二访问数据的偏移值。 进一步地,第一计算模块包括:计算子模块,用于按照如下公式计算偏移值D,其 J - β 中,公式为β = P X 100%,A为第二访问数据,B为置信区间的端点,C为第一访问数据。 进一步地,第一确定模块包括:第二获取模块,用于获取第一时间段对应的第二时 间段;提取子模块,用于从数据库中提取第二时间段的历史数据,其中,第二时间段的截止 时刻早于第一时间段的起始时刻;第二确定模块包括:拟合模块,用于使用霍尔特温特斯 模型对历史数据进行拟合处理得到第一时间段的第一访问数据;读取模块,用于读取预先 获取的修正值;第二计算模块,用于计算第一访问数据与修正值的差得到第一值,并计算第 一访问数据与修正值的和得到第二值;确定子模块,用于使用第一值和第二值确定置信区 间,其中,第一值和第二值为置信区间的端点。 进一步地,处理装置还包括:展示模块,用于在从数据库中提取第一时间段的第二 访问数据之后,将置信区间、历史数据和第二访问数据展示在折线图上。 进一步地,处理装置还包括:生成模块,用于在判断出记录的第二访问数据出现异 常之后,生成第二访问数据出现异常的异常信息。 采用本专利技术实施例,在确定第一时间段对应的历史数据之后,根据历史数据确定 第一时间段的第一访问数据和第一访问数据的置信区间,并判断从数据库中提取到的第一 时间段的第二访问数据是否在该置信区间内,在第二访问数据不在该置信区间内时,判断 出第二访问数据出现异常;在第二访问数据在本文档来自技高网...
【技术保护点】
一种网页访问数据的处理方法,其特征在于,包括:确定与第一时间段对应的历史数据,其中,所述第一时间段为请求分析的时间段;根据所述历史数据确定所述第一时间段的第一访问数据和所述第一访问数据的置信区间;从数据库中提取所述第一时间段的第二访问数据,其中,所述第二访问数据为记录的用户终端访问网页的数据;判断所述第二访问数据是否在所述第一访问数据的置信区间内;若所述第二访问数据不在所述第一访问数据的置信区间内,判断出记录的所述第二访问数据出现异常;若所述第二访问数据在所述第一访问数据的置信区间内,判断出记录的所述第二访问数据正常。
【技术特征摘要】
【专利技术属性】
技术研发人员:钦滨杰,李梦溪,
申请(专利权)人:北京国双科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。