网页稳定性的检测方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:30167919 阅读:34 留言:0更新日期:2021-09-25 15:24
本公开提供了网页稳定性的检测方法、装置、电子设备及可读存储介质,涉及互联网技术领域,尤其涉及内容推荐技术领域。具体实现方案为:获取网页被访问后所返回的网页的第一状态码以及网页中各资源的第二状态码,并基于第一状态码确定网页的第一稳定性值,基于第二状态码确定各资源的第二稳定性值,从而基于第一稳定值以及第二稳定性值,确定网页的第三稳定性值。本方案中,将网页的响应状态以及网页中各资源的响应状态结合来确定网页的稳定性,能够全面、准确地衡量网页稳定性,为根据网页稳定性来保证用户对网页的正常访问,提升用户的使用体验提供了基础。使用体验提供了基础。使用体验提供了基础。

【技术实现步骤摘要】
网页稳定性的检测方法、装置、电子设备及可读存储介质


[0001]本公开涉及互联网
,尤其涉及内容推荐
,具体而言,本公开涉及一种网页稳定性的检测方法、装置、电子设备及可读存储介质。

技术介绍

[0002]随着互联网技术的快速发展,用户越来越多的通过网页来进行信息获取、传递以及处理。
[0003]当网页存在状态不稳定等情况时,都会造成用户无法正常访问网页,严重影响用户的使用体验。为了保证用户在访问网页时的使用体验,对网页稳定性的检测成为了一个重要问题。

技术实现思路

[0004]本公开为了解决上述缺陷中的至少一项,提供了一种网页稳定性的检测方法、装置、电子设备及可读存储介质。
[0005]根据本公开的第一方面,提供了一种网页稳定性的检测方法,该方法包括:
[0006]获取网页被访问后所返回的第一状态码以及第二状态码,其中,第一状态码为网页的状态码,第二状态码为网页中各资源的状态码;
[0007]基于第一状态码确定网页的第一稳定性值;
[0008]基于第二状态码确定各资源的第二稳定性值;
[0009]基于第一稳定值以及第二稳定性值,确定网页的第三稳定性值。
[0010]根据本公开的第二方面,提供了一种搜索结果的排序方法,该方法包括:
[0011]确定搜索结果中各网页的第三稳定性值,其中,第三稳定性值是根据上述的站点稳定性的检测方法确定出的;
[0012]基于第三稳定性值,对搜索结果中各网页进行排序。
[0013]根据本公开的第三方面,提供了一种数据的爬取方法,该方法包括:
[0014]确定站点的第四稳定性值;
[0015]基于第四稳定性值,对站点进行爬取。
[0016]根据本公开的第四方面,提供了一种网页稳定性的检测装置,该装置包括:
[0017]状态码获取模块,用于获取网页被访问后所返回的第一状态码以及第二状态码,其中,第一状态码为网页的状态码,第二状态码为网页中各资源的状态码;
[0018]第一稳定性值确定模块,用于基于第一状态码确定网页的第一稳定性值;
[0019]第二稳定性值确定模块,用于基于第二状态码确定各资源的第二稳定性值;
[0020]网页稳定性确定模块,用于基于第一稳定值以及第二稳定性值,确定网页的第三稳定性值。
[0021]根据本公开的第五方面,提供了一种搜索结果的排序装置,该装置包括:
[0022]网页稳定性确定模块,用于确定搜索结果中各网页的第三稳定性值,其中,第三稳
定性值是根据上述的网页稳定性的检测方法确定出的;
[0023]搜索结果排序模块,用于基于第三稳定性值,对搜索结果中各网页进行排序。
[0024]根据本公开的第六方面,提供了一种数据的爬取装置,该装置包括:
[0025]站点稳定性确定模块,用于确定站点的第四稳定性值;
[0026]数据爬取模块,用于基于第四稳定性值,对站点进行爬取。
[0027]根据本公开的第七方面,提供了一种电子设备,该电子设备包括:
[0028]至少一个处理器;以及
[0029]与上述至少一个处理器通信连接的存储器;其中,
[0030]存储器存储有可被上述至少一个处理器执行的指令,指令被上述至少一个处理器执行,以使上述至少一个处理器能够执行上述任一项方法。
[0031]根据本公开的第八方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,该计算机指令用于使计算机执行上述任一项方法。
[0032]根据本公开的第九方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现上述任一项方法。
[0033]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0034]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0035]图1是本公开实施例提供的一种网页稳定性的检测方法的流程示意图;
[0036]图2是本公开实施例提供的一种搜索结果的排序方法的流程示意图;
[0037]图3是本公开实施例提供的一种数据的爬取方法的流程示意图;
[0038]图4是根据本公开提供的一种网页稳定性的检测装置的结构示意图;
[0039]图5是根据本公开提供的一种搜索结果的排序装置的结构示意图;
[0040]图6是根据本公开提供的一种数据的爬取装置的结构示意图;
[0041]图7是用来实现本公开实施例的任一项方法的电子设备的框图。
具体实施方式
[0042]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0043]图1示出了本公开实施例提供的一种网页稳定性的检测方法的流程示意图,如图1中所示,该方法主要可以包括:
[0044]步骤S110:获取网页被访问后所返回的第一状态码以及第二状态码,其中,第一状态码为网页的状态码,第二状态码为网页中各资源的状态码;
[0045]步骤S120:基于第一状态码确定网页的第一稳定性值;
[0046]步骤S130:基于第二状态码确定各资源的第二稳定性值;
[0047]步骤S140:基于第一稳定值以及第二稳定性值,确定网页的第三稳定性值。
[0048]其中,状态码即访问状态码,是在终端设备发起对网页的访问请求后,服务器响应于访问请求所返回的。状态码反映了网页或资源的响应状态。
[0049]第一状态码为针对网页所返回状态码,第二状态码为针对网页中的各资源所返回的状态码。
[0050]网页中的各资源可以包括脚本(JavaScript,js),层叠样式表(Cascading Style Sheets,css),图像(img),媒体(media),字体(font),可扩展超文本传输请求(XML Http Request,XHR)等。
[0051]第一状态码能够反映网页的响应状态,可以基于第一状态码确定网页的第一稳定性值,第一稳定性值用于反映网页的稳定性。
[0052]第二状态码能够反映对应资源的响应状态,可以基于第二状态码确定对应资源的第二稳定性值,第二稳定性值用于反映资源的稳定性。
[0053]根据网页的第一稳定性值以及各资源的第二稳定性值来确定网页的第三稳定性值,使得第三稳定性值能够从整体上反映网页的稳定性,实现对网页稳定性进行全面、准确地衡量。
[0054]本公开实施例提供的方法,通过获取网页被访问后所返回的网页的第一状态码以及网页中各资源的第二状态码,并基于第一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网页稳定性的检测方法,包括:获取网页被访问后所返回的第一状态码以及第二状态码,其中,所述第一状态码为所述网页的状态码,所述第二状态码为所述网页中各资源的状态码;基于所述第一状态码确定所述网页的第一稳定性值;基于所述第二状态码确定各所述资源的第二稳定性值;基于所述第一稳定值以及所述第二稳定性值,确定所述网页的第三稳定性值。2.根据权利要求1所述的方法,其中,所述基于所述第一稳定值以及所述第二稳定性值,确定所述网页的第三稳定性值,包括:基于预配置的所述网页的第一权重,各所述资源的第二权重,并基于所述第一稳定值以及所述第二稳定性值,确定所述网页的第三稳定性值。3.根据权利要求2所述的方法,其中,当所述资源为图像时,所述方法还包括:基于所述图像在所述网页中的位置,和/或,所述图像在所述网页中的面积占比,确定所述资源对应的第二权重。4.根据权利要求1

3中任一项所述的方法,其中,所述基于所述第一状态码确定所述网页的第一稳定性值,包括:基于预配置的状态码与状态值的对应关系,确定所述第一状态码对应的第一状态值;基于所述第一状态值确定所述网页的第一稳定性值;所述基于所述第二状态码确定各所述资源的第二稳定性值,包括:基于预配置的状态码与状态值的对应关系,确定所述第二状态码对应的第二状态值;基于所述第二状态值确定各所述资源的第二稳定性值。5.根据权利要求4所述的方法,若所述网页被访问多次,则所述方法还包括:基于各次访问的发起时间,确定所述各次访问的第三权重;所述基于所述第一状态值确定所述网页的第一稳定性值,包括:基于所述第三权重以及各次访问的所述第一状态值,确定所述网页的第一稳定性值;所述基于所述第二状态值确定各所述资源的第二稳定性值,包括:基于所述第三权重以及各次访问的所述第二状态值确定各所述资源的第二稳定性值。6.根据权利要求5所述的方法,在获取网页被访问后所返回的第一状态码以及第二状态码之前,所述方法还包括:确定所述网页的被访问次数是否小于预设值;若小于,则发起对所述网页的访问,直至所述网页的被访问次数不小于预设值。7.根据权利要求1

6中任一项所述的方法,在确定所述网页的第三稳定性值之后,所述方法还包括:基于所述网页的第三稳...

【专利技术属性】
技术研发人员:刘伟董慧旭张博林赛群
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1