实现文字浏览的方法、系统和客户端浏览器技术方案

技术编号:7307114 阅读:153 留言:0更新日期:2012-05-02 19:59
本发明专利技术提供了一种实现文字浏览的方法、系统和客户端浏览器,包括根据网页中的资源属性,区分文字信息和非文字信息,屏蔽网页中的非文字信息,并显示文字信息。其中网页中的资源属性可以是标签、或请求的资源类型、或DOM树的节点属性等。通过本发明专利技术方案,屏蔽了文字信息资源之外的其他网页资源,实现了文字浏览模式,提高了网页渲染速度以及用户浏览速度,特别是在用户浏览网络文字信息时,避免了其他网络资源信息对用户浏览文字信息的干扰,快速而简洁地实现了网页浏览。

【技术实现步骤摘要】
实现文字浏览的方法、系统和客户端浏览器
本专利技术涉及网页浏览技术,尤指一种实现文字浏览的方法、系统和客户端浏览器。
技术介绍
浏览器有多种浏览模式,不同浏览模式对用户的不同需求做相应的优化,使得用户能更好的浏览网页。现有浏览器浏览模式大概定义为完全浏览模式、安全浏览模式、文字浏览模式以及自定义屏蔽模式。其中,在完全浏览模式中,对于网页的任何内容下载,任何脚本的运行没有任何屏蔽,完全按其默认的规则运行;在安全浏览模式中,为了保护本地计算机受到网页的威胁,选择性屏蔽恶意的插件下载以及JavaScript脚本的运行;在文字浏览模式中,不显示图片、视频、Flash等,不播放声音,屏蔽除了网页需要显示的文字以外的所有其他资源,并以简洁的格式化方式显现网页内容,使得网页变得更干净,浏览变得更快速;在自定义浏览模式中,基于上述的浏览模式所能提供的选项,自定义浏览模式,使用户更好地选择自身需要的浏览模式,比如:禁止(或允许)下载和播放Flash、禁止(或允许)下载和显示图片、禁止(或允许)下载和播放视频、禁止(或允许)下载和播放声音、禁止(或允许)运行网页脚本、禁止(或允许)运行Java小程序等。网页资源中,除了文字信息外,还包括很多其他内容,比如图片、声音、视频、Flash等。目前,国内的大多数浏览器实现了安全浏览模式、对广告实现了拦截等。能够屏蔽恶意脚本、广告以及插件的运行。为了简便,大多数浏览器提供的浏览模式主要是直接屏蔽JavaScript、插件的运行或者通过特定的脚本字符串匹配来验证广告,并屏蔽相关展现。基于现阶段的浏览器技术成熟度、网页展现的多样性,以及存在各种系统的漏洞等原因,对于这些插件、脚本的运行以及广告的拦截是不够智能的,能力是极其有限的。比如:现有广告拦截是基于屏蔽弹窗和根据弹窗的用户的鼠标操作,或者通过URL黑名单屏蔽来实现的,对于非弹窗的且不在黑名单的广告,现有方法就不能正确地识别相关内容,从而导致用户想要拦截的广告仍然被展现,这样,是不能彻底屏蔽这些无用的资源下载的。目前,网络速度不是问题,但是,随着网络速度的提高,网页内容也越来越丰富,而垃圾信息的注入量也越来越多,比如用户并不关心的大多数网页广告。当用户只需要浏览文字内容时,完全浏览模式加载的大量的图片、视频、音频,特别是广告等资源,影响了网页渲染速度以及用户浏览速度。特别地,当用户访问小说等网站时,用户只关心的是小说的文字内容,对于其他图片、广告等内容用户是不关心的,这些图片、广告等内容会是的网页复杂化,干扰了用户对文字信息的浏览。对于文字浏览模式,现有技术中没有提供具体实现方法。
技术实现思路
有鉴于此,本专利技术的主要目的在于提供一种实现文字浏览的方法、系统和客户端浏览器,能够实现文字浏览模式,快速而简洁地实现网页浏览。为达到上述目的,本专利技术的技术方案是这样实现的:一种实现文字浏览的方法,包括:根据网页中的资源属性,区分文字信息和非文字信息;屏蔽网页中的非文字信息,并显示文字信息。所述根据网页中的资源属性,区分文字信息和非文字信息包括:在网页浏览过程中,根据解析出的网页文件的标签来区分文字信息和非文字信息。该方法还包括:预先设置每个所述标签的级别,根据标签的级别来设置文字浏览的其他资源屏蔽程度。所述屏蔽网页中的非文字信息包括:根据区分出的标签,屏蔽非文字信息对应的标签,并重新浏览修改后的网页文件。所述根据网页中的资源属性,区分文字信息和非文字信息包括:在网页浏览过程中,在下载网页文件中的标签相关的网络资源时,根据识别出的请求的资源的类型,区分请求的是文字信息资源,还是非文字信息资源。该方法还包括:预先设置每个所述资源的类型的级别,根据类型的级别来设置文字浏览的其他资源屏蔽程度。所述屏蔽网页中的非文字信息包括:根据区分出的请求的资源的类型,屏蔽对非文字资源信息的请求。所述屏蔽对非文字资源信息的请求包括:按照预先设置的策略选择性地屏蔽选择出的对除文字资源信息之外的其他资源的请求。所述根据网页中的资源属性,区分文字信息和非文字信息包括:根据文档对象模型DOM树的节点属性来区分文字信息和非文字信息。所述屏蔽对非文字资源信息的请求包括:根据所述区分出的不同属性的节点,删除文本节点以外的其他资源节点;或者,更改所述区分出的除文字节点之外的其他资源节点的属性来屏蔽该资源节点。一种文字浏览系统,至少包括网页服务器和客户端浏览器,其中,客户端浏览器,用于向网页服务器请求网页文件,根据网页中的资源属性,区分文字信息和非文字信息;屏蔽网页中的非文字信息,并显示文字信息;网页服务器,用于根据客户端浏览器的请求,提供网页文件。客户端浏览器包括请求模块、分析模块和显示模块,其中,请求模块,用于向网页服务器请求网页文件,输出给分析模块;分析模块,用于分析来自请求模块的网页文件,根据网页中的资源属性,区分文字信息和非文字信息,并屏蔽网页中的非文字信息;显示模块,用于显示文字信息。所述分析模块,具体用于根据解析出的标签来区分文字信息和非文字信息,并屏蔽网页中的非文字信息;或者,分析模块,具体用于在下载标签相关的网络资源时,识别请求的资源的类型,区分请求的是文字信息资源,还是非文字信息资源,并屏蔽对非文字信息资源的请求;或者,分析模块,具体用于根据调整DOM树的结构以及属性来来区分文字信息和非文字信息,并屏蔽网页中的非文字信息节点。一种客户端浏览器,包括请求模块、分析模块和显示模块,其中,请求模块,用于向网页服务器请求网页文件,输出给分析模块;分析模块,用于分析来自请求模块的网页文件,根据网页中的资源属性,区分文字信息和非文字信息,并屏蔽网页中的非文字信息;显示模块,用于显示文字信息。所述分析模块,具体用于根据解析出的标签来区分文字信息和非文字信息,并屏蔽网页中的非文字信息;或者,分析模块,具体用于在下载标签相关的网络资源时,识别请求的资源的类型,区分请求的是文字信息资源,还是非文字信息资源,并屏蔽对非文字信息资源的请求;或者,分析模块,具体用于根据调整DOM树的结构以及属性来来区分文字信息和非文字信息,并屏蔽网页中的非文字信息节点。从上述本专利技术提供的技术方案可以看出,包括根据网页中的资源属性,区分文字信息和非文字信息,屏蔽网页中的非文字信息,并显示文字信息。其中网页中的资源属性可以是标签、或请求的资源类型、或DOM树的节点属性等。通过本专利技术方案,屏蔽了文字信息资源之外的其他网页资源,实现了文字浏览模式,提高了网页渲染速度以及用户浏览速度,特别是在用户浏览网络文字信息时,避免了其他网络资源信息对用户浏览文字信息的干扰,快速而简洁地实现了网页浏览。附图说明图1为本专利技术实现文字浏览的方法的流程图;图2为本专利技术实现文字浏览的系统的组成结构示意图;图3为现有一种典型的HTML文件的DOM树形模型的示意图。具体实施方式网页主要通过超文本标记语言(HTML,HyperTextMark-upLanguage,也称为超文本链接标识语言)来编写的。HTML文本是由HTML命令组成的描述性文本,HTML命令可以说明文字、图形、声音、表格、连接、图形等。HTML结构包括头部(Head)和主体(Body)两大部分,其中,头部描述浏览器所需信息,而主体包含所要说明的具体内容。浏览本文档来自技高网
...
实现文字浏览的方法、系统和客户端浏览器

【技术保护点】

【技术特征摘要】
1.一种实现文字浏览的方法,其特征在于,包括:在浏览器的文字浏览模式下,向网页服务器请求得到网页,所述文字浏览模式下不显示图片、视频、Flash,不播放声音,屏蔽所述网页需要显示的文字以外的所有其他资源;根据网页中的资源属性,区分文字信息和非文字信息,其中所述网页中的资源属性包括非文字信息对应的标签;其中,所述非文字信息对应的标签包括:图像相关的标签:<imgsrc=“URL”>、声音相关的标签:<vocsrc=“URL”>;所述根据网页中的资源属性,区分文字信息和非文字信息包括:在网页浏览过程中,根据解析出的网页文件的非文字信息对应的标签来区分文字信息和非文字信息;屏蔽或删除网页中的非文字信息,并显示文字信息。2.根据权利要求1所述的方法,其特征在于,该方法还包括:预先设置每个所述标签的级别,根据标签的级别来设置文字浏览的其他资源屏蔽程度。3.根据权利要求1或2所述的方法,其特征在于,所述屏蔽网页中的非文字信息包括:根据区分出的标签,屏蔽非文字信息对应的标签,并重新浏览修改后的网页文件。4.一种文字浏览系统,其特征在于,至少包括网页服务器和客户端浏览器,其中,客户端浏览器,用于在浏览器的文字浏览模式下,向网页服务器请求得到网页,根据网页中的资源属性,区分文字信息和非文字信息;屏蔽或删除网页中的非文字信息,并显示文字信息;其中:所述文字浏览模式下不显示图片、视频、Flash,不播放声音,屏蔽...

【专利技术属性】
技术研发人员:严峻李鹤
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术