本发明专利技术公开了一种WAP网站在线网页转换方法及其装置,该方法包括:S1:获取用户访问的WAP网站地址;S2:下载所述WAP网站地址对应的WML网页;S3:解析所述WML网页并将其转化为HTML网页,将所述HTML网页结果返回给所述用户。本发明专利技术能够在用户无需安装任何软件情况下,直接访问WAP网站的WML网页,充分利用更多现有WAP网站的网络资源。
【技术实现步骤摘要】
本专利技术涉及计算机网页转换领域,尤其涉及ー种WAP网站在线网页转换方法及装置。
技术介绍
目前通过移动终端上网是ー个流行的趋势,新型智能移动终端都采用的浏览器是 ー个HTML(Hyper Text Mark-up Language,超文本标记语言)浏览器,然而上述智能移动终端所采用的HTML浏览器以及传统的用在计算机终端的HTML浏览器(IE,Firefox,chrome), 都不能浏览传统的为非智能移动终端设计的WML移动终端网页,而只能浏览HTML格式的网页。而现在非智能移动终端仍然占到市场主流,各大网站提供商都针对非智能移动终端提供了 WML(Wireless Markup language,无线标记语言)格式的网页,并建立了相对应的 WAP(Wireless Application Protocol,无线应用通讯协议)站点。随着用户的增加,WAP网站的质量和WML网页的数量越来越丰富,如果新型智能移动终端和无线计算机终端仍不能浏览WAP网站中的WML类型的网页,这样就使新型智能移动终端和无线计算机终端的上网服务受到限制,并且造成原有WAP资源的浪费。
技术实现思路
为了解决上述问题,本专利技术的实施例的ー种目的是提供ー种WAP网站在线网页转换方法,能够实现智能移动终端以及计算机终端访问WAP网站资源,充分利用更多的网络资源。因此,为了实现上述目的,本专利技术提供ー种WAP网站在线网页转换方法,包括以下步骤S1 获取用户访问的WAP网站地址;S2 下载所述WAP网站地址对应的WML网页;S3 解析所述WML网页并将其转化为HTML网页,将所述HTML网页结果返回给所述用户。根据本专利技术的一个实施例,所述步骤S3具体为S31 将所述WML网页解析生成文档结构DOM树;S32 遍历所述DOM树结构,寻找WML与HTML不同的元素,依据元素的语义对寻找到元素进行语法转换,在DOM树中将其转换为对应的HTML网页节点;S33 然后将所述处理后的DOM树转换成HTML格式的网页,返回给所述用户。根据本专利技术的一个实施例,在步骤S31之前还包括去除WML网页转义符标记的步ο根据本专利技术的一个实施例,上述所述步骤S32还包括以下步骤处理丽L网页标签的步骤若寻找到的元素中不具有HTML网页中所必须有的标签,则添加HTML网页中所必须有的标签,以及若寻找到的元素中具有在HTML网页内容没有相对应的标签,则忽略掉该标签,保留标签中的内容;处理地址的步骤遍历所述DOM树中所有URL地址,将所述URL字符串编码转换为utf_8编码格式,以及遍历所述DOM树中的图片地址,将其转换为能够直接访问图片的绝对地址。根绝本专利技术的一个实施例,所述步骤S2具体为S21 对所述网站地址进行编码转换,将所述网站地址的编码转换为utf-8编码;S22 将所述网站地址中包含的有关代理服务器信息的地址字符进行转换,使所述网站地址成为所要访问网站的绝对地址;S23 根据http协议判断给定网页地址的网页是否能下载,是则下载所述网站地址对应的网页内容,否则向用户返回下载失败的信息。本专利技术的另一目的是提供ー种WAP网站在线网页转换装置,所述装置包括获取模块,用于获取用户访问的WAP网站地址;下载模块,用于下载所述WAP网站地址对应的WML网页;解析模块,用于解析所述WML网页并将其转化为HTML网页,并将所述HTML网页结果返回给所述用户。所述解析模块还包括结构转换单元,用于将所述WML网页解析生成文档结构DOM树;遍历单元,用于遍历所述DOM树结构,寻找不同的展示元素,根据不同的语义将其转换为对应的HTML网页节点;转换单元,用于将处理后的DOM树转换成HTML格式的网页,返回给所述用户。所述下载模块还包括编码转换单元,用于对所述网站地址进行编码转换,将所述网站地址的编码转换为utf-8编码;地址转换単元,用于将所述网站地址中包含的有关代理服务器信息的地址字符进行转换,使所述网站地址成为所要访问网站的绝对地址;下载判断単元,用于根据http协议判断给定网页地址的网页是否能下载,是则下载所述网站地址对应的网页内容,否则向用户返回下载失败的信息。根据本专利技术的实施例,本专利技术能够在用户无需安装任何软件情况下,直接访问WAP 网站的WML网页,充分利用更多现有WAP网站的网络资源。附图说明图1为根据本专利技术的一种实施例的WAP网站在线网页转换方法的流程图;图2为根据本专利技术的一种实施例的下载WML网页方法的流程图;图3为根据本专利技术的一种实施例的解析所述WML网页将其转换为html网页方法的流程图。具体实施例方式下面将详细描述本专利技术的具体实施例。应当注意,这里描述的实施例只用于举例说明,并不用于限制本专利技术。为了更便于理解本专利技术,在说明本专利技术的实施例之前,先说明一下WML和HTML语言格式各自的特点WML(Wireless Markup Language,无线标记语言)是ー种从HTML继承而来的标记语言,但是WML基于XML因此它较HTML更严格。WML被用来创建可显示在WAP浏览器中的页面。而HTML (HyperText Mark-up Language)即超文本标记语言或超文本链接标示语言, 是目前计算机网络上应用最为广泛的语言,也是构成网页文档的主要语言,HTML文本是由 HTML命令組成的描述性文本,HTML命令可以说明文字、图形、动画、声音、表格、链接等;因而WML是ー套不同于HTML的语言,具有不同的语法和标签以及独特的语义,并且其所支持的标签数量要小于HTML语言所支持的标签数量,从而WML仅用于WAP站点的网页显示,而 HTML 一般是应用于计算机或者智能移动终端的HTML浏览器。由于上述不同,因而在智能移动终端上的HTML浏览器无法浏览WAP站点所提供的 WML网页,但是WML和HTML同属于XML家族,其具有共通的语义和许多相似的语法。因而,本专利技术的实施例提出了在移动终端上通过HTML浏览器直接访问WAP网站的 WML网页的一种技术方案,在移动终端访问WAP网站时通过将丽L网页转换成HTML网页,从而向用户提供HTML网页浏览,使智能手机终端的用户得到更多的网络资源。在本专利技术中,用户的访问请求被代理服务器重定向到转化服务,转化服务根据用户访问的URL去取得各个WAP网站的网页。取得WML网页后,然后通过本专利技术的WML到HTML 转换器进行转换,该转换器的核心算法为对WML文档进行语法检查与语义解释,通过栈操作和特殊标记的模块化的处理,完成WML语言到语法严格的HTML语言的翻译转换。具体地,如图1所示,本专利技术的ー种WAP网站在线网页转换方法,包括以下步骤S1 取得用户访问的WAP网站地址;由于智能移动终端或者无线上网计算机终端通过HTML浏览器访问WAP网站吋,不能直接获取到WAP网站所提供的网页,需要先通过本专利技术的WAP网页转化服务,才能获取到所浏览的HTML网页,因而在转化服务的第一步骤就需要获取该用户想访问的是哪个WAP网站地址。在上述步骤之后,进行步骤S2 下载该WAP网站地址对应的WML网页在该步骤中,如图2所示,在下载WML网页时还包括如下步骤S21 对网站url地址进行编码转换为了防止由于WAP网站地址编码不统一而造成在后续下载过程本文档来自技高网...
【技术保护点】
【技术特征摘要】
【专利技术属性】
技术研发人员:贾海禄,
申请(专利权)人:北京瑞信在线系统技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。