一种将web网站中的标题转换为wap网站标题的技术,首先获取目标web网页中的海量信息;然后将海量信息进行统一的格式化与提纯;从提纯后的数据中提取出标题信息并加载为wap网页标题;本发明专利技术使得能够节省web网页内容向wap网页转化的时间与资源。
【技术实现步骤摘要】
本专利技术涉及一种将web网站中的标题转换为wap网站标题的技术,涉及一种采用 网页智能解析方式,实现自动的提取出web网站的标题信息并将其转化为wap网站标题的 方法。
技术介绍
随着移动互联网产业的快速发展。越来越多的人使用手机上网。3G各类wap网站 开始蓬勃发展,很多传统互联网网站都希望将自己原有的内容移植到移动互联网中,借助 手机网络用户的增长,继续保持发展。当前的wap站点的建设,大多依靠建立专门的项目组 进行wap程序开发。这其中需要解决数据整合,内容发布和管理,实时更新,系统运营与维 护等众多复杂问题。要耗费相对较高的成本才能完成wap站点的建立并整合原有web站点 内容。本专利技术的建立,实现了智能的分辨出web网站的标题,并自动将之转换为wap网站上 标题的技术,无需wap页面程序开发,能够将原有的web站点的文档标题自动移植为wap站 点标题。
技术实现思路
本专利技术所要解决的技术问题是提供一种采用web信息提纯技术,实现将wed页面 中的标题智能提取出来并转化为wap页面标题的方法。本专利技术所述的一种将web网站中的标题转换为wap网站标题的技术,该方法至少 包括如下的步骤步骤1 获取目标web网页中的海量信息。步骤2 将海量信息进行统一的格式化与提纯。步骤3 从提纯后的数据中提取出标题信息并加载为wap网页标题。本专利技术所述的一种将web网站中的标题转换为wap网站标题的技术,获取目标web 网页中的海量信息,其步骤为步骤11 将目标web网页的海量异构信息抓取到内容聚合服务器中。步骤12 将内容聚合服务器中的海量异构信息进行统一的格式化。步骤13 将格式化后的信息存放到资源服务器中。本专利技术所述的一种将web网站中的标题转换为wap网站标题的技术,将海量信息 进行统一的格式化与提纯,其步骤为步骤21 将格式化后的信息通过智能解析进行提纯,滤去多余的数据。步骤22 从提纯后的信息中提取出标题、正文、时间、图片、音频、视频等关键信 肩、ο本专利技术所述的一种将web网站中的标题转换为wap网站标题的技术,从提纯后的 数据中提取出标题信息并加载为wap网页标题,其步骤为步骤31 将提取出的关键信息进行智能分析,提取出标题信息。步骤32 将标题信息自动加载到wap网页上。本专利技术涉及一种将web网站中的标题转换为wap网站标题的技术,利用智能web 信息提取技术,使得节省了 web网页内容向wap网页转化的时间与资源。具体实施例方式本专利技术的主要步骤如下步骤1 获取目标web网页中的海量信息。步骤2 将海量信息进行统一的格式化与提纯。步骤3 从提纯后的数据中提取出标题信息并加载为wap网页标题。上述步骤1获取目标web网页中的海量信息的具体步骤如下步骤11 将目标web网页的海量异构信息抓取到内容聚合服务器中。步骤12 将内容聚合服务器中的海量异构信息进行统一的格式化。步骤13 将格式化后的信息存放到资源服务器中。上述步骤2将海量信息进行统一的格式化与提纯的具体步骤如下步骤21 将格式化后的信息通过智能解析进行提纯,滤去多余的数据。步骤22 从提纯后的信息中提取出标题、正文、时间、图片、音频、视频等关键信息。上述步骤3从提纯后的数据中提取出标题信息并加载为wap网页标题的具体步骤 如下步骤31 将提取出的关键信息进行智能分析,提取出标题信息。步骤32 将标题信息自动加载到wap网页上。上述的技术方案实施时利用智能web信息提取技术,节省了 web网页内容向wap 网页转化的时间与资源。最后所应说明的是,以上实施例仅用以说明而并非限制本专利技术所描述的技术方 案;因此,尽管本说明书参照上述的实施例对本专利技术已进行了详细的说明,但是,本领域的 普通技术人员应当理解,仍然可以对本专利技术进行修改或者等同地替换;而一切不脱离本发 明的精神和范围的技术方案及其改进,其均应涵盖在本专利技术的权利要求范围当中。权利要求一种将web网站中的标题转换为wap网站标题的技术,其特征在于该方法至少包括如下的步骤步骤1获取目标web网页中的海量信息。步骤2将海量信息进行统一的格式化与提纯。步骤3从提纯后的数据中提取出标题信息并加载为wap网页标题。2.根据权利要求1所述的一种将web网站中的标题转换为wap网站标题的技术,其特 征在于获取目标web网页中的海量信息,其步骤为步骤11 将目标web网页的海量异构信息抓取到内容聚合服务器中。 步骤12 将内容聚合服务器中的海量异构信息进行统一的格式化。 步骤13 将格式化后的信息存放到资源服务器中。3.根据权利要求1所述的一种将web网站中的标题转换为wap网站标题的技术,其特 征在于将海量信息进行统一的格式化与提纯,其步骤为步骤21 将格式化后的信息通过智能解析进行提纯,滤去多余的数据。步骤22 从提纯后的信息中提取出标题、正文、时间、图片、音频、视频等关键信息。4.根据权利要求1所述的一种将web网站中的标题转换为wap网站标题的技术,其特 征在于从提纯后的数据中提取出标题信息并加载为wap网页标题,其步骤为步骤31 将提取出的关键信息进行智能分析,提取出标题信息。 步骤32 将标题信息自动加载到wap网页上。全文摘要一种将web网站中的标题转换为wap网站标题的技术,首先获取目标web网页中的海量信息;然后将海量信息进行统一的格式化与提纯;从提纯后的数据中提取出标题信息并加载为wap网页标题;本专利技术使得能够节省web网页内容向wap网页转化的时间与资源。文档编号G06F17/30GK101887426SQ20091008407公开日2010年11月17日 申请日期2009年5月13日 优先权日2009年5月13日专利技术者朱红军, 汤海京, 田耘, 蒋海涛, 贾鹏 申请人:北京博越世纪科技有限公司本文档来自技高网...
【技术保护点】
一种将web网站中的标题转换为wap网站标题的技术,其特征在于:该方法至少包括如下的步骤:步骤1:获取目标web网页中的海量信息。步骤2:将海量信息进行统一的格式化与提纯。步骤3:从提纯后的数据中提取出标题信息并加载为wap网页标题。
【技术特征摘要】
【专利技术属性】
技术研发人员:贾鹏,汤海京,朱红军,蒋海涛,田耘,
申请(专利权)人:北京博越世纪科技有限公司,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。