网页内容提取方法和网页内容提取装置制造方法及图纸

技术编号:9519304 阅读:108 留言:0更新日期:2014-01-01 16:57
本发明专利技术公开了一种网页内容提取装置和网页内容提取方法。网页内容提取装置包括:检测单元,用于检测用户的输入;第一计算单元,用于根据检测到的用户的输入,计算出一个区域的坐标,其中用户的输入在所述区域内;第二计算单元,用于计算出网页内容的坐标;比较单元,用于比较计算出的区域的坐标与计算出的网页内容的坐标;以及提取单元,用于根据比较结果,提取出所述区域中的相应网页内容。根据本发明专利技术,用户能够方便地提取网页内容。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种网页内容提取装置和网页内容提取方法。网页内容提取装置包括:检测单元,用于检测用户的输入;第一计算单元,用于根据检测到的用户的输入,计算出一个区域的坐标,其中用户的输入在所述区域内;第二计算单元,用于计算出网页内容的坐标;比较单元,用于比较计算出的区域的坐标与计算出的网页内容的坐标;以及提取单元,用于根据比较结果,提取出所述区域中的相应网页内容。根据本专利技术,用户能够方便地提取网页内容。【专利说明】网页内容提取方法和网页内容提取装置
本专利技术涉及信息技木。更具体地,本专利技术涉及一种网页内容提取方法和一种网页内容提取装置。
技术介绍
随着互联网的快速发展,互联网上的信息每天都以惊人的速度增长。其中以HTML格式的web页面是主要的信息载体,互联网也因此成为了当前社会的主要信息来源之一。如何从网页中抽取出相应的内容,是业界的研究热点之一。目前,已知存在很多种网页内容提取技术。例如,基于用户设计的特定语言来提取网页内容的技术、基于自然语言来提取网页内容的技术、基于本体技术(Ontology)的网页内容提取技术等等。
技术实现思路
在下文中给出了关于本专利技术的简要概述,以便提供关于本专利技术的某些方面的基本理解。应该理解,这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关键或重要部分,也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。根据本专利技术的第一方面,提出了一种网页内容提取方法,包括:检测用户的输入;根据检测到的用户的输入,计算出一个区域的坐标,其中用户的输入在所述区域内;计算网页内容的坐标;比较计算出的区域的坐标与计算出的网页内容的坐标;以及根据比较结果,提取出所述区域中的相应网页内容。根据本专利技术的第二方面,提出了一种网页内容提取装置,包括:检测单元,用于检测用户的输入;第一计算单元,用于根据检测到的用户的输入,计算出一个区域的坐标,其中用户的输入在所述区域内;第二计算单元,用于计算出网页内容的坐标;比较单元,用于比较计算出的区域的坐标与计算出的网页内容的坐标;以及提取単元,用于根据比较結果,提取出所述区域中的相应网页内容。根据本专利技术,用户能够方便地提取网页内容。【专利附图】【附图说明】通过以下结合附图的说明,并且随着对本专利技术的更全面了解,本专利技术的其他目的和效果将变得更加清楚和易于理解,其中:图1示出了适于用来实现本专利技术实施方式的移动终端10的框图;图2示意性地示出了根据本专利技术实施方式的无线通信系统;图3示出了根据本专利技术的一个实施方式的网页内容提取器的框图;图4示出了根据本专利技术的一个实施方式的网页内容方法的流程图。在所有的上述附图中,相同的标号表示具有相同、相似或相应的特征或功能。【具体实施方式】下面将參照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整的传达给本领域的技术人员。图1示出了适于用来实现本专利技术实施方式的移动终端10的框图。然而,应当理解,所示出以及在此后描述的移动终端仅仅是适于用来实现本专利技术实施方式的移动终端的示范,因此,不应用来限制本专利技术实施方式的范围。移动终端诸如移动电话、个人数字助理(PDA)、平板电脑、移动电视、游戏设备、膝上型电脑、照相机、录像机、GPS设备等等。此外,应该理解,非移动终端也可以适于用来实现本专利技术的实施方式。下文将主要结合无线通信应用来描述本专利技术实施方式。然而,应当理解,本专利技术也适用于有线通信的情形。移动终端10包括天线12,其可与发射机14和接收机16进行通信。移动终端10还包括控制器20,其分别提供去往发射机14的信号和接收来自接收机16的信号。信号包括按照适当蜂窝系统的空中接ロ标准的信令信息,并且还包括文本、语音和/或视频。移动终端10能够利用ー个或多个空中接ロ标准来进行操作。作为示范,移动终端10能够根据第一代、第二代、第三代和/或第四代通信协议中的任何协议来进行操作。例如,移动终端10能够按照第二代(2G)无线通信协议IS-136((时分多址)TDMA)、GSM(全球移动通信系统)或IS-95((码分多址)CDMA)来进行操作;或者按照诸如通用移动电信系统(UMTS)、CDMA2000、宽带CDMA (WCDMA)或时分-同步CDMA (TD-SCDMA)的第三代(3G)无线通信协议来进行操作;或者按照第四代(4G)无线通信协议来进行操作。应该理解,控制器20包括用于实现移动终端10的功能所需的装置,诸如电路。例如,控制器20可以包括数字信号处理器、微处理器以及各种模数转换器、数模转换器和其他支持电路。移动终端10的控制和信号处理功能按照这些设备各自的能力在其间分配。控制器20还可以包括在调制和传输之前对消息进行卷积编码和交织的功能。控制器20还可以包括内部声音编码器,并且可以包括内部数据调制解调器。此外,控制器20可以包括对可以存储在存储器中的一个或多个软件程序进行操作的功能。例如,控制器20能够操作连接程序,诸如Web浏览器。连接程序可以允许移动终端10例如按照无线应用协议(WAP)、超文本传输协议(HTTP)等来发送和接收Web内容。移动终端10还可以包括输出设备以及用户输入设备,所有这些设备都耦合至控制器20。输出设备包括例如传统的耳机或者扬声器24、显示器28等。用户输入设备包括麦克风26、允许移动終端10接收数据的用户输入设备,其可以包括小键盘30、触摸显示器(未示出)等。在包括小键盘30的实施方式中,小键盘30可以包括传统的数字键(0-9)和相关键(#、*)等。备选地,小键盘30可以包括传统的QWERTY小键盘布置。此外或者备选地,移动终端10可以包括诸如操纵杆的用户输入设备。移动终端10还包括电池34,诸如振动电池组,用于为操作移动终端10所需的各种电路供电。移动终端10还可以由补充电源44供电。补充电源44可以向移动终端10直接供电。补充电源44还可以通过对电池34充电而间接地向移动终端10供电,而电池34直接向移动终端10供电。由此,在某些实施方式中,即使移动终端10连接至补充电源44,移动终端10可以并不操作,直到电池34从补充电源44接收到了充分的电荷。此外,补充电源44可以从移动终端10移除,以允许移动终端10的无拘束的移动性。当补充电源44以物理方式或者电气方式被移除或者断开时,电池34可以是移动终端10的独有电源。移动终端10的控制器20可以包括检测电池34的电池水平的功能和/或电路。电池水平可以是针对电池34的剩余电量或者剰余时间的任意指示。当考虑是否执行各种操作时,控制器20可以使用电池水平。控制器20还可以检测移动终端10是否连接至补充电源44。控制器20可以经由例如对控制器20的输入,直接检测补充电源的连接。移动终端10还可以包括网页内容提取器36。网页内容提取器36可以是以硬件、软件或者硬件和软件结合实现的任意装置、设备或者电路,其能够在移动终端10上提取网页内容。网页内容提取器36可以将提取的内容项存储至易失性存储器40或者非易失性存储器本文档来自技高网...

【技术保护点】
一种网页内容提取方法,包括:检测用户的输入;根据检测到的用户的输入,计算出一个区域的坐标,其中用户的输入在所述区域内;计算网页内容的坐标;比较计算出的区域的坐标与计算出的网页内容的坐标;以及根据比较结果,提取出所述区域中的相应网页内容。

【技术特征摘要】

【专利技术属性】
技术研发人员:吴涛
申请(专利权)人:北京千橡网景科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1