本发明专利技术公开了一种网页信息的筛选方法和装置。其中,该网页信息的筛选方法包括:在浏览器中加载网页页面,获取网页页面显示的所有产品对象的产品数据;接收用户输入的筛选信息,确定筛选条件,其中,筛选条件至少包括如下任意一个或多个条件:产品对象的属性类型信息、来源信息和兴趣标签信息;根据筛选条件对所有产品对象的产品数据进行筛选,得到筛选后的产品对象;在浏览器显示的筛选后的产品对象的产品数据。本发明专利技术解决了由于文本类别由舆论情报监测分析系统的提供方提供,进而产生的分类方式过于单一的问题。
【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种网页信息的筛选方法和装置。其中,该网页信息的筛选方法包括:在浏览器中加载网页页面,获取网页页面显示的所有产品对象的产品数据;接收用户输入的筛选信息,确定筛选条件,其中,筛选条件至少包括如下任意一个或多个条件:产品对象的属性类型信息、来源信息和兴趣标签信息;根据筛选条件对所有产品对象的产品数据进行筛选,得到筛选后的产品对象;在浏览器显示的筛选后的产品对象的产品数据。本专利技术解决了由于文本类别由舆论情报监测分析系统的提供方提供,进而产生的分类方式过于单一的问题。【专利说明】网页信息的筛选方法和装置
本专利技术涉及互联网领域,具体而言,涉及一种网页信息的筛选方法和装置。
技术介绍
随着网络的发展,越来越多的网络数据能够体现出使用网络的用户的习惯和喜好,但是如何通过利用上述网络数据获取用户对某类产品的意见,成为了现有分析系统努力获取成果的一个方向。其中,在现有的舆论监测分析系统中,会对不同类别的文本内容进行分类的功能,其逻辑如下:通过预先设定一组关键词,例如,关键词口味”就会对应的出现巧克力味,牛奶味,香草味”,因此当机器爬虫从互联网上抓取到文本内容时,会第一时间的查看是否涵盖上述关键词,以此来对文本内容进行分类,若包含,则将这些内容让入到“口味”这一类别中,当舆论情报监测分析系统运行时,能直接在用户界面上展示出早已分好类别的“ 口味”所包含的文本。即,通过分类好的类别“ 口味”显示用户的喜好倾向。 但上述操作存在两个问题:问题1.该类别的创建是在后端完成的(即,舆论情报监测分析系统的提供方),用户只能查看预先设定好的类别,不能根据自己的喜好增加或修改类别;问题2.分类方式过于单一,仅仅从关键字的包含情况来进行分类,不够灵活,例如,若用户需要将包含关键词XXX的,来自于微博平台的且时间为最近一个月之内的文本分为一个类。对于上述的分类方式则不能灵活的满足。 针对现有技术中文本类别由于由舆论情报监测分析系统的提供方提供,进而产生的分类方式过于单一的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术的主要目的在于提供一种网页信息的筛选方法和装置,以解决由于文本类别由舆论情报监测分析系统的提供方提供,进而产生的分类方式过于单一的问题。 为了实现上述目的,根据本专利技术实施例的一个方面,提供了一种网页信息的筛选方法。根据本专利技术的网页信息的筛选方法包括:在浏览器中加载网页页面,获取网页页面显示的所有产品对象的产品数据;接收用户输入的筛选信息,确定筛选条件,其中,筛选条件至少包括如下任意一个或多个条件:产品对象的属性类型信息、来源信息和兴趣标签信息;根据筛选条件对所有产品对象的产品数据进行筛选,得到筛选后的产品对象;在浏览器显示的筛选后的产品对象的产品数据。 为了实现上述目的,根据本专利技术实施例的另一方面,提供了一种网页信息的筛选装置。根据本专利技术的网页信息的筛选装置包括:获取模块,用于在浏览器中加载网页页面,获取网页页面显示的所有产品对象的产品数据;设置模块,用于接收用户输入的筛选信息,确定筛选条件,其中,筛选条件至少包括如下任意一个或多个条件:产品对象的属性类型信息、来源信息和兴趣标签信息;筛选模块,用于根据筛选条件对所有产品对象的产品数据进行筛选,得到筛选后的产品对象;显示模块,用于在浏览器显示的筛选后的产品对象的产品数据。 根据专利技术实施例,通过在浏览器中加载网页页面,获取网页页面显示的所有产品对象的产品数据;接收用户输入的筛选信息,确定筛选条件,其中,筛选条件至少包括如下任意一个或多个条件:产品对象的属性类型信息、来源信息和兴趣标签信息;根据筛选条件对所有产品对象的产品数据进行筛选,得到筛选后的产品对象;在浏览器显示的筛选后的产品对象的产品数据,解决了由于文本类别由舆论情报监测分析系统的提供方提供,进而产生的分类方式过于单一的问题,达到了提升文本分类的精度的效果。 【专利附图】【附图说明】 构成本申请的一部分的附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中: 图1是根据本专利技术实施例的网页信息的筛选方法的流程图; 图2是根据本专利技术实施例的网页信息的筛选装置的示意图; 图3是根据本专利技术优选实施例的网页信息的筛选装置的示意图; 图4是根据本专利技术优选实施例的网页信息的筛选装置的示意图;以及 图5是根据本专利技术优选实施例的网页信息的筛选装置的示意图。 【具体实施方式】 需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本专利技术。 为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。 需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。 实施例一 本专利技术实施例提供了一种网页信息的筛选方法。 图1是根据本专利技术实施例的网页信息的筛选方法的流程图。如图1所示,该网页信息的筛选方法包括步骤如下: 步骤S102,在浏览器中加载网页页面,获取网页页面显示的所有产品对象的产品数据; 具体的,本专利技术实施例提供的网页信息的筛选方法可以适用于终端设备,该终端设备可以为以下至少之一:智能手机、笔记本电脑、台式电脑、掌上电脑、平板电脑,通过在浏览器中加载网页页面,获取当前网页页面显示的所有产品对象的产品数据,其中,产品对象可以以多个词汇的形式显示在当前网页页面上,并且,获取的网页页面显示的所有产品对象的产品数据可以通过机器人爬虫程序,在预先确定的爬取范围内,将该爬取范围内的所有词条都进行采集,这里机器人爬虫程序可以为脚本javascript代码,且爬取范围可以是一个网站或由多个网站组成的网络平台。 由上可知,在浏览器中加载网页页面,获取网页页面显示的所有产品对象的产品数据可以是在一个网站或由多个网站组成的网络平台中,通过javascript代码采集该网络平台中的所有词条,该词条对应的产品对象可以为任意一类产品或信息。 步骤S104,接收用户输入的筛选信息,确定筛选条件,其中,筛选条件至少包括如下任意一个或多个条件:产品对象的属性类型信息、来源信息和兴趣标签信息; 具体的,通过接收用户输入的筛选信息,将该筛选信息组成筛选条件,本专利技术实施例中的筛选条件的形式可以为:通过接收用户在当前网页页面显示的产品对象的属性类型信息、来源信息和兴趣标签信息中选取的一种或多种组本文档来自技高网...
【技术保护点】
一种网页信息的筛选方法,其特征在于,包括:在浏览器中加载网页页面,获取所述网页页面显示的所有产品对象的产品数据;接收用户输入的筛选信息,确定筛选条件,其中,所述筛选条件至少包括如下任意一个或多个条件:产品对象的属性类型信息、来源信息和兴趣标签信息;根据所述筛选条件对所述所有产品对象的产品数据进行筛选,得到筛选后的产品对象;在所述浏览器显示的所述筛选后的产品对象的产品数据。
【技术特征摘要】
【专利技术属性】
技术研发人员:陈俊宏,余德乐,杨韬,赵冬玲,
申请(专利权)人:北京国双科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。