本发明专利技术实施例公开了一种确定搜索项的方法和系统。其中,所述方法包括:获取待定搜索项集合;以待定搜索项集合中的各个待定搜索项为搜索条件,通过搜索引擎进行搜索,并从搜索结果中获得搜索结果文本;统计各个搜索结果文本中候选目标项的出现次数,并根据候选目标项的出现次数对各个待定搜索项进行排序;根据排序结果从待定搜索项中确定搜索项。本发明专利技术实施例所提供的方法,可以结合用户输入的预设搜索项协助用户在需要进行搜索时,通过准确的搜索项找到准确的目标信息。
【技术实现步骤摘要】
本专利技术涉及网络
,尤其涉及一种确定搜索项的方法和系统。
技术介绍
随着网络技术的不断普及,网络已经融入了人们日常工作和生活的各个方面。其中借助网络提供的搜索引擎来搜索自己需要的信息是一个非常重要的应用。专利技术人通过对现有技术的研究发现,随着信息量的增加,面对庞杂纷繁的信息,很多时候用户并不知道要根据什么样的搜索项才能够找到准确的信息。
技术实现思路
有鉴于此,本专利技术实施例的目的是提供一种确定搜索项的方法和系统,协助用户在需要进行搜索时,能够通过准确的搜索项找到准确的信息。为实现上述目的,本专利技术实施例提供了如下技术方案 一种确定搜索项的方法,包括 获取待定搜索项集合; 以待定搜索项集合中的各个待定搜索项为搜索条件,通过搜索引擎进行搜索,并从搜索结果中获得搜索结果文本; 统计各个搜索结果文本中候选目标项的出现次数,并根据候选目标项的出现次数对各个待定搜索项进行排序; 根据排序结果从待定搜索项中确定搜索项。所述待定搜索项包括预设搜索项和第一推荐搜索项。获取待定搜索项包括 通过搜索引擎对预设搜索项进行搜索; 根据所述预设搜索项的搜索结果获得第一推荐搜索项。所述待定搜索项还包括第二推荐搜索项;所述获取待定搜索项还包括 通过搜索引擎对第一推荐搜索项进行搜索; 根据所述第一推荐搜索项的搜索结果获得第二推荐搜索项。所述从搜索结果中获得搜索结果文本包括 从每个待定搜索项的搜索结果中提取统一资源定位符; 对每个统一资源定位符对应的网络资源进行下载,得到对应的搜索结果文本。一种确定搜索项的系统,包括 第一获取单元,用于获取待定搜索项集合; 搜索单元,用于以待定搜索项集合中的各个待定搜索项为搜索条件,通过搜索引擎进行搜索; 第二获取单元,用于从搜索结果中获得搜索结果文本; 统计单元,用于统计各个搜索结果文本中候选目标项的出现次数,并根据候选目 4标项的出现次数对各个待定搜索项进行排序; 确定单元,用于根据排序结果从待定搜索项中确定搜索项。所述第一获取单元包括 第一搜索子单元,用于通过搜索引擎对预设搜索项进行搜索; 第一获取子单元,用于根据所述预设搜索项的搜索结果获得第一推荐搜索项。所述待定搜索项还包括第二推荐搜索项,所述第一获取单元还包括 第二搜索子单元,用于通过搜索引擎对第一推荐搜索项进行搜索; 第二获取子单元,用于根据所述第一推荐搜索项的搜索结果获得第二推荐搜索项。所述第二获取单元包括 提取子单元,用于从每个待定搜索项的搜索结果中提取统一资源定位符; 下载子单元,用于对每个统一资源定位符对应的网络资源进行下载,得到对应的搜索结果文本。可见,在本专利技术实施例中,获取待定搜索项集合;以待定搜索项集合中的各个待定搜索项为搜索条件,通过搜索引擎进行搜索,并从搜索结果中获得搜索结果文本;统计各个搜索结果文本中候选目标项的出现次数,并根据候选目标项的出现次数对各个待定搜索项进行排序;根据排序结果从待定搜索项中确定搜索项。本专利技术实施例所提供的技术方案,可以结合用户输入的预设搜索项协助用户在需要进行搜索时,通过准确的搜索项找到准确的目标信息。附图说明 为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一实施例所提供的方法流程图; 图2为本专利技术另一实施例所提供的方法的流程图; 图3为本专利技术一实施例所提供的系统的结构示意图; 图4为本专利技术一实施例所提供的系统中一单元的结构示意图; 图5为本专利技术一实施例提供的系统中另一单元的结构示意图。具体实施例方式为了使本
的人员更好地理解本专利技术中的技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。参见图1,本专利技术实施例提供的一种确定搜索项的方法,包括 S101、获取待定搜索项集合; 本专利技术实施例中,所述待定搜索项集合中包含多个待定搜索项。该待定搜索项包括预设搜索项和推荐搜索项。预设搜索项时待定搜索项的一种。预设搜索项可以是用户输入的搜索项,例如,用户希望通过搜索引擎搜索一下目前的流行语,就可以在搜索引擎中输入“最新流行语”这样的搜索项。但是这个搜索项对于其希望获得的目标项——具体的最新流行语来说不一定是非常准确的搜索项。所以本专利技术实施例所提供的方法中,通过推荐搜索项对待确定搜索项进行了补充。推荐搜索项是通过预设搜索项获得的。当通过搜索引擎对预设搜索项进行搜索后,搜索引擎会提供与预设搜索项相关或者相近的搜索项。这些相关或者相近的搜索项就是预设搜索项的推荐搜索项。例如,利用一搜索引擎对预设搜索项“最新流行语”进行搜索,得到的搜索结果页面中,在搜索结果页面中会提供“最新流行语”的相关搜索,包括“2009年网络流行语”、 “2009最新流行语”等等。这些相关搜索就是预设搜索项的推荐搜索项。从预设搜索项的搜索结果页面中将这些推荐搜索项提取出来,成为待定搜索项。多个待定搜索项组成待定搜索项集合。需要说明的是,在获取待定搜索项的过程中,为了获得更多的待定搜索项,在得到推荐搜索项后,可以利用搜索引擎对推荐搜索项进行进一步搜索,从对推荐搜索项的搜索结果页面中得到推荐搜索项的相关搜索,将这些相关搜索也列入待确定搜索项中。为了描述上的方便,本专利技术实施例中,将根据预设搜索项得到的推荐搜索项记为第一推荐搜索项; 将根据第一推荐搜索项得到的推荐搜索项记为第二推荐搜索项。S102、以待定搜索项集合中的各个待定搜索项为搜索条件,通过搜索引擎进行搜索,并从搜索结果中获得搜索结果文本; 具体地,可以从每个待定搜索项的搜索结果中提取统一资源定位符;然后对每个统一资源定位符对应的网络资源进行下载,得到对应的搜索结果文本。例如,通过步骤SlOl得到的待定搜索项集合中的待定搜索项包括“最新流行语”、 “2009最新流行语”、“09最新流行语”等等。以每个待定搜索项为搜索条件,通过搜索引擎进行搜索,得到搜索结果。该搜索结果中可以包括多个统一资源定位符,从搜索结果中将统一资源定位符提取出来,然后对每个统一资源定位符对应的网络资源进行下载,所得到的内容即为该待定搜索项对应的搜索结果文本。S103、统计各个搜索结果文本中候选目标项的出现情况,并根据候选目标项的出现情况对各个待定搜索项进行排序; 为了从待定搜索项中准确选取出搜索项,本专利技术实施例所提供的方法中,针对待定搜索项可以预先设置一些候选目标项。以对流行语的搜索为例,为了确定在搜索流行语时的搜索项,预先可以设置一些已经确定是流行语的词语作为候选目标项,多个候选目标项组成候选目标项集合。例如候选目标项集合中可以包括“打酱油”、“躲猫猫”、“俯卧撑”等多个流行词的候选目标项。统计各个搜索结果文本中候选目标项出现的情况,包括出现了多少个候选目标项,每个候选目标项出现了多少次等等本文档来自技高网...
【技术保护点】
1.一种确定搜索项的方法,其特征在于,包括:获取待定搜索项集合;以待定搜索项集合中的各个待定搜索项为搜索条件,通过搜索引擎进行搜索,并从搜索结果中获得搜索结果文本;统计各个搜索结果文本中候选目标项的出现次数,并根据候选目标项的出现次数对各个待定搜索项进行排序;根据排序结果从待定搜索项中确定搜索项。
【技术特征摘要】
1.一种确定搜索项的方法,其特征在于,包括 获取待定搜索项集合;以待定搜索项集合中的各个待定搜索项为搜索条件,通过搜索引擎进行搜索,并从搜索结果中获得搜索结果文本;统计各个搜索结果文本中候选目标项的出现次数,并根据候选目标项的出现次数对各个待定搜索项进行排序;根据排序结果从待定搜索项中确定搜索项。2.根据权利要求1所述的方法,其特征在于,所述待定搜索项包括预设搜索项和第一推荐搜索项。3.根据权利要求2所述的方法,其特征在于,获取待定搜索项包括 通过搜索引擎对预设搜索项进行搜索;根据所述预设搜索项的搜索结果获得第一推荐搜索项。4.根据权利要求3所述的方法,其特征在于,所述待定搜索项还包括第二推荐搜索项;获得第一推荐搜索项之后还包括通过搜索引擎对第一推荐搜索项进行搜索;根据所述第一推荐搜索项的搜索结果获得第二推荐搜索项。5.根据权利要求1-4任意一项所述的方法,其特征在于,所述从搜索结果中获得搜索结果文本包括从每个待定搜索项的搜索结果中提取统一资源定位符; 对每个统一资源定位符对应的网络资源进行下载,得到对应的搜索结果文本。6.一种确定搜索项的系统,其特征在于,包括 第一获取单元,用于获取待定搜索项集合;搜索...
【专利技术属性】
技术研发人员:于亮,张宇峰,
申请(专利权)人:北京金山软件有限公司,北京金山数字娱乐科技有限公司,
类型:发明
国别省市:11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。