一种搜索方法,包括以下步骤:设置网页或网站的主题分值;接收限制主题的搜索请求;根据搜索请求搜索满足主题分值的网页或在满足主题分值的网站内搜索;返回搜索结果。上述搜索方法通过设着网页或网站的主题分值,在接收到用户限制主题的搜索请求时,根据搜索请求搜索满足主题分值的网页或在满足主题分值的网站内搜索并返回搜索结果,使得获得的搜索结果与用户所需的主题密切相关,使用户快速、方便地获得所需的搜索结果。此外,还有必要提供一种根据用户的搜索主题进行搜索的搜索系统。
【技术实现步骤摘要】
搜索方法及搜索系统
本专利技术涉及计算机
,尤其是一种搜索方法及搜索系统。
技术介绍
计算机网络技术的发展极大的提高了人们获取信息的便利性。计算机网络 中存储了海量的信息,为了便于人们查找到自己所需的信息,搜索引擎被广泛 使用。人们通过输入关键词,即可找到包含该关键词的网页。然而,正由于计算机网络中数据量非常庞大,通过搜索引擎搜索获得的满 足条件的搜索结果通常也是非常多,有时甚至多达数百万,这其中就有相当一 部分网页虽然包含用户输入的关键词,但是与用户所要了解的信息无关。例如, 当用户搜索"三亚景点"的时候,目的是为了搜索"旅游"这个主题的内容, 但是涉及到"三亚,,"景点"这两个关键字的站点/网页也有很多是和"旅游"无 关的,这些无关的网页将浪费用户的时间并分散用户的精力。那么如果返回的 结果的站点/网页都和"旅游"相关的话,就可以很好的提高用户体验。为了解决上述问题, 一般的搜索引擎都提供了限制关键词的位置(例如限制关键词在网页的标题中、在网页的URL中、在某些指定的网站中)进行搜索。 虽然这种方式可以提高搜索结果内容的相关度,但是用户因此会将搜索的面限 制得很窄,不利于用户获取更多有价值的信息。
技术实现思路
基于此,有必要提供一种根据用户的搜索主题进行搜索的搜索方法。 一种搜索方法,包括以下步骤设置网页或网站的主题分值;接收限制主题的搜索请求;根据搜索请求搜索满足主题分值的网页或在满足主题分值的网站内搜索;返回搜索结果。优选地,所述设置网页或网站的主题分值的步骤包括如下步骤获取种子页面的主题分值;计算网页的主题分值;计算网站的主题分值;将所述网页的主题分值及网站的主题分值作为搜索索引的一部分。优选地,所述计算网页的主题分值包括如下步骤获取父页面的主题分值; 计算子页面与主题及父页面的关联度;根据父页面的主题分值和所述关联度计 算子页面的主题分值。优选地,所述计算子页面的主题分值还包括判断迭代次数是否超过预定值 的步骤,如果未超过所述预定值,则重复执行所述获取父页面的主题分值;计 算子页面与主题及父页面的关联度;根据父页面的主题分值和关联度计算子页 面的主题分值的步骤。优选地,所述子页面与父页面的关联度根据父页面的链接文字和子页面的 标题或根据子页面与父页面的内容的相关程度进行计算获得,所述子页面与主 题的关联度根据所述链接文字和子页面的标题、内容命中该主题下的核心词的 词表中的词的数量计算获得。优选地,所述计算网站的主题分值包括如下步骤统计网站各网页的主题 分值;将主题分值之和或者网站各网页的平均主题分值作为所述网站的主题分 值。此外,还有必要提供一种根据用户的搜索主题进行搜索的搜索系统。一种搜索系统,包括输入模块,用于接收限制主题的搜索请求;主题分 值模块,用于设置网页或网站的主题分值;索引模块,与所述主题分值模块相 连,用于存储所述主题分值的信息;搜索模块,与所述输入模块及索引模块相 连,根据所述搜索请求搜索满足主题分值的网页或在满足主题分值的网站内搜 索;输出模块,用于输出搜索结果。优选地,所述主题分值模块包括种子页面设定单元,用于选定种子页面 及设定种子页面的主题分值;页面关系追踪单元,与所述种子页面设定单元相 连,追踪与所述种子页面链接的网页;关联度计算单元,与所述页面关系追踪 单元相连,根据所述页面关系追踪单元获得的网页计算子页面与主题及父页面 的关联度;主题分值计算单元,与所述关联度计算单元相连,根据父页面的主 题分值和所述关联度计算子页面的主题分值。优选地,所述子页面与父页面的关联度根据父页面的链接文字和子页面的标题或根据子页面与父页面的内容的相关程度进行计算获得,所述子页面与主 题的关联度根据所述链接文字和子页面的标题、内容命中该主题下的核心词的 词表中的词的数量计算获得。优选地,所述主题分值计算单元还用于统计网站各网页的主题分值;将主 题分值之和或者网站各网页的平均主题分值作为所述网站的主题分值。上述搜索方法通过设着网页或网站的主题分值,在接收到用户限制主题的 搜索请求时,根据搜索请求搜索满足主题分值的网页或在满足主题分值的网站 内搜索并返回搜索结果,使得获得的搜索结果与用户所需的主题密切相关,使 用户快速、方便地获得所需的搜索结果。附图说明图1为搜索方法的流程图2为设置网页或网站的主题分值的详细流程图3为计算子页面的主题分值的详细流程图4为搜索系统的模块图5为主题分值才莫块的结构示意图6为网页链"l妄关系的示意图。具体实施方式在以下实施方式中,对网页或网站的主题分值进行计算,在用户输入搜索 请求时,根据用户的搜索主题在满足主题分值的网页或网站内搜索,便于用户 获得所需的信息。如图1所示,其为搜索方法的流程图。首先,步骤SllO,设置网页或网站 的主题分值。网页的主题分值可以由网页的提供商设置,也可以由搜索引擎设 定。主题分值的多少可以人为主观设定;也可以由计算才几依据某一主题所涉及 的关键词的数量、与某一主题网页的关联度等计算获得,并且依据网页之间的 链接来传递各网页的主题分值。在优选的实施方式中,选用计算机计算主题分 值,便于客观地获得主题分值。网站的主题分值可以依据网站所包含的网页的主题分值来确定。本实施方式中,利用搜索引擎搜集信息的过程来获得网页或 网站的主题分值。搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛(spider)的自动搜索机器人程序来连上每一个网页上的超连结。机器人 程序根据网页链到其他中的超链接,就像日常生活中所说的"一传十,十传 百……" 一样,从少数几个网页开始,连到数据库上所有到其他网页的链接。 理论上,若网页上有适当的超链接,机器人便可以遍历绝大部分网页。利用这 种链接关系,如果设置起始网页的主题分值,再比较起始网页和链接网页,才艮 据起始网页的主题分值和链接网页的关联度设置链接网页的主题分值,即可获 得绝大部分网页的主题分值。步骤S120,接收限制主题的搜索请求。用户通过搜索引擎的用户界面输入 搜索的关键词,选择或者输入主题之后即可产生限制主题的搜索请求,该搜索 请求被搜索引擎接收以便进行搜索。步骤S130,根据搜索请求搜索满足主题分值的网页或在满足主题分值的网 站内搜索。搜索引擎在搜集信息的过程获得的主题分值可以作为其建立索引的 一部分。搜索引擎整理信息的过程称为"建立索引"。搜索引擎不仅要保存搜集 起来的信息,还要将它们按照一定的规则进行编排。这样,搜索引擎就不用重 新翻查它所有保存的信息而迅速找到所要的资料。信息按规则存放在搜索引擎 的数据库中,可以极大地提高搜索的效率。用户向搜索引擎发出限制主题的搜 索请求后,按照用户的要求检查自己的索引,查找符合要求的网页。搜索范围 可以限于主题分值大于某 一预定值的网页或网站内,同时搜索的结果可以按主 题分值进行排序。步骤S140,返回搜索结果。将搜索出的结果返回给用户所在的客户端。目 前,搜索引擎返回主要是以网页链接的形式提供的,通过这些链接,用户便能 到达含有自己所需资料的网页。通常搜索引擎会在这些链接下提供一小段来自 这些网页的摘要信息以帮助用户判断此网页是否含有自己需要的内容。上述搜索方法通过设着网页或网站的主题分值,在接收到用户限制主题的 搜索请求时,根据搜本文档来自技高网...
【技术保护点】
一种搜索方法,其特征在于,包括以下步骤: 设置网页或网站的主题分值; 接收限制主题的搜索请求; 根据搜索请求搜索满足主题分值的网页或在满足主题分值的网站内搜索; 返回搜索结果。
【技术特征摘要】
【专利技术属性】
技术研发人员:王顼,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:94[中国|深圳]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。