当前位置: 首页 > 专利查询>孙燕群专利>正文

基于用户参与的搜索引擎排序方法技术

技术编号:9794596 阅读:137 留言:0更新日期:2014-03-21 19:19
本发明专利技术涉及一种基于用户参与的搜索引擎排序方法,属于软件技术领域。该方法基于搜索引擎排序系统,搜索结果的显示列表上用户通过表达赞同、喜欢、不赞同、反对等意见针对全部的信息及检索结果评分,依据搜索结果的分值,在下一次搜索结果的时候,会自动按照分值的高低排序,分数高的排在前面,并设置有防止恶意评分程序。该方法实施所建立的系统包括用户、搜索引擎排序系统、模型处理系统和输出系统。本发明专利技术方法可以加强用户的参与,针对搜索信息进行意见表达,并供其他用户参考,从而能够有效地提高搜索质量,便于用户参考意见进行选择,从而有效地减少了用户的搜索查找时间,提高了办事效率和获知信息的能力。

【技术实现步骤摘要】
基于用户参与的搜索引擎排序方法
本专利技术涉及一种基于用户参与的搜索引擎排序方法,属于软件

技术介绍
中国互联网络信息中心调查报告指出,有82.5%的网民经常使用搜索引擎,83.4%的用户通过搜索引擎得知新网站。可见,搜索引擎在大家日常的网络生活中发挥了重要作用。一个优秀的搜索引擎能从巨量的、形如垃圾的信息中发现真正的知识,通过对信息的甄别、加工、提纯,带来信息价值的提升。然而由于当今搜索引擎相关性排序算法并不完善,用户通常需要从大量的返回结果中手工挑选相关网页,搜索引擎的导航功能没有发挥明显优势。在搜索引擎发展的初期,搜索结果的排列只是根据搜索引擎在数据库中找到匹配网页的先后次序,不保证排在前面的网页与用户查询的相关性更大,因此不能帮助用户从过载的海量信息中快速地选取真正相关的信息。目前搜索引擎访问的网页数量已达到上十亿的规模,通常搜索结果包含成千上万的网页,即便这些网页都是用户所需要的,用户也不可能浏览所有的网页。如何将更相关的网页排在前面,减少用户浏览网页的数目,帮助其快速找到需要的信息,是一项很有意义且富有挑战性的工作。用户通常只关心搜索引擎返回的排在前面的文档。因此研究搜索引擎的相关性排序算法,将用户期望的结果排列在前面,显得越来越重要。搜索引擎不仅需要返回检索结果,而且应该对这些结果进行再加工,判断哪些更符合用户搜索意图,将用户最感兴趣的文档排列在前面,方便用户在最短时间内找到需要的信息,提高搜索引擎的用户满意度。这便是搜索引擎的相关性原则,已被作为搜索引擎最基本原则之一。搜索引擎的相关性排序模型包含布尔模型,向量空间模型,概率模型,超链接模型,自学习排序模型。布尔模型建立在经典集合论和布尔代数的基础上,根据文档中是否出现关键词来判断文档是否相关,所有相关文档与查询的相关程度都是一样的,所以不支持相关性排序。向量空间模型将文档和用户查询分别转化为向量形式,计算两个向量的夹角余弦,并按照递减的顺序排列文档。概率模型通过估计文档与查询相关联的概率,根据关联概率对所有文档进行排序。超链接模型根据网页之间相互的超链接计算网页排名,从链接数目和链接页面的质量判断网页的级别。自学习排序模型将机器学习的方法运用到搜索引擎相关性排序问题,解决了以往模型的许多不足之处。它根据训练样本学习排序模型,再将排序模型预测与查询相关的文档排序。目前,不同的搜索引擎使用了不同的相关度排序方法。比较流行的有两类:超链接分析法,即一个网页被链接的次数越多而且链接的站点越权威就说明此网页的质量越高;词频统计法,即网页文档中出现查询词的频率越高,其排序就越靠前。此外,还有点击率法,即网页被点击的次数越多,相关度越高。任何一个搜索引擎的目的就是更快速地响应用户搜索,把满足用户需求的搜索结果反馈给搜索用户。能否把与用户检索需求最相关的高质量文档纳入结果排序的前面是衡量搜索引擎性能的关键技术之一。
技术实现思路
本专利技术的目的在于提供一种基于用户参与的搜索引擎排序方法,依据用户参与对搜索列表的评价,并对评价结果打分评比参与排序,方便根据用户参与评价的结果查找相应的结果,方便人们根据需要使用。为了实现上述目的,本专利技术的技术方案如下。一种基于用户参与的搜索引擎排序方法,该方法基于搜索引擎排序系统,搜索结果的显示列表上用户通过表达赞同、喜欢、不赞同、反对意见针对检索结果评分,依据搜索结果的分值,在下一次搜索结果的时候,会自动按照分值的高低排序,分数高的排在前面,并设置有防止恶意评分程序。该方法实施所建立的系统包括用户、搜索引擎排序系统、模型处理系统和输入输出系统,其中,(1)用户分别为注册用户和非注册用户,个性化服务主要针对注册用户,非注册用户具有搜索引擎排序功能。搜索引擎排序系统本身较为复杂性,为保证搜索引擎排序质量和实时性,要求构建合理的搜索引擎排序系统。(2)搜索引擎排序系统采用基于用户参与的方法,属于完全个性化搜索引擎排序,为用户提供个性化的服务。其中,搜索引擎排序系统需要管理网站信息、用户注册信息、评分等数据以及搜索引擎排序方法、模型、结果等内容。考虑到搜索引擎排序方法运行效率和搜索引擎排序实时性的要求,搜索引擎排序系统包括在线实时搜索引擎排序和模型处理两部分。在线是对于访问用户而言。模型处理不实时进行,从而有利于提高搜索引擎排序系统的执行效率。搜索引擎排序系统适用于一般网站,根据客户注册信息采集用户个人信息,根据用户对不同显示列表评价,预测其感兴趣的列表内容。搜索引擎排序系统目的是方便用户选择评价,促进搜索选择。由于不同的搜索引擎排序技术在特定类型的搜索引擎排序系统中,会获得较好的效果,具有一定的适用性范围。对于搜索结果的显示列表来说,一般不能通过规范的形式全面描述出,而是需要依据用户感受描述。用户选择一种搜索结果的显示列表后,根据用户一系列信息,用户可以表达赞同、喜欢、不赞同、反对等意见。(3)模型处理系统主要根据搜索引擎排序方法处理数据得到模型,当用户浏览网页时,在线搜索引擎排序会依据模型结果实时输出搜索引擎排序列表反馈给用户;在线搜索引擎排序部分根据不同的情况,执行不同的搜索引擎排序策略;特别是对于新用户,采用离线计算模型,产生模型输出结果;所述在线搜索引擎排序过程如下:在线推荐主要的功能是分析搜索引擎排序的类型,选择相应的算法模型的输出结果与输入数据结合预测出搜索引擎排序结果,并反馈给用户,具体过程为:选择模型:搜索引擎排序系统根据搜索引擎排序的类型,选择不同模型,主要包括三种搜索引擎排序:①评分用户的搜索引擎排序:如果是系统中已存在评分的用户,根据其评分数据、列表数据以及用户数据选择用于分类的模型;②新列表搜索引擎排序:新列表是指原有搜索引擎排序系统不存在有关该列表的任何用户评分数据以及列表特征数据;对于新列表的搜索引擎排序根据输入的列表特征运用基于内容的分类模型进行分析;如果用户对所有的搜索结果都不满意,或者没有他想要的信息,用户自觉提供添加他觉得应该出现的搜索信息;此添加信息将在某一页面位置出现;搜索结果的右侧或者在分值高的搜索结果后面列表出来,同时此添加结果同样参与其他用户的评分,分值决定其排列顺序;③新用户搜索引擎排序:新用户是指搜索引擎排序系统中不存在其任何评分数据,包括有两种类型的用户,一种是新注册的用户,另一种是注册但没有进行过评分的用户;对于新用户的搜索引擎排序采用依据用户信息的模型;预测搜索引擎排序:根据模型的输出结果和输入的数据进行计算,预测搜索引擎排序结果;在线搜索引擎排序采用的是实时搜索引擎排序模式的进行搜索引擎排序;当用户登录搜索引擎排序系统网站,浏览页面时,直接读取用户评分数据,预测用户感兴趣的列表,直接反馈给用户其最可能感兴趣的列表;结合基于用户信息的混合搜索引擎排序算法实现两种类型的搜索引擎排序;其中,近邻聚类结合基于内容和用户信息的混合搜索引擎排序是根据列表信息和用户评分数据,形成用户偏好,然后进行近邻聚类,将相似用户进行聚类,然后结合测试用户信息预测,产生用户搜索引擎排序列表;另一种是基于用户信息的搜索引擎排序算法实现对新用户的搜索引擎排序,根据新用户信息和原有用户信息加权使用支持向量机预测新用户评分,产生新用户列表搜索引擎排序列表,供用户使用。(4)输入输出系统:个本文档来自技高网
...
基于用户参与的搜索引擎排序方法

【技术保护点】
一种基于用户参与的搜索引擎排序方法,其特征在于:该方法基于搜索引擎排序系统,搜索结果的显示列表上用户通过表达赞同、喜欢、不赞同、反对等意见针对全部的信息及检索结果评分,依据搜索结果的分值,在下一次搜索结果的时候,会自动按照分值的高低排序,分数高的排在前面,并设置有防止恶意评分程序;该方法实施所建立的系统包括用户、搜索引擎排序系统、模型处理系统和输出系统,所述:(1)用户分别为注册用户和非注册用户,个性化服务主要针对注册用户,非注册用户具有搜索引擎排序功能;(2)搜索引擎排序系统采用基于用户参与的方法,属于完全个性化搜索引擎排序,为用户提供个性化的服务;搜索引擎排序系统管理网站信息、用户注册信息、评分等数据以及搜索引擎排序方法、模型、结果等内容;系统包括在线实时搜索引擎排序和模型处理两部分;在线是对于访问用户而言,模型处理不实时进行;搜索引擎排序系统适用于一般网站,根据客户注册信息采集用户个人信息,根据用户对不同显示列表评价,预测其感兴趣的列表内容;用户选择一种搜索结果的显示列表后,根据用户一系列信息,用户能表达赞同、喜欢、不赞同、反对等意见;(3)模型处理系统主要根据搜索引擎排序方法处理数据得到模型,当用户浏览网页时,在线搜索引擎排序会依据模型结果实时输出搜索引擎排序列表反馈给用户;在线搜索引擎排序部分根据不同的情况,执行不同的搜索引擎排序策略;特别是对于新用户采用不同搜索引擎排序方法,在一定程度上解决冷启动问题,提高搜索引擎排序质量;(4)输入输出系统:个性化搜索引擎排序系统主要的功能是收集用户信息、网站信息以及对网站的评价信息,经过模型处理,为用户提供搜索引擎排序列表。...

【技术特征摘要】
1.一种基于用户参与的搜索引擎排序方法,其特征在于:该方法基于搜索引擎排序系统,搜索结果的显示列表上用户通过表达赞同、喜欢、不赞同、反对意见针对检索结果评分,依据搜索结果的分值,在下一次搜索结果的时候,会自动按照分值的高低排序,分数高的排在前面,并设置有防止恶意评分程序;该方法实施所建立的系统包括用户、搜索引擎排序系统、模型处理系统和输入输出系统,所述:(1)用户分别为注册用户和非注册用户,个性化服务主要针对注册用户,非注册用户具有搜索引擎排序功能;(2)搜索引擎排序系统采用基于用户参与的方法,属于完全个性化搜索引擎排序,为用户提供个性化的服务;搜索引擎排序系统管理网站信息、用户注册信息、评分等数据以及搜索引擎排序方法、模型、结果内容;搜索引擎排序系统包括在线实时搜索引擎排序和模型处理两部分;在线是对于访问用户而言,模型处理不实时进行;搜索引擎排序系统适用于一般网站,根据客户注册信息采集用户个人信息,根据用户对不同显示列表评价,预测其感兴趣的列表内容;用户选择一种搜索结果的显示列表后,根据用户一系列信息,用户能表达赞同、喜欢、不赞同、反对意见;(3)模型处理系统主要根据搜索引擎排序方法处理数据得到模型,当用户浏览网页时,在线搜索引擎排序会依据模型结果实时输出搜索引擎排序列表反馈给用户;在线搜索引擎排序部分根据不同的情况,执行不同的搜索引擎排序策略;特别是对于新用户,采用离线计算模型,产生模型输出结果;所述在线搜索引擎排序过程如下:在线推荐主要的功能是分析搜索引擎排序的类型,选择相应的算法模型的输出结果与输入数据结合预测出搜索引擎排序结果,并反馈给用户,具体过程为:选择模型:搜索引擎排序系统根据搜索引擎排序的类型,选择不同模型,主要包括三种搜索引擎排序:①评分用户的搜索引擎排序:如果是系统中已存在评分的用户,根据其评分数据、列表数据以及用户数据选择用于分类的模型;②新列表搜索引擎排序:新列表是指原有搜索引擎排序系统不存在有关该列表的任何用户评分数据以及列表特征数据;对于新列表的搜索引擎排序根据输入的列表特征运用基于内容的分类模型进行分析;如果用户对所有的搜索结果都不满意,或者没有他想要的信息,用户自觉提供添加他觉得应该出现的搜索信息;此添加信息将在某一页面位置出现;搜索结果的右侧或者在分值高的搜索结果后面列表出来,同时此添加结果同样参与其他用户的评分,分值决定其排列顺序;③新用户搜索引擎排序:新用户是指搜索引擎排序系统中不存在其任何评分数据,包括有两种类型的用户,一种是新注册的用户,另一种是注册但没有进行过评分的用户;对于新用户的搜索引擎排序采用依据用户信息的模型;预测搜索引擎排序:根据模型的输出结果和输入的数据进行计算,预测搜索引擎排序结果;在线搜索引擎排序采用的是实时搜索引擎排序模式的进行搜索引擎排序;当用户登录搜索引擎排序系统网站,浏览页面时,直接读取用户评分数据,预测用户感兴趣的列表,直接反馈给用户其最可能感兴趣的列表;结合基于用户信息的混合搜索引擎排序算法实现两种类型的搜索引擎排序;其中,近邻聚类结合基于内容和用户信息的混合搜索引擎排序是根据列表信息和用户评分数据,形成用户偏好,然后进行近邻聚类,将相似用户进行聚类,然后结合测试用户信息预测,产生用户搜索引擎排序列表;另一种是基于用户信息的搜索引擎排序算法实现对新用户的搜索引擎排序,根据新用户信息和原有用户信息加权使用支持向量机预测新用户评分,产生新用户列表搜索引擎排序列表,供用户使用;(4)输入输出系统:个性化搜索引擎排序系统主要的功能是收集用户信息、网站信息以及对网站的评价信息,经过模型处理,为用户提供搜索引擎排序...

【专利技术属性】
技术研发人员:孙燕群
申请(专利权)人:孙燕群
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1