【技术实现步骤摘要】
【国外来华专利技术】背景根据文档与给定搜索查询的相关性来对文档排序的排序函数是已知的。在本领域中继续努力开发为给定搜索查询提供比由搜索引擎使用已知排序函数生成的搜索结果更好的搜索结果的排序函数。概述在此所描述的特别地是用于确定网络上的给定文档的文档相关性得分的各种技术。文档相关性得分经由包括一个或多个查询无关组件的排序函数来生成,其中至少一个查询无关组件包括偏离点击距离(biased click distance)参数,该参数考虑了网络上的多个文档的偏离点击距离值。排序函数可以由搜索引擎用来基于多个文档的文档相关性得分按顺序(通常是降序)对多个文档排序。提供本概述一般以简化的形式向读者介绍在“详细描述”一节中所描述的一个或多个选择概念。本概述并非旨在标识所要求保护的主题的关键和/或必需特征。附图简述图1表示示出响应于由用户输入的搜索查询产生已排序的搜索结果的方法的示例性步骤的示例性逻辑流程图;图2是用于实现在此公开的方法和过程的示例性操作环境的一些主要组件的框图;图3描述了标识网络空间中的文档、文档之间的链接、具有分配的偏离点击距离值的权威节点和具有计算的偏离点击距离值的非权威节点的的示例性网图;图4A-4B表示示出为网图上的节点分配并生成偏离点击距离值的方法中的示例性步骤的逻辑流程图;图5A-5B表示示出为网图上非权威节点生成偏离点击距离值的方法中的示例性步骤的逻辑流程图;以及图6表示使用包含偏 ...
【技术保护点】
一种其上存储有用于对网络上的文档排序的计算机可执行指令的计算机可读介质,所述计算机可执行指令利用包括一个或多个查询无关分量的排序函数,其中至少一个查询无关分量包括偏离点击距离参数,所述偏离点击距离参数考虑了所述网络上的每个文档的偏离点击距离值。
【技术特征摘要】
【国外来华专利技术】US 2005-8-15 11/206,2861.一种其上存储有用于对网络上的文档排序的计算机可执行指令的计算机可
读介质,所述计算机可执行指令利用包括一个或多个查询无关分量的排序函数,其
中至少一个查询无关分量包括偏离点击距离参数,所述偏离点击距离参数考虑了所
述网络上的每个文档的偏离点击距离值。
2.如权利要求1所述的计算机可读介质,其特征在于,一偏离点击距离值被
分配给包括总共N个文档的网络上的m个权威文档,其中m大于或等于2且小于
N。
3.如权利要求2所述的计算机可读介质,其特征在于,所述分配的偏离点击
距离值中的至少两个相互不同。
4.如权利要求1所述的计算机可读介质,其特征在于,所述排序函数还包括
至少一个查询无关分量,所述查询无关分量包括考虑了所述网络上的每条边的边值
的边值参数,其中一个或多个边值是除1之外的数字。
5.如权利要求4所述的计算机可读介质,其特征在于,所述边值彼此相等并
等于除1之外的数字。
6.如权利要求4所述的计算机可读介质,其特征在于,所述边值彼此相等且
等于或大于最初被分配给一个或多个权威文档的最高偏离点击距离值。
7.如权利要求4所述的计算机可读介质,其特征在于,所述至少一个查询无
关分量包括所述偏离点击距离参数和所述边值参数两者。
8.如权利要求1所述的计算机可读介质,其特征在于,还包括用于将由所述
排序函数生成的得分分配给所述网络上的每个文档的计算机可执行指令,所述得分
被用来以升序或降序对文档排序。
9.如权利要求7所述的计算机可读介质,其特征在于,所述每个文档的得分
是使用以下公式生成的:
其中:
wtf′表示加权的项频率,
N表示所述网络上的文档数目,
n表示包含查询项的文档数目,
wcd表示查询无关分量的权重,
bcd表示点击距离的权重,
bud表示URL深度的权重,
CD表示文档的计算的点击距离或分配的偏离点击距离,
kew表示与边权重相关的调整常数,
UD表URL深度,以及
kcd和k1是常数。
10.如权利要求1所述的计算机可读介质,其特征在于,还包括用于接受由
用户输入的搜索查询、进行对网络上的文档的搜索以生成包括多个文档的搜索结
果、使用所述排序函数来对所述搜索结果的多个文档排序以生成经排序的搜索结
果、以及将所述经排序的搜索结果显示给用户的计算机可执行指令。
11.一种计算系统,所述计算系统包含可在所述计算系统上使用的至少一个
应用程序模块,其中所述至少一个应用程序模块包括从如权利要求1所述的计算机
可读介质载入到其上的应用程序代码。
12.一种为网络上的文档确定文档相关性得分的方法,所述方法包括以下步
骤:
储存网络上的文档以及关于文档的链接信息;
从所述文档和链接信息生成...
【专利技术属性】
技术研发人员:D梅耶左,H扎拉格扎,
申请(专利权)人:微软公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。