当前位置: 首页 > 专利查询>微软公司专利>正文

包括使用可重用索引字段的对特征的索引和搜索制造技术

技术编号:7843342 阅读:131 留言:0更新日期:2012-10-13 01:42
本申请提供了包括使用可重用索引字段的对特征的索引和搜索。提供了包括相关联的系统、方法和其它实现的索引和搜索特征。一个实施例的计算系统被配置为对于不同承租人重用或重新确定物理索引字段以作为提供有效且可缩放的索引和搜索服务的部分。一个实施例的方法操作为提供包括许多可重用索引字段的经索引的数据结构,所述可重用索引字段被共享并被用于索引与多个承租人相关联的信息。还包括其他实施例。

【技术实现步骤摘要】

本申请涉及包括使用可重用索引字段的对特征的索引和搜索
技术介绍
索引方法被作为对搜索系统和技术进行优化的部分来用于管理复杂计算环境的信息以提供相关的搜索结果。许多当前的搜索引擎对于要索引的项的每个方面或属性使用不同的物理字段结构来对这些项进行索引,导致非常巨大和高度维护的数据结构。例如,典·型的技术报告可以具有多个属性,例如标题、统一资源定位符(URL)、主要内容、作者、最近编辑的日期和时间等一些示例。产品描述可以包括例如价格、大小、重量、颜色和口味等示例的属性。要索引和使用的不同类型的信息可以随着一个承租人到下一承租人的不同而显著不同,导致大量物理索引字段和相关联的索引的空区域。承租人可以意指承租和/或使用与其他人共享的基础结构但与其他承租人在逻辑上隔离的人或组织。相应地,当将搜索作为一种服务提供时,搜索系统需要认识到一个事实,即不同的消费者或承租人要索引不同类型的项。通常,搜索服务对于所有不同的承租人的所有的项的所有的属性的并集使用专用的物理结构,导致一个具有许多空洞(hole)和高数量的物理结构来处理所有各种属性的索引。一个解决方案是为每个承租人使用单独的索引,这导致比在同一索引中存储所有属性的并集时更大总数的物理结构。然而,当前的索引技术没有被配置为将物理索引字段重用(reuse)作为提供索引和搜索服务的部分。
技术实现思路
提供本
技术实现思路
以便以简化的形式介绍将在以下的具体实施例中进一步描述的一些概念。本
技术实现思路
并不旨在标识出所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。实施例提供了索引和搜索特征,但不局限于此。在一个实施例中,计算系统被配置为对于不同承租人重用或重新确定物理索引字段以作为提供索引和搜索服务的部分。一个实施例的方法操作为提供包括许多可重用索引字段的经索引的数据结构,所述可重用索引字段被共享并被用于索引与多个承租人相关联的信息。还包括其他实施例。通过阅读下面的详细描述并参考相关联的附图,这些及其它特点和优点将变得显而易见。可以理解,前述一般描述和以下详细描述均仅是说明性的,并且不限制所要求保护的本专利技术。附图说明图I是示例性计算环境的框图。图2描述了包括许多重用索引字段的示例性索引表示。图3A-3C描述了许多示例性的承租人索引集以及示例性的索引表示。图4是描述了作为搜索服务的部分来提供索引操作的示例性的过程的流程图。图5是描述了配置用于提供索引和搜索服务的示范性系统的组件的框图。图6描述了用于每承租人不同索引的解决方案的许多文件(资源)的差异。图7是示出用于实现此处所描述的各个实施例的示例性计算环境的框图。具体实施例方式图I是示范性计算环境100的框图,该环境包括提供索引、搜索和/或其他信息处理操作的处理、存储器以及其他组件/资源。环境100的组件包括用于爬行内容、添加元数据、产生索引表示以及提供搜索查询(不局限于此)的特征和功能性。如下所述,一个实施例的索引模型可被用于提供包括许多可重用索引字段的索引结构,其中,每个可重用索引字段被配置为包含每个承租人的相同数据类型的不同数据,但不局限于此。例如,环境100的组件可以操作以将不同承租人的相同数据类型路由或映射到同 一索引字段结构,以便将可排序的属性存储在同一物理索引字段中。在一个实施例中,环境100的组件使用每个承租人的模式模型以及从每个承租人模式到所定义的可重用索引字段的映射,因为每个承租人通常要求使用他们自己的特定项和/或少量唯一或承租人专用的属性。这样,所有相关联的承租人可以部分基于可重用字段索引模型来共享和重用与唯一的或承租人专用的属性相关联的减少的索引以及物理索引字段的有限集合。如下所述,根据一个实施例,环境100的组件对于多个承租人的不同属性自动使用相同物理字段,这显著地减少了相关联的索引的物理字段的总数。组件可以将特征(例如排序、细化器、范围搜索、查询等)的项属性或要求用作到可用的可重用物理索引字段的映射操作的部分。这样,组件可以直接使用索引技术,因为映射对于与索引服务相关联的所有承租人都映射到相同类型的字段。如图I所示,示范性环境100包括与一个或多个客户机104和/或一个或多个信息储存库106通信上耦合的搜索引擎102。在一个实施例中,信息储存库106被用于提供与多个承租人站点集合、站点、场内容(farm content)等相关联的经爬行的数据。在一个实施例中,环境100包括可用于提供包括搜索引擎102的搜索服务的共享服务场,所述搜索引擎102包括对于多个相关联的承租人使用和重用或重新确定同一物理索引字段的索引特征。如下所述,映射组件108包括用于将一个或多个储存库106的信息映射到许多可重用索引字段的许多映射。搜索引擎102可以包括利用可重用索引字段的属性来存储与多个承租人相关联的信息的索引特征。一个实施例的每个可重用索引字段可以与多个承租人相关联,以便映射将多个承租人的承租人专用信息(例如重叠和部分重叠的受管属性)映射到对应的可重用索引字段。当索引承租人专用属性和相关联的信息时,一个实施例的每个可重用索引字段可以被用作提供索引操作的部分,所述索引操作与每个承租人的特定数据类型和/或特征相关联(例如参见图2)。在一个实施例中,通过将每个可重用索引字段作为具有代表性的数据结构的不同文件来存储以维护所述索引。因此,映射组件108可以被配置为包括与承租人受管属性模式的单个实例相关联的映射或与多承租的实现的多个模式相关联的映射。继续参考图1,一个实施例的搜索引擎102包括用于处理任意数目的可搜索项的索引特征,包括但不限于网页、任意类型的文档、电子表格、音乐文件、图片文件、视频文件、联系、列表以及列表项、任务、日历条目、任意类型的内容、元数据、元-元数据等。一个实施例的搜索引擎102包括用于以下操作的特征(但不限于)基于原始文本输入创建索引和/或通过使用索引返回查询的结果;从各种客户机、爬行器、连接器等接收可被处理和索引的内容;和/或分析包括文档和其他内容的信息以产生文本输出,例如包括作为示例的文档标题、文档内容、正文、位置、大小等的属性列表。如下所述,搜索引擎102的索引特征可结合可细化的、可排序的、可检索的和/或其他可管理的属性来作为提供到所关联的可重用索引字段的合适映射的部分来使用。例如,搜索引擎102可以使用索引特征来部分基于可细化的、可排序的、可查询的和/或可检索的字段类型中的一个或多个,将多个承租人的承租人信息映射到一个或多个可重用索引字段。一个实施例的可细化的字段类型可被用于将管理可细化的属性作为细化查询或 某一结果的部分。例如,可细化字段类型可被用作通过使用聚集统计数据(例如使用查询结果中的受管属性值的某个分布)来钻入(drill into)查询结果的过程的部分。作为一个示例,可细化的属性可以被用作在包括出售的汽车的联网储存库上对“汽车”的搜索的部分。这样,可细化属性可被用于返回对价格属性的细化器,如在下面的表I中所述。表I 细化(价格范围($)) 汽车而胃 0-10003 ~1001-500045 5001-10000534 ~10001-10000024 ~> 10000015如在表I中所示,可细化的属性或细化器返回了价格在相关联本文档来自技高网...
包括使用可重用索引字段的对特征的索引和搜索

【技术保护点】

【技术特征摘要】
2011.03.11 US 13/045,7901.一种系统(100),其被配置成 提供包括许多可重用的索引字段的索引服务,每个可重用的索引字段具有对应的字段类型; 索引与多个承租人和承租人专用的属性相关联的索引信息,包括部分基于对应的字段类型和承租人专用的属性来使用所述许多可重用的索引字段;以及 存储所述经索引的信息。2.如权利要求I所述的系统(100),其特征在于,进一步被配置为使用包括可搜索、可查询、可排序、可细化和可检索的字段类型中的一个或多个的所述许多可重用的索引字段来提供索引服务。3.如权利要求I所述的系统(100),其特征在于,进一步被配置为提供所述索引服务,包括部分基于可查询的字符串、可查询的整数、可查询的日期/时间、可查询的十进制、可查询的双精度型、可排序和可细化的整数、可排序和可细化的日期/时间、可排序和可细化的十进制以及可排序和可细化的双精度型中的一个或多个,用多承租人信息填充所述许多可重用的索引字段。4.如权利要求I所述的系统(100),其特征在于,进一步被配置为提供所述索引服务,包括使用所述许多可重用的索引字段来管理一个或多个重叠的或部分重叠的承租人的属性。5.如权利要求I所述的系统(100),其特征在于,进一步被配置为部分基于可搜索的项字段映射、可查询的项字段映射、可排序的和可细化的项字段映射以及可检索的项字段映射中的一个或多个,将与承租人专用的属性相关联的信息映射到对应的可重用的索引字段。6.一种使用搜索引擎(102)的方法,包括: 重新使用与...

【专利技术属性】
技术研发人员:H·G·索罕O·弗莱德博格E·M·罗克M·苏赛格
申请(专利权)人:微软公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1