A search system for multi user instant index: token repository for the document in the current version of the storage token set; a token server, the new version of the document was a token, and generate a new version of the document for the token set; instant index, the difference between the current version of the new version the identified for the document collection and the token for the document set is determined based on the token will be used to index the document and generate tokens, including the document will be used to index the token index variable; and time variant marker index associated with storing the generated index variant diary; the variant and the index server from time stamp update related index linked variants generated compared with the time mark specified by the index server A token that is used to index the document from the index variant diary to the index server.
【技术实现步骤摘要】
【国外来华专利技术】
本专利技术公开的技术总体上涉及信息取回计算机系统,更具体来说涉及具有用于即时索引的方法的多用户搜索系统。
技术介绍
计算机是用于在海量信息当中搜索相关信息的非常强有力的工具。索引是用于利用计算机高效地识别大量信息当中的感兴趣信息的常见机制。典型的索引是关键字到从中提取或导出所述关键字的信息文档的有组织映射。作为一个实例,世界上的公共可访问网页的索引可以把网页中的单词映射到包含该单词的网页子集。在实际的物理索引本身(例如存储在一台或多台计算机上的索引数据)与系统的用户之间,通常提供作为软件缓冲或层的搜索系统。实质上,搜索系统使得用户无需知道或者甚至关心底层索引细节。通常来说,来自用户的针对索引中的信息的所有请求都由搜索系统处理。举例来说,可以由搜索系统利用索引识别与用户的信息请求相关的文档,而完全不需要用户知道底层索引实现方式。通过这种方式,搜索系统为用户提供对于相关信息的访问,而无需关注信息如何被索引或访问。用于识别世界上的公共可访问网页当中的相关信息的一种众所周知的搜索系统是由GoogleInc.(MountainView,California)提供的GOOGLE因特网搜索引擎。搜索系统的一项功能是回答搜索查询(或者简称作“查询”)。查询可以被定义成包括由一个或多个搜索项构成的集合的逻辑表达式,并且导致识别出索引文档的一个子集。例如考虑对于来自因特网搜索引擎的信息请求的应对。在操作中,该请求通常由客户端系统作为一项或多项超文本传输协议或“HTTP”请求发出,以用于从服务器计算机上的索引取回特定的搜索结果(例如包含单词“大学”和“篮球”的所有因特网网页的 ...
【技术保护点】
一种系统,包括:一个或多个硬件处理器;存储用于文档的当前版本的令牌集合的令牌存储库;令牌化器服务器,其被配置成通过至少其中一个硬件处理器对文档的新版本进行令牌化,并且通过至少其中一个硬件处理器生成用于文档的新版本的令牌集合;即时索引器服务器,其被配置成基于所识别出的用于文档的新版本的令牌集合与用于文档的当前版本的令牌集合之间的差异,通过至少其中一个硬件处理器确定将用来对文档进行索引的一个或多个令牌,并且通过至少其中一个硬件处理器生成包括将用来对文档进行索引的所述一个或多个令牌的索引变种;索引变种日记,其被配置成与时间标记相关联地存储索引变种;以及索引变种服务器,其被配置成在与索引变种日记中的索引变种相关联的时间标记比由索引服务器指定的时间标记更近期的情况下,通过至少其中一个硬件处理器把将用来对文档进行索引的所述一个或多个令牌从索引变种日记中的索引变种提供到索引服务器。
【技术特征摘要】
【国外来华专利技术】2014.08.21 US 62/040,382;2014.11.26 US 14/555,1401.一种系统,包括:一个或多个硬件处理器;存储用于文档的当前版本的令牌集合的令牌存储库;令牌化器服务器,其被配置成通过至少其中一个硬件处理器对文档的新版本进行令牌化,并且通过至少其中一个硬件处理器生成用于文档的新版本的令牌集合;即时索引器服务器,其被配置成基于所识别出的用于文档的新版本的令牌集合与用于文档的当前版本的令牌集合之间的差异,通过至少其中一个硬件处理器确定将用来对文档进行索引的一个或多个令牌,并且通过至少其中一个硬件处理器生成包括将用来对文档进行索引的所述一个或多个令牌的索引变种;索引变种日记,其被配置成与时间标记相关联地存储索引变种;以及索引变种服务器,其被配置成在与索引变种日记中的索引变种相关联的时间标记比由索引服务器指定的时间标记更近期的情况下,通过至少其中一个硬件处理器把将用来对文档进行索引的所述一个或多个令牌从索引变种日记中的索引变种提供到索引服务器。2.根据权利要求1所述的系统,其中:即时索引器服务器还被配置成基于所识别出的用于文档的新版本的令牌集合与用于文档的当前版本的令牌集合之间的差异,通过至少其中一个硬件处理器确定将不会用来对文档进行索引的一个或多个令牌,并且通过至少其中一个硬件处理器生成包括将不会用来对文档进行索引的所述一个或多个令牌的索引变种;并且索引变种服务器还被配置成在与索引变种日记中的索引变种相关联的时间标记比由索引服务器指定的时间标记更近期的情况下,通过至少其中一个硬件处理器把将不会用来对文档进行索引的所述一个或多个令牌从索引变种日记中的索引变种提供到索引服务器。3.根据权利要求1所述的系统,其中,索引服务器还被配置成:通过至少其中一个硬件处理器在被发送到索引变种服务器的网络请求中发送所指定的时间标记;响应于发送网络请求,通过至少其中一个硬件处理器从索引变种服务器接收将用来对文档进行索引的所述一个或多个令牌;以及基于将用来对文档进行索引的所述一个或多个令牌,通过至少其中一个硬件处理器更新对文档进行索引的索引服务器处的索引。4.根据权利要求1所述的系统,还包括:适于耦合到令牌化器和即时索引器的消息队列;其中,令牌化器还被配置成响应于对文档的新版本进行令牌化并且为之生成令牌集合,通过至少其中一个硬件处理器将消息放置在消息队列中,所述消息包括文档的标识符;并且其中,即时索引器服务器被配置成通过至少其中一个硬件处理器把所述消息从消息队列中退出并且处理所述消息。5.根据权利要求1所述的系统,其中:索引变种日记还被配置成与文档所属的文档命名空间的标识符相关联地存储索引变种;索引变种服务器还被配置成基于与索引变种日记中的索引变种相关联的内容项目命名空间标识符,通过至少其中一个硬件处理器把索引变种日记中的索引变种识别成用于索引服务器;并且其中,索引服务器对属于所述内容项目命名空间的一个或多个文档进行索引。6.根据权利要求1所述的系统,其中:所述索引变种是第一索引变种;所述文档是第一文档;令牌存储库存储用于不是第一文档的第二文档的当前版本的令牌集合;令牌化器服务器还被配置成通过至少其中一个硬件处理器对第二文档的新版本进行令牌化,并且通过至少其中一个硬件处理器生成用于第二文档的新版本的令牌集合;即时索引器服务器还被配置成基于所识别出的用于第二文档的新版本的令牌集合与用于第二文档的当前版本的令牌集合之间的差异,通过至少其中一个硬件处理器确定将用来对第二文档进行索引的一个或多个令牌,确定第二文档的新版本是绕过文档版本还是非绕过文档版本,并且基于所述文档的新版本是绕过文档版本还是非绕过文档版本生成用于第二文档的新版本的第二索引变种,其中包括关于第二索引变种是绕过索引变种还是非绕过索引变种的规定;并且索引变种服务器还被配置成在第二索引变种是非绕过索引变种的情况下通过至少其中一个硬件处理器将第二索引变种提供到索引服务器,或者在所生成的索引变种是绕过索引变种的情况下不通过至少其中一个硬件处理器把所生成的索引变种提供到索引服务器。7.根据权利要求1所述的系统,其中:索引服务器还被配置成基于将用来对文档进行索引的所述一个或多个令牌,通过至少其中一个硬件处理器更新对文档进行索引的索引服务器处的索引;在对索引服务器处的索引进行更新之后,索引服务器处的索引包括基础索引和增量索引;在对索引服务器处的索引进行更新之后,基础索引包括用于文档的当前版本的令牌集合中的每一个令牌的索引条目,基础索引中的索引条目包括所述每一个令牌以及标识文档的记录列表;并且在对索引服务器处的索引进行更新之后,增量索引包括用于将用来对文档进行索引的所述一个或多个令牌当中的每一个令牌的索引条目,增量索引中的索引条目包括所述每一个令牌以及标识文档的记录列表。8.一种系统,包括:用于存储用于文档的当前版本的令牌集合的装置;用于对文档的新版本进行令牌化的装置;用于通过至少其中一个硬件处理器生成用于文档的新版本的令牌集合的装置;用于基于所识别出的用于文档的新版本的令牌集合与用于文档的当前版本的令牌集合之间的差异确定将用来对文档进行索引的一个或多个令牌的装置;用于生成包括将用来对文档进行索引的所述一个或多个令牌的索引变种的装置;用于把索引变种与时间标记相关联地存储在索引变种日记中的装置;以及用于在与索引变种日记中的索引变种相关联的时间标记比由索引服务器指定的时间标记更近期的情况下,把将用来对文档进行索引的所述一个或多个令牌从索引变种日记中的索引变种提供到索引服务器的装置。9.根据权利要求8所述的系统,还包括:用于基于所识别出的用于文档的新版本的令牌集合与用于文档的当前版本的令牌集合之间的差异确定将不会用来对文档进行索引的一个或多个令牌的装置;用于生成包括将不会用来对文档进行索引的所述一个或多个令牌的索引变种的装置;以及用于在与索引变种日记中的索引变种相关联的时间标记比由索引服务器指定的时间标记更近期的情况下,把将不会用来对文档进行索引的所述一个或多个令牌从索引变种日记中的索引变种提供到索引服务器的装置。10.根据权利要求8所述的系统,还包括:用于在来自索引服务器的...
【专利技术属性】
技术研发人员:S·格尔,F·查斯塔格诺,A·阿格拉瓦尔,
申请(专利权)人:卓普网盘股份有限公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。