【技术实现步骤摘要】
集群检索平台中的自动容灾恢复方法及系统
本申请涉及容灾恢复
,特别是涉及集群检索平台中的自动容灾恢复方法及系统。
技术介绍
对于搜索引擎而言,在索引量和搜索量大到一定程度的时候,索引更新的效率会逐渐降低,并且服务器的压力也会逐渐升高,因此,基本上整个搜索引擎的利用率可以说是越来越低了,由此,分布式检索技术便应运而生了。基于服务器集群的检索系统便是分布式检索技术中的一种,这种系统将检索业务部署到多个节点中。Solr是一个独立的企业级搜索应用解决方案,在Solr的方案中,每个搜索应用会对应一个SolrCore的抽象,可以根据各个检索业务的业务规模合理分配承载SolrCore的机器,并实现M*N的索引模型。在这种M*N的索引模型下,承载同一检索业务的各台机器在逻辑上可以组成一个M*N(M行N列)的矩阵。当在该集群中时创建一个检索业务时,可以根据业务规模等为其选择矩阵的规模(也即,确定出M与N的取值),然后,将检索业务的索引文件按一定的规则切分成N个分片,将各个分片分别部署到矩阵中水平向的各个不同的机器中,同样在此切分规则之下,对数据的访问请求也将按此规则分发到不同的机器中;同时,矩阵中位于同一列上的各个机器可以形成一个副本集,也即同一列的各个机器中保存有相同的索引文件备份,这样可以将来自应用服务器的请求访问(requestvisit)得以均匀的分布在同一列的各台机器上,用以减缓单台服务器在请求负载上的压力。也就是说,对于一个检索业务而言,在M*N的索引模型下,将会存在N个分片,每个分片存在M个副本,通过这种业务的划分以及冗余机制,可以实现负载均 ...
【技术保护点】
一种集群检索平台中的自动容灾恢复方法,其特征在于,所述集群检索平台包括中心节点以及用于提供检索服务的检索节点,所述方法包括:在所述中心节点中生成各个检索节点的抽象,在所述检索节点的抽象中创建关于该检索节点的第一数据结构,并分别为该检索节点承载的各个副本创建第二数据结构;在所述第一动态信息数据结构中保存所述检索节点上传的当前机器状态信息,在各个第二数据结构中保存所述检索节点上传的各个副本的当前状态信息;根据所述当前机器状态信息和/或各个副本的当前状态信息,判断是否存在需要进行恢复的副本;如果存在,则根据所述当前机器状态信息以及各个副本的当前状态信息,为所述需要进行恢复的副本选择目标检索节点;将所述需要进行恢复的副本对应的索引文件拷贝到所述目标检索节点中,由所述目标检索节点根据所述索引文件提供检索服务。
【技术特征摘要】
1.一种集群检索平台中的自动容灾恢复方法,其特征在于,所述集群检索平台包括中心节点以及用于提供检索服务的检索节点,所述方法包括: 在所述中心节点中生成各个检索节点的抽象,在所述检索节点的抽象中创建关于该检索节点的第一数据结构,并分别为该检索节点承载的各个副本创建第二数据结构; 在所述第一动态信息数据结构中保存所述检索节点上传的当前机器状态信息,在各个第二数据结构中保存所述检索节点上传的各个副本的当前状态信息; 根据所述当前机器状态信息和/或各个副本的当前状态信息,判断是否存在需要进行恢复的副本; 如果存在,则根据所述当前机器状态信息以及各个副本的当前状态信息,为所述需要进行恢复的副本选择目标检索节点; 将所述需要进行恢复的副本对应的索引文件拷贝到所述目标检索节点中,由所述目标检索节点根据所述索引文件提供检索服务。2.根据权利要求1所述的方法,其特征在于,所述当前机器状态信息中保存有所述检索节点上传所述机器状态信息时的最近更新时间信息,所述根据所述当前机器状态信息和/或各个副本的当前状态信息,判断是否存在需要进行恢复的副本包括: 判断所述最近更新时间是否小于当前时间与预置的安全时间间隔的差值,如果是,则确定所述检索节点发生宕机,并将该检索节点中承载的各个副本均确定为需要进行恢复的副本。3.根据权利要求2所述的方法,其特征在于,在将所述需要进行恢复的副本对应的索引文件拷贝到所述目标检索节点中之前,还包括: 根据各个检索节点上传的各个副本的当前状态信息,查询各个副本的当前存活数量,如果存活数量等于为对应检索业务分配的副本数量,则取消对该检索节点中承载的各个副本的恢复操作。4.根据权利要求1所述的方法,其特征在于,所述根据所述当前机器状态信息和/或各个副本的当前状态信息,判断是否存在需要进行恢复的副本包括: 根据所述各个副本的当前状态信息,判断某正常运行的检索节点中是否存在不正常的副本,如果是,则将该不正常的副本确定为需要进行恢复的副本。5.根据权利要求1所述的方法,其特征在于,所述根据所述当前机器状态信息以及各个副本的当前状态信息,为所述需要进行恢复的副本选择目标检索节点包括: 将标识为不能承载其他检索业务的检索节点、机器负载超出预置阈值的检索节点、以及正在执行副本恢复的检索节点排除; 将剩余的检索节点,从机器状态维度以及副本状态维度进行综合排序,并根据排序结果确定目标检索节点;其中,所述机器状态维度包括磁盘剩余空间、可用内存、...
【专利技术属性】
技术研发人员:柳明,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。