【技术实现步骤摘要】
一种数据库集群故障自愈方法及装置
本专利技术涉及数据库故障修复,具体涉及一种数据库集群故障自愈方法及装置。
技术介绍
随着各个领域数据化和信息化的发展,业务数据的价值越来越受到行业重视。数据库是云计算的核心,云平台能够存储体量较大的数据,通过对数据的挖掘可以从中获取社会规律、经济规律等信息,应用至行业发展的分析预测中。数据库集群可以更加深入地挖掘数据的价值。但是数据库集群在使用的过程中,可能因为系统原因或人为操作关闭,导致数据集群不可用或者数据丢失。现有的修复方法,通常需要数据库管理人员及时监控数据库运行情况,并及时对数据库集群进行修复,修复效率低。
技术实现思路
专利技术目的:本申请的目的在于提供一种数据库集群故障自愈方法及装置,解决数据库集群故障修复效率低的缺陷。技术方案:本专利技术一方面提供了一种数据库集群故障自愈方法,包括:监测分布式数据库集群中各个服务器的运行状态参数,并生成监测日志;若任一运行状态参数超出预先设定的对应的监测阈值,则对导致运行状态参数超出预先设定的对应监测阈值的进程或线程执行终止操作;根据各个服务器的运行状态,在集群上查找未运行的程序或硬件,并按照未运行的程序或硬件优先的原则,根据预先设定的时间算法启动故障查找,生成查找日志;将监测日志和查找日志中的报错记录进行解析,得到故障信息,对故障信息进行处理形成查询条件;根据查询条件,在预先构建的标准知识库中查询故障问题,获得相应的解决方案,并在当前数据库集群中运行解决方案 ...
【技术保护点】
1.一种数据库集群故障自愈方法,其特征在于,包括:/n监测分布式数据库集群中各个服务器的运行状态参数,并生成监测日志;/n若任一运行状态参数超出预先设定的对应的监测阈值,则对导致运行状态参数超出预先设定的对应监测阈值的进程或线程执行终止操作;/n根据各个服务器的运行状态,在集群上查找未运行的程序或硬件,并按照未运行的程序或硬件优先的原则,根据预先设定的时间算法启动故障查找,生成查找日志;/n将所述监测日志和查找日志中的报错记录进行解析,得到故障信息,对故障信息进行处理形成查询条件;/n根据查询条件,在预先构建的标准知识库中查询故障问题,获得相应的解决方案,并在当前数据库集群中运行所述解决方案对应的脚本,进行故障修复。/n
【技术特征摘要】
1.一种数据库集群故障自愈方法,其特征在于,包括:
监测分布式数据库集群中各个服务器的运行状态参数,并生成监测日志;
若任一运行状态参数超出预先设定的对应的监测阈值,则对导致运行状态参数超出预先设定的对应监测阈值的进程或线程执行终止操作;
根据各个服务器的运行状态,在集群上查找未运行的程序或硬件,并按照未运行的程序或硬件优先的原则,根据预先设定的时间算法启动故障查找,生成查找日志;
将所述监测日志和查找日志中的报错记录进行解析,得到故障信息,对故障信息进行处理形成查询条件;
根据查询条件,在预先构建的标准知识库中查询故障问题,获得相应的解决方案,并在当前数据库集群中运行所述解决方案对应的脚本,进行故障修复。
2.根据权利要求1所述的方法,其特征在于,所述根据预先设定的时间算法启动故障查找,包括以下步骤:
获取程序或硬件当前的运行状态参数;
若所述运行状态参数均未超出预先设定的第一查找阈值,则以预先设定的故障查找启动概率来启动故障查找;
若任一运行状态参数超出预先设定的第一查找阈值,则对导致参数超出所述第一查找阈值的线程或进程执行终止操作,每执行终止操作一次逻辑时钟累计一次;
在故障查找的过程中,若所述运行状态参数均未超出预先设定的第二查找阈值,则故障查找过程执行完毕;否则,对导致参数超出所述第二查找阈值的线程或进程执行终止操作,每执行终止操作一次逻辑时钟累计一次。
3.根据权利要求2所述的方法,其特征在于,所述根据预先设定的时间算法启动故障查找,还包括:
若所述逻辑时钟达到或超出预先设定的逻辑时钟最大值,则检查点后暂停当前运行的数据库事务。
4.根据权利要求1所述的方法,其特征在于,所述将所述监测日志和查找日志中的报错记录进行解析,得到故障信息,对故障信息进行处理形成查询条件,包括:
对所述监测日志和查找日志中的报错记录进行解析,得到故障信息;
根据预先设置的停用词,对故障信息中的停用词进行删除,对删除停用词的故障信息进行分词,得到查询词;
将查询词转化为sparkSQL查询条件,所述查询条件适用于知识语义搜索引擎。
5.根据权利要求1所述的方法,其特征在于,所述标准知识库通过以下步骤构建:
搜集现有数据库中存在的软硬件问题及解决方案,生成数据库运维日志;
对数据库运维日志中的数据进行规范化处理,形成规范化的数据库问题清单及解决方案;
参照规范化的解决方案,将规范化的数据库问题在指定环境中进行仿真,直至问题得以解决;
将仿真得到的解决方案编写脚本,得到与规范化问题对应的解决脚本;
将规范化的问题及解决脚本对应存储,形成标准知识库。
6.一种数据库集群故障自愈装置,其特征在于,包括:
监测模块,监测分布式数据库集群中各个服务器的运行状态参数,并生成监测日志;
监测执行模块,被配置为若任一运行状态...
【专利技术属性】
技术研发人员:胡俊军,杨波,闫润珍,王琼,俞俊,林开云,
申请(专利权)人:国网电力科学研究院有限公司,国电南瑞科技股份有限公司,国网甘肃省电力公司,国网甘肃省电力公司信息通信公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。