生成用于自动化系统管理的领域知识的系统和方法技术方案

技术编号:2846015 阅读:221 留言:0更新日期:2012-04-11 18:40
一种用于创建自动化系统管理所需的领域知识库模型的系统和方法,其中,该方法包括定义包括输入/输出参数的数据存储系统设计者规范;分析数据存储系统的运行时系统性能日志;识别输入/输出参数的不同参数之间的关系函数;从设计者规范、运行时系统性能日志以及关系函数派生出知识库模型;在系统运行时使用新监视的系统性能日志,细化知识库模型;通过检测不完整的设计者规范来改善知识库模型的精度,其中,优选情况下,通过数据挖掘技术产生知识库模型。

【技术实现步骤摘要】

一般而言,本专利技术的实施例涉及存储系统,具体来说,用于创建实现运行时系统管理自动化的域知识库的系统。
技术介绍
系统管理通常是由人类管理员驱动的,它们连续地对系统进行监视,分析其行为,采取校正操作,以确保它能够朝着所希望的性能、可用性、安全性等等阈值目标方向前进。随着系统管理的成本占总拥有成本(TOC)的比例越来越大,自我管理本质上已经变得越来越迫切。自我管理的思想在当前技术中是已知的。已经使用专家系统来自动化各种劳动密集型的过程,如疾病诊断、故障分析等等。通过部署专家系统所学到的重要教训由已知的知识原理作出了概述“人工智能程序(即,专家系统)执行胜任高水平的任务的能力主要取决于程序对其任务领域的知识的了解,而不是取决于该程序的推理过程”。换句话说,自动化系统的有效性取决于在管理框架内编码的特定领域的知识。现有的用于编码领域知识的技术一般陷于两个极端(1)白箱方法,在这种方法中,系统设计者定义了详细的公式或规则来描述系统的特征。这些技术一般受到领域知识面对系统中正在发生的变化时过度的复杂性和脆弱性的限制。(2)黑箱方法,在这种方法中,系统通过监视系统行为并使用机器学习技术来获取特定领域知识。然而,此方法容易出错,一般需要的迭代次数太大,无法实现,很难接近于真实世界的多参数系统。对特定领域知识的编码是专家系统内的研究比较活跃的领域。在系统管理中,用于创建领域知识的白箱方法被表示为事件-条件-操作(ECA)规则,该规则定义了不同系统状态下的系统行为。这些规则充当自动化管理的“罐装的配方”;即,在运行时,管理软件只需确定在当前状态下适用的规则,并调用它。类似地,黑箱方法主要表示为“基于情况的推理”(CBR),其中,管理软件通过扫描类似于当前状态的以前的系统状态的历史来确定要调用的操作。鉴于上述情况,需要有克服了复杂性、脆弱性和精度这些问题的新颖的领域知识编码技术。鉴于上述情况,本专利技术的实施例提供了一种用于创建自动化系统管理所需的领域知识库模型的系统,其中,系统包括数据存储系统设计者规范,其中,包括输入/输出参数;用于收集数据存储系统的运行时系统性能日志的第一处理器;用于识别输入/输出参数的不同参数之间的关系函数的第二处理器;从设计者规范、运行时系统性能日志以及关系函数派生出知识库模型;以及第三处理器,用于使用所述系统性能日志来在系统运行时细化本知识库模型,并通过检测不完整的设计者规范来改善知识库模型的精度。优选情况下,通过数据挖掘技术产生知识库模型。知识库模型可以包括数学函数,这些数学函数捕获决定系统运行时的校正操作所需的数据存储系统的细节,其中,知识库模型可以包括针对数据存储系统的单个组件的响应时间的模型,作为组件中的传入的负载的函数,其中,响应时间取决于由数据存储系统的工作负荷流所产生的服务时间和等待时间。知识库模型可以包括数据存储系统的系统工作负荷的调用路径中的单个组件上的负载,其中,作为每一个工作负荷注入到数据存储系统中的请求速率的函数,对每一个组件中的负载进行预测。另外,知识库模型还可以包括数据存储系统的操作调用的成本和效益。优选情况下,数据存储系统设计者规范包括在知识库模型中具有相关性的调用参数、工作负荷特征以及设置参数的操作模型子集;以及不同的知识库模型之间的相关性的性质,其中,相关性的性质包括线性函数、二次函数、多项式函数和指数函数中的任何一个。优选情况下,不完整的设计者规范包括缺少影响正在模型化的输出参数的所有相关输入参数的设计者指定的规范。本专利技术的另一个实施例提供了一种用于创建自动化系统管理所需的领域知识库模型的方法,用于执行创建领域知识库模型的方法的程序存储设备,其中,该方法包括定义包括输入/输出参数的数据存储系统设计者规范;分析数据存储系统的运行时系统性能日志;识别输入/输出参数的不同参数之间的关系函数;从设计者规范、运行时系统性能日志以及关系函数派生出知识库模型;在系统运行时使用新监视的系统性能日志,细化知识库模型;通过检测不完整的设计者规范来改善知识库模型的精度,其中,优选情况下,通过数据挖掘技术产生知识库模型。知识库模型可以包括数学函数,这些数学函数捕获决定系统运行时的校正操作所需的数据存储系统的细节。知识库模型可以包括针对数据存储系统的单个组件的响应时间的模型,作为组件中的传入的负载的函数,其中,响应时间取决于由数据存储系统的工作负荷流所产生的服务时间和等待时间。知识库模型可以包括数据存储系统的系统工作负荷的调用路径中的单个组件上的负载,其中,作为每一个工作负荷注入到数据存储系统中的请求速率的函数,对每一个组件中的负载进行预测。知识库模型可以包括数据存储系统的操作调用的成本和效益。优选情况下,数据存储系统设计者规范包括在知识库模型中具有相关性的调用参数、工作负荷特征以及设置参数的操作模型子集;以及不同的知识库模型之间的相关性的性质,其中,相关性的性质包括线性函数、二次函数、多项式函数和指数函数中的任何一个。优选情况下,不完整的设计者规范包括缺少影响正在模型化的输出参数的所有相关输入参数的设计者指定的规范。通过阅读下面的说明并参考附图,本专利技术的实施例的这些方面和其他方面和目标将变得显而易见。然而,应该理解,下面的说明,尽管指出了本专利技术的优选实施例和许多具体细节,但是该说明只作为说明,而不作出限制。在不偏离本专利技术的精神的情况下,在本专利技术的实施例的范围内,可以作出许多更改和修改,本专利技术的实施例包括所有这样的修改。附图说明通过参考附图,从下面的详细说明中可以更好地理解本专利技术的实施例,其中图1显示了根据本专利技术的实施例的工作负荷的数据集与可用资源的映射;图2显示了根据本专利技术的实施例的导出操作和组件函数的过程;图3显示了根据本专利技术的实施例的迁移操作的规范;图4显示了根据本专利技术的实施例的被监视的信息的数据库的架构;图5显示了根据本专利技术的实施例的神经网络的自适应学习;图6显示了根据本专利技术的实施例的不完整的组件规范;图7显示了根据本专利技术的实施例的IOPS与num_thread关系的图形表示;图8(a)和8(b)显示了根据本专利技术的实施例的通过修复诸如RW_ratio和SR_ratio之类的其他参数的值的IOPS vs.num_thread的图形表示;图9显示了其中根据本专利技术的实施例指定了所有相关参数的组件规范;图10(a)和10(b)显示了根据本专利技术的实施例的批学习和自适应学习的精度和运行时的图形表示;图11显示了根据本专利技术的实施例的优选方法的流程图;图12是根据本专利技术的实施例的计算机系统的示意图;以及图13是根据本专利技术的实施例的系统的示意图。具体实施例方式下面将参考非限制性的实施例(在附图和下面的描述中进行说明)比较全面地讲述本专利技术的实施例和其各种特征和优点。值得注意的是,附图中所说明的特点不一定是按比例绘制的。省略了对已知的组件和处理技术的描述,以便不至于会对本专利技术的实施例的理解造成模糊。这里所使用的示例只用于促进对实施本专利技术的实施例的方式的理解,并帮助那些本领域技术人员实施本专利技术的实施例。相应地,示例不应该被理解为限制本专利技术的实施例的范围。如上文所提及的,需要有克服了复杂性、脆弱性和精度这些问题的新颖的领域知识编码技术。本专利技术的实施例是这样实现这一点的提供叫做“Monit本文档来自技高网...

【技术保护点】
一种用于创建自动化系统管理所需的领域知识库模型的系统,所述系统包括:    包括输入/输出参数的数据存储系统设计者规范;    用于收集数据存储系统的运行时系统性能日志的第一处理器;    用于识别所述输入/输出参数的不同参数之间的关系函数的第二处理器;    从所述设计者规范、所述运行时系统性能日志以及所述关系函数派生出的知识库模型;以及    第三处理器,用于使用所述系统性能日志来在系统运行时细化所述知识库模型,并通过检测不完整的设计者规范来改善所述知识库模型的精度。

【技术特征摘要】
US 2005-7-20 11/185,6451.一种用于创建自动化系统管理所需的领域知识库模型的系统,所述系统包括包括输入/输出参数的数据存储系统设计者规范;用于收集数据存储系统的运行时系统性能日志的第一处理器;用于识别所述输入/输出参数的不同参数之间的关系函数的第二处理器;从所述设计者规范、所述运行时系统性能日志以及所述关系函数派生出的知识库模型;以及第三处理器,用于使用所述系统性能日志来在系统运行时细化所述知识库模型,并通过检测不完整的设计者规范来改善所述知识库模型的精度。2.根据权利要求1所述的系统,其中,所述知识库模型是通过数据挖掘技术生成的。3.根据权利要求1所述的系统,其中,所述知识库模型包括数学函数,这些数学函数捕获决定系统运行时的校正操作所需的所述数据存储系统的细节。4.根据权利要求3所述的系统,其中,所述知识库模型包括针对所述数据存储系统的单个组件的响应时间的模型,作为所述组件中的传入的负载的函数,其中,所述响应时间取决于由所述数据存储系统的工作负荷流所产生的服务时间和等待时间。5.根据权利要求3所述的系统,其中,所述知识库模型包括所述数据存储系统的系统工作负荷的调用路径中的单个组件上的负载,其中,作为每一个工作负荷注入到所述数据存储系统中的请求速率的函数,对每一个所述组件中的负载进行预测。6.根据权利要求3所述的系统,其中,所述知识库模型包括所述数据存储系统的操作调用的成本和效益。7.根据权利要求3所述的系统,其中,所述数据存储系统设计者规范包括在所述知识库模型中具有相关性的调用参数、工作负荷特征以及设置参数的操作模型子集;以及所述知识库模型的不同的知识库模型之间的相关性的性质,其中,所述相关性的性质包括线性函数、二次函数、多项式函数和指数函数中的任何一个。8.根据权利要求1所述的系统,其中,所述不完整的设计者规范包括缺少影响正在模型化的输出参数的所有相关输入参数的设计者指定的规范。9...

【专利技术属性】
技术研发人员:桑迪普M尤塔姆查恩达尼约翰D帕尔默阴晓昕
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1