转储的自动分配方法和设备组成比例

技术编号：14418883 阅读：124 留言：0更新日期：2017-01-12 18:24

本公开的实施例涉及转储的自动分配方法和设备，该方法包括：计算未分配的转储与已分配的转储中的每个转储之间的堆栈相似性得分，并且将堆栈相似性得分大于堆栈相似性得分阈值的所有已分配的转储确定为相关的已分配的转储；响应于确定相关的已分配的转储，计算相关的已分配的转储中的每个转储的其它特征的得分，该其它特征包括与转储相关联的转储的新近度、转储的状态、转储的发行号、转储的版本号以及转储的重复值中的至少一项；根据堆栈相似性得分和其它特征的得分来计算总相似性得分，以及基于总相似性得分来对未分配的转储进行自动分配。本公开的实施例通过计算转储的堆栈相似性和其他特征的得分，能够快速、准确地对转储进行自动分配。

全部详细技术资料下载

【技术实现步骤摘要】

本公开的实施例总体上涉及计算机领域，更具体地涉及转储的自动分配方法和设备。
技术介绍
崩溃转储(crashdump)是计算机系统或进程崩溃时的状态快照。崩溃转储在系统发生崩溃或异常时保存故障信息或者环境信息，以供相关人员进行排错分析使用。在具有多个功能组件区域的大型系统中，在开发、测试和部署期间可能产生许多崩溃转储。在获得转储之后，通常需要确定大型系统中的具体哪个功能区域应当负责转储分析。通常，可以根据转储的原因、理由或者签名将崩溃转储分类或分配到相应的功能区域。签名可以是堆栈信息或者转储中的其它内部状态。例如，崩溃转储中的堆栈信息是最常使用的信息，并且它是将产生的转储映射到某些功能区域的最有价值的签名。然而，现有技术中通过人工的对崩溃转储进行分配，不仅耗费大量时间精力，而且受分析人员知识的限制，导致转储分配的准确性较低。此外，不同的功能区域可以引起具有相似的甚至相同的堆栈转储，因此，仅仅依靠转储堆栈中的信息进行分类不够准确。因此，在不断地产生崩溃转储时，如何在没有了解转储的具体内容的情况下，快速、准确地对转储进行自动分类，成为一个亟待解决的问题。
技术实现思路
有鉴于此，本公开的各实施例提出了一种转储的自动分配方法和设备。根据本公开的一个方面，提供了一种转储的自动分配方法，该方法包括：计算未分配的转储与已分配的转储中的每个转储之间的堆栈相似性得分，并且将堆栈相似性得分大于堆栈相似性得分阈值的所有已分配的转储确定为相关的已分配的转储；响应于确定相关的已分配的转储，计算相关的已分配的转储中的每个转储的其它特征的得分，其它特征包括与转储相关联的转储的新近度、转储...
转储的自动分配方法和设备

【技术保护点】
一种转储的自动分配方法，包括：计算未分配的转储与已分配的转储中的每个转储之间的堆栈相似性得分，并且将所述堆栈相似性得分大于堆栈相似性得分阈值的所有已分配的转储确定为相关的已分配的转储；响应于确定所述相关的已分配的转储，计算所述相关的已分配的转储中的每个转储的其它特征的得分，所述其它特征包括与转储相关联的转储的新近度、转储的状态、转储的发行号、转储的版本号以及转储的重复值中的至少一项；根据所述堆栈相似性得分和所述其它特征的得分来计算总相似性得分；以及基于所述总相似性得分来对所述未分配的转储进行自动分配。

【技术特征摘要】
1.一种转储的自动分配方法，包括：计算未分配的转储与已分配的转储中的每个转储之间的堆栈相似性得分，并且将所述堆栈相似性得分大于堆栈相似性得分阈值的所有已分配的转储确定为相关的已分配的转储；响应于确定所述相关的已分配的转储，计算所述相关的已分配的转储中的每个转储的其它特征的得分，所述其它特征包括与转储相关联的转储的新近度、转储的状态、转储的发行号、转储的版本号以及转储的重复值中的至少一项；根据所述堆栈相似性得分和所述其它特征的得分来计算总相似性得分；以及基于所述总相似性得分来对所述未分配的转储进行自动分配。2.根据权利要求1所述的方法，进一步包括：从所述转储获得与堆栈有关的信息，以及从所述转储、系统日志或系统数据库获得与其它特征有关的信息。3.根据权利要求1所述的方法，其中计算未分配的转储与已分配的转储中的每个转储之间的堆栈相似性得分包括：选择转储中直接导致转储发生的一个堆栈来计算堆栈相似性得分，或者选择转储中的多个堆栈来计算堆栈相似性得分。4.根据权利要求1或3所述的方法，其中计算未分配的转储与已分配的转储中的每个转储之间的堆栈相似性得分包括：通过从上到下逐行地比较堆栈中的行，来计算未分配的转储与已分配的转储中的每个转储之间的堆栈相似性得分。5.根据权利要求1所述的方法，其中计算所述相关的已分配的转储中的每个转储的其它特征的得分包括：分别计算其它特征中的每个特征的得分，并根据所述其它特征中的每个特征的权重来计算其它特征的得分。6.根据权利要求5所述的方法，其中分别计算其它特征中的每
\t个特征的得分包括：通过比较转储的时间戳信息来计算转储的新近度得分；和/或通过确定已分配的转储的当前状态来计算转储的状态得分；和/或通过比较转储的发行号信息来计算转储的发行号得分；和/或通过比较转储的版本号信息来计算转储的版本号得分；和/或通过确定已分配转储的副本数量来计算转储的重复值得分。7.根据权利要求6所述的方法，其中通过比较转储的时间戳信息、发行号信息或者版本号信息来计算转储的新近度得分、发行号得分或者版本号得分包括：将所有的转储按照时间戳信息、发行号信息或者版本号信息的进行排序，并且根据转储之间的排序间隔来计算新近度得分、发行号得分或者版本号得分。8.根据权利要求6所述的方法，其中通过确定已分配的转储的当前状态来计算转储的状态得分包括：根据转储的当前状态在转储的所有状态中所处的顺序，来计算转储的状态得分。9.根据权利要求6所述的方法，其中通过确定已分配转储的副本数量来计算转储的重复值得分包括：根据特定已分配的转储在所有已分配的转储中的累计副本数量，来计算转储的重复值得分。10.根据权利要求1所述的方法，其中基于所述总相似性得分来对未分配的转储进行自动分配包括：选择总相似性得分排名前K名的相关的已分配的转储的分配区域作为候选分配区域，对所述前K名的相关的已分配的转储的分配区域进行统计，并且选择统计结果最高的分配区域作为最终分配区域，其中K≥3。11.一种转储的自动分配设备，包括：堆栈相似性计算装置，所述堆栈相似性计算装置用于计算未分配的转储与已分配的转储中的每个转储之间的堆栈相似性...

【专利技术属性】
技术研发人员：肖会兵，高健，韩耕，董继炳，康剑斌，高宏坡，
申请(专利权)人：伊姆西公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人