基于语义的软件故障模式判定方法及系统技术方案

技术编号:34181361 阅读:13 留言:0更新日期:2022-07-17 13:10
本发明专利技术提供了一种基于语义的软件故障模式判定方法及系统。该方法包括:基于软件故障元数据标准,建立故障数据语义分析模型;基于收集的训练数据,构建故障模式判定模型,其中,训练数据经过了故障数据语义分析模型的自动筛选及标注;对构建的故障模式判定模型进行评估;利用通过评估的故障模式判定模型进行模式判定。本发明专利技术提供的基于语义的软件故障模式判定方法及系统能够提高故障模式预测的准确性。定方法及系统能够提高故障模式预测的准确性。定方法及系统能够提高故障模式预测的准确性。

Method and system of software failure mode determination based on semantics

【技术实现步骤摘要】
基于语义的软件故障模式判定方法及系统


[0001]本专利技术涉及软件工程
,特别是涉及一种基于语义的软件故障模式判定方法及系统。

技术介绍

[0002]软件故障模式是对同一类软件故障发生现象的抽象描述,它是故障原因、改进措施分析的依据。故障模式判定错误,可能会造成后续故障的原因分析不准确、处理措施的不得当,无法采取有效的措施改进产品的质量。
[0003]当前软件故障模式判定主要是以人工判定为主,人工判定是依据故障发生现象描述,依赖人的经验或采用分析技术,如:故障树分析方法,最终分析确定该故障所属的故障模式。
[0004]目前存在一些故障模式自动判定的方法,绝大部分方法是利用软件故障数据,采用统计建模的方法预测故障模式,但是这些方法没有对故障数据提出规范化要求,仅仅采用少量的数据对方法进行验证且故障模式预测的准确性不高。

技术实现思路

[0005]本专利技术要解决的技术问题是提供一种基于语义的软件故障模式判定方法及系统,能够提高故障模式预测的准确性。
[0006]为解决上述技术问题,本专利技术提供了一种基于语义的软件故障模式判定方法,所述方法包括:基于软件故障元数据标准,建立故障数据语义分析模型;基于收集的训练数据,构建故障模式判定模型,其中,训练数据经过了故障数据语义分析模型的自动筛选及标注;对构建的故障模式判定模型进行评估;利用通过评估的故障模式判定模型进行模式判定。
[0007]在一些实施方式中,基于软件故障元数据标准,建立故障数据语义分析模型,包括:建立故障语料库;对故障语料库中的语料进行预处理;建立对故障语料库进行分析的改进N元语言模型;基于哈希函数,建立故障数据语义分析模型。
[0008]在一些实施方式中,建立故障语料库,包括:句子切分,从故障数据和标准数据中提取文本信息,并按照标点符号进行切分;去掉无效句子;分词和词性标注,然后对每个切分的部分进行分词和词性标注;将分词和词性标注的结果存入词库;对词库进行优化。
[0009]在一些实施方式中,对故障语料库中的语料进行预处理,包括:建立基于此语料的二元模型,直接统计训练语料中单个词和两个词组合出现的次数;利用统计结果,可以计算出以数据为条件的条件概率是否满足归一性;为了处理语料库中首末词的特殊性,在语料库的首末位均增加虚拟词,使其原有的首末尾词成为句子中间的词;重新统计相邻两个词同现的次数,得到的二元模型;计算以数据为历史的单元的条件概率,看它的条件概率是否满足归一性;按照相同的办法计算以其他元素为历史的条件概率也满足归一性。
[0010]在一些实施方式中,基于哈希函数,建立故障数据语义分析模型,包括:确定哈希
函数,将每个词与对应的ID关联起来;对ID进行编号;读取语料库文件,按行读取文件,当行中包含多个词时,每个词用空格分隔,那么用空格分割获得每个词;将每个词存入哈希映射中,词是哈希映射中的key,而词的ID是哈希映射中的value,往哈希映射中存入一个新词,ID为当前的ID,并将当前ID加1;对语料进行遍历,将各个一元词以及每个词出现的次数存入哈希映射中;读取语料库文件,按行读取文件,按空格将每行中包含的多个词切分成单个词,将每个词存入哈希映射,词是哈希映射中的key,而词的出现次数是哈希映射中的value,value初始值为1,如果哈希映射中已经包含该词,那么将value加1;对语料进行遍历,将各个二元词以及每个二元词出现的次数存入哈希映射中;读取语料库文件,按行读取文件,按空格将每行中包含的多个词切分成单个词,将每个词与之相邻的词组成二元词,将每个二元词存入哈希映射,二元词是哈希映射中的key,而二元词的出现次数是哈希映射中的value,value初始值为1,如果哈希映射中已经包含该二元词,那么将value加1;计算每个语句的条件概率。
[0011]在一些实施方式中,基于收集的训练数据,构建故障模式判定模型,包括:对训练数据进行预处理;对经过预处理的训练数据进行特征选择;由经过预处理的训练数据中提取特征;利用提取特征后的训练数据进行模型训练。
[0012]在一些实施方式中,利用提取特征后的训练数据进行模型训练,包括:将所有的训练集切分为k份互不重合的子集;每次取其中k

1份作为训练集,另外的1份用来验证集;训练完成后得到k模型,用验证集测试模型的预测效果,取预测结果的平均值作为模型最终结果。
[0013]此外,本专利技术还提供了一种基于语义的软件故障模式判定系统,所述系统包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现根据前文所述的基于语义的软件故障模式判定方法。
[0014]采用这样的设计后,本专利技术至少具有以下优点:
[0015]制定了一种软件故障元数据标准,并且建立故障数据语义分析模型,用于检查故障数据描述是否满足元数据标准,然后基于故障模式判定模型建立原型工具,支持用户填报故障数据以及自动导入数据,规范故障信息的填写,对故障信息进行语法合法性检查,以及语义合理性检查。
附图说明
[0016]上述仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,以下结合附图与具体实施方式对本专利技术作进一步的详细说明。
[0017]图1是故障数据的XML表现形式;
[0018]图2是标点匹配用正则表达式;
[0019]图3是三元词出现次数统计的统计结果图;
[0020]图4是建立模型过程的流程示意图;
[0021]图5是模型评估流程;
[0022]图6是故障模式判定的预测结果;
[0023]图7是故障模式判定的评估结果;
[0024]图8是基于故障模式判定模型的工具的功能结构图;
[0025]图9是系统结构图;
[0026]图10是软件问题描述规范性检查功能界面。
具体实施方式
[0027]以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。
[0028]1、专利技术目的
[0029]由于现有的机器学习方法解决的问题空间是巨大的,因此它可以适配各类数据,实践经验表明,高质量的大量训练数据比机器学习方法更加重要,没有高质量的训练数据,模型无法收敛,训练数据量太小,训练得出的模型是有偏见的,预测结果自然不够理想。
[0030]为了解决训练数据质量的问题,本方法制定了一种软件故障元数据标准,并且建立故障数据语义分析模型,用于检查故障数据描述是否满足元数据标准,然后基于故障模式判定模型建立原型工具,支持用户填报故障数据以及自动导入数据,规范故障信息的填写,对故障信息进行语法合法性检查,以及语义合理性检查。
[0031]2、技术方案
[0032]2.1制定元数据标准
[0033]表1元数据标准
[0034][0035][0036]具体的XML表现形式如图1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于语义的软件故障模式判定方法,其特征在于,包括:基于软件故障元数据标准,建立故障数据语义分析模型;基于收集的训练数据,构建故障模式判定模型,其中,训练数据经过了故障数据语义分析模型的自动筛选及标注;对构建的故障模式判定模型进行评估;利用通过评估的故障模式判定模型进行模式判定。2.根据权利要求1所述的基于语义的软件故障模式判定方法,其特征在于,基于软件故障元数据标准,建立故障数据语义分析模型,包括:建立故障语料库;对故障语料库中的语料进行预处理;建立对故障语料库进行分析的改进N元语言模型;基于哈希函数,建立故障数据语义分析模型。3.根据权利要求2所述的基于语义的软件故障模式判定方法,其特征在于,建立故障语料库,包括:句子切分,从故障数据和标准数据中提取文本信息,并按照标点符号进行切分;去掉无效句子;分词和词性标注,然后对每个切分的部分进行分词和词性标注;将分词和词性标注的结果存入词库;对词库进行优化。4.根据权利要求2所述的基于语义的软件故障模式判定方法,其特征在于,对故障语料库中的语料进行预处理,包括:建立基于此语料的二元模型,直接统计训练语料中单个词和两个词组合出现的次数;利用统计结果,可以计算出以数据为条件的条件概率是否满足归一性;为了处理语料库中首末词的特殊性,在语料库的首末位均增加虚拟词,使其原有的首末尾词成为句子中间的词;重新统计相邻两个词同现的次数,得到的二元模型;计算以数据为历史的单元的条件概率,看它的条件概率是否满足归一性;按照相同的办法计算以其他元素为历史的条件概率也满足归一性。5.根据权利要求2所述的基于语义的软件故障模式判定方法,其特征在于,基于哈希函数,建立故障数据语义分析模型,包括:确定哈希函数,将每个词与对应的ID关联起来;对ID进行编号;读取语料库文件,按行读取文件,当行中包含多个词时,每个词用空格分隔,那么用空格分割获得每个词;将每个词存入哈希映射中,词...

【专利技术属性】
技术研发人员:陈理国马由
申请(专利权)人:中国电子科技集团公司第十五研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1