当前位置: 首页 > 专利查询>湖南大学专利>正文

基于深度学习的软件需求文本缺陷检测方法及系统技术方案

技术编号:33529027 阅读:21 留言:0更新日期:2022-05-19 01:56
本发明专利技术公开了基于深度学习的软件需求文本缺陷检测方法及系统,使用深度学习算法构建以软件需求文本为输入量,以软件需求文本中的缺陷所在语句及对应缺陷类别为输出量的缺陷检测分类器;获取多个软件需求文本,并对多个软件需求文本中的缺陷所在语句及对应缺陷类别进行标注,并使用标注好的多个软件需求文本训练缺陷检测分类器;将待检测的软件需求文本输入训练好的缺陷检测分类器中,得到软件需求文本的缺陷所在语句及对应缺陷类别。本发明专利技术通过预先借助深度学习算法构建缺陷检测分类器,再使用训练好的缺陷检测分类器对软件需求文本进行缺陷检测,能够快速、准确地检测出软件需求文本中的表述性缺陷,为发现缺陷节省了大量的人力和时间。量的人力和时间。量的人力和时间。

【技术实现步骤摘要】
基于深度学习的软件需求文本缺陷检测方法及系统


[0001]本专利技术涉及软件工程领域,尤其涉及基于深度学习的软件需求文本缺陷检测方法及系统。

技术介绍

[0002]软件需求文档的编制是为了使用户和软件开发者双方对该软件的初始规定有一个共同的理解。在软件开发生命周期中,需求的缺陷会产生严重且昂贵的后果。并且需求问题发现得越晚,其修复成本越高,发现问题的时间越早,则修复成本越低。需求工程师与项目参与者都希望能在早期发现并修正存在的需求问题。在实际需求分析期间,对软件需求文本的检测一般有三个方面,第一就是对软件需求文本中需求获取中的需求错误的检测;第二种就是对软件需求文本编写的规范性错误的检测;第三种就是对软件需求文本表述性错误的检测。对于软件需求文本的前两方面的检测现已存在相关的检测方法了,但是对于第三方面的检测,即对于软件需求文本表述性错误的检测至今还依靠人工检测,但人工检测通常是容易出错,繁琐,且会耗费了大量的人力和时间。
[0003]因此,现有的软件需求文本表述性错误检测效率低且准确性不高的技术问题已成为本领域技术人员亟待解决的技术问题。

技术实现思路

[0004]本专利技术提供了基于深度学习的软件需求文本缺陷检测方法及系统,用于解决现有的软件需求文本表述性错误检测效率低且准确性不高的技术问题。
[0005]为解决上述技术问题,本专利技术提出的技术方案为:
[0006]一种基于深度学习的软件需求文本缺陷检测方法,包括以下步骤:
[0007]使用深度学习算法构建以软件需求文本为输入量,以软件需求文本中的缺陷所在语句及对应缺陷类别为输出量的缺陷检测分类器;
[0008]获取多个软件需求文本,并对多个所述软件需求文本中的缺陷所在语句及对应缺陷类别进行标注,并使用标注好的多个软件需求文本训练所述缺陷检测分类器;
[0009]将待检测的软件需求文本输入训练好的缺陷检测分类器中,得到所述软件需求文本的缺陷所在语句及对应缺陷类别。
[0010]优选的,所述缺陷类别包括:指代正确需求、模糊需求、不可验证需求、不完整需求中任意一种或几种的组合。
[0011]优选的,对多个所述软件需求文本中的缺陷及缺陷类别进行标注,具体包括以下步骤:
[0012]将各个软件需求文本进行分词处理,得到各个软件需求文本的分词集;
[0013]利用词典编码算法将各个分词集中的各个分词转换为词向量;基于各个软件需求文本中的各个语句对应的词向量,构建各个软件需求文本中的各个语句的词向量矩阵;并对各个语句的词向量矩阵进行缺陷标记以及缺陷类别标记,其中,缺陷标记分为无缺陷以
及有缺陷;
[0014]并将标记后的各个词向量矩阵依次输入至所述缺陷检测分类器中,以训练所述缺陷检测分类器。
[0015]优选的,将待检测的软件需求文本输入训练好的缺陷检测分类器中,包括以下步骤:
[0016]将待检测的软件需求文本进行分词处理;
[0017]利用词典编码算法将待检测的软件需求文本中的各个分词转换为词向量;
[0018]基于待检测的软件需求文本中的各个语句对应的词向量,构建待检测的软件需求文本的各个语句的词向量矩阵;
[0019]将待检测的软件需求文本的各个语句的词向量矩阵依次输入至所述缺陷检测分类器中。
[0020]优选的,在将各个分词转换为词向量前,还包括以下步骤:
[0021]将各个分词中包含的小节编号、无意义的分隔符以及乱码字符删去。
[0022]优选的,在构建各个语句的词向量矩阵时,还包括以下步骤:
[0023]对于任一语句均执行以下操作:
[0024]统计所述语句的词向量数量,并将所述词向量数量与预设阈值进行比较:
[0025]当所述词向量数量大于预设阈值时,删除所述语句中位置靠前的词向量,使删减后语句的词向量数量等于预设阈值,并使用删减后语句的词向量的构建词向量矩阵;
[0026]当所述词向量数量小于预设阈值时,使用预设词向量填充所述语句,使填充后语句的词向量数量等于预设阈值,并使用填充后语句的词向量构建词向量矩阵。
[0027]优选的,所述深度学习模型为TextCNN模型,所述缺陷检测分类器包括卷积层、最大池化层以及全连接层;所述卷积层包括多种不同尺寸的卷积核,所述卷积核通过在输入量上进行卷积运算,提取并输出输入量的特征序列;所述最大池化层用于提取并输出各卷积核提取的特征序列中的最大值;所述全连接层根据各卷积核提取的特征序列中的最大值对对输入量所属的类别进行判断。
[0028]优选的,所述缺陷检测分类器在训练和验证时采用了Adam算法进行优化,并使用稀疏分类交叉熵作为损失函数。
[0029]一种计算机系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述权利要求方法的步骤。
[0030]本专利技术具有以下有益效果:
[0031]1、本专利技术中的基于深度学习的软件需求文本缺陷检测方法及系统,使用深度学习算法构建以软件需求文本为输入量,以软件需求文本中的缺陷所在语句及对应缺陷类别为输出量的缺陷检测分类器;获取多个软件需求文本,并对多个所述软件需求文本中的缺陷所在语句及对应缺陷类别进行标注,并使用标注好的软件需求文本数据集训练所述缺陷检测分类器;将待检测的软件需求文本输入训练好的缺陷检测分类器中,得到所述软件需求文本的缺陷所在语句及对应缺陷类别。本专利技术通过预先借助深度学习算法构建缺陷检测分类器,再使用训练好的缺陷检测分类器对软件需求文本进行缺陷检测,能够快速、准确地检测出软件需求文本中的表述性缺陷,节省了大量的人力和时间。
[0032]除了上面所描述的目的、特征和优点之外,本专利技术还有其它的目的、特征和优点。
下面将参照附图,对本专利技术作进一步详细的说明。
附图说明
[0033]构成本申请的一部分的附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0034]图1是本专利技术优选实施例的基于深度学习的软件需求文本缺陷检测方法的流程图;
[0035]图2是本专利技术优选实施例的基于深度学习的软件需求文本缺陷检测方法的返回结果;
[0036]图3是本专利技术的基于深度学习的软件需求文本缺陷检测方法的返回结果。
具体实施方式
[0037]以下结合附图对本专利技术的实施例进行详细说明,但是本专利技术可以由权利要求限定和覆盖的多种不同方式实施。
[0038]实施例一:
[0039]如图3所示,本实施中公开了一种基于深度学习的软件需求文本缺陷检测方法,包括以下步骤:
[0040]使用深度学习算法构建以软件需求文本为输入量,以软件需求文本中的缺陷所在语句及对应缺陷类别为输出量的缺陷检测分类器;
[0041]获取多个软件需求文本,并对多个所述软件需求文本中的缺陷所在语句及对应缺陷类别进行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的软件需求文本缺陷检测方法,其特征在于,包括以下步骤:使用深度学习算法构建以软件需求文本为输入量,以软件需求文本中的缺陷所在语句及对应缺陷类别为输出量的缺陷检测分类器;获取多个软件需求文本,并对多个所述软件需求文本中的缺陷所在语句及对应缺陷类别进行标注,并使用标注好的多个软件需求文本训练所述缺陷检测分类器;将待检测的软件需求文本输入训练好的缺陷检测分类器中,得到所述软件需求文本的缺陷所在语句及对应缺陷类别。2.根据权利要求1所述的基于深度学习的软件需求文本缺陷检测方法,其特征在于,所述缺陷类别包括:指代正确需求、模糊需求、不可验证需求、不完整需求中任意一种或几种的组合。3.根据权利要求1所述的基于深度学习的软件需求文本缺陷检测方法,其特征在于,对多个所述软件需求文本中的缺陷及缺陷类别进行标注,具体包括以下步骤:将各个软件需求文本进行分词处理,得到各个软件需求文本的分词集;利用词典编码算法将各个分词集中的各个分词转换为词向量;基于各个软件需求文本中的各个语句对应的词向量,构建各个软件需求文本中的各个语句的词向量矩阵;并对各个语句的词向量矩阵进行缺陷标记以及缺陷类别标记,其中,缺陷标记分为无缺陷以及有缺陷;并将标记后的各个词向量矩阵依次输入至所述缺陷检测分类器中,以训练所述缺陷检测分类器。4.根据权利要求3所述的基于深度学习的软件需求文本缺陷检测方法,其特征在于,将待检测的软件需求文本输入训练好的缺陷检测分类器中,包括以下步骤:将待检测的软件需求文本进行分词处理;利用词典编码算法将待检测的软件需求文本中的各个分词转换为词向量;基于待检测的软件需求文本中的各个语句对应的词向量,构建待检测的软件需求文本的各个语句的词向量矩阵;将待检测的软件需求文本的各个语句的...

【专利技术属性】
技术研发人员:欧阳柳波秦家豪
申请(专利权)人:湖南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1