【技术实现步骤摘要】
一种基于词性标注和组块分析的需求模板符合性检查优化方法
本专利技术属于自然语言处理
,具体涉及一种基于词性标注和组块分析的需求模板符合性检查优化方法。
技术介绍
软件需求通常是用自然语言描述的,自然语言一般易于理解,适用于任何领域的需求描述。尽管如此,自然语言若不加以限制,可能带有歧义,自然语言一般很难自动分析。需求模板提供了一种有效的工具,可以减少自然语言中的歧义,并对自然语言需求进行自动分析。需求模板定义了自然语言需求的格式,比如Rupp模板包括以下部分:(1)起始条件;(2)系统名称;(3)情态动词;(4)系统功能;(5)对象;(6)对象的详细信息。在软件需求中使用模板时,判断一个自然语言需求是否符合模板就显得尤为重要。如果对自然语言需求人工进行模板符合性判断,则非常耗时。在这种情况下,一个自动化的工具,如何通过词性标注、组块分析的方法,抽取自然语言需求中的建模元素,并进行模板符合性检查,能够判断软件需求是否符合模板,并提高其精度和召回率,就成了一个重要的技术问题。词性标注最简单的方法是将词汇中每个词对应的高频词性作为默认词性,但显然还有选择的余地。目前,主流的分词方法是将句子的词性标注作为一个序列标注问题,应用于词性标注任务中。然而,由于每个英文单词在不同的语境中具有不同的词性,这也将影响到组块分析的结果。组块分析一般的方法是将词性按照一定的语法规则进行组合。然而,仅仅是按照词性对单词进行组合,没有考虑到上下文之间的关系。因此,需要重新考虑词性标注、组块分析的方法。现有的词性标注、组块分 ...
【技术保护点】
1.一种基于词性标注和组块分析的需求模板符合性检查优化方法,其特征在于,包括:/n步骤一、构建需求模板,确定需求模板的BNF范式;/n步骤二、获取需求,并对需求是否满足需求模板进行人工标注;/n步骤三、根据需求模板,对每一条需求进行词性标注以及组块分析,进而对需求是否满足需求模板进行自动标注;/n步骤四、将人工标注的结果与自动标注的结果进行比较,得到对需求文档进行需求模板符合性检查的精度、召回率和F2度量。/n
【技术特征摘要】
1.一种基于词性标注和组块分析的需求模板符合性检查优化方法,其特征在于,包括:
步骤一、构建需求模板,确定需求模板的BNF范式;
步骤二、获取需求,并对需求是否满足需求模板进行人工标注;
步骤三、根据需求模板,对每一条需求进行词性标注以及组块分析,进而对需求是否满足需求模板进行自动标注;
步骤四、将人工标注的结果与自动标注的结果进行比较,得到对需求文档进行需求模板符合性检查的精度、召回率和F2度量。
2.根据权利要求1所述的一种基于词性标注和组块分析的需求模板符合性检查优化方法,其特征在于,所述步骤一构建的需求模板为:
<conditional-keyword><sequence-of-tokens><np><vp-starting-with-modal><np><opt-details>;
其中,<conditional-keyword>表示条件关键词,包含if、after、before、assoonas、when、while、incase、at这八个单词及词组;
<sequence-of-tokens>表示条件的token序列;
<np>表示名词短语;
<vp-starting-with-modal>表示以情态动词开头的动词短语;
<opt-details>表示对象的详细信息。
3.根据权利要求1所述的一种基于词性标注和组块分析的需求模板符合性检查优化方法,其特征在于,所述步骤二具体为:
获取需求,并根据模板符合性手动检查协议,人工检查并标注需求是否符合需求模板,需求符合需求模板时,标注为N,需求不符合需求模板时,标注为P。
4.根据权利要求3所述的一种基于词性标注和组块分析的需求模板符合性检查优化方法,其特征在于,所述模板符合性手动检查协议为:
R是被检查是否符合需求模板T的需求;
验证R是一个语法正确的句子,在确定正确性时不考虑标点符号;
验证R使用了可接受的情态动词;
如果R是条件性的,验证条件只出现在需求R的开始,条件符合T描述的结构;
验证<systemname>,<object>,以及<whom?>由名词短语填充;
验证<process>由动词短语填充;
若满足上述所...
【专利技术属性】
技术研发人员:王立松,曹步展,
申请(专利权)人:南京航空航天大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。