一种服务化信息系统需求的离散划分方法技术方案

技术编号:21570770 阅读:40 留言:0更新日期:2019-07-10 15:13
本发明专利技术涉及一种服务化信息系统需求的离散划分方法,通过对服务化信息系统的业务场景描述进行分析,利用自然语言处理技术从中抽取基本的业务目标,依据业务场景中的核心词集,筛选出服务文档集,对服务文档集进行聚类,从选择出的候选服务文档集中抽取各个服务蕴含的功能目标,并得到各个类簇的主要服务功能目标,根据初始业务目标从获取的服务功能目标集中进行选择、修改或增加,构造相应的目标模型,进而根据目标模型,定义相应的服务需求接口描述,所述离散划分方法能够帮助软件需求分析人员对用户的服务需求进行建模和分析,实现业务需求与服务的对齐,为后续的服务开发奠定基础。

A Discrete Partition Method for Requirements of Service Information System

【技术实现步骤摘要】
一种服务化信息系统需求的离散划分方法
本专利技术涉及软件工程
,具体涉及一种服务化信息系统需求的离散划分方法。
技术介绍
随着云计算和服务计算技术的飞速发展,软件开发模式和软件部署方式都在发生深刻地变革,面向服务的软件架构已经成为构造大型分布式软件系统的主流架构。通过重用和组合各种可用的Web服务,面向服务的软件架构能够改善开发质量、大幅缩短软件应用的交付时间和维护成本。在这一趋势下,以服务化方式进行信息系统软件的开发与部署或对其遗留系统进行服务化改造已成为信息系统软件的重要发展趋势。需求问题是长期困扰着软件工程的一个重要问题,糟糕的需求是造成软件危机的根本原因之一。根据2003年发布的Chaos报告,在对项目管理人员的调研中发现不合格的需求是导致软件开发项目失败的主要原因之一。在服务化信息系统软件开发中,其首要任务是对用户需求进行分析和建模,然后基于分析后的用户需求,开发新服务或组合已有的服务资源以满足用户的需要。因此,需求分析和建模对服务化信息系统软件开发的成败具有决定性作用。传统的需求建模方法由于缺乏对服务计算及其实现机理的足够支持,难以满足服务化软件系统需求建模的需要。同时,由于服务化信息系统软件的用户需求更具个性化和多样化的特点,这也增加了进行服务化信息系统软件需求建模和分析的难度。因此,在进行服务化信息系统软件开发时,建立与其特点相适应的用户需求分析方法显得至关重要和迫切。
技术实现思路
有鉴于此,本专利技术提供一种服务化信息系统需求的离散划分方法,即帮助软件需求分析人员对用户的服务需求进行建模和分析,实现业务需求与服务的对齐,为后续的服务开发奠定基础。本专利技术公开一种服务化信息系统需求的离散划分方法,所述方法包括以下步骤:S1、通过对服务化信息系统的业务场景的分析,运用自然语言处理方式,从中抽取初始的业务目标;S2、依据所述业务场景中的核心词集,筛选包含N个核心词的服务文档集,并对服务文档集进行聚类,根据筛选出的候选服务文档,集中抽取各个服务文档集蕴含的功能目标,得到各个类簇的服务功能目标,其中,N为大于等于1的整数;S3、根据初始业务目标,从步骤S2中获取的服务功能目标集中进行选择、修改或增加,得到可操作服务功能目标,从而建立初始业务目标与可操作服务功能目标之间的关系,构造相应的目标模型,进而根据目标模型中的可操作服务功能目标,定义相应的服务需求接口描述。在上述技术方法中,所述步骤S1包括以下步骤:S11、将业务场景描述进行预处理,首先进行分词,利用自然语言处理工具,得到业务场景描述中包含的单词集合,然后利用词干化技术进行词形标准化,以便所有词还原成其基本原形,在所述还原过程中保留在业务场景描述文件中重复出现的词,最后进行去停用词,即删除对表达功能需求无意义的词,包括介词、连词和代词;S12、从预处理后的业务场景描述中提取基本业务目标;所述基本业务目标表示为动词-名词短语形式。在上述技术方法中,所述步骤S12中提取的基本业务目标是通过StanfordParser工具中的词汇间的依存关系来抽取通过动词-名词短语形式表达的目标。在上述技术方法中,,词汇依存关系描述语句中各个单词之间的二元关系,进行目标抽取时利用两类依存关系包括:S121、Dobj(w1,w2):表示在主动语态的句子中的名词w2是动词w1的直接宾语,运用StanfordParser解析后,得到词汇依存关系,即找出w1及w2在句中的位置,并从中识别出目标;S122、Nsubjpass(w3,w4):表示w4是在被动语态的句子中的动词w3的主语,利用StanfordParser解析后,可以得到词汇依存关系,即找出w3及w4在句中的位置,并从中识别出目标。在上述技术方法中,所述步骤S2中包括以下步骤:S21、识别业务场景描述中的核心词,采用TF-IDF技术度量业务场景描述中所有单词的权重,tf-idfs,w代表单词w在业务场景描述s中的TF-IDF权重,计算如下:其中,|S|代表业务场景描述与已有服务文档集组成的集合S所包含的文档数;代表s包含的所有词的频次之和;代表包含w的文档数,根据业务场景描述中的TF-IDF权重对单词进行排序,将权重值的TopK作为描述中的核心词;S22、依据业务场景中的核心词集,选择包含核心词的服务文档集,即对每个核心词而言,搜索包含该核心词的服务文档,将所有得到的服务文档取并集,得到候选服务文档集;S23、采用步骤S11的方式对选择出的候选服务文档集进行预处理,然后对该服务文档集进行聚类;S24、按照步骤S12的处理方式从步骤S22选择出的候选服务文档集中抽取各个服务的功能目标,针对候选服务文档集中的每个服务文档,利用StanfordParser工具对每个句子进行解析,利用两类依存关系抽取功能目标;S25、统计各个类簇中得到的服务功能目标,按照功能目标在该类簇中的出现次数进行排序,得到各个类簇的主要服务功能目标。在上述技术方法中,所述步骤S23包括以下步骤:S231、在进行服务文档集聚类时,利用广泛使用的主题模型LDA对预处理后的服务集S进行建模,得到两个概率分布,每个服务s的主题概率分布θs以及每个主题z∈{1,2,...,T}的词概率分布φz其中T代表主题数;S232、利用服务的主题概率分布,为每个隐式主题构建一个服务类簇,其中,共T个服务类簇,将每个服务划分到与之具有较高相关度的主题所对应的类簇中,服务s的主题概率分布θs中每一维的概率值即反映了s与该维所对应的主题的相关度,概率值越大,则相关度越高,将θs中概率值最大的k个维度所对应的k个主题作为s相关的主题集,记为RelT(s),然后将s分配到RelT(s)中每个主题所对应的服务类簇中。在上述技术方法中,所述步骤S3包括以下步骤:S31、根据初始业务目标,结合步骤S25得到的各个类簇的服务功能目标,根据用户需求进行筛选、修改或增加,得到合适的可操作服务目标;S32、基于S12抽取出的初始业务目标和步骤S31选择的可操作服务目标构造目标模型,定义初始业务目标和可操作服务目标间的分解关系和约束关系,其中,所述初始业务目标为高层目标,所述可操作服务目标为低层目标;S33、根据目标模型中的低层目标,定义相应的服务需求接口描述,其中,服务需求接口描述包括服务的输入、输出、前置条件和后置条件。在上述技术方法中,所述步骤S32中的在高层目标和低层目标集之间分解时,定义了四种关系:必选的、可选的、多选一的和多选多的;其中,必选关系代表当高层目标要实现时,与该目标有必选关联的低层目标集也必须实现;可选关系代表当高层目标被实现,与该目标有可选关联的低层目标集中的目标是否实现均可;多选一关系代表当高层目标要实现时,与该目标有多选一关联的低层目标集中,有且只有一个目标被实现;多选多关系意味着,当高层目标被实现时,与该高层目标有多选多关联的低层目标集里有至少一个被实现即可。在上述技术方法中,所述步骤S32中的高层目标和低层目标集相互的约束关系包括:依赖、排斥、促进和对等;其中,依赖关系表示如果高层目标或低层目标被实现,与该目标具有依赖关联的高层目标或低层目标也必须被实现;排斥关系代表如果某个高层目标或低层目标被实现,与该目标具有排斥关联的高层目标或低层目标必须不能本文档来自技高网...

【技术保护点】
1.一种服务化信息系统需求的离散划分方法,其特征在于,所述方法包括以下步骤:S1、通过对服务化信息系统的业务场景的分析,运用自然语言处理方式,从中抽取初始的业务目标;S2、依据所述业务场景中的核心词集,筛选包含N个核心词的服务文档集,并对服务文档集进行聚类,根据筛选出的候选服务文档,集中抽取各个服务文档集蕴含的功能目标,得到各个类簇的服务功能目标,其中,N为大于等于1的整数;S3、根据初始业务目标,从步骤S2中获取的服务功能目标集中进行选择、修改或增加,得到可操作服务功能目标,从而建立初始业务目标与可操作服务功能目标之间的关系,构造相应的目标模型,进而根据目标模型中的可操作服务功能目标,定义相应的服务需求接口描述。

【技术特征摘要】
1.一种服务化信息系统需求的离散划分方法,其特征在于,所述方法包括以下步骤:S1、通过对服务化信息系统的业务场景的分析,运用自然语言处理方式,从中抽取初始的业务目标;S2、依据所述业务场景中的核心词集,筛选包含N个核心词的服务文档集,并对服务文档集进行聚类,根据筛选出的候选服务文档,集中抽取各个服务文档集蕴含的功能目标,得到各个类簇的服务功能目标,其中,N为大于等于1的整数;S3、根据初始业务目标,从步骤S2中获取的服务功能目标集中进行选择、修改或增加,得到可操作服务功能目标,从而建立初始业务目标与可操作服务功能目标之间的关系,构造相应的目标模型,进而根据目标模型中的可操作服务功能目标,定义相应的服务需求接口描述。2.根据权利要求1所述一种服务化信息系统需求的离散划分方法,其特征在于,所述步骤S1包括以下步骤:S11、将业务场景描述进行预处理,首先进行分词,利用自然语言处理工具,得到业务场景描述中包含的单词集合,然后利用词干化技术进行词形标准化,以便所有词还原成其基本原形,在所述还原过程中保留在业务场景描述文件中重复出现的词,最后进行去停用词,即删除对表达功能需求无意义的词,包括介词、连词和代词;S12、从预处理后的业务场景描述中提取基本业务目标;所述基本业务目标表示为动词-名词短语形式。3.根据权利要求2所述一种服务化信息系统需求的离散划分方法,其特征在于,所述步骤S12中提取的基本业务目标是通过StanfordParser工具中的词汇间的依存关系来抽取通过动词-名词短语形式表达的目标。4.根据权利要求3所述一种服务化信息系统需求的离散划分方法,其特征在于,词汇依存关系描述语句中各个单词之间的二元关系,进行目标抽取时利用两类依存关系包括:S121、Dobj(w1,w2):表示在主动语态的句子中的名词w2是动词w1的直接宾语,运用StanfordParser解析后,得到词汇依存关系,即找出w1及w2在句中的位置,并从中识别出目标;S122、Nsubjpass(w3,w4):表示w4是在被动语态的句子中的动词w3的主语,利用StanfordParser解析后,可以得到词汇依存关系,即找出w3及w4在句中的位置,并从中识别出目标。5.根据权利要求4所述一种服务化信息系统需求的离散划分方法,其特征在于,所述步骤S2中包括以下步骤:S21、识别业务场景描述中的核心词,采用TF-IDF技术度量业务场景描述中所有单词的权重,tf-idfs,w代表单词w在业务场景描述s中的TF-IDF权重,计算如下:其中,|S|代表业务场景描述与已有服务文档集组成的集合S所包含的文档数;代表s包含的所有词的频次之和;代表包含w的文档数,根据业务场景描述中的TF-IDF权重对单词进行排序,将权重值的TopK作为描述中的核心词;S22、依据业务场景中的核心词集,选择包含核心词的服务文档集,即对每个核心词而言,搜索包含该核心词的服务文档,将所有得到的服务文档取并集,得到候选服务文档集;S23、采用步骤S11的方式对选择出的候选服务文档集进行预处理,然后对该服务文档集进行聚类;S24、按照步骤S12的处理方式从步骤S22选择出的候选服务文档集中抽取各个服...

【专利技术属性】
技术研发人员:赵恒王健梁鹏陈娟
申请(专利权)人:中国船舶重工集团公司第七零九研究所
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1