【技术实现步骤摘要】
一种服务化信息系统需求的离散划分方法
本专利技术涉及软件工程
,具体涉及一种服务化信息系统需求的离散划分方法。
技术介绍
随着云计算和服务计算技术的飞速发展,软件开发模式和软件部署方式都在发生深刻地变革,面向服务的软件架构已经成为构造大型分布式软件系统的主流架构。通过重用和组合各种可用的Web服务,面向服务的软件架构能够改善开发质量、大幅缩短软件应用的交付时间和维护成本。在这一趋势下,以服务化方式进行信息系统软件的开发与部署或对其遗留系统进行服务化改造已成为信息系统软件的重要发展趋势。需求问题是长期困扰着软件工程的一个重要问题,糟糕的需求是造成软件危机的根本原因之一。根据2003年发布的Chaos报告,在对项目管理人员的调研中发现不合格的需求是导致软件开发项目失败的主要原因之一。在服务化信息系统软件开发中,其首要任务是对用户需求进行分析和建模,然后基于分析后的用户需求,开发新服务或组合已有的服务资源以满足用户的需要。因此,需求分析和建模对服务化信息系统软件开发的成败具有决定性作用。传统的需求建模方法由于缺乏对服务计算及其实现机理的足够支持,难以满足服务化软件系统需求建模的需要。同时,由于服务化信息系统软件的用户需求更具个性化和多样化的特点,这也增加了进行服务化信息系统软件需求建模和分析的难度。因此,在进行服务化信息系统软件开发时,建立与其特点相适应的用户需求分析方法显得至关重要和迫切。
技术实现思路
有鉴于此,本专利技术提供一种服务化信息系统需求的离散划分方法,即帮助软件需求分析人员对用户的服务需求进行建模和分析,实现业务需求与服务的对齐,为后续的服务开 ...
【技术保护点】
1.一种服务化信息系统需求的离散划分方法,其特征在于,所述方法包括以下步骤:S1、通过对服务化信息系统的业务场景的分析,运用自然语言处理方式,从中抽取初始的业务目标;S2、依据所述业务场景中的核心词集,筛选包含N个核心词的服务文档集,并对服务文档集进行聚类,根据筛选出的候选服务文档,集中抽取各个服务文档集蕴含的功能目标,得到各个类簇的服务功能目标,其中,N为大于等于1的整数;S3、根据初始业务目标,从步骤S2中获取的服务功能目标集中进行选择、修改或增加,得到可操作服务功能目标,从而建立初始业务目标与可操作服务功能目标之间的关系,构造相应的目标模型,进而根据目标模型中的可操作服务功能目标,定义相应的服务需求接口描述。
【技术特征摘要】
1.一种服务化信息系统需求的离散划分方法,其特征在于,所述方法包括以下步骤:S1、通过对服务化信息系统的业务场景的分析,运用自然语言处理方式,从中抽取初始的业务目标;S2、依据所述业务场景中的核心词集,筛选包含N个核心词的服务文档集,并对服务文档集进行聚类,根据筛选出的候选服务文档,集中抽取各个服务文档集蕴含的功能目标,得到各个类簇的服务功能目标,其中,N为大于等于1的整数;S3、根据初始业务目标,从步骤S2中获取的服务功能目标集中进行选择、修改或增加,得到可操作服务功能目标,从而建立初始业务目标与可操作服务功能目标之间的关系,构造相应的目标模型,进而根据目标模型中的可操作服务功能目标,定义相应的服务需求接口描述。2.根据权利要求1所述一种服务化信息系统需求的离散划分方法,其特征在于,所述步骤S1包括以下步骤:S11、将业务场景描述进行预处理,首先进行分词,利用自然语言处理工具,得到业务场景描述中包含的单词集合,然后利用词干化技术进行词形标准化,以便所有词还原成其基本原形,在所述还原过程中保留在业务场景描述文件中重复出现的词,最后进行去停用词,即删除对表达功能需求无意义的词,包括介词、连词和代词;S12、从预处理后的业务场景描述中提取基本业务目标;所述基本业务目标表示为动词-名词短语形式。3.根据权利要求2所述一种服务化信息系统需求的离散划分方法,其特征在于,所述步骤S12中提取的基本业务目标是通过StanfordParser工具中的词汇间的依存关系来抽取通过动词-名词短语形式表达的目标。4.根据权利要求3所述一种服务化信息系统需求的离散划分方法,其特征在于,词汇依存关系描述语句中各个单词之间的二元关系,进行目标抽取时利用两类依存关系包括:S121、Dobj(w1,w2):表示在主动语态的句子中的名词w2是动词w1的直接宾语,运用StanfordParser解析后,得到词汇依存关系,即找出w1及w2在句中的位置,并从中识别出目标;S122、Nsubjpass(w3,w4):表示w4是在被动语态的句子中的动词w3的主语,利用StanfordParser解析后,可以得到词汇依存关系,即找出w3及w4在句中的位置,并从中识别出目标。5.根据权利要求4所述一种服务化信息系统需求的离散划分方法,其特征在于,所述步骤S2中包括以下步骤:S21、识别业务场景描述中的核心词,采用TF-IDF技术度量业务场景描述中所有单词的权重,tf-idfs,w代表单词w在业务场景描述s中的TF-IDF权重,计算如下:其中,|S|代表业务场景描述与已有服务文档集组成的集合S所包含的文档数;代表s包含的所有词的频次之和;代表包含w的文档数,根据业务场景描述中的TF-IDF权重对单词进行排序,将权重值的TopK作为描述中的核心词;S22、依据业务场景中的核心词集,选择包含核心词的服务文档集,即对每个核心词而言,搜索包含该核心词的服务文档,将所有得到的服务文档取并集,得到候选服务文档集;S23、采用步骤S11的方式对选择出的候选服务文档集进行预处理,然后对该服务文档集进行聚类;S24、按照步骤S12的处理方式从步骤S22选择出的候选服务文档集中抽取各个服...
【专利技术属性】
技术研发人员:赵恒,王健,梁鹏,陈娟,
申请(专利权)人:中国船舶重工集团公司第七零九研究所,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。