电子政务项目具有更多的行政管理内涵,这使得电子政务项目评价专家组的知识结构对于项目管理具有十分重要的作用。基于认知科学理论和心理学理论,专家个体的多种特征差异是导致认知差异和情感极性差异的根本原因。专家组作为均衡这种差异的群体决策方法,其是否更加有效的问题实际应建立在专家组多种特征均衡的组成方法之上。据此,刻画专家特征、实现基于特征均衡的专家组推荐方法对于电子政务项目评价的一致性并提升项目评价总体水平具有重要的基础价值。本成果用于项目评价前的专家抽取阶段,可以大幅度提升专家组与被评项目间的符合性、多维特征均衡性,进而提升项目评价的结果一致性水平。
【技术实现步骤摘要】
基于多维特征均衡的电子政务项目评价专家组推荐方法1、
计算机科学与技术(人工智能、知识工程)、科学技术管理与情报学、知识计量学、知识管理、文本处理技术2、
技术介绍
(1)科学技术管理与情报学科学学的研究更加注重对于专家研究专长与所评价项目的一致性、专家阅历与权威性等要素,目的是尽可能实现同行评价,解决复杂的知识边界带来的认知差异问题。情报学的研究侧重具有特定知识类型的专家发现方法,是科学学研究的方法论之一。科学技术管理中,元评价理论针对专家评价问题提供了理解专家评价质量偏差的方法。元评价指标主要包括偏差系数、变异系数等基于评分数据构建的客观指标。(2)知识计量学知识计量学是专家专长识别的基础理论,知识计量学中定义了知识元作为知识计量的基本单位。专家意见作为一个知识单元,是由不同的知识元按照不同结构组成的类比基础。科技文献实际上就是不同的知识单元,在科技文献中可以通过文本挖掘技术获取知识元。在评价目标导向的专家特征定义基础上,以电子政务项目评审过程中累积的专家意见作为主要元评价的数据源,利用知识挖掘、知识计量的基本方法实现对专家多维特征的刻画,进而完成基于多维特征均衡的专家组推荐方法具有问题针对性与合理性。(3)知识管理以电子政务项目评审专家具备时间连续性的项目评价打分表与专家意见短文本为数据源,对专家意见进行文本挖掘,完成知识获取。以同时刻形成的专家组综合打分与专家组意见文本作为类比依据评价专家的水平等。包含以下内容:①建立项目知识概念树:项目知识概念树实际上是一种针对评价目标的、具有标准概念的分层知识表示方法。项目知识概念树的作用在这里是支持对专家评审意见实体进行分层语义识别,可以支持基于SAO结构的依存句法分析对专家意见文本进行结构化处理后,实现基于概念树的SAO结构语义映射,从而实现对专家意见文本中的实体进行不同概念层次的语义识别。②建立电子政务项目知识本体:项目知识本体可以比较完整地表示项目背景知识,也是知识融合的语义规范。电子政务项目知识本体的概念与概念间的关系来自于电子政务项目管理的相关标准与规定。③意见挖掘技术:意见挖掘是专家意见文本中知识获取的有效手段。短文本意见挖掘的难点在于短文本中对意见元素的表达具有形式多样或非显式的方式,在中文语境中则更加难以理解。自动化的短文本理解需要依赖额外的知识,这些知识可以帮助机器充分挖掘短文本中词与词之间的联系,如语义相关性。④知识聚合技术:从知识管理视角看,专家组的知识结构可以用组内多位专家的知识结构聚合来进行刻画。专家组的情感极性、评价经验则可以通过科学计量来呈现,进而可以计算专家组的多维特征。(4)文本处理技术常规文本处理技术:包括项目评价指标打分表的整理,利用电子政务项目的标准与管理规范训练项目的概念词库,辅之以同义词、近义词构成的基础词库。利用开源工具Hanlp对专家意见文本进行分句、分词、词性标注、去除无意义的停用词,利用依存句法分析识别语句SAO(主谓宾)结构,进行多主语或多宾语的意见句拆分,将包含多评价对象的复杂句细化为多个只包含唯一评价对象的SAO结构简单句等。(5)情感分析技术利用深度学习模型对专家意见语句进行情感倾向判定,利用RNN、LSTM、BIRNN、BILSTM四种分类器进行情感分类对比,得到最优的语义确定、情感倾向确定的意见集。3、
技术实现思路
本成果采用在评价目标导向的专家特征定义基础上,以电子政务项目评审过程中累积的专家意见作为主要元评价内容,利用知识挖掘、知识计量的基本方法可以实现对专家的针对性多维特征刻画,进而完成基于多维特征均衡的专家组推荐。具体步骤与方法分别描述如下:(1)知识补充与知识表示为实现专家意见中的知识元获取与分类,定义微观层的项目知识概念树层次化地表达项目概念知识与概念间的语义层次;在宏观层引入领域知识本体表示项目知识,支持知识扩充与关联、知识变换以实现隐性知识发现;从而支撑知识元获取与分类的目标。构成概念树与本体的知识均来自国家标准及对电子政务项目的相关管理政策。(2)基于分层语义识别的知识获取专家意见知识获取旨在获取专家意见中的知识元,为专家知识结构刻画、情感极性分析提供基础。该策略分别在词汇层(分词和词性标注)、句法层(命名实体识别和语法分析)、语义层(语义识别)进行知识挖掘与获取。针对评审意见的短文本特征,在语法分析基础上对专家意见进行SAO(subject-action-object)提取以实现结构化知识的获取,再以概念树支撑分层语义识别,挖掘出专家意见评价特征,利用深度学习模型构建情感分类器获得情感极性。该部分具体包括如下内容:①命名实体识别通过投票法集成HMM、CRF、BILSTM、BILSTM-CRF四种命名实体识别方法在政务职能实体抽取中得到较好的结果。在此以专家评审意见文本为数据,首先利用开源工具Hanlp对专家意见文本初步分句、分词、词性标注、去除停用词,然后将其分词特征Xi、词性特性POSi融入命名实体标注以提高集成模型效果。在抽取的同时形成领域实体词库。②内在语义分析与结构化知识获取利用依存句法分析,对多主语或多宾语并列的意见句进行拆分,抽取到细粒度的SAO结构化知识,将其作为基础语义单元来表示专家意见,主语S和宾语O主要表示被评价对象,一般为名词、动名词等,这些词或词组所组成的主语或宾语与项目概念语义紧密相关。③评价特征分层语义识别SAO结构化后的评审意见需要针对主语和宾语进行评价特征分层语义识别,得到针对性强的细粒度评价特征。由于不同专家在概念表达上存在差异,采用精准匹配和基于文本最大相似度的模糊匹配方法综合实现基于概念树的概念语义映射,以得到较好的分层语义识别效果,其方法如下:1)精准匹配方法对于SAO结构文本SAOi,将其主语Si和宾语Oi分别与概念树概念集合C中的概念cj进行双向最大匹配,并将二者匹配成功的概念集合取并集得到集合Ri。若Ri不为空,比较Ri中的每个概念的层次深度,取最大深度的概念为该句的语义识别结果;若Ri为空,则进行模糊匹配。2)模糊匹配方法在意见文本结构化形成过程中,为不破坏专家意见完整性,保留形容词、副词、介词、连词等修饰性词语。但在利用文本相似度计算的模糊匹配中,必须利用分词并通过词性筛选去除修饰性词语以提高准确性,保留主要词语集合Si’={si1,si2,...,sim}和Oi’={oi1,oi2,...,oin}(m、n为词语个数)。因此,将概念集合C中的概念cj进行分词得到cj={cj1,cj2,...,cjt}(t为词语个数)。基于细粒度分词的相似度Sim(Si’,cj)、Sim(Oi’,cj)的计算过程如公式(1)(2)所示。其中sim(sik,cjr)为word2vec词向量余弦相似度计算。通过细粒度分词,采用笛卡尔积形式求平均相似度得到的结果准确性更高。循环概念集合C,计算S本文档来自技高网...
【技术保护点】
1.一种用于电子政务领域的项目评价专家组推荐方法,其特征在于,包括:S1、定义专家特征指标,利用知识计量方法获取电子政务领域的项目评价专家多个维度特征;S2、基于多维特征均衡抽取专家,提升专家组与被评项目间的关联性,以及专家组间对于电子政务领域项目评价的一致性。/n
【技术特征摘要】
1.一种用于电子政务领域的项目评价专家组推荐方法,其特征在于,包括:S1、定义专家特征指标,利用知识计量方法获取电子政务领域的项目评价专家多个维度特征;S2、基于多维特征均衡抽取专家,提升专家组与被评项目间的关联性,以及专家组间对于电子政务领域项目评价的一致性。
2.根据权利要求1所述的方法,其特征在于所述方法利用非结构化文本,即专家评审意见的长...
【专利技术属性】
技术研发人员:华斌,吴诺,贺欣,
申请(专利权)人:华斌,吴诺,贺欣,
类型:发明
国别省市:天津;12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。