当前位置: 首页 > 专利查询>南华大学专利>正文

基于图的距离分类和主成分分析的评价指标体系构建方法技术

技术编号:12924460 阅读:72 留言:0更新日期:2016-02-25 12:40
一种基于图的距离分类和主成分分析的评价指标体系构建方法,初始评价指标的选取;进行基于图的距离分类的指标分类;进行基于主成分分析的指标筛选;得到简化后的指标体系。利用相关系数与图论中的最短路径相结合的分类方法-图的距离分类法,将相关程度较高的元素划分为一类,从各类中选取指标代表元进行主成分分析,减少信息处理的工作量。选取主成分分析中保留指标及其与保留指标同属一类的指标作为构建指标体系的重要指标,避免重要指标的缺失。

【技术实现步骤摘要】

本专利技术属于信息处理
,涉及一种基于图的距离分类和主成分分析的评价 指标体系构建方法。
技术介绍
评价指标的选取以及指标体系是否合理对评价结果有着至关重要的影响。那么, 如何在复杂庞大的指标体系中筛选指标是评价指标体系构建的一个难题。若对所有的指标 进行评价,必定会因为指标过细过多而极大地增加信息处理的工作量;若只是单独的选出 部分指标,可能会损失很多原始数据信息,导致评价结果的不准确性。 文献:《基于相关-主成分分析的人的全面发展评价指标体系构建》系统工程理论 与实践基于相关-主成分分析的指标体系构建方法,其指标筛选思路为: 1)通过相关性分析删除同一准则层内相关系数大的指标,避免了指标的信息重 复; 2)通过出成分分析删除因子负载小的指标,保证筛选出的指标对评价结果有显著 影响。 指标筛选的相关性分析: 通过计算两个评价指标之间的相关系数,删除相关系数较大的评价指标,消除评 价指标所反映的信息重复对评价结果的影响,简化指标体系相关性分析筛选指标的好处是 剔除信息重复的指标。 具体步骤如下: (1)计算各个评价指标之间的相关系数。设为第i个指标和第j个指标之间 的相关系数,zkl为第k个评价对象第i个指标的值,马为第i个指标的平均值。 根据相关系数计算公式,则Γι]为 ⑵规定一个临界值Μ(0〈Μ〈1),如果|Γι]|>Μ,则可以删除其中的一个评价指标;如 果|Γι]|〈Μ,则同时保留两个评价指标。 指标筛选的主成分分析: 主成分的实质是观测指标的线性组合,主成分分析的模型为: F.j= α jA+α j2X2+A + a jiXi+Λ + α jmXm,j = 1,2,Λ,k 其中,Xi为第 i 个指标(i = 1,2, A,m) ;F.j为第 j 个主成分(j = 1,2, Λ, k) ; a 为对应第j个特征值的特征向量的第i个分量;k为主成分的个数;m为指标个数。 主成分分析的具体步骤: (1)求标准化指标值的相关系数矩阵Rmxm; ⑵求矩阵R的特征值λ J (j = 1,2, Λ,m),λ J表示第j个主成分F J所解释的原 始指标数据的总方差,则主成分匕对原始指标数据的方差贡献率ω ,为: (3)将特征值λ ,按从大到小的顺序排列,根据累积方差贡献率多85%的要求选 取前k个特征值对应的主成分,得到第i个指标在第j个主成分上因子负载矩阵 主成分分析对评价指标的筛选:根据主成分F,上因子负载的绝对值| b ^ |筛选指 标。IbJ越大表明指标i对评价结果的影响越显著,越应当保留;Ibd越小则表明指标对 评价结果的影响越弱,越应当剔除。 现有技术具有以下缺点: 1)相关性分析所得的相关系数所体现的仅是数据之间的相关性,不代表指标之间 的影响程度的相关性。A与B的相关系数很大,但两者对评价对象的影响是独立的,若仅根 据相关性删除其中一个,可能会造成重要指标的缺失; 2)在指标多样复杂的情况下进行主成分分析,若未进行分类,会增加主成分分析 信息处理的工作量,数据分析时舍弃的一部分成分中也可能存在与选取主成分中主要元素 相关程度高的元素,影响评价结果。A与B的相关程度很高,数据分析时,若A对评价结果有 显著影响,那么B也应对评价结果有显著影响,在主成分分析过程中,很可能出现A为选取 主成分中的主要元素,而B为舍弃主成分中的元素,则必然会剔除掉B,这样就会造成重要 指标B的缺失。
技术实现思路
本专利技术的目的是提供一种基于图的距离分类和主成分分析的评价指标体系构建 方法,利用相关系数与图论中的最短路径相结合的分类方法-图的距离分类法,将相关程 度较高的元素划分为一类,从各类中选取指标代表元进行主成分分析,减少信息处理的工 作量。选取主成分分析中保留指标及其与保留指标同属一类的指标作为构建指标体系的重 要指标,避免重要指标的缺失。 本专利技术所采用的技术方案是,一种基于图的距离分类和主成分分析的评价指标体 系构建方法,按照以下步骤进行: 步骤1,初始评价指标的选取; 步骤2,进行基于图的距离分类的指标分类; 步骤3,进行基于主成分分析的指标筛选; 步骤4,得到简化后的指标体系。 本专利技术的特征还在于,进一步的,所述步骤2按照以下步骤进行: 步骤a,数据标准化; 设\为某个指标的观察值,其中i = 1,2, '为标准化数据,令 那么标准化公式为 其中,Xl为指标的观察值,η为指标的个数,S、s分别为指标观察值的均值、标准 差,X/为指标的标准化数据; 步骤b,基于相关系数计算指标之间的距离; 计算指标之间的相关系数,以相关系数的倒数作为两个指标之间的距离,相关系 数越大就体现了两个指标之间的距离越短;相关系数计算公式为 其中Γι;为第i个指标与第j个指标之间的相关系数,X kjP X 别为第k个评价 对象第i和j个指标的值,写和馬分别为第i和j个指标的平均值; 通过相关系数来体现指标之间的距离,取相关系数的倒数作为指标之间的距离, 设山,为第i个指标与第j个指标之间的距离,即 将标准化数据代入相关系数计算公式,得到相关系数矩阵;指标之间的距离即为 指标之间相关系数的倒数; 步骤 c, 基于Floyd算法计算指标之间的最短路径距离; 根据指标之间的距离得到距离完全赋权图G,以初始指标作为图G上的顶点,求出 图G上任意两点间的最短路径距离,即为指标之间的最短路径距离; 令每一个指标对应图G中的一个顶点V,设G的顶点集为V = {Vi, ν2, Λ,vk},贝lj边 集,那么图G是一个完全简单图; 设每条边(X,Vj) (i辛j)所对应的赋权为 ^ij = d ^ 将图G中每一条边都赋权Wij,则称G是一个完全赋权图,在图G中用最短路算法 计算出任意两个顶点之间的最短距离;设d' ^为顶点v Ji = 1,2, Λ, k)到顶点'(j = 1, 2, Λ , k)的最短路径距尚,米用Floyd算法计算图G上任意两点之间的最短路径; 步骤d,基于图论的最短路径距离进行指标分类; 对指标进行分类,其实质就是对图G顶点集的一个划分,BP V = Vi Y V2 Υ Λ Y Vt, 其中 乂工 I Vj= φ Q,j = 1,2, Λ,t)且P为距离参数。 进一步的,所述步骤c中采用Floyd算法按照以下步骤进行:输入完全赋权图的权 矩阵W = ^山"对于顶点v ;和v ,在邻接矩阵中,当存在eik+ejeu时,则更新数值,用eik+ekj代替e ij的值,找出最短路径,得到最短路径矩阵DnXn,其中eg为图G上顶点 v$j v 的距离,即边(v ;,')的赋权值,eik、ekj贝lj分别为边(v ;,vk)和边(vk, ')的赋权值, d'min 〇 进一步的,所述步骤3按照以下步骤进行: 步骤a,选取指标代表元; 从指标分类中选出指标代表元作为主成分分析的指标,根据指标分类当前第1页1 2 3 本文档来自技高网
...

【技术保护点】
一种基于图的距离分类和主成分分析的评价指标体系构建方法,其特征在于,按照以下步骤进行:步骤1,初始评价指标的选取;步骤2,进行基于图的距离分类的指标分类;步骤3,进行基于主成分分析的指标筛选;步骤4,得到简化后的指标体系。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘永招国栋刘清张志军章求才贺桂成
申请(专利权)人:南华大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1