本申请实施例公开了一种图表化的主成分分析方法、装置、电子设备及存储介质,所述方法包括:获得与指定对象对应的原始特征;通过主成分分析对所述原始特征进行自动归类,获得综合特征和对应的特征贡献率;对所述综合特征和所述特征贡献率进行图表化处理,获得综合图表;根据所述综合图表对所述综合特征进行筛选,获得目标特征,应用本方法实施例提供的方法,能够以图表化的形式,清晰直观地将需要处理的信息展示出来。理的信息展示出来。理的信息展示出来。
Graphical principal component analysis method, device, electronic equipment and storage medium
【技术实现步骤摘要】
图表化的主成分分析方法、装置、电子设备及存储介质
[0001]本申请涉及数据处理
,尤其涉及一种图表化的主成分分析方法、 装置、电子设备及存储介质。
技术介绍
[0002]在医学研究或流行病学调查过程中,为了能够完整的收集到所研究对象的 所有信息,往往需要从多角度对多个变量进行信息的采集,变量越全面,所收 集信息和数据对所研究事物的反应就越完整、越准确。主成分分析方法 (Principal Component Analysis,PCA)是一种常用的数据分析方法。PCA通过 线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主 要特征分量,常用于高维数据的降维。然而,由于该方法建立在复杂的数学原 理基础上,要理解中间的过程和最后的结果呈现都需要比较强的理论基础,对 于广大的研究者来说,存在非常大的局限性。
技术实现思路
[0003]本申请实施例为了解决
技术介绍
中存在的上述问题,创造性地提供一种图 表化的主成分分析方法、装置、电子设备及存储介质。
[0004]根据本申请实施例第一方面,提供了一种图表化的主成分分析方法,所述 方法包括:获得与指定对象对应的原始特征;通过主成分分析对所述原始特征 进行自动归类,获得综合特征和对应的特征贡献率;对所述综合特征和所述特 征贡献率进行图表化处理,获得综合图表;根据所述综合图表对所述综合特征 进行筛选,获得目标特征。
[0005]根据本申请一实施方式,所述对所述综合特征和所述特征贡献率进行图表 化处理,获得综合图表,包括:根据所述综合特征和所述特征贡献率确定第一 横轴坐标和第一纵轴坐标;根据所述第一横轴坐标和第一纵轴坐标构建碎石图, 获得特定碎石图。
[0006]根据本申请一实施方式,所述对所述综合特征和所述特征贡献率进行图表 化处理,获得综合图表,包括:根据特征贡献率对所述综合特征按数值进行排 序,获得综合特征序列;按照综合特征序列对所述特征贡献率进行依次累加, 获得与每一个综合特征对应的累计贡献率;根据所述综合特征、所述特征贡献 率和所述累计贡献率构建帕累托图,获得特定帕累托图。
[0007]根据本申请一实施方式,所述根据所述综合图表对所述综合特征进行筛选, 获得目标特征,包括:对所述综合图表进行边际效益分析,将满足预设阈值的 综合特征确定为目标特征。
[0008]根据本申请一实施方式,所述方法还包括:根据所述目标特征进行数据处 理,以确定与所述原始特征对应的目标模型。
[0009]根据本申请一实施方式,所述通过主成分分析对所述原始特征进行自动归 类,获得综合特征和对应的特征贡献率,包括:对所述原始特征进行标准化处 理,获得标准指标值和对应所述标准指标值的相关性矩阵;根据所述相关性矩 阵确定特征值和对应的特征
向量;根据所述特征值和所述特征向量确定所述综 合特征和对应的特征贡献率。
[0010]根据本申请一实施方式,在通过主成分分析对所述原始特征进行自动归类 之前,所述方法还包括:通过预设条件判断所述原始特征是满足强相关性阈值; 当所述原始特征满足强相关性阈值的情况下,通过主成分分析对所述原始特征 进行自动归类。
[0011]根据本申请实施例第二方面,还提供了一种图表化的主成分分析装置,所 述装置包括:获得模块,用于获得与指定对象对应的原始特征;归类模块,用 于通过主成分分析对所述原始特征进行自动归类,获得综合特征和对应的特征 贡献率;图表化模块,用于对所述综合特征和所述特征贡献率进行图表化处理, 获得综合图表;筛选模块,用于根据所述综合图表对所述综合特征进行筛选, 获得目标特征。
[0012]根据本申请一实施方式,所述图表化模块,用于根据所述综合特征和所述 特征贡献率确定第一横轴坐标和第一纵轴坐标;根据所述第一横轴坐标和第一 纵轴坐标构建碎石图,获得特定碎石图。
[0013]根据本申请一实施方式,所述图表化模块,还用于根据特征贡献率对所述 综合特征按数值进行排序,获得综合特征序列;按照综合特征序列对所述特征 贡献率进行依次累加,获得与每一个综合特征对应的累计贡献率;根据所述综 合特征、所述特征贡献率和所述累计贡献率构建帕累托图,获得特定帕累托图。
[0014]根据本申请一实施方式,所述筛选模块,用于对所述综合图表进行边际效 益分析,将满足预设阈值的综合特征确定为目标特征。
[0015]根据本申请一实施方式,所述装置还包括:确定模块,用于根据所述目标 特征进行数据处理,以确定与所述原始特征对应的目标模型。
[0016]根据本申请一实施方式,所述归类模块,包括:标准化子模块,用于对所 述原始特征进行标准化处理,获得标准指标值和对应所述标准指标值的相关性 矩阵;确定子模块,用于根据所述相关性矩阵确定特征值和对应的特征向量; 所述确定子模块,还用于根据所述特征值和所述特征向量确定所述综合特征和 对应的特征贡献率。
[0017]根据本申请一实施方式,所述装置还包括:判断模块,用于通过预设条件 判断所述原始特征是满足强相关性阈值;当所述原始特征满足强相关性阈值的 情况下,通过主成分分析对所述原始特征进行自动归类。
[0018]根据本申请实施例第三方面,又提供了一种计算机设备,包括:存储器、 处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所 述处理器执行所述程序时实现如上述实施例第一方面中任一项所述的方法。
[0019]根据本申请实施例第四方面,还提供了一种包含计算机可执行指令的存储 介质,所述计算机可执行指令在由计算机处理器执行时用于执行如上述实施例 第一方面中任一项所述的方法。
[0020]本申请实施例提供的图表化的主成分分析方法、设备及计算机可读存储介 质,通过主成分分析将原始特征进行自动归类,得到总数量少于原始特征的综 合特征和与综合特征对应的特征贡献率,特征贡献率用于判断综合特征与指定 对象对应的信息贡献率,然后通过对综合特征和特征贡献率进行图表化处理, 形成一种直观的、图表化的信息呈现方式,无需理解算法复杂的数学原理和理 论基础,大大降低了使用者对专业知识的依赖程度,使使用者能够通过综合图 表快速而准确地确定目标特征,进而为其他决策提供合理的
依据。
[0021]需要理解的是,本申请的教导并不需要实现上面所述的全部有益效果,而 是特定的技术方案可以实现特定的技术效果,并且本申请的其他实施方式还能 够实现上面未提到的有益效果。
附图说明
[0022]通过参考附图阅读下文的详细描述,本申请示例性实施方式的上述以及其 他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式 示出了本申请的若干实施方式,其中:
[0023]在附图中,相同或对应的标号表示相同或对应的部分。
[0024]图1示出了本申请实施例一种图表化的主成分分析方法的实现流程示意图 一;
[0025]图2示出了本申请实施例一种图表化的主成分分析方法的实现流程示意图 二;
[002本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种图表化的主成分分析方法,其特征在于,所述方法包括:获得与指定对象对应的原始特征;通过主成分分析对所述原始特征进行自动归类,获得综合特征和对应的特征贡献率;对所述综合特征和所述特征贡献率进行图表化处理,获得综合图表;根据所述综合图表对所述综合特征进行筛选,获得目标特征。2.根据权利要求1所述的方法,其特征在于,所述对所述综合特征和所述特征贡献率进行图表化处理,获得综合图表,包括:根据所述综合特征和所述特征贡献率确定第一横轴坐标和第一纵轴坐标;根据所述第一横轴坐标和第一纵轴坐标构建碎石图,获得特定碎石图。3.根据权利要求1所述的方法,其特征在于,所述对所述综合特征和所述特征贡献率进行图表化处理,获得综合图表,包括:根据特征贡献率对所述综合特征按数值进行排序,获得综合特征序列;按照综合特征序列对所述特征贡献率进行依次累加,获得与每一个综合特征对应的累计贡献率;根据所述综合特征、所述特征贡献率和所述累计贡献率构建帕累托图,获得特定帕累托图。4.根据权利要求1所述的方法,其特征在于,所述根据所述综合图表对所述综合特征进行筛选,获得目标特征,包括:对所述综合图表进行边际效益分析,将满足预设阈值的综合特征确定为目标特征。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述目标特征进行数据处理,以确定与所述原始特征对应的目标模型。6.根据权利要求1所述的方法,其特征在于,所述通过主...
【专利技术属性】
技术研发人员:李欣,裴宏悦,
申请(专利权)人:天津开心生活科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。