基于映射等价关系的属性约简方法、系统及装置制造方法及图纸

技术编号：38815214 阅读：10 留言：0更新日期：2023-09-15 19:54

本发明专利技术公开了基于映射等价关系的属性约简方法，包括：从连续型数据分类的角度出发，根据样本的决策值，将样本分为不同的决策类，并寻找决策类的决策中心；根据样本与决策中心的距离，分别取与该样本距离最近与距离最远的决策类的决策值，将样本映射到新的属性空间中；根据新属性空间中的等价关系，在原论域中建立映射等价关系，通过映射等价关系进行利息粒化；将映射质量作为度量准则，利用前向贪心算法计算，当属性集合的映射质量大于全体属性的映射质量时，得到最终的约简结果。本发明专利技术通过引入映射等价关系进行信息粒化，不仅求解属性约简的时间效率得到了极大的提升，而且能保持相当的分类性能。相当的分类性能。相当的分类性能。

全部详细技术资料下载

【技术实现步骤摘要】
基于映射等价关系的属性约简方法、系统及装置

[0001]本专利技术属于数据挖掘预处理
，具体是指基于映射等价关系的属性约简方法。

技术介绍

[0002]近几年来，随着属性约简在机器学习、数据挖掘和知识发现等领域的应用，针对属性约简的相关研究日趋成熟。属性约简作为一种特征选择技术，是粗糙集理论的核心研究方向之一。
[0003]在粗糙集理论中，全体样本称为论域，通过样本间的不可分辨关系，可将论域划分为一个个样本子集，这个过程被称为信息粒化，划分后的样本子集被称为信息粒。信息粒是论域的基本单位，论域中的任意概念都可以通过信息粒的并集进行逼近。这一方法模拟了人类的学习和推理过程，便于理解和推广，因而得到了广泛的重视。遗憾的是，作为一种有效的粒计算模型，基于不可分辨关系的经典粗糙集模型，只适合于处理离散型数据，对于现实应用中广泛存在的连续型数据却不能直接处理。为了解决这一问题，学者提出了邻域粗糙集的概念。
[0004]邻域粗糙集理论自提出以来，相关概念得到了极大的拓展。基于δ
‑
邻域关系拓展的模型都需要预先指定一个邻域半径，而在实际应用中，获取邻域半径等先验知识是比较困难的。有学者通过一个自适应算法，动态的为每个样本生成合适的邻域半径，产生了GAP邻域粗糙集模型。以上模型的提出极大扩展了邻域粗糙集的应用范围。学者们可以根据数据集的特点灵活选用不同的模型。为了获取约简后的属性，除了选择合适的模型外，还需要对算法进行研究。
[0005]分辨矩阵和回溯策略是穷举法的典型应用，虽然该方法...

【技术保护点】

【技术特征摘要】
1.基于映射等价关系的属性约简方法，其特征在于，包括以下步骤：步骤S1：从数据分类的角度出发，根据样本的决策值，将样本分为不同的决策类，并寻找决策类的决策中心；步骤S2：根据样本与决策中心的距离，分别取与该样本距离最近与距离最远的决策类的决策值，将样本映射到新的属性空间中；步骤S3：在新的属性空间中，对论域进行信息粒化，即根据新属性空间中的等价关系在原论域中建立映射等价关系，对样本进行划分，相同样本的集合称为映射等价类；步骤S4：将映射质量作为度量准则，利用前向贪心算法计算每个属性集合的映射质量，当属性集合的映射质量大于全体属性的映射质量时，得到最终的约简结果。2.根据权利要求1所述的基于映射等价关系的属性约简方法，其特征在于：步骤S1中所述的数据为连续型数据。3.根据权利要求1所述的基于映射等价关系的属性约简方法，其特征在于：步骤S2中所述的将样本映射到新的属性空间中，步骤为将不同决策中心按照与样本的距离从近到远排序，取距离样本最近和最远的决策类的决策值，作为该样本在新属性空间中的属性值。4.根据权利要求1所述的基于映射等价关系的属性约简方法，其特征在于：步骤S3中，根据样本在新的属性空间中是否等价，判断样本是否满足映射等价关系，满足映射等价关系的样本会被划分到同一个映射等价类。5.根据权利要求1所述的基于映射等价关系的属性约简方法，其特征在于：步骤S4中映射质量的大小作为衡量属性重要度的标准，依据加入的属性组不同而产生相应的变化。6.根据权利要求5所述的基于映射等价关系的属性约简方法，其特征在于：所述映射质量越大代表当前属性组导致的信息粒化更加理想，说明该组属性能够凸显样本的关...

【专利技术属性】
技术研发人员：刘长顺，宋晶晶，陈建军，徐泰华，王平心，
申请(专利权)人：江苏科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人