System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据分类,具体涉及一种基于邻域划分的特征提取方法。本申请要求优先权,在先申请的申请号为:2024108350454,名称为:一种基于邻域划分的特征提取方法,优先权日为2024-06-26。
技术介绍
1、工业数据一般包含多种属性,通常以数值型数据记载,无法直接利用pawlak模型对工业数据进行分类,通常采用间接法和直接法。间接法是先采用离散化算法把工业数据转化成符号型数据,再采用pawlak模型进行处理,虽然能够在一定程度上解决了pawlak模型在数值型数据上的应用问题,但忽略了原始数值到离散值的隶属程度信息,造成信息丢失,对分类结果产生不良影响;例如,工业数据是进行预测性维护的数据,若存在分类结果的不准确,可能误判设备的状态,导致不必要的维护或忽略潜在的故障,进而影响生产效率和安全;例如,工业数据是进行质量呈现的参数,其分类精度的降低可能导致对产品质量的误判,从而影响产品的合格率和一致性。
2、直接法是通过扩展pawlak模型来直接处理原始数据,考虑到典型的模糊粗糙集模型是在数值型属性上建立覆盖整个值域的多个模糊概念来构建论域上的模糊相似关系,然而针对工业数据的分类需求构建行之有效的模糊相似关系从而提高分类质量是值得探讨的。
技术实现思路
1、本专利技术的目的在于提供一种基于邻域划分的特征提取方法,所要解决的技术问题是如何提高分类质量。
2、本专利技术通过下述技术方案实现:
3、一种基于邻域划分的特征提取方法,该方法用于分析工业数
4、s100、对邻域进行划分,判断该邻域是一致邻域还是不一致邻域;
5、s200、构建邻域划分分类模型;通过上述邻域划分分类模型对对象进行分类,得到一致邻域对象和不一致邻域对象;将一致邻域对象分类至决策正域,将不一致邻域对象分类至决策边界;
6、s300、构建不平衡二叉树算法;通过上述不平衡二叉树算法计算论域中的一致邻域对象和不一致邻域对象;
7、其中,论域可以是从数据库中调用的工业数据集,且将工业数据集中的工业数据作为对象;
8、s400、构建邻域正域确定度算法;通过上述邻域正域确定度算法确定论域中所有对象对决策正域的贡献度总和;单个上述对象对决策正域的贡献度为[0,1];
9、s500、构建特征提取算法,通过特征提取算法确定提取属性并用于分类。
10、其中,分类是通过所述提取属性对论域进行的。
11、通过上述邻域划分,定义一致邻域和不一致邻域,邻域划分分类模型将对象分类至决策正域和决策边界,一致邻域对象被分类至决策正域,不一致邻域对象被分类至决策边界,决策正域包含与某一类别高度相关的对象,决策边界包含分类较为模糊的对象;不平衡二叉树能快速定位到与特定类别紧密相关的对象,提高分类效率,通过树的层次结构,逐步细化分类决策,从而提高分类精度和分类质量;通过邻域正域确定度算法,量化论域中每个对象对决策正域的贡献度,该贡献度的取值区间是[0,1],为对象提供了与特定类别关联程度的量化指标,相较于现有技术中对象对决策正域的贡献度{0,1}来说,更能反映属性的分类能力;量化指标有助于识别对分类决策起关键作用的属性,进而提高分类质量。
12、进一步的,对邻域进行划分,判断该邻域是一致邻域还是不一致邻域,具体步骤如下:
13、s110、获取邻域决策空间nds=(u,n,d)、邻域关系n、条件属性集c、决策属性集d、决策值域vd、属性集p和对象u;
14、s120、设置前置条件:上述属性集p包含于条件属性集c,对象u属于论域u;
15、s130、基于决策值di对邻域δp(u)进行划分,得到邻域子区,公式如下:
16、
17、其中,δp(u)表示在属性集p下对象u的邻域;表示邻域δp(u)内决策值为di的对象集合,即di的邻域子区;v表示论域中的对象v;f(v,d)表示对象v的决策值;di表示决策值;
18、s140、通过邻域δp(u)和邻域子区确定子区概率,公式如下:
19、
20、其中,表示邻域子区的子区概率;表示邻域子区内的对象个数;|δp(u)|表示邻域δp(u)内的对象个数;
21、s150、通过邻域δp(u)内各邻域子区的决策值集合,判定邻域δp(u)是否为一致邻域;
22、s151、若邻域δp(u)内任意两个邻域子区的决策值集合相等,则邻域δp(u)为一致邻域;
23、s152、若邻域δp(u)内存在不相等的两个邻域子区的决策值集合,则邻域δp(u)为不一致邻域;
24、进一步的,上述构建邻域划分分类模型的步骤包括:
25、s210、通过|λ(δp(u))|是否等于1,确定该对象u属于决策正域还是决策边界;其中,|λ(δp(u))|表示邻域δp(u)所包含对象的决策值集合的决策值个数;
26、s211、若上述|λ(δp(u))|=1,则该对象u属于决策正域;
27、s212、若上述|λ(δp(u))|>1,则该对象u属于决策边界。
28、进一步的,构建不平衡二叉树算法的步骤包括:
29、s310、将上述论域作为根节点
30、s320、通过计算不平衡二叉树算法的左子节点;
31、通过计算不平衡二叉树算法的右子节点;
32、其中,表示第k个左子节点;ψcon表示一致邻域增维算子;表示第k-1个左子节点;ak表示第k个属性,ak属于属性集p;表示第k个右子节点;ψinc表示不一致邻域增维算子;表示第k-1个右子节点;
33、s330、将第k个右子节点作为父节点,执行s320,得到第k+1个左子节点和第k+1个右子节点
34、该不平衡二叉树算法的左子节点为叶节点,右子节点不断生长。
35、进一步的,上述邻域正域确定度算法的公式如下:
36、
37、其中,nprcp表示在属性集p下的邻域正域确定度;u表示论域;σnprc(u)表示对象u对决策正域的贡献度;表示对象u的焦点子区;表示对象u的焦点子区概率;df表示焦点子区的决策值;npu(u)表示在属性集p下对象u的邻域划分不确定度。
38、进一步的,构建特征提取算法,通过特征提取算法确定提取属性,具体步骤包括:
39、s510、设置附加条件:属性b属于属性集p在条件属性集c中的相对补集;
40、s520、计算属性b相对于决策属性集d的重要度,公式如下:
41、sig(b,p,d)=nprcp∪{b}-nprcp
42、其中,sig(b,p,d)表示属性b相对于决策属性集d的重要度;nprcp∪{b}表示在属性集p∪{b}下的邻域正域确定度;nprcp表示在属性集p下的邻域正域确定度;
43本文档来自技高网...
【技术保护点】
1.一种基于邻域划分的特征提取方法,该方法用于分析数据,提取关键的属性指标;其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于邻域划分的特征提取方法,其特征在于,对邻域进行划分,判断该邻域是一致邻域还是不一致邻域,具体步骤如下:
3.根据权利要求2所述的一种基于邻域划分的特征提取方法,其特征在于,所述构建邻域划分分类模型的步骤包括:
4.根据权利要求1所述的一种基于邻域划分的特征提取方法,其特征在于,所述构建不平衡二叉树算法的步骤包括:
5.根据权利要求3所述的一种基于邻域划分的特征提取方法,其特征在于,所述邻域正域确定度算法的公式如下:
6.根据权利要求5所述的一种基于邻域划分的特征提取方法,其特征在于,构建特征提取算法,通过特征提取算法确定提取属性,具体步骤包括:
7.根据权利要求5所述的一种基于邻域划分的特征提取方法,其特征在于,在所述属性集P下对象u的邻域划分不确定度的计算公式如下:
【技术特征摘要】
1.一种基于邻域划分的特征提取方法,该方法用于分析数据,提取关键的属性指标;其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于邻域划分的特征提取方法,其特征在于,对邻域进行划分,判断该邻域是一致邻域还是不一致邻域,具体步骤如下:
3.根据权利要求2所述的一种基于邻域划分的特征提取方法,其特征在于,所述构建邻域划分分类模型的步骤包括:
4.根据权利要求1所述的一种基于邻域划分的特征提取方法,其特...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。