一种基于动态规划的模糊集自动划分方法技术

技术编号:26033910 阅读:72 留言:0更新日期:2020-10-23 21:11
本发明专利技术涉及一种基于动态规划的模糊集自动划分方法,属于模糊理论系统、知识发现技术领域。本发明专利技术根据动态规划理论,针对传统样本数据模糊化方法需要预先指定模糊集划分个数的问题,设计一个优化目标函数,首先对每个属性的属性值数据从大到小进行排序,然后根据提出的动态规划算法对排好序的数据进行样本区间的自动划分,最后计算每个区间所涵盖属性值数据的均值,并将所有的均值作为参数对该属性上的模糊集进行构建。本发明专利技术对样本数据的模糊化问题进行研究,实现了每个属性上模糊集自动构建的同时又使得所构建的模糊集具备较好的表征效果。

【技术实现步骤摘要】
一种基于动态规划的模糊集自动划分方法
本专利技术涉及一种基于动态规划的模糊集自动划分方法,属于模糊理论系统、知识发现

技术介绍
随着科技的进步、联网的发展以及数据存储能力的不断提升,人们在日常的社会生活中产生了越来越多的数据积累,例如“旅游”、“医疗”、“饮食”、“购物”等,人类社会已进入大数据时代。这些来自各行各业的海量数据中蕴含着极其有价值的信息,与我们的生活息息相关、密不可分的,对社会生产和日常生活产生了重要的影响,已经成为了一种能够加强决策、发现和优化处理模式的高容量、高速度以及多样化的信息资产。因此,如何合理有效的从这些海量数据发现有价值的信息并对这些信息进行应用的研究也就愈发受到社会各界的重视。这些“有价值的信息”可认为是一种“知识”,对“有价值的信息”进行提取的过程可认为是知识发现的过程。知识发现是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。知识发现的主要目的是探索应用领域的新知识,一般来说由数据预处理、数据变换、数据挖掘、解释分析等基本步骤构成。知识发现从数据中进行知识发现,其过程并不是简单的查询,而是根据实际情况为用户需要必要的决策支持,所发现的知识一般都是特定条件下针对特定问题的知识,并且这些知识还能被自然语言所表达,易于被用户所理解。目前,从数据中进行知识发现的研究已经在商业服务、航海航天、股票期货、工业生产等方面产生了越来越多的价值。在当今数字化和智能化快速发展的信息化时代,从数据中快速有效地发现知识变得越来越重要。目前国内外研究学者已经提出了各种各样的知识发现技术,例如统计方法、神经网络、决策树、规则提取、支持向量机、模糊集、粗糙集等方法。在这众多的知识发现方法中,基于模糊集的方法是最常用的知识发现工具之一,该类方法通过构建模糊集对数据集进行模糊化,然后利用模糊规则对知识进行合理表示,并采用模糊逻辑对知识进行推理和应用,这类研究已经涉及到分类、聚类等各种各样的知识工程领域。基于模糊集的方法在收敛速度、准确率以及可解释性等方面具有较大优势,目前成为了一种非常受欢迎的知识发现方法,在信用评估、医疗卫生、交通管理、金融服务等实际领域得到了广泛的应用。在基于模糊集的知识发现方法中,对模糊集进行合理划分和构建是其中的必备步骤。现有的大多数方法在对模糊集进行划分时往往需要预先指定所要划分的个数,而且在数据集的不同属性上一般指定相同个数的模糊集,虽然这种处理方式可以有效地降低时间复杂度,但是却带来了额外的参数负担,并且在参数指定上往往依赖于专家经验。从人们对事物进行认知和感知的过程出发,这种模糊集的划分方式并不能精确地发现数据中的内在规律,因而不能取得最合理有效的表征效果。
技术实现思路
本专利技术要解决的技术问题是提供一种基于动态规划的模糊集自动划分方法,以用于解决传统数据模糊化方法需要预先指定模糊集划分个数的问题,实现在知识发现过程中模糊集自动划分的同时又使得模糊集的表征效果更好的目标。本专利技术采用动态规划的思想,设计了一个优化目标函数,首先对每个属性上的属性值数据进行排序,然后根据提出的动态规划算法对排序好的数据进行样本区间的自动划分,进一步对每个区间所覆盖的数据计算均值,通过将所有均值作为参数来完成对应属性上模糊集的自动构建过程,实现在知识发现过程中既能确保模糊集自动划分的同时又能使所构造的模糊集具有更好表征效果的目标。为了达到上述目标,以知识发现领域常用的具有类标签的实际数据为基础,在动态规划的思想框架下先对不同属性上的数据进行排序,并通过优化目标函数对属性值数据进行自动划分和构建模糊集。提出了一种基于动态规划的模糊集自动划分法方法。本专利技术的技术方案是:一种基于动态规划的模糊集自动划分方法,根据动态规划理论,针对传统样本数据模糊化方法需要预先指定模糊集划分个数的问题,设计了一个优化目标函数,首先对每个属性的属性值数据从大到小进行排序,然后根据提出的动态规划算法对排序好的属性值数据进行样本区间的自动划分,最后计算每个区间所涵盖属性值数据的均值,并将所有的均值作为参数对该属性上的模糊集进行构建。所述基于动态规划的模糊集自动划分方法共包含四个步骤,若表示含有n个样本点的数据集,表示数据集X的m个属性集,样本xi在属性Ak上的属性值用v(xi,Ak)来表示,则其具体实施步骤如下:Step1、对数据集的每个属性Ak的属性值v(xi,Ak)进行从大到小的排序;所述Step1的主要作用是对每个属性上的属性值数据按从大到小进行排序,该步骤可认为是一种数据预处理过程,其主要目的是为步骤Step2做准备。Step2、利用动态规划算法对排序好的属性值数据进行样本区间的自动划分所述步骤Step2的主要作用是利用动态规划算法对属性上排序后的属性值数据进行聚集,可以达到对该属性上数据进行合理自动聚集的目的,其具体步骤为:Step2.1、假设数据集X的属性Ak上属性值按从大到小的原则进行排序,排序后的结果为:p1,p2,...,pn。Step2.2、设f(0)=0,B0=Φ,r0=0,这里f(0)=0表示目标函数的初值为0,B0=Φ表示初始划分,且其不包含任何属性值数据,r0=0表示初始状态,且其从0开始计数。Step2.3、迭代计算f(t),Bt,rt,t=1,2,...,n,计算过程可根据下面的式子:在区间[rt-1,t-1]会有不同的整数值,每个整数值都对应产生一个目标函数值,这里f(t)表示区间[rt-1,t-1]中目标函数最小的目标函数值,rt表示区间[rt-1,t-1]中使目标函数最小的那个整数,Bt表示所产生的一个划分,pi+1,t的定义如下:这里α(0<α≤1)是一个参数,其目的是用于调节划分的粗细或包含属性值数据的多少;该步骤中的||diff(Bt)||的定义如下:表示以[rt-1,t-1]中的整数为下标的属性值数据的进行差分并求和,其目的是对划分进行进一步的修正,使相同划分中的属性值数据尽可能的相近。Step2.4、从Bn(Bn表示产生的所有划分中位于最后的一个划分)开始,利用回溯法得到属性Ak上所有属性值数据的最优划分Step2.5、输出属性Ak上nk个划分:这里每个划分可认为是一个集合,集合中的元素表示被划分到该集合里的属性值数据。Step3、计算划分区间所涵盖属性值数据的平均值所述步骤Step3的主要作用是对属性Ak上的nk个划分分别求取平均值。若用Bs'表示nk个划分中的任意一个,即s=1,2,...,nk,将Bs'中覆盖的所有属性值数据的平均值记为mss,则mss的计算公式如下:这里的p表示Bs'中覆盖的所有属性值数据,|Bs'|表示Bs'中覆盖的属性值数据的个数。Step4、将属性Ak上的所有划分的平均值作为参数,构建模糊集所述步骤Step4的主要作用是利用属性Ak上的每个划分的均值构造模糊集其具体构造过程如下:Step4.1、本文档来自技高网
...

【技术保护点】
1.一种基于动态规划的模糊集自动划分方法,其特征在于:首先对每个属性的属性值数据从大到小进行排序,然后根据提出的动态规划算法对排序好的属性值数据进行样本区间的自动划分,最后计算每个区间所涵盖属性值数据的均值,并将所有的均值作为参数对该属性上的模糊集进行构建。/n

【技术特征摘要】
1.一种基于动态规划的模糊集自动划分方法,其特征在于:首先对每个属性的属性值数据从大到小进行排序,然后根据提出的动态规划算法对排序好的属性值数据进行样本区间的自动划分,最后计算每个区间所涵盖属性值数据的均值,并将所有的均值作为参数对该属性上的模糊集进行构建。


2.根据权利要求1所述的基于动态规划的模糊集自动划分方法,其特征在于具体步骤为:
Step1、对数据集的每个属性Ak上的属性值v(xi,Ak)从大到小进行排序;
Step2、利用动态规划算法对排序好的属性值数据进行样本区间的自动划分
Step3、分别计算划分区间所涵盖属性值数据的平均值
Step4、将属性Ak上每个划分的平均值作为参数,构建该属性上的模糊集


3.根据权利要求2所述的基于动态规划的模糊集自动划分方法,其特征在于:所述步骤Step2的具体步骤为:
Step2.1、假设数据集X的属性Ak上属性值按从大到小的原则进行排序,排序后的结果为:p1,p2,...,pn;
Step2.2、设f(0)=0,B0=Φ,r0=0,f(0)=0表示目标函数的初值为0,B0=Φ表示初始划分,且其不包含任何属性值数据,r0=0表示初始状态,且其从0开始计数;
Step2.3、迭代计算f(t),Bt,rt,t=1,2,...,n,计算过程根据下面的公式:









式中,f(t)表示区间[rt-...

【专利技术属性】
技术研发人员:母亚双孙丽君郭红月王利东刘晓东
申请(专利权)人:河南工业大学
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1