【技术实现步骤摘要】
本专利技术涉及数据分析领域,具体涉及。
技术介绍
进入21世界以来,人们的生活水平随科技的发展而逐步提高,越来越多的人开始关注自身的健康问题,而医学上会根据测量得到的人体健康数据进行健康情况的判定。由于所获得的众多数据会出现属性一样、类别相同的数据,这些数据对于判断整体健康数据来说没有太多帮助,因此如何从众多的数据属性当中获得有效的数据是本领域的重要内容。属性约简是粗糙集和模糊粗糙集应用于医学领域的重要技术。在生物医学中,使用到模糊粗糙集的属性约简,可以大大提高人类健康数据分析的效率。生物医学领域当中会根据对人体检测获得的健康数据进行分析,从而根据分析的结果来判定该实体的健康情况,但是一个实体的健康数据会有很多,真正有决策意义的数据却并没有测得的数据那样多,这就涉及到属性约简的方法,采用基于模糊粗糙集条件熵属性约简可以对获得的人体健康数据进行属性归类,从众多数据中获得需要的有用健康信息。属性约简当中涉及到模糊粗糙集,模糊粗糙集是D.Dubios和H.Prad在1992年提出的,他们将模糊集和粗糙集结合,对粗糙集理论进行了扩展,从而得到了模糊粗糙集。模糊粗糙集相对经典粗糙集的优势就在于引入了模糊集理论,该理论是用模糊集合及隶属度来描述一个对象,使得模糊粗糙集不需要进行经典粗糙集的离散化过程,只需要进行的是模糊化过程,即求解对象隶属度值的过程。相比离散化,模糊化能够较好的保留原来健康数据连续属性值之间的差异性及过渡性。
技术实现思路
本专利技术的目的是为了提高数据分析的效率而提出的一种。为了实现以上专利技术目的,本专利技术采取的技术方案如下:一种,包 ...
【技术保护点】
一种基于模糊粗糙集条件熵属性约简的数据分析方法,其特征在于:包括以下步骤:S1:将数据的属性构造为一个模糊粗糙集,同时确定数据的模糊决策表其中U是论域,A是由对象的基本属性构成的集合,C为条件属性,D为决策属性,V代表信息函数f的值域;S2:取一个集合T,并规定它为空集,令这个集合T的最优依赖函数Hbest为0,A的个数i=1;S3:在每一次判断时,都使得集合T为前一次执行时符合条件的集合T,并使得期望的依赖函数Hpre为最优依赖函数值Hbest;S4:对于每一个其中R是等价关系的集合,计算获得决策属性D和属性的条件熵并判断它与条件熵H(D|T)的大小关系;如果前者小于后者,那么就令集合T为新的集合如果前者大于后者,那么就需要寻找新的更加符合条件的属性集合;S5:当判断是否为新的数据属性集合时,要判断i个子集A是否已经全部覆盖了集合C?R,如果还没有覆盖完全,即i<基数|C?R|,则让i=i+1,同时重复S4;如果此时i为C?R的基数|C?R|,则进行S6;S6:当i为C?R的基数|C?R|后,令最优依赖函数Hbest为条件熵H(D|T);S7:比较期望的依赖函数Hpre与最优依赖函数 ...
【技术特征摘要】
1.一种基于模糊粗糙集条件熵属性约简的数据分析方法,其特征在于:包括以下步骤:S1:将数据的属性构造为一个模糊粗糙集,同时确定数据的模糊决策表DT= (I;, = CuD.V.r),其中U是论域,A是由对象的基本属性构成的集合,C为条件属性,D为决策属性,V代表信息函数f的值域;S2:取一个集合T,并规定它为空集,令这个集合T的最优依赖函数Hbest为O,A的个数i=l ; S3:在每一次判断时,都使得集合T为前一次执行时符合条件的集合T,并使得期望的依赖函数Hpra为最优依赖函数值Hbest ;S4:对于每一个A丨e C-/?,其中R是等价关系的集合,计算获得决策属性D和属性的条件熵并判断它与条件熵H(D|T)的大小关系;如果前者小于后者,那么就令集合T为新的集合如果前者大于后者,那么就需要寻找新的更加符合条件的属性集合;S5:当判断是否为新的数据属性集合时,要判断i个子集A是否已经全部覆盖了集合C-R,如果还没有覆盖完全,即i〈基数|C-R|,则让i=i+l,同时重复S4 ;如果此时i为C-R的基数I C-R |,则进行S6 ; S6:当i为C-R的基数|C-R|后,令最优依赖函数Hbest为条件熵H(D|T); S7:比较期望的依赖函数Hrm与最优依赖函数Hbest的差值是否在规定的误差阈值n范围之内,如果在规定的范围之内则输出约简结果;如果不在规定的范围之内则返回S3重新进行约简。2.根据权利要求1所述的方法,其特征在于:S1具体步骤如下:输入数...
【专利技术属性】
技术研发人员:贾海涛,张伟,唐建杨,莫祖忠,杨锋,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。