本发明专利技术提出了一种结合粗糙集和距离型模糊推理获取生理信息与健康状况相关性的新方法,该方法首先利用粗糙集描述构建生理信息知识库的过程,利用属性依赖度约简算法约简原有数据的冗余属性,并提取有效规则构建知识库。再利用模糊集合中距离的概念,匹配知识库中已有的规则,获取生理信息与健康状况之间的相关性,帮助人间更好地了解身体状况,改善身体,而且之后还可以利用方法结合其他数据检查人们的身体状况。该方法性能均衡,可以保证规则的准确性和有效性。
【技术实现步骤摘要】
【专利摘要】本专利技术提出了一种结合粗糙集和距离型模糊推理获取生理信息与健康状况相关性的新方法,该方法首先利用粗糙集描述构建生理信息知识库的过程,利用属性依赖度约简算法约简原有数据的冗余属性,并提取有效规则构建知识库。再利用模糊集合中距离的概念,匹配知识库中已有的规则,获取生理信息与健康状况之间的相关性,帮助人间更好地了解身体状况,改善身体,而且之后还可以利用方法结合其他数据检查人们的身体状况。该方法性能均衡,可以保证规则的准确性和有效性。【专利说明】
:本专利技术提供一种结合粗糙集和距离型模糊推理的生理信息与健康状况相关性的获取方法,属于数据挖掘及模糊推理领域。本专利技术可以在知识获取、故障诊断、专家系统等领域得到广泛应用。
技术介绍
:随着生活环境的改善与生活习惯的改变,癌症、心脏疾病、糖尿病、高血压等疾病逐渐成为威胁人类生命的主要杀手,而人类身体健康的问题并非一朝一夕,而是与日常生活紧密相关,不健康的生活所带来的健康问题日益严重,不良的固定模式的生活习惯会导致各种身体问题。因此,对身体状况的的早期关注、早期改善显得尤为重要。目前的医疗实验领域中存在着大量的电子病例,如果利用各种先进信息处理技术开发处理这些数据信息,通过分析这些数据找出各种生理信息与人们健康状况的相关性,将对医护人员的工作起到辅助作用,可以帮助人们及早地认识身体健康状况的相关问题并及时改善,无疑对于增进健康状况和预防疾病具有重大的意义。为了获取生理信息与健康状况之间相关性,在分析粗糙集知识约简理论和模糊推理系统的基础上,提出一种结合粗糙集和距离型模糊推理获取生理信息与健康状况的相关性的新方法。粗糙集理论能有效地分析和处理不精确、不完备的数据,并有可能直接提取出隐含的知识,因此将粗糙集应用到生理信息知识的获取中,构建生理信息的规则库。然后依据模糊规则,选择距离型模糊推理获取生理信息与健康状况之间的相关性。
技术实现思路
:专利技术目的:本专利技术提供一种结合粗糙集和距离型模糊推理的生理信息与健康状况相关性的获取方法,其目的是解决以往的知识库的建立过程中所存在的数据不精确、不完备等问题,并首次实现粗糙集与距离型模糊推理相结合的新方法来获取生理信息与身体健康之间的相关性。本专利技术首先利用粗糙集描述构建生理信息知识库的过程,利用属性依赖度约简算法约简原有数据的冗余属性,并提取有效规则构建知识库。再利用模糊集合中距离的概念,匹配知识库中已有的规则,获取生理信息与健康状况之间的相关性,帮助人间更好地了解身体状况,改善身体,而且之后还可以利用方法结合其他数据检查人们的身体状况。技术方案:本专利技术是通过以下技术方案实现的:(I)利用粗糙集理论对生理信息数据进行数据挖掘,构建知识库I)首先进行数据预处理,即对采集到的原始数据进行量化处理,根据数据离散化准则处理数据,确定条件属性和决策属性,形成决策数据表;2)其次进行属性约简,即在保持属性分类能力不变的前提下,利用改进的属性依赖度约简算法,删除其中不相关或不重要的属性;3)然后进行属性值约简,即去除每条规则中冗余的属性值,得到简化的决策数据表;4)此后进行规则提取,即根据约简后的属性决策数据表,合并相同或相关的规则,计算规则的支持度和准确度,提取出支持度和准确度高的规则;5)最后进行知识库的构建,即将所提取的规则合并,构建出由若干条规则组成的知识库;(2)由构建的知识库根据距离型模糊推理得到推理结果;I)首先根据隶属度函数将输入的事实模糊化;2)然后通过计算给定事实与知识库中每条规则的前件的距离,来判断给定事实与规则的匹配程度。距离越小,说明事实与该规则的匹配程度越高,反之匹配程度越低;3)最后根据给定事实与知识库中所有规则的距离推理出生理信息与健康状况的相关性。为更好地实现本专利技术的目的,所述步骤(I)的步骤2)中对属性依赖度约简算法的改进,以及首次结合粗糙集理论与距离型模糊推理这两种方法来获取生理信息与健康状况的相关性。对属性依赖度约简算法的改进是指:在决策系统中,多个条件属性针对决策属性的依赖度可能会相同,根据传统属性依赖度的计算无法区分相同依赖度属性的重要度;我们判断一个条件属性的依赖度大小,是根据单个属性与核属性或核属性集所构成的新的属性集的依赖度大小来判断的,并可以依此求解出依赖度最大的核属性集,其过程如下:I)计算核属性;2)将核属性与其余单个属性组合为新的属性集,我们称为核属性集,划分核属性和单个属性构成的核属性集的等价类;3)求出每个核属性集的依赖度,并依次排序,求出最大依赖度的核属性集4)再重新划分所求出的最大核属性集与剩余单个属性的新的核属性集,重复步骤3),直到所求出的最大依赖度的核属性集满足整个属性集合的下近似分布;此满足整个属性集合的下近似分布的最大核属性集即为属性约简结果;5)删除冗余属性,完成属性依赖度约简。本专利技术首次结合粗糙集理论与距离型模糊推理这两种方法来获取生理信息与健康状况的相关性,其过程如下:I)首先利用粗糙集理论对生理信息数据进行数据挖掘,构建知识库,即将简化的决策信息表中的条件属性作为模糊规则的前件,决策属性作为模糊规则的后件;2)然后输入用户的各个属性值,即输入事实;3)最后根据距离型模糊推理方法将输入事实与知识库中已有规则进行匹配,推理出生理信息与健康状况相关性;优点及效果:本专利技术提供一种结合粗糙集和距离型模糊推理的生理信息与健康状况相关性的获取方法,在分析粗糙集知识约简理论和模糊推理处理模糊问题的基础上,将粗糙集理论和模糊推理方法相结合应用于获取生理信息与健康状况的相关性。该方法在构建规则库方面不再单纯依靠专家经验,而是利用粗糙集实现构建规则库的过程,约简原始数据的冗余属性,并挖掘出有效规则构建知识库,可以有效地解决知识库构建过程中不完备,不精确问题。再利用满足分离原则的距离型模糊推理获取生理信息与身体健康的相关性问题,可以有效地解决身体检查中的模糊性问题。该方法可以保证规则准确、方法性能均衡等优点,同时该方法可以广泛地应用于其他相关领域中。本专利技术将粗糙集理论应用到人们生理信息与健康状况相关性的获取中,构建有关生理信息的模糊规则库,依据所建立模糊规则,采用距离型模糊推理方法对身体健康状况进行检查分析,建立基于粗糙集理论和距离型模糊推理的获取生理信息与健康状况相关性新方法° 并利用 University of California at Irvine (UCI)machine learningrepository database (UCI机器学习数据库)中的临床数据验证所得到规则库的准确性以及距离型模糊推理方法的有效性,并与其它类似方法做了对比,对比结果见表1:表1本专利技术方法与其他方法的对比结果【权利要求】1.,其特征在于该方法的步骤如下: (1)利用粗糙集理论对生理信息数据进行数据挖掘,构建知识库 1)首先进行数据预处理,即对采集到的原始数据进行量化处理,根据数据离散化准则处理数据,确定条件属性和决策属性,形成决策数据表; 2)其次进行属性约简,即在保持属性分类能力不变的前提下,利用改进的属性依赖度约简算法,删除其中不相关或不重要的属性; 3)然后进行属性值约简,即去除每条规则中冗余的属性值,得到简化的决策数据表; 4)此后进行规则提取,即本文档来自技高网...
【技术保护点】
结合粗糙集和模糊推理的生理信息与健康相关性获取方法,其特征在于该方法的步骤如下: (1)利用粗糙集理论对生理信息数据进行数据挖掘,构建知识库 1)首先进行数据预处理,即对采集到的原始数据进行量化处理,根据数据离散化准则处理数据,确定条件属性和决策属性,形成决策数据表; 2)其次进行属性约简,即在保持属性分类能力不变的前提下,利用改进的属性依赖度约简算法,删除其中不相关或不重要的属性; 3)然后进行属性值约简,即去除每条规则中冗余的属性值,得到简化的决策数据表; 4)此后进行规则提取,即根据约简后的属性决策数据表,合并相同或相关的规则,计算规则的支持度和准确度,提取出支持度和准确度高的规则; 5)最后进行知识库的构建,即将所提取的规则合并,构建出由若干条规则组成的知识库; (2)由构建的知识库根据距离型模糊推理得到推理结果; 1)首先根据隶属度函数将输入的事实模糊化; 2)然后通过计算给定事实与知识库中每条规则的前件的距离,来判断给定事实与规则的匹配程度。距离越小,说明事实与该规则的匹配程度越高,反之匹配程度越低; 3)最后根据给定事实与知识库中所有规则的距离推理出生理信息与健康状况的相关性。...
【技术特征摘要】
【专利技术属性】
技术研发人员:于霞,苏良,王硕玉,
申请(专利权)人:沈阳工业大学,
类型:发明
国别省市:辽宁;21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。