一种面向多源信息融合的智慧健康关联分析方法技术

技术编号:28678666 阅读:25 留言:0更新日期:2021-06-02 02:56
一种面向多源信息融合的智慧健康关联分析方法,首先对多源异构数据进行模糊关联规则挖掘,然后优化适合于数据分布动态化的智能平衡参数,再分析兼容流式存储架构,提出针对上述智能平衡参数优化的动态增量式的建模方法,实现健康风险预警。该方法通过批量数据处理方法,可以在保证一定准确率的前提下进行增量式关联规则挖掘;可与快速并行处理相结合,高效地挖掘出与疾病相关的指标;用来训练模型的数据可实时更新,每次更新的数据均可实时更新关联规则模型,从而挖掘出更准确更有效的规则,从而进行健康风险预警;更新数据或者优化模型所需要的参数均由当前数据的数据分布状态也自动产生,无需研究人员和用户的参与,具有良好的可行性。

【技术实现步骤摘要】
一种面向多源信息融合的智慧健康关联分析方法
本专利技术属于人工智能领域,具体涉及一种面向多源信息融合的智慧健康关联分析方法。
技术介绍
医疗传感网的普及和应用在为提升诊断精准性提供海量数据支持的同时,也带来了严峻的挑战。传感网收集数据的量太大,速度太快,从传感网收集的数据无法全部经过医生的检查,只能将多源信息融合起来有选择地传递给医生查看。然而,固定的信息融合和选择难免会让医生遗漏掉某些非常规但又有可能很重要的信息,这有可能会导致医生无法作出正确的判断;而动态的信息融合和选择又面临着如何选择才能达到最佳效果的难题,最佳效果往往又要根据实际情况综合考虑多方面因素的,所以解决这个问题就变得更加困难了。更重要的是,医疗传感网的信息融合需要满足医学探索的应用需求,特别是要在海量的医疗传感数据中发现疾病的更多潜在或诱发因素来辅助诊断。这种探索只靠医生查看和查找数据来做基本上是不可能的,毕竟医生作为个体在数据处理和分析能力上都很有限,难以胜任此类大数据任务。然而,医学探索不可能完全脱离医生来做,疾病潜在或诱发因素的发现必须通过人机合作来联系医学领域的专业知识。此外在特征层面的信息融合应选择哪些特征,以及如何优化这些特征的数据转化过程,都要考虑到其在医学探索应用中是否适合人机合作以及是否可以满足探索精准度的问题。概括来说,医疗传感网的数据融合和应用都要考虑到与医生的联系,但这种联系的最优化实现是非常困难的。由于医疗传感网的成本问题,本专利技术研究混合架构下的信息融合与应用。具体来说,在医学研究和治疗中心,医疗传感网使用高成本高精准度的数据级别信息融合;在重点医学观察社区,医疗传感网使用中精准度的特征级别信息融合;在其它社区,医疗传感网使用低成本低精准度的决策级别信息融合。本专利技术在这样的混合架构下研究如何优化信息融合,使与医生保持的联系尽可能完善,并且在辅助诊断、疾病预测等医学探索应用中能通过与医生人机合作充分地发挥医疗传感网的作用。
技术实现思路
本专利技术针对如何在医疗传感网中使用基于模糊关联规则的算法进行信息融合与智慧健康的研究问题,提出了面向多源信息融合的智慧健康关联分析方法,对健康相关因素进行监督与辅助预警,从而实现具有智慧学习能力的健康关联分析、健康风险预警与个性健康推荐,进而及时发现健康风险状态与健康风险致因。一种面向多源信息融合的智慧健康关联分析方法,首先对获得的医疗多源异构数据进行模糊关联规则挖掘,然后进行适合于数据分布动态化的智能平衡参数优化,再分析兼容流式存储架构,最后提出针对上述智能平衡参数优化的动态增量式的建模方法,最终实现健康风险预警;所述分析方法具体包括如下步骤:步骤1:分析医疗传感器组成的传感网络得到的多源异构数据,根据不同应用,赋予多源数据不同的隶属度值[0,1],生成对应模糊集合。例如,如果需要预测某种疾病的致因。这时,所有多源数据,根据与这种疾病的相关性进行隶属度赋值。如果,某条数据与这种疾病极为相关,则隶属度赋值越接近1;反之,如果某条数据与这种疾病没有任何关系,则隶属度赋值为0;步骤2:通过适用于不同应用的多目标函数优化来生成高质量的模糊关联规则,得到满足应用需求的模糊集合;例如,如果需要对某种疾病的致因进行分类。这时优化过程中的多个目标函数可以直接采用分类结果的准确率与判断错误的代价作为优化目标函数;步骤3:分析数据分布状态,以标准正态分布为基础,进行数据分布动态化的智能平衡模糊集合隶属度参数优化;步骤4:针对流式数据特点,将预定义数量的数据,定义为一批次数据;每当新出现的流式数据达到预定义的数量,则对数据新出现的一批次进行局部频繁项集挖掘并存储当前批次的频繁项集与其支持度值等信息,这些数据将用于协助处理步骤5-6,因此,原数据流数据可以在此处删除;步骤5:根据与当前批次数据的数据分布的欧式距离,结合数据正态分布的欧式距离,进行动态的数据批次的数据变化量赋值;步骤6:根据数据变化量与当前数据的乘积作为历史频繁项集支持度的权重,再结合当前批次频繁项集及其支持度,找出频繁项集支持度高于用户自定义最小支持度,从而进行增量式全局频繁项集挖掘;步骤7:此时进行判断,如果新的流式数据没有增加到一个自定义的量,则直接进行步骤8,否则重复步骤4-7;步骤4-7为一个迭代过程,即增量式建模的主要过程;每次进行迭代都进行局部频繁项集挖掘,通过这些局部频繁项集,再加上新批次数据与历史数据的数据变化量,进行全局数据分频项集挖掘,由于这个过程中,无需使用全局数据本身,只需要历史频繁项集信息与当前批次数据,故这个过程称为增量式频繁项集挖掘;步骤8:根据挖掘出的频繁项集,筛选出关联规则;步骤9:对筛选出的关联规则中与健康状态相关的规则,进行整理;步骤10:根据挖掘与筛选出的健康相关关联规则,进行健康状态预测与风险分析。进一步地,本关联分析方法中,利用正态分布描述数据特征之间的变化关系,根据数据分布的变化程度来判断是进行模型更新还是模型重建,即实现动态增量式建模。进一步地,根据用户自定义数据分布参数变化度量,超过自定义变化度量即重新构建模型,否则只进行模型更。进一步地,所述按照增量式建模过程,即在旧的关联规则挖掘模型的基础上,根据数据分布变化量对模型进行微调,具体如下:根据新的数据分布计算新旧数据分布变化量:根据正态分布包含的两个参数:均数μ与标准差σ;按照当前数据集合求出其均值做为新的均数其中xi为当前第i个数据的数据值,N为当前数据总个数;同时,求出当前数据集合的标准差作为新的数据分布的标准差得到新的数据集合分布根据新的数据分布,再设旧的数据分布为得数据分布的变化量根据数据分布变化量对新增数据进行加权:将数据变化量v作为为新增数据的加权,这时默认旧数据无需加权。本专利技术提出一种面向多源信息融合的智慧健康关联分析方法,其有益效果是:本专利技术提出一种面向多源信息融合的智慧健康关联分析方法,利用关联规则方法推断可能的疾病相关指标。旨在通过疾病相关指标监控,检测出可能的潜在高风险状态,并给予警示。该方法主要具有以下优点:(1)高效性:通过批量数据处理方法,可以在保证一定准确率的前提下进行增量式关联规则挖掘。该批量处理方法可与快速并行处理相结合,能够高效的挖掘出一些与疾病相关的指标。(2)实时性:用来训练模型的数据可实时更新,根据批量处理方法,每次更新的数据均可实时的关联规则模型更新,从而挖掘出更准确更有效的规则,从而进行健康风险预警。(3)可行性:提出的动态模型构建方法,更新数据或者优化模型所需要的参数均有当前数据的数据分布状态也自动产生,无需研究人员和用户的参与,具有良好的可行性。附图说明图1是本专利技术实施例中所述面向多源信息融合的智慧健康关联分析方法的工作流程图。具体实施方式下面结合说明书附图对本专利技术的技术方案做进一步的详细说明。一种面向多源信息融合的智慧健康关联分析方法基于以下两点:首先,数据具有多源动态流式的特征;其次,构建模本文档来自技高网
...

【技术保护点】
1.一种面向多源信息融合的智慧健康关联分析方法,其特征在于:/n本方法中,首先对获得的医疗多源异构数据进行模糊关联规则挖掘,然后进行适合于数据分布动态化的智能平衡参数优化,再分析兼容流式存储架构,最后提出针对上述智能平衡参数优化的动态增量式的建模方法,最终实现健康风险预警;/n所述分析方法具体包括如下步骤:/n步骤1:分析医疗传感器组成的传感网络得到的多源异构数据,根据不同应用,赋予多源数据不同的隶属度值[0,1],生成对应模糊集合;/n步骤2:通过适用于不同应用的多目标优化来生成高质量的模糊关联规则,得到满足应用需求的模糊集合;/n步骤3:分析数据分布状态,以标准正态分布为基础,进行数据分布动态化的智能平衡模糊集合隶属度参数优化;/n步骤4:针对流式数据特点,将预定义数量的数据,定义为一批次数据;每当新出现的流式数据达到预定义的数量,则对数据新出现的一批次进行局部频繁项集挖掘并存储当前批次的频繁项集与其支持度值,这些数据用于协助处理步骤5-6,原数据流数据删除;/n步骤5:根据与当前批次数据的数据分布的欧式距离,结合数据正态分布的欧式距离,进行动态的数据批次的数据变化量赋值;/n步骤6:根据数据变化量与当前数据的乘积作为历史频繁项集支持度的权重,再结合当前批次频繁项集及其支持度,找出频繁项集支持度高于用户自定义最小支持度,从而进行增量式全局频繁项集挖掘。/n步骤7:此时进行判断,如果新的流式数据没有增加到一个自定义的量,则直接进行步骤8,否则重复步骤4-7;/n步骤8:根据挖掘出的频繁项集,筛选出关联规则;/n步骤9:对筛选出的关联规则中与健康状态相关的规则,进行整理;/n步骤10:根据挖掘与筛选出的健康相关关联规则,进行健康状态预测与风险分析。/n...

【技术特征摘要】
1.一种面向多源信息融合的智慧健康关联分析方法,其特征在于:
本方法中,首先对获得的医疗多源异构数据进行模糊关联规则挖掘,然后进行适合于数据分布动态化的智能平衡参数优化,再分析兼容流式存储架构,最后提出针对上述智能平衡参数优化的动态增量式的建模方法,最终实现健康风险预警;
所述分析方法具体包括如下步骤:
步骤1:分析医疗传感器组成的传感网络得到的多源异构数据,根据不同应用,赋予多源数据不同的隶属度值[0,1],生成对应模糊集合;
步骤2:通过适用于不同应用的多目标优化来生成高质量的模糊关联规则,得到满足应用需求的模糊集合;
步骤3:分析数据分布状态,以标准正态分布为基础,进行数据分布动态化的智能平衡模糊集合隶属度参数优化;
步骤4:针对流式数据特点,将预定义数量的数据,定义为一批次数据;每当新出现的流式数据达到预定义的数量,则对数据新出现的一批次进行局部频繁项集挖掘并存储当前批次的频繁项集与其支持度值,这些数据用于协助处理步骤5-6,原数据流数据删除;
步骤5:根据与当前批次数据的数据分布的欧式距离,结合数据正态分布的欧式距离,进行动态的数据批次的数据变化量赋值;
步骤6:根据数据变化量与当前数据的乘积作为历史频繁项集支持度的权重,再结合当前批次频繁项集及其支持度,找出频繁项集支持度高于用户自定义最小支持度,从而进行增量式全局频繁项集挖掘。
步骤7:此时进行判断,如果新的流式数据没有增加到一个自定义的量,则...

【专利技术属性】
技术研发人员:郑会陈静李鹏王汝传徐鹤程海涛殷悦周宁
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1