基于迁移学习的脑卒中风险预测方法及系统技术方案

技术编号:33468515 阅读:21 留言:0更新日期:2022-05-19 00:46
基于迁移学习的脑卒中风险预测方法及系统,包括:获取脑卒中发病人群发病前和无标签人员的生理和运动数据及日常生活习惯的历史数据,对数据进行滤波和归一化预处理,得到源数据和目标数据;选取源数据中的高危风险特征,建立脑卒中高危风险特征数据集,提取目标数据中的脑卒中高危风险特征数据;计算目标数据的相似距离,获取这些数据的相似历史数据片段;如果求出特征Xi源数据中的样本特征片段为c个,则构成可迁移样本K={K1,K2,...Kc},将每个片段按照时间窗进行拆分;构建基于LSTM的预测模型,利用训练好的预测模型分别对目标数据样本进行预测;重复上述步骤,得到待测样本q个特征分别对应的预测结果,并将预测结果进行权重融合,得到最终的预测结果。得到最终的预测结果。得到最终的预测结果。

【技术实现步骤摘要】
基于迁移学习的脑卒中风险预测方法及系统


[0001]本专利技术涉及健康管理领域,特别涉及一种基于迁移学习的脑卒中风险预测方法及系统。

技术介绍

[0002][0003]随着人工智能技术和大数据的迅速发展,国内外学者利用机器学习等人工智能技术在脑卒中早期风险预警方面进行了大量研究。研究者主要基于临床生化数据指标(低密度脂蛋白、胆固醇、同型半胱氨酸等)、影像学和个人基本信息,利用人工智能算法进行大数据挖掘和分析,实现脑卒中早期风险预测,这种预测模型采用了生化指标,属于有创监测,在实际中广泛应用比较困难。近年来,有学者开始研究利用基于心冲击图来判断房颤,从而来进行心血管风险预警,但是目前缺乏大样本数据库进行训练学习,预测的精度和准确度都有待进一步提高。
[0004]为此,本专利技术提出一种基于迁移学习的脑卒中风险预测方法及系统,对脑卒中的风险预测和防治具有重要的意义。

技术实现思路

[0005]本专利技术的目的是提供一种基于迁移学习的脑卒中风险预测方法及系统,该方法有助于解决当前基于低成本、无感式生理信号监测数据对脑卒中风险预测中的个体差异大,样本量少或者无标签等问题。
[0006]为了实现本专利技术的技术目的,采取如下的技术方案。
[0007]一种基于迁移学习的脑卒中风险预测方法,该方法包括如下步骤:获取脑卒中发病人群发病前的生理和运动数据以及日常生活习惯的历史数据,并对这些数据进行滤波和归一化预处理,得到源数据;获取无标签人员的生理和运动数据以及日常生活习惯数据,并对这些数据进行如上述一致的滤波和归一化预处理,得到目标数据;选取源数据中的高危风险(特异性敏感性)特征,建立脑卒中高危风险特征数据集X=[X1,X2,X3...Xq],并相应地提取目标数据中的脑卒中高危风险特征数据;基于动态时间规整算法计算目标数据中的脑卒中高危风险特征数据与源数据中的脑卒中高危风险特征数据的相似距离,并且获取这些数据的相似历史数据片段;如果求出特征Xi源数据中的样本特征片段为c个,则构成可迁移样本K={K1,K2,...Kc},并将每个片段按照时间窗t进行拆分,扩大可迁移样本数据集;构建基于长短时记忆神经网络LSTM的预测模型,利用迁移学习训练数据集训练好的预测模型分别对目标数据样本进行预测,得到目标域样本中特征Xi的预测结果;重复上述步骤,得到待测样本q个特征分别对应的预测结果Z=[z1,z2,...zq];基于权重融合的方法,将多个预测结果进行融合,得到最终的预测结果Fc。
[0008]在一个实施例中,选取高危风险特征的步骤如下:将源数据中样本未发病但数据参数已改变的一段时间(例如发病前一个月)的生理和运动数据以及日常生活习惯的历史
数据的时域特征相邻心动周期差值均方根、相邻正常心动周期差值大于50ms占全部心动周期的比值、平均心动周期、心动周期标准差的每个数据特征以窗口截图的形式保存,分别定义为每个特征的危险图;将源数据中样本未发病且数据参数未改变时(例如发病前6个月)的生理和运动数据以及日常生活习惯的历史数据的时域特征相邻心动周期差值均方根、相邻正常心动周期差值大于50ms占全部心动周期的比值、平均心动周期、心动周期标准差的每个数据特征以窗口截图的形式保存,分别定义为每个特征的安全图;将每个特征的危险图和安全图构成特征的样本数据库,并随机将样本数据库分为训练集和测试集,利用卷积神经网络算法对每个特征的样本集进行训练,并最终得到不同特征危险图和安全图的识别准确率;将特征识别准确率高于一定阈值的特征,定义为脑卒中的高危风险数据特征。
[0009]在一个有利实施例中,获取数据的相似历史数据片段的步骤如下:设目标数据中待测样本的第i个特征的时间序列为Xi={xi1,xi2,...xin},长度为L, Xi按照时间滑动时间窗长度f在源数据样本上的对应特征上进行移动,将源数据样本对应的特征序列Yi分为w个片段,[Yi1,Yi2,...Yiw],其中Yiw的时间序列为Yiw={yiw1,yiw2,...yiwn},基于动态时间规整算法计算待测样本第i个特征对应源数据样本的相似距离Di,最小值对应的源数据特征片段为目标数据待测样本的相似历史数据片段。
[0010]所述生理和运动数据以及日常生活习惯的历史数据包括心率、心率变异性、血压、血氧、呼吸、睡眠、运动状况、吸烟、饮酒习惯。
[0011]在一个有利实施例中,采用遗传算法对基于长短时记忆神经网络LSTM的预测模型的参数进行如下优化:
[0012]将第i个特征的可迁移样本数据集K按照一定的比例随机分为训练集和测试集;
[0013]初始化长短时记忆神经网络模型的参数种群,将训练集的数据放到长短时记忆神经网络模型中进行训练;
[0014]将长短时记忆神经网络模型的均方根误差作为遗传算法的适应度函数;
[0015]将训练和测试完一次的长短时记忆神经网络模型的参数进行交叉变异操作,若获得适应度函数的最优目标值,则进行下一步操作,否则,返回上一步操作;
[0016]得出长短时记忆神经网络模型的最优参数组合;
[0017]将得出的最优参数组合输入到长短时记忆神经网络模型中,得到训练好的长短时记忆神经网络的预测模型及输入门、遗忘门的权重和偏置。
[0018]在一个有利实施例中,,将目标数据中待测样本第i个特征输入到训练好的LSTM长短时记忆神经网络的预测模型进行预测。
[0019]本专利技术还提供一种基于迁移学习的脑卒中风险预测系统,包括:第一信息收集模块,用于收集脑卒中发病人群发病前的生理和运动数据以及日常生活习惯的历史数据;第二信息收集模块,用于收集无标签人员的生理和运动数据以及日常生活习惯的历史数据;信号预处理分析模块,用于对第一信息收集模块和第二信息收集模块收集的数据进行滤波和归一化预处理,分别得到源数据和目标数据;信息分析模块,用于提取源数据的高危风险特征,建立脑卒中高危风险特征数据集X=[X1,X2,X3...Xq],并相应地提取目标域中的脑卒中高危风险特征数据;迁移学习模块,用于基于动态时间规整算法计算目标数据与源数据的相似距离,获取目标数据的相似历史数据片段,获取各数据特征的可迁移学习样本;脑卒中风险预测模块,构建基于长短时记忆神经网络LSTM的预测模型,并将得到的各特征迁
移学习样本的预测结果,进行权重融合,得到最终的预测结果Fc。
[0020]有利地,信息分析模块如下选取高危风险特征:将源数据中样本未发病但数据参数已改变的一段时间的生理和运动数据以及日常生活习惯的历史数据的时域特征相邻心动周期差值均方根、相邻正常心动周期差值大于50ms占全部心动周期的比值、平均心动周期、心动周期标准差的每个数据特征以窗口截图的形式保存,分别定义为每个特征的危险图;将源数据中样本未发病且数据参数未改变时的生理和运动数据以及日常生活习惯的历史数据的时域特征相邻心动周期差值均方根、相邻正常心动周期差值大于50ms占全部心动周期的比值、平均心动周期、心动周期标准差的每个数据特征以窗口截图的形式保存,分别定义为每本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于迁移学习的脑卒中风险预测方法,该方法包括如下步骤:获取脑卒中发病人群发病前的生理和运动数据以及日常生活习惯的历史数据,并对这些数据进行滤波和归一化预处理,得到源数据;获取无标签人员的生理和运动数据以及日常生活习惯数据,并对这些数据进行如上述一致的滤波和归一化预处理,得到目标数据;选取源数据中的高危风险特征,建立脑卒中高危风险特征数据集X=[X1,X2,X3...Xq],并相应地提取目标数据中的脑卒中高危风险特征数据;基于动态时间规整算法计算目标数据中的脑卒中高危风险特征数据与源数据中的脑卒中高危风险特征数据的相似距离,并且获取这些数据的相似历史数据片段;如果求出特征Xi源数据中的样本特征片段为c个,则构成可迁移样本K={K1,K2,...Kc},并将每个片段按照时间窗t进行拆分,扩大可迁移样本数据集;构建基于长短时记忆神经网络LSTM的预测模型,利用迁移学习训练数据集训练好的预测模型分别对目标数据样本进行预测,得到目标域样本中特征Xi的预测结果;重复上述步骤,得到待测样本q个特征分别对应的预测结果Z=[z1,z2,...zq];基于权重融合的方法,将多个预测结果进行融合,得到最终的预测结果Fc。2.根据权利要求1所述的基于迁移学习的脑卒中风险预测方法,其特征在于,选取高危风险特征的步骤如下:将源数据中样本未发病但数据参数已改变的一段时间的生理和运动数据以及日常生活习惯的历史数据的时域特征相邻心动周期差值均方根、相邻正常心动周期差值大于50ms占全部心动周期的比值、平均心动周期、心动周期标准差的每个数据特征以窗口截图的形式保存,分别定义为每个特征的危险图;将源数据中样本未发病且数据参数未改变时的生理和运动数据以及日常生活习惯的历史数据的时域特征相邻心动周期差值均方根、相邻正常心动周期差值大于50ms占全部心动周期的比值、平均心动周期、心动周期标准差的每个数据特征以窗口截图的形式保存,分别定义为每个特征的安全图;将每个特征的危险图和安全图构成特征的样本数据库,并随机将样本数据库分为训练集和测试集,利用卷积神经网络算法对每个特征的样本集进行训练,并最终得到不同特征危险图和安全图的识别准确率;将特征识别准确率高于一定阈值的特征,定义为脑卒中的高危风险数据特征。3.根据权利要求1所述的基于迁移学习的脑卒中风险预测方法,其特征在于,获取数据的相似历史数据片段的步骤如下:设目标数据中待测样本的第i个特征的时间序列为X
i
={x
i1
,x
i2
,...x
in
},长度为L,X
i
按照时间滑动时间窗长度f在源数据样本上的对应特征上进行移动,将源数据样本对应的特征序列Y
i
分为w个片段,[Y
i1
,Y
i2
,...Y
iw
],其中Y
iw
的时间序列为Y
iw
={y
iw1
,y
iw2
,...y
iwn
},基于动态时间规整算法计算待测样本第i个特征对应源数据样本的相似距离D
i
,最小值对应的源数据特征片段为目标数据待测样本的相似历史数据片段。4.根据权利要求1所述的基于迁移学习的脑卒中风险预测方法,其特征在于,所述生理和运动数据以及日常生活习惯的历史数据包括心率、心率变异性、血压、血氧、呼吸、睡眠、运动状况、吸烟、饮酒习惯。
5.根据权利要求1所述的基于迁移学习的脑卒中风险预测方法,其特征在于,采用遗传算法对基于长短时记忆神经网络LSTM的预测模型的参数进行如下优化:将第i个特征的可迁移样本数据集K按照一定的比例随机分为训练集和测试集;初始化长短时记忆神经网络模型的参数种群,将训练集的数据放到长短时记忆神经网络模型中进行训练;将长短时记忆神经网络模型的均方根误差作为遗传算法的适应度函数;将训练和测试完一次的长短时记忆神经网络模型的参数进行交叉变异操作,若获得适应度函数的最优目标值,则进行下一步操作,否则,返回上一步操作;得出长短时记忆神经网络模型的最优参数组合;将得出的最优参数...

【专利技术属性】
技术研发人员:张静莎李增勇张腾宇
申请(专利权)人:国家康复辅具研究中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1