本发明专利技术公开了一种基于持续测试时间域适应的ECG数据分类方法,可以在不修改源模型的训练过程,不需要访问源数据以及不需要目标域数据标签的情况下,在测试时使用持续测试时间适应提高模型的泛化性,使得模型能够适应不断变化的测试环境。本发明专利技术提出的持续测试时间域适应的ECG数据分类方法通过在测试时间适应过程中将一部分的模型参数恢复成源模型参数能缓解模型出现灾难性遗忘,且不影响模型的性能。本发明专利技术使用的ECG数据预处理方法很简单,不需要做噪音滤波和特征提取的预处理。传统的ECG数据预处理方法非常依赖于研究人员的经验且效果不佳,由于提取到的特征不理想,在训练模型时模型对噪音信号非常敏感。模型时模型对噪音信号非常敏感。模型时模型对噪音信号非常敏感。
【技术实现步骤摘要】
一种基于持续测试时间适应的心率失常分类方法
[0001]本专利技术属于数据分类领域,具体涉及一种基于持续测试时间适应的心率失常分类方法。
技术介绍
[0002]测试时间域适应的目的是通过在测试时间从未标记的测试数据(目标域)中学习来适应源预训练模型。现有的工作主要考虑目标域是静态的情况,然而,真实世界的机器感知系统运行在不稳定且不断变化的环境中,其中目标域分布会随着时间而变化,在这种不断变化的环境下,大多数基于自训练和熵正则化的方法会受到这些不断变化的环境的影响,使得模型性能显著下降。由于隐私问题或法律约束,在测试时间域适应的设置下,源域数据通常被认为在测试期间不可用,这使得它比无监督的域适应更具挑战性,但也是更现实的问题。因此,测试时间域适应对于领域转换下真实世界机器感知系统应用的成功至关重要。
[0003]心电图(electrocardiogram,简称ECG)被心脏病专家和医疗从业人员广泛用于监测心脏健康,通过心电图的检查,可以发现有无心律失常。心律失常是心血管疾病的一种典型类型,是指正常心脏节律的不规则变化,几种典型的心律失常包括心房纤维性颤动、早搏、心室纤维性颤动和心动过速。虽然单次心律失常心跳可能不会对生命产生严重影响,但连续心律失常心跳可能会对心脏造成非常严重的威胁,因此,定期监测心律以管理和预防心血管疾病是非常重要的。现有的针对ECG数据分类方法都面临着以下几个棘手的问题:需要依赖于人工标注数据标签、模型不能较好的适用于不断变化的测试环境以及模型容易遭受灾难性遗忘。主要存在以下问题:
[0004]1)数据集类不平衡。在深度学习的分类任务中,模型性能很容易受数据集类不平衡的影响,导致最终模型对大类的分类效果很好,而对数目少的小类分类效果极差,在心电图相关数据集中,类不平衡问题尤为突出,因为心电图数据中正常心拍很多,而异常心拍数目非常少,存在严重的类不平衡问题,导致使用传统的深度学习方法在对心电图分类时最终效果不佳。
[0005]2)模型泛化能力弱。模型泛化能力的强弱决定了该模型能否很好的应用于现实世界中各种机器感知系统。现有的ECG数据分类方法能够在目标域是静态的情况下表现出良好的性能,但是当目标域不断变化时,模型性能显著下降。
[0006]3)标注成本高。基于监督学习的ECG数据分类方法在训练过程中需要用到大量人工标注标签的数据集,然而标注数据标签将消耗大量的人力、物力等资源,标注成本十分昂贵。针对ECG这种特定的时间序列医疗数据集,标注则依赖于经验丰富,有一定专业知识的医护人员,这进一步提高了人工标注的门槛,使得大规模、更复杂的数据集标注工作十分艰难。标签训练数据的缺乏阻碍了监督机器学习在医疗保健中的全面临床影响,因此基于无监督的学习方法变得越来越重要。
[0007]4)模型容易遭受灾难性遗忘。灾难性遗忘是指模型学习了新的知识之后,几乎彻
底遗忘掉之前习得的内容,在现实世界中,很多任务不可能一次性得到所有的训练数据,这就使得模型必须能够利用不断产生的新数据持续学习新知识,并且不遗忘之前所学过的重要内容。因此,缓解模型的灾难性遗忘对于模型的实际部署应用有很重要的意义。
[0008]5)适应过程需要使用源域数据。现有的基于域适应的ECG分类方法通常需要在测试时访问源数据,通常使用源域数据和目标域数据重新训练模型以使得模型适应变化的目标域数据,出于隐私或法律约束方面考虑,这可能并不总是可行的,因为源域数据可能不再可用,在测试期间可用的仅仅是在训练阶段预训练的源预训练模型。
[0009]数据预处理过程复杂。心电信号是一种具有强烈的非线性、非平稳性和随机性的微弱信号,在对其采集的过程中,极易受来自体内和体外环境的影响,如人体四肢的运动、呼吸、周边环境中的电磁干扰等等,因此直接采集到的心电信号伴随着大量噪声,常见的噪声有基线漂移、工频干扰、肌电干扰和运动伪迹。传统的ECG数据去噪方法如小波滤波、FIR滤波、中值滤波等方法中一些参数的选择非常依赖研究人员的经验,若参数选择不当,会导致去噪效果不佳,进而影响后续ECG数据分类任务。
技术实现思路
[0010]为了解决上述
技术介绍
提到的技术问题,本专利技术提出了一种基于持续测试时间适应的心率失常分类方法。
[0011]为了实现上述技术目的,本专利技术的技术方案为:
[0012](基本与权书相同)
[0013]采用上述技术方案带来的有益效果:
[0014]本专利技术提出一种基于持续测试时间域适应的ECG数据分类方法,可以在不修改源模型的训练过程,不需要访问源数据以及不需要目标域数据标签的情况下,在测试时使用持续测试时间适应提高模型的泛化性,使得模型能够适应不断变化的测试环境。
[0015]本专利技术提出的持续测试时间域适应的ECG数据分类方法通过在测试时间适应过程中将一部分的模型参数恢复成源模型参数能缓解模型出现灾难性遗忘,且不影响模型的性能。
[0016]本专利技术使用的ECG数据预处理方法很简单,不需要做噪音滤波和特征提取的预处理。传统的ECG数据预处理方法非常依赖于研究人员的经验且效果不佳,由于提取到的特征不理想,在训练模型时模型对噪音信号非常敏感。
附图说明
[0017]图1是持续测试时间域适应的ECG数据分类方法的工作流程图;
[0018]图2是ECGGAN中的生成器模型和判别器模型图;
[0019]图3是ECGGAN训练过程中的Loss变化图;
[0020]图4是使用ECGGAN生成的样本与真实样本的室上异位搏动比较图;
[0021]图5是使用ECGGAN生成的样本与真实样本的室性异位搏动比较图;
[0022]图6是使用ECGGAN生成的样本与真实样本的融合拍比较图;
[0023]图7是使用ECGGAN生成的样本与真实样本的不可分类拍比较图;
[0024]图8是预训练的卷积神经网络模型图;
[0025]图9是持续测试时间域适应过程图。
具体实施方式
[0026]以下将结合附图,对本专利技术的技术方案进行详细说明。
[0027]本专利技术公布了一种基于持续测试时间适应的心率失常分类方法,如图1所示,图1展示了基于持续测试时间域适应的ECG数据分类方法的工作步骤,首先进行ECG数据预处理,通过检测Q峰的位置来定位心拍位置,然后使用生成对抗网络(GAN)生成小类样本扩充数据集,然后在MIT
‑
BIH Arrhythmia Database(以下简称为MITdb)数据集上预训练卷积神经网络并保存模型参数,最后在测试时,加载预训练的卷积神经网络模型作为源模型,MIT
‑
BIH ST Change Database(以下简称为MITst)心律失常数据集上测试,测试过程中使用本专利技术提出的持续测试时间域适应使得源模型不断适应目标数据,最终完成ECG分类任务。具体执行过程如下:步骤1:数据预处理
[0028]1.1通过数据集自身标注的Q峰位置采集心拍。本次实验采用MI本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于持续测试时间适应的心率失常分类方法,其特征在于,包括以下步骤:S1、获取ECG数据生成数据集,通过数据集自身标注的Q峰位置采集心拍,使用ECGGAN生成小类样本扩充数据集,将一维ECG心电数据转换成二维ECG图像,划分数据集;S2、搭建训练阶段的卷积神经网络模型;S3、初始化卷积神经网络模型参数,将预处理后的MITdb数据集输入到模型中进行预训练;S4、对步骤S3训练后的卷积神经网络模型利用持续测试时间域适应方法更新权重,所述持续测试时间域适应方法包括权值平均伪标签、增强平均伪标签以及随机恢复源模型权重;经过更新后的卷积神经网络模型用于ECG分类。2.根据权利要求1所述一种基于持续测试时间适应的心率失常分类方法,其特征在于,步骤S1中获取心律失常数据生成数据集,通过数据集自身标注的Q峰位置采集心拍具体指:采用MITdb心律失常数据库和MITst心律失常数据库作为数据集,MITdb数据集由47个不同受试者以360Hz采样率记录的心电图记录组成,MITdb包含了48条双导联ECG记录,除少数记录外,每条记录的第一个导联都是II导联,每条记录长度为30分钟,采样率360Hz,每条记录都有650000个采样点,MITst数据集包括28条不同长度的心电图记录,将心拍分成正常心拍、室上异位搏动和室性异位搏动,对应标签编码为0、1和2,将融合拍以及不可分类拍类的数据删除,根据数据集的Q峰所在的位置下标索引,然后以Q峰的位置为基准,向左包括150个点,向右包括100个点,将这一段数据截取出来作为心拍。3.根据权利要求1所述一种基于持续测试时间适应的心率失常分类方法,其特征在于,步骤S1中使用ECGGAN生成小类样本扩充数据集,将一维ECG心电数据转换成二维ECG图像,划分数据集具体值:设计一个适用于ECG数据集的GAN,包括生成器G和判别器D,在训练过程中,G和D相互对抗,相互学习,训练3000轮后,G生成的样本输入到D中,D完全无法判断该样本是真实样本还是生成样本时,此时表示G生成的样本非常接近真实样本,结束训练,保存G的模型参数用于批量生成小类样本扩充数据集;将一维ECG心电数据通过Matplotlib绘图工具绘制成二维ECG图像,为MITdb数据集重新打上标签并打乱重排,将MITdb数据集分为训练集和验证集,取前70%的数据作为训练集,后30%的数据作为验证集。4.根据权利要求1所述一种基于持续测试时间适应的心率失常分类方法,其特征在于,步骤S2中的卷积神经网络包括六个卷积层、六个批量归一化层、三个做大池化层、一个Flatten层以及两个线性层。5.根据权利要求1所述一种基于持续测试时间适应的心率失常分类方法,其特征在于,步骤S3包括以下步骤:S31、设置模型学习率为10^(
‑
3),样本批次大小为128,迭代次数为30,使用SGD优化学习率,动量系数为0.7,权值衰减为10^(
‑
4),损失函数使用交叉熵;S32、将预处理后的MITdb数据集输入到模型中,首先初始化模型参数,然后开始训练模型,损失函数的值越来越小直到收敛时,此时初始化的参数会随着发生变化,保存变化后的参数,将经过预训练后的卷积神经网络模型作为源模型;S33、将训练好的模型保存,在进行ECG分类任务...
【专利技术属性】
技术研发人员:孙乐,何志强,
申请(专利权)人:南京信息工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。