一种逐步进化自动睡眠分期方法技术

技术编号:38389460 阅读:10 留言:0更新日期:2023-08-05 17:42
一种逐步进化自动睡眠分期方法,包括以下步骤:步骤一,基于多种特征提取方法,构建多个睡眠分期模型;步骤二,有标签数据集训练模型,计算模型在验证集上的评价指标;步骤三,睡眠分期模型自动标记无标签数据集,基于可信度评价方法筛选可信样本;步骤四,有标签数据和步骤三筛选的可信样本组成训练集,重复步骤二、三;步骤五,测试集测试睡眠分期模型,计算模型逐步进化结果;本发明专利技术能够在少量有标签数据集和大量无标签数据集的情况下,不断提高自动睡眠分期模型性能,有效缓解医疗数据紧缺和标记数据复杂的困难。数据复杂的困难。数据复杂的困难。

【技术实现步骤摘要】
一种逐步进化自动睡眠分期方法


[0001]本专利技术涉及睡眠监测
,具体涉及一种逐步进化自动睡眠分期方法。

技术介绍

[0002]睡眠作为生命所必须的过程,是机体复原、整合和巩固记忆的重要环节,是健康不可缺少的组成部分。长期的睡眠质量不佳会影响人们的精神状态、健康质量,严重则还会诱发其他身体疾病。据世界卫生组织的调查显示,27%的人有睡眠问题,睡眠障碍已经成为威胁世界公众健康的突出问题。睡眠分期对于睡眠质量分析和睡眠障碍诊断有着重要意义。
[0003]临床上,睡眠分期以多导睡眠图(Polysomnography,PSG)和专家判读作为“金标准”。PSG是指同时采集患者睡眠过程中的心电(Electrocardiogram,ECG)、脑电(Electroencephalogram,EEG)、眼电(Electrooculogram,EOG)、肌电(Electromyogram,EMG)、呼吸等多通道生理信号。临床医生将夜间睡眠以30s为单位分为清醒期、非快速眼动睡眠期和快速眼动睡眠期,其中非快速眼动睡眠期可以进一步分为Ⅰ期、Ⅱ期、Ⅲ期。但是PSG费用较高,患者在监测期间需要在专业睡眠实验室中佩戴大量传感器,监测数据需要人工分析,这些因素都严重制约了睡眠监测的普及。
[0004]近年来,随着大健康概念的兴起和人工智能技术的广泛应用,越来越多的科研人员开始关注人工智能技术在睡眠监测领域的研究和应用。而且,海量的睡眠数据为自动睡眠分期算法提供了研究基础。
[0005]半监督学习(Semi

Supervised Learning,SSL)是机器学习领域研究的重点问题,是有监督学习与无监督学习相结合的一种学习方法。半监督学习使用少量有标签数据和大量无标签数据训练模型,无标签数据的抽象信息可以改善少量标签数据引起的过拟合现象。自训练(Self

Training)是一种常见的半监督学习方法,其原理是将模型的预测结果作为真实标签进行标记,从而扩充训练集,并用于有监督学习。通过不断迭代来逐渐增加训练数据以提高模型性能。
[0006]自动睡眠分期算法训练分类器往往采用有监督训练策略,分类精度与训练集规模呈正相关。但由于医疗数据的特殊性和人工标记的复杂性,可用的标记数据非常稀缺。而且,使用数量有限的标记数据训练出的分期模型,其分类精度和泛化能力很难保证。例如:中国专利专利技术201710002025.9公开了一种单导联脑电的睡眠自动分期方法,但是该方案的缺点是模型训练仅依赖初始的少量数据,得到的模型无法适应实际应用中的海量数据,准确性和泛化能力有待提高。

技术实现思路

[0007]为了克服上述现有技术的缺点,本专利技术的目的在于提供一种逐步进化自动睡眠分期方法,旨在利用有限标记数据和大量无标记数据,逐步提高睡眠分期模型的分类准确率和泛化能力。
[0008]为了达到上述目的,本专利技术采用的技术方案如下:
[0009]一种逐步进化自动睡眠分期方法,包括以下步骤:
[0010]步骤一:基于多种特征提取方法,构建多个睡眠分期模型;
[0011]步骤二:有标签数据集训练睡眠分期模型,计算睡眠分期模型在验证集上的评价指标;
[0012]步骤三:睡眠分期模型自动标记无标签数据集,基于可信度评价方法筛选可信样本;
[0013]步骤四:有标签数据和步骤三筛选的可信样本组成训练集,重复步骤二、三;
[0014]步骤五:测试集测试睡眠分期模型,计算模型逐步进化结果。
[0015]所述的步骤一具体为:
[0016]根据实际应用场景选择多模生理信号或者单一生理信号作为睡眠分期任务的原始数据;
[0017]当使用多种生理信号时,根据不同生理信号特点,分别采用卷积神经网络自动提取局部特征,一维数据采用一维卷积网络提取特征,二维数据采用二维卷积网络提取特征,获得多组特征;
[0018]当使用单一生理信号时,由于单一的生理信号具有时域和频域的不同特征,因此既可以对原始信号采用卷积神经网络自动提取特征,又可以对原始信号转换到频域的数据采用卷积神经网络自动提取特征,保证时域和频域两组特征具有区分度;
[0019]获得的多组特征分别采用分类器实现分类任务,至此完成多个睡眠分期模型的搭建。
[0020]所述的步骤二具体为:
[0021]数据集按比例划分为有标签数据集、无标签数据集、验证集和测试集,其中,无标签数据集超过数据集总数的50%,验证集和测试集在模型进化过程中始终保持不变,且与其他数据集没有重合;
[0022]将有标签数据集和验证集按照固定长度划分为数据片段,在睡眠分期任务中被称为睡眠片段,然后,睡眠片段输入到步骤一构建的睡眠分期模型中训练模型;
[0023]训练过程中,有标签数据集用来拟合模型,验证集用来验证每次迭代后的模型性能,计算评价指标包括准确率(Accuracy)、F1分数平均值(MF1)、Cohen

s Kappa系数;并且不断调整超参数,超参数包括学习率、批大小、最大训练次数;最后将计算评价指标最好的模型作为最优模型。
[0024]所述的步骤三具体为:
[0025]使用步骤二得到的最优模型对无标签数据集进行自动标记,并基于可信度评价方法筛选可信样本;
[0026]根据使用对象不同,可信度评价方法分为数据可信度评价方法和模型可信度评价方法;数据可信度评价方法是指判断原始数据是否可信,包括EEG信号的数据可信度评价是判断是否存在因电极脱落导致信号采集失败、是否有强干扰淹没真实信号等情况下采集的数据,模型可信度评价是指判断模型的预测结果是否可信,包括睡眠分期模型可信度评价是指对单一模型输出概率分布的评价,以及对多个模型间分类一致性的评价。
[0027]所述的步骤四具体为:
[0028]通过步骤三筛选得到的可信样本与步骤二使用的有标签数据组成训练集,继续训
练睡眠分期模型,多次重复步骤二和步骤三,直至满足模型进化终止条件;
[0029]所述的模型进化终止条件根据可信样本的数据量以及验证集的评价指标共同确定,通常是筛选的可信样本数量非常少的情况下终止进化或者自定义迭代次数。
[0030]所述的步骤五具体为:
[0031]通过多次筛选可信样本、更新训练集,逐步提升模型性能,并使用测试集测试模型最终分类准确率。
[0032]与现有技术相比,本专利技术的优点是:
[0033]1、本专利技术使用半监督训练方法,即步骤二首次训练仅需要有限甚至少量的人工标记数据,后续模型进化完全使用无标签数据,有效缓解了医疗数据紧缺和标记数据复杂的困难,降低了深度学习模型研发的数据成本。
[0034]2、模型进化过程中即步骤三中,大量使用无标签数据不断丰富训练集,增加数据多样性,有利于提高模型分类准确率和泛化能力。
[0035]综上所述,本专利技术提出了一种逐步进化自动睡眠分期方法,适用于各种生理信号和分类器的睡眠分期本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种逐步进化自动睡眠分期方法,其特征在于,包括以下步骤:步骤一:基于多种特征提取方法,构建多个睡眠分期模型;步骤二:有标签数据集训练睡眠分期模型,计算睡眠分期模型在验证集上的评价指标;步骤三:睡眠分期模型自动标记无标签数据集,基于可信度评价方法筛选可信样本;步骤四:有标签数据和步骤三筛选的可信样本组成训练集,重复步骤二、三;步骤五:测试集测试睡眠分期模型,计算模型逐步进化结果。2.根据权利要求1所述的一种逐步进化自动睡眠分期方法,其特征在于,所述的步骤一具体为:根据实际应用场景选择多模生理信号或者单一生理信号作为睡眠分期任务的原始数据;当使用多种生理信号时,根据不同生理信号特点,分别采用卷积神经网络自动提取局部特征,一维数据采用一维卷积网络提取特征,二维数据采用二维卷积网络提取特征,获得多组特征;当使用单一生理信号时,由于单一的生理信号具有时域和频域的不同特征,因此既可以对原始信号采用卷积神经网络自动提取特征,又可以对原始信号转换到频域的数据采用卷积神经网络自动提取特征,保证时域和频域两组特征具有区分度;获得的多组特征分别采用分类器实现分类任务,至此完成多个睡眠分期模型的搭建。3.根据权利要求1所述的一种逐步进化自动睡眠分期方法,其特征在于,所述的步骤一具体为:数据集按比例划分为有标签数据集、无标签数据集、验证集和测试集,其中,无标签数据集超过数据集总数的50%,验证集和测试集在模型进化过程中始终保持不变,且与其他数据集没有重合;将有标签数据集和验证集按照固定长度划分为数据片段,在睡眠分期任务中被称为睡眠片段,然后,睡眠片段输入到步骤一构建的睡眠分期模型中训练模型;训练过程中...

【专利技术属性】
技术研发人员:闫相国白淑琪罗琛李晓斌胡岩王刚吴宁
申请(专利权)人:西安交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1