时序生理数据分类方法、装置、存储介质和处理器制造方法及图纸

技术编号:22331883 阅读:24 留言:0更新日期:2019-10-19 12:36
本发明专利技术公开了一种时序生理数据分类方法、装置、存储介质和处理器。其中方法包括:从数据库中提取多源体征数据,将数据分为训练数据和测试数据并进行预处理;构建深度学习模型DeepPhysioNet,该模型采用编码器‑解码器的神经网络架构,编码器是由基础的特征学习单元、序列残差单元以及表示学习单元组成,能进行强力特征抽取,而解码器利用提取的特征,针对不同目标的分类任务计算分类结果;离线训练阶段,将训练数据输入到模型中进行初步训练,通过测试数据对初步训练完成的模型进行测试,不断重复直至符合预设条件;在线推断阶段将待检测的数据输入到训练好的DeepPhysioNet模型,输出分类结果。本发明专利技术具有避免专家偏向、适用于多源时序生理数据、引入注意力机制的优点。

Classification method, device, storage medium and processor of sequential physiological data

【技术实现步骤摘要】
时序生理数据分类方法、装置、存储介质和处理器
本专利技术涉及数据处理领域,特别涉及一种基于深度学习的时序生理数据分类方法、装置、存储介质和处理器。
技术介绍
虽然深度学习技术已经广泛应用在各种智慧医疗的场景中,但是基于时间维度产生的海量时序生理信号数据的挖掘尚处于起步阶段。主要表现在时序生理体征数据存在超长时序依赖,采集设备差异导致的数据量纲不统一,以及通用骨干网络模型的瓶颈。针对时序生理数据分析在疾病预测方面的分析,医师决策过程是从给定数据中圈出异常部分,睡眠呼吸暂停疾病中的“心电信号突然密集”。目前的研究大多数都将此问题转化为固定时间窗口下的分类问题。如图1(a)所示,在载入原始数据后,将原始数据划分为固定窗口模式,根据切分后的数据进行建模,得到每种类别的概率。具体的,如图1(b)所示,通过固定窗口下的数据切分后,交给分类器去建模,得到每个窗口的分类概率,对应当前窗口下不同疾病的概率。最终通过统计病人的全集合表现,例如睡眠呼吸暂停计算AHI指标来衡量该病人的是否患病极其轻重程度。现有技术中,对时序生理信号进行处理的方法如图2所示,包含传统特征工程建模与简单的深度学习模型。这类装置的缺点是:1.通用性较差。针对不同数据集或不同细分任务,即使都属于监督学习中的分类问题,仍需要重新进行特征工程步骤。特征工程不仅耗时,且对不同细分任务都需要较强的领域知识。2.特征工程与特征选择步骤必不可少。模型决策时起决定作用的是少数重要特征,所以特征选择步骤也是非常重要的一环。3.泛化能力较弱。此类方法在大数据集任务上通常表现较差,因为手动特征工程一类特征刻画一部分数据分布,很难刻画大数据中的全部内在模式。因此,需要提供随着数据量的增大,不仅可减少对领域先验知识的要求,模型效果与泛化能力也会相应增强的时序生理数据分类方法、装置。
技术实现思路
本专利技术的目的在于克服现有技术的缺点与不足,提供一种时序生理数据分类方法、装置,其具有避免专家偏向、适用于多源时序生理数据、引入注意力机制的优点。本专利技术的另一个目的在于提供一种存储介质,其上存储有计算机程序,该程序运行时执行所述时序生理数据分类方法。本专利技术的另一个目的在于提供一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述时序生理数据分类方法。本专利技术的目的通过以下的技术方案实现:时序生理数据分类方法,包括步骤:(1)从数据库中提取出多源体征数据,将数据分为训练数据和测试数据,并进行数据的预处理;(2)构建深度学习模型DeepPhysioNet,所述DeepPhysioNet模型采用编码器-解码器(Encoder-Decoder)的神经网络架构,编码器的首部是由卷积神经网络构成的基础的特征学习单元,然后通过跳字连接构成序列残差单元(SequenceResidualBlock,SRB)以加深网络及避免网络出现梯度退化的问题,最后由表示学习单元(RepresentLearning)引入注意力机制,解码器自动对时序生理数据进行强力的特征抽取,而解码器利用提取到的特征,针对不同目标的分类任务计算分类结果;(3)离线训练阶段,以步骤(1)中的训练数据作为输入,输入到DeepPhysionet模型中进行初步训练,再通过步骤(1)中的测试数据对初步训练完成的模型进行测试,不断重复此过程直至模型符合预设条件为止;(4)在线推断阶段,将待检测的数据输入到所述DeepPhysioNet模型,输出分类结果。优选的,对数据库中的数据进行预处理,首先使用标准差标准化的方法进行归一化,然后通过整数分解进行降采样,把不同采样频率的数据规整到固定尺度。优选的,步骤(2)中,DeepPhysioNet模型中基础的特征学习单元包括五层卷积神经网络,其中每层卷积神经网络由两个卷积核大小为3的卷积层、一个线性整流单元和一个最大池化层组成。优选的,步骤(2)中,DeepPhysioNet模型的序列残差单元由多个序列残差子单元堆叠而成,每个序列残差子单元由两个卷积层堆叠一个线性整流单元组成,通过加入跳字连接(skipconnection)用于加深网络,同时避免网络出现梯度退化问题。优选的,步骤(2)中,DeepPhysioNet模型的表示学习单元由多头注意力机制(Multi-headAttention)层与前馈神经网络(Feed-ForwardNetwork,FFN)组成,所述多头注意力机制层与前馈神经网络都由一个残差连接链路(ResidualConnection)连接着归一化层(LayerNorm)。此结构能够将模型的注意力集中于对模型输出结果有贡献的部分,而将数据中冗余部分的权重降低。优选的,步骤(2)中,DeepPhysioNet模型中的解码器由m个目标任务Softmax函数层拼接组成,根据数据集的目标任务数量变化,用于处理多目标任务与单目标任务的数据。更进一步的,当待处理的数据为单目标多类型的任务时,DeepPhysioNet模型的损失函数如下式所示:其中i∈m,表示多任务的数量;x是输入样本,y是标签,N表示样本数量,n∈N;当待处理的数据为多目标任务,损失函数为多个目标任务的加权损失函数,公式如下:Lsum=w1l1+w2l2+...wili其中,ω1、ω2、ωi表示各目标任务的权重,l1、l2、li表示各目标任务的损失函数。时序生理数据分类装置,包括:原始数据获取及预处理模块,用于从数据库中提取出多源体征数据,将数据分为训练数据和测试数据,并进行数据的预处理;模型构建模块,用于构建深度学习模型DeepPhysioNet,所述DeepPhysioNet模型采用编码器-解码器的神经网络架构,编码器的首部是由卷积神经网络构成的基础的特征学习单元,然后通过跳字连接构成序列残差单元以加深网络及避免网络出现梯度退化的问题,最后由表示学习单元引入注意力机制,解码器自动对时序生理数据进行强力的特征抽取,而解码器利用提取到的特征,针对不同目标的分类任务计算分类结果;离线训练模块,用于以训练数据作为输入,输入到DeepPhysionet模型中进行初步训练,再通过测试数据对初步训练完成的模型进行测试,不断重复此过程直至模型符合预设条件为止;在线推断模块,用于将待检测的数据输入到所述DeepPhysioNet模型,输出分类结果。优选的,所述原始数据获取及预处理模块中对数据进行预处理,方法是:首先使用标准差标准化的方法进行归一化,然后通过整数分解进行降采样,把不同采样频率的数据规整到固定尺度。优选的,DeepPhysioNet模型的序列残差单元由多个序列残差子单元堆叠而成,每个序列残差子单元由两个卷积层堆叠一个线性整流单元组成,通过加入跳字连接用于加深网络,同时避免网络出现梯度退化问题。优选的,DeepPhysioNet模型的表示学习单元由多头注意力机制层与前馈神经网络组成,所述多头注意力机制层与前馈神经网络都由一个残差连接链路连接着归一化层。优选的,DeepPhysioNet模型中的解码器由m个目标任务Softmax函数层拼接组成,当待处理的数据为单目标多类型的任务时,DeepPhysioNet模型的损失函数如下式所示:其中i∈m,表示多任务的数量;x是输入样本,y是标签,N表示样本数量,n∈N;当待处理的数据为多本文档来自技高网
...

【技术保护点】
1.时序生理数据分类方法,其特征在于,包括步骤:(1)从数据库中提取出多源体征数据,将数据分为训练数据和测试数据,并进行数据的预处理;(2)构建深度学习模型DeepPhysioNet,所述DeepPhysioNet模型采用编码器‑解码器的神经网络架构,编码器的首部是由卷积神经网络构成的基础的特征学习单元,然后通过跳字连接构成序列残差单元以加深网络及避免网络出现梯度退化的问题,最后由表示学习单元引入注意力机制,解码器自动对时序生理数据进行强力的特征抽取,而解码器利用提取到的特征,针对不同目标的分类任务计算分类结果;(3)离线训练阶段,以步骤(1)中的训练数据作为输入,输入到DeepPhysionet模型中进行初步训练,再通过步骤(1)中的测试数据对初步训练完成的模型进行测试,不断重复此过程直至模型符合预设条件为止;(4)在线推断阶段,将待检测的数据输入到所述DeepPhysioNet模型,输出分类结果。

【技术特征摘要】
1.时序生理数据分类方法,其特征在于,包括步骤:(1)从数据库中提取出多源体征数据,将数据分为训练数据和测试数据,并进行数据的预处理;(2)构建深度学习模型DeepPhysioNet,所述DeepPhysioNet模型采用编码器-解码器的神经网络架构,编码器的首部是由卷积神经网络构成的基础的特征学习单元,然后通过跳字连接构成序列残差单元以加深网络及避免网络出现梯度退化的问题,最后由表示学习单元引入注意力机制,解码器自动对时序生理数据进行强力的特征抽取,而解码器利用提取到的特征,针对不同目标的分类任务计算分类结果;(3)离线训练阶段,以步骤(1)中的训练数据作为输入,输入到DeepPhysionet模型中进行初步训练,再通过步骤(1)中的测试数据对初步训练完成的模型进行测试,不断重复此过程直至模型符合预设条件为止;(4)在线推断阶段,将待检测的数据输入到所述DeepPhysioNet模型,输出分类结果。2.根据权利要求1所述的时序生理数据分类方法,其特征在于,对数据库中的数据进行预处理,首先使用标准差标准化的方法进行归一化,然后通过整数分解进行降采样,把不同采样频率的数据规整到固定尺度。3.根据权利要求1所述的时序生理数据分类方法,其特征在于,步骤(2)中,DeepPhysioNet模型中基础的特征学习单元包括五层卷积神经网络,其中每层卷积神经网络由两个卷积核大小为3的卷积层、一个线性整流单元和一个最大池化层组成。4.根据权利要求1所述的时序生理数据分类方法,其特征在于,步骤(2)中,DeepPhysioNet模型的序列残差单元由多个序列残差子单元堆叠而成,每个序列残差子单元由两个卷积层堆叠一个线性整流单元组成,通过加入跳字连接用于加深网络,同时避免网络出现梯度退化问题。5.根据权利要求1所述的时序生理数据分类方法,其特征在于,步骤(2)中,DeepPhysioNet模型的表示学习单元由多头注意力机制层与前馈神经网络组成,所述多头注意力机制层与前馈神经网络都由一个残差连接链路连接着归一化层。6.根据权利要求1所述的时序生理数据分类方法,其特征在于,步骤(2)中,DeepPhysioNet模型中的解码器由m个任务类型的Softmax函数层拼接组成,当待处理的数据为单目标多类型的任务时,DeepPhysio...

【专利技术属性】
技术研发人员:聂瑞华李铮席云
申请(专利权)人:华南师范大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1