一种基于半监督Semi-KNN模型的PISA故障识别方法技术

技术编号:33635847 阅读:90 留言:0更新日期:2022-06-02 01:48
本发明专利技术涉及一种基于半监督Semi

【技术实现步骤摘要】
一种基于半监督Semi

KNN模型的PISA故障识别方法


[0001]本专利技术涉及PISA故障识别技术,尤其涉及一种基于半监督Semi

KNN模型的PISA故障识别方法。

技术介绍

[0002]近年来,连续血糖监测系统CGM已经得到越来越广泛的关注。连续血糖监测信号被用于诊断和指导各类型的糖尿病的辅助手段。连续血糖监测信号通常采用数据驱动的方法进行分析,存在血糖信号易受噪声影响、血糖监测仪易发生故障、血糖预测报警受数据误差影响而精度不高等问题。针对连续血糖监测系统的故障识别方法大多都受到性能差和高假阳性率的困扰,这限制了辅助的临床用途。
[0003]近年来数字信号处理的发展迅速,通过有限和无限脉冲响应滤波器,解决了CGM信号的噪声问题。但CGM故障检测仍然是一个需要关注的挑战,是一个非常活跃的研究应用领域。
[0004]当连续血糖监测系统CGM使用的传感器周围皮肤受到巨大压力时,CGM读数会快速下降,基于CGM读数的算法比如预测泵关闭(predictive pump shut

off)依靠葡萄糖传感器变化速率的估计来关闭胰岛素泵以避免低血糖。但由于PISA事件在夜间发生时无法及时得到关注,会造成不恰当的泵关闭;另外预测算法也会由于PISA故障造成预测数据偏低,并对预报预警产生更为严重的影响。因此如何区分PISA故障与胰岛素事件、低血糖事件、运动事件等其他信号值变低事件成为当前亟需解决的技术问题。因此,需要一种具有足够快的执行时间进行实时操作的半监督PISA故障识别方法。

技术实现思路

[0005](一)要解决的技术问题
[0006]鉴于现有技术的上述缺点、不足,本专利技术提供一种基于半监督Semi

KNN模型的PISA故障识别方法。
[0007](二)技术方案
[0008]为了达到上述目的,本专利技术采用的主要技术方案包括:
[0009]第一方面,本专利技术实施例提供一种基于半监督Semi

KNN模型的PISA故障识别方法,其包括:
[0010]S10、获取预设时间段内的待测血糖信息,并对待测血糖信息进行预处理,得到预处理后的待测血糖信息;
[0011]S20、基于预先建立的PISA约束集合和所述预处理后的待测血糖信息,采用相似度度量处理方式,获取待测血糖信息所属的约束关系;
[0012]所述PISA约束集合为半监督Semi

KNN模型训练阶段基于先验知识构造的具有ML约束、CL约束的集合,集合中每一元素为血糖子序列的一阶差分特征的信息;
[0013]S30、将所述预处理后的待测血糖信息、约束关系输入到预先训练的半监督Semi

KNN模型中,所述半监督Semi

KNN模型输出待测血糖信息的分类结果;
[0014]所述半监督Semi

KNN模型为采用训练数据集和所述PISA约束集合对KNN模型进行训练,得到的用于识别血糖信息异常的半监督方式的模型,且所述训练数据集包括经由一阶差分处理的血糖数据。
[0015]可选地,所述S10之前,所述方法还包括:
[0016]S01、借助于CGM设备获取多个历史血糖数据,并对每一历史血糖数据进行预处理,并得到血糖序列;每一血糖序列中包括具有PISA时间戳标签的血糖数据和非PISA时间戳标签的血糖数据;
[0017]S02、将每一血糖序列划分为多个子序列,并对每一个子序列进行一阶差分计算,得到训练数据集;
[0018]S03、基于先验知识和训练数据集中的具有PISA时间戳标签的训练数据,按照半监督约束条件形成规则,生成PISA约束集合;
[0019]S04、将所述训练数据集和PISA约束集合对半监督Semi

KNN模型进行训练获取训练后的半监督Semi

KNN模型;
[0020]所述半监督Semi

KNN模型为改进KNN模型并采用半监督方式构建的。
[0021]可选地,所述S04包括:
[0022]S04

1、遍历训练数据集的所有子序列,构建离线K维搜索二叉树,得到K

D树;
[0023]S04

2、基于所述K

D树,遍历PISA约束集合,获取半监督Semi

KNN模型的异常阈值σ,所述异常阈值的边界阈值为σ1和σ2,表示为σ=[σ1,σ2];
[0024]其中,采用DTW相似性度量函数计算PISA约束集合中每一个PISA事件与其他事件的平均距离,得到距离集合;
[0025]则根据下述公式(1)获得异常阈值σ=[σ1,σ2];
[0026]σ1=Q3+1.5(Q3

Q1),公式(1)
[0027]σ2=Q1

1.5(Q3

Q1),
[0028]待测血糖数据距离PISA约束中ML关系的样本距离dist<σ2,则确定为异常样本;待测血糖数据距离PISA约束中CL关系的样本距离dist>σ1,则确定为异常样本;
[0029]Q3为距离集合中的上四分位数,Q1为距离集合中的下四分位数。
[0030]可选地,所述S02包括:
[0031]对每一个血糖序列做滑动窗口处理,在血糖序列X={x1,x2,

,xn}中,经大小为w滑动窗口后形成若干子序列qi={x
i
,x
i+1
,

,x
i+k
},
[0032]一个序列子集为D={q1,q2,

,qm},对每一个子序列qi按照公式(2)进行一阶差分计算,
[0033]h为一阶差分公式的改变量,h取值为0.8

1.2;
[0034][0035]对所有的子序列计算一阶差分后,每一子序列的一阶差分值作为训练数据集。
[0036]可选地,所述S10包括:
[0037]借助于CGM设备获取大于等于30

45分钟的待测血糖信息;
[0038]进行滤波处理,并通过滑动窗口方式对待测血糖信息进行预处理,以去除待测血
糖信息中的孤立噪声点并实现缺失值填补,得到待测血糖信息的待测血糖序列。也就是说,可对待测血糖信息进行滤波处理,并通过适当大小的滑动窗口方式遍历待测血糖信息,当滑窗范围内存在此类微小区域时将其平均处理,从而去除待测血糖信息准孤立噪声点。当由于传感器问题造成待测血糖信息存在缺失值时,首先可以判断缺失值连续存在的个数,然后通过一般的线性插值方法对待测血糖信息进行缺失值填补,得到待测血糖信息的预处理后的待测血糖序列。
[0039]可选地,所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于半监督Semi

KNN模型的PISA故障识别方法,其特征在于,包括:S10、获取预设时间段内的待测血糖信息,并对待测血糖信息进行预处理,得到预处理后的待测血糖信息;S20、基于预先建立的PISA约束集合和所述预处理后的待测血糖信息,采用相似度度量处理方式,获取待测血糖信息所属的约束关系;所述PISA约束集合为半监督Semi

KNN模型训练阶段基于先验知识构造的具有ML约束、CL约束的集合,集合中每一元素为血糖子序列的一阶差分特征的信息;S30、将所述预处理后的待测血糖信息、约束关系输入到预先训练的半监督Semi

KNN模型中,所述半监督Semi

KNN模型输出待测血糖信息的分类结果;所述半监督Semi

KNN模型为采用训练数据集和所述PISA约束集合对KNN模型进行训练,得到的用于识别血糖信息异常的半监督方式的模型,且所述训练数据集包括经由一阶差分处理的血糖数据。2.根据权利要求1所述的方法,其特征在于,所述S10之前,所述方法还包括:S01、借助于连续血糖监测系统CGM获取多个历史血糖数据,并对每一历史血糖数据进行预处理,并得到血糖序列;每一血糖序列中包括具有PISA时间戳标签的血糖数据和非PISA时间戳标签的血糖数据;S02、将每一血糖序列划分为多个子序列,并对每一个子序列进行一阶差分计算,得到训练数据集;S03、基于先验知识和训练数据集中的具有PISA时间戳标签的训练数据,按照半监督约束条件形成规则,生成PISA约束集合;S04、将所述训练数据集和PISA约束集合对半监督Semi

KNN模型进行训练获取训练后的半监督Semi

KNN模型;所述半监督Semi

KNN模型为改进KNN模型并采用半监督方式构建的。3.根据权利要求2所述的方法,其特征在于,所述S04包括:S04

1、遍历训练数据集的所有子序列,构建离线K维搜索二叉树,得到K

D树;S04

2、基于所述K

D树,遍历PISA约束集合,获取半监督Semi

KNN模型的异常阈值σ,所述异常阈值的边界阈值为σ1和σ2,表示为σ=[σ1,σ2];其中,采用DTW相似性度量函数计算PISA约束集合中每一个PISA事件与其他事件的平均距离,得到距离集合;则根据下述公式(1)获得异常阈值σ=[σ1,σ2];σ1=Q3+1.5(Q3

Q1),公式(1)σ2=Q1

1.5(Q3

Q1),待测血糖数据距离PISA约束中ML关系的样本距离dist&lt;σ2,则确定为异常样本;待测血糖数据距离PISA约束中CL关系的样本距离dist&gt;σ1,则确定为异常样本;Q3为距离集合中的上四分位数,Q1为距离集合中的下四分位数。4.根据权利要求2所述的方法,其特征在于,所述S02包括:对每一个血糖序列做滑动窗口处理,在血糖序列X={x1,x2,<...

【专利技术属性】
技术研发人员:于霞张占虎李鸿儒周健陆静毅马晓静
申请(专利权)人:上海市第六人民医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1