基于XGBoost的凝血检测中血液样本的分类方法及系统技术方案

技术编号:33934177 阅读:16 留言:0更新日期:2022-06-25 22:54
本发明专利技术提供一种基于XGBoost的凝血检测中血液样本的分类方法及系统,属于智慧医疗技术领域,通过获取待检测血液样本的凝血指标数据;将血液样本的凝血指标数据输入预训练的基于XGBoost的凝血检测中血液样本的分类模型中,对血液样本的凝血指标数据,按照预设的各个凝血指标的权重进行低层次特征和高层次特征提取,并将提取的低层次特征和高层次特征进行融合,获取检测项目特征;利用基于XGBoost的分类器,根据检测项目特征获取待检测血液样本的凝血检测分类结果。本发明专利技术具备鲁棒性,充分利用凝血分析仪的各项数据特征,能够动态调整预警信息,具有预测速度快、预测准确度高的显著效果。著效果。著效果。

【技术实现步骤摘要】
基于XGBoost的凝血检测中血液样本的分类方法及系统


[0001]本专利技术属于智慧医疗
,具体涉及一种基于XGBoost的凝血检测中血液样本的分类方法及系统。

技术介绍

[0002]随着人口老龄化的加剧,血栓性疾病检测和抗凝药物监测的需求不断提升,而凝血检测是血栓与止血临床筛查的主要指标。凝血检测通常采用凝固法、免疫比浊法和发色底物法对人体血浆进行凝血和抗凝、纤溶和抗纤溶功能的分析。常规凝血检测试验项目包括凝血酶原时间(PT)、活化部分凝血活酶时间(APTT)、纤维蛋白原(FIB)和凝血酶时间(TT)、D二聚体(D

dimer)和纤维蛋白降解产物(FDP)。临床上在对患者进行凝血检测实验时,其血液标本的质量可直接影响检测的结果。血液标本存放的时间、进行离心的时间、是否发生溶血及标本采集人员和检测人员操作的规范性及熟练性等过程均会对检测结果造成影响。其中,血液标本中的血栓可能导致凝血检测结果产生偏差,这可能严重影响临床决策过程。虽然在离心前插入木棍或倒置采集管可以检测到部分血栓凝块,但这些方法在使用自动化流水线的实验室很难实践,并且增加了检测成本。
[0003]近年来,机器学习因其在诊断、医学图像识别和预测癌症等方面的高准确率而受到越来越多医学研究人员的关注。机器学习是通过研究算法和统计模型来对目标进行预测,依靠模式推理而不使用明确指令来执行特定的任务,能够基于样本数据建立数学模型,以便在没有被明确指令的情况下作出预测或决策。把机器学习技术应用到检验医学领域,被证明是一种有前途的早期诊断和个性化治疗的有效方法。其中,XGBoost(eXtreme Gradient Boosting)即极限梯度提升是最常用的最大似然算法之一,它是一个高性能的梯度提升树模型,能够高效、灵活地进行复杂的非线性学习。与传统的GBDT(梯度提升决策树)算法相比,XGBoost加入了正则项来控制模型的复杂度,有利于防止模型过拟合、加快收敛速度,从而提高模型的泛化能力。XGBoost的算法特点非常适用于进行凝血检测分析,但是,现有技术中尚无基于XGBoost算法的凝血检测分析方法。
[0004]因此,亟需一种基于XGBoost算法的凝血检测分析方法。

技术实现思路

[0005]本专利技术提供一种基于XGBoost的凝血检测中血液样本的分类方法、系统、电子设备及存储介质,用以克服现有技术中存在的至少一个技术问题。
[0006]为实现上述目的,本专利技术提供一种基于XGBoost的凝血检测中血液样本的分类方法,方法包括:获取待检测血液样本的凝血指标数据;所述凝血指标数据的凝血指标包括凝血酶原时间、活化部分凝血活酶时间、纤维蛋白原、凝血酶时间、D二聚体和纤维蛋白降解产物;将所述血液样本的凝血指标数据输入预训练的基于XGBoost的凝血检测中血液样本的分类模型中,对所述血液样本的凝血指标数据,按照预设的各个凝血指标的权重进行
低层次特征和高层次特征提取,并将提取的低层次特征和高层次特征进行融合,获取检测项目特征;利用基于XGBoost的分类器,根据所述检测项目特征获取待检测血液样本的凝血检测分类结果;其中,所述基于XGBoost的分类器通过贝叶斯网络,采用5折交叉验证的方式进行参数优化。
[0007]进一步,优选的,在获取待检测血液样本的凝血指标数据之后,还包括对凝血指标数据的预处理,包括:对凝血指标数据进行归一化处理;遍历所述归一化处理后的凝血指标数据,查找缺失值,并利用正向填充策略对所述缺失值进行填充;进行异常值去除。
[0008]进一步,优选的,各个凝血指标的权重的确定方法,包括:获取包括凝血指标数据的数据集;对所述数据集按照是否含有血栓凝块进行手动标记;利用双侧T检验比较数据集中有血栓凝块的数据均值和无血栓凝块的数据均值;在有血栓凝块的数据和无血栓凝块的数据两组数据之间以及两组数据中分别计算皮尔逊相关系数;根据所述皮尔逊相关系数,利用Logistic回归估计确定各个凝血指标与是否存在血栓凝块间的相关性;根据各个凝血指标与是否存在血栓凝块间的相关性确定进行特征提取的权重。
[0009]进一步,优选的,所述基于XGBoost的分类器通过贝叶斯网络,采用5折交叉验证的方式进行参数优化的步骤,包括:实施5折交叉验证,得到5个XGBoost分类器模型;利用训练集对所述5个XGBoost分类器模型进行训练,实现对血液样本状态的检测;其中,将所述预处理后的待检测血液样本的凝血指标数据划分为测试集和训练集;所述训练集分成五个子集,每个子集轮流用作内部验证集;利用内部验证集对其他子集训练的XGBoost分类器模型进行预测精度评估;使用贝叶斯网络对所述XGBoost分类器模型进行参数优化。
[0010]进一步,优选的,还包括对于训练好的基于XGBoost的凝血检测中血液样本的分类模型进行模型评价,包括:通过内部验证集对其他子集训练的XGBoost分类器模型进行预测精度评估的过程中获取所述XGBoost分类器模型的预测值;将每个测试样本的预测值和二进制真实值结合,得到平均工作特性曲线和基于XGBoost的凝血检测中血液样本的分类模型的混淆矩阵;根据所述混淆矩阵,利用无梯度优化算法确定使训练集效用分数最大的截止阈值作为所述工作特性曲线的最佳阈值;筛选符合所述最佳阈值的基于XGBoost的凝血检测中血液样本的分类模型的分类结果,作为待检测血液样本的凝血检测分类结果。
[0011]进一步,优选的,使用贝叶斯网络对所述XGBoost分类器模型进行参数优化采用下
述四种策略中的一种或多种组合:L2范数正则化、学习率衰减策略、丢失法和提前停止策略。
[0012]为了解决上述问题,本专利技术还提供一种基于XGBoost的凝血检测中血液样本的分类系统,包括:数据获取单元,用于获取待检测血液样本的凝血指标数据;所述凝血指标数据的凝血指标包括凝血酶原时间、活化部分凝血活酶时间、纤维蛋白原、凝血酶时间、D二聚体和纤维蛋白降解产物;特征提取单元,用于将所述血液样本的凝血指标数据输入预训练的基于XGBoost的凝血检测中血液样本的分类模型中,对所述血液样本的凝血指标数据,按照预设的各个凝血指标的权重进行低层次特征和高层次特征提取,并将提取的低层次特征和高层次特征进行融合,获取检测项目特征;检测结果确定单元,用于利用基于XGBoost的分类器,根据所述检测项目特征获取待检测血液样本的凝血检测分类结果;其中,所述基于XGBoost的分类器通过贝叶斯网络,采用5折交叉验证的方式进行参数优化。
[0013]进一步,优选的,包括数据预处理单元,用于对凝血指标数据进行归一化处理;遍历所述归一化处理后的凝血指标数据,查找缺失值,并利用正向填充策略对所述缺失值进行填充;进行异常值去除。
[0014]为了解决上述问题,本专利技术还提供一种电子设备,电子设备包括:存储器,存储至少一个指令;及处理器,执行存储器中存储的指令以实现上述的基于XGBoost的凝血检测中血液样本的分类方法中的步骤。
[0015]本专利技术还本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于XGBoost的凝血检测中血液样本的分类方法,其特征在于,包括:获取待检测血液样本的凝血指标数据;所述凝血指标数据的凝血指标包括凝血酶原时间、活化部分凝血活酶时间、纤维蛋白原、凝血酶时间、D二聚体和纤维蛋白降解产物;将所述血液样本的凝血指标数据输入预训练的基于XGBoost的凝血检测中血液样本的分类模型中,对所述血液样本的凝血指标数据,按照预设的各个凝血指标的权重进行低层次特征和高层次特征提取,并将提取的低层次特征和高层次特征进行融合,获取检测项目特征;利用基于XGBoost的分类器,根据所述检测项目特征获取待检测血液样本的凝血检测分类结果;其中,所述基于XGBoost的分类器通过贝叶斯网络,采用5折交叉验证的方式进行参数优化。2.如权利要求1所述的基于XGBoost的凝血检测中血液样本的分类方法,其特征在于,在获取待检测血液样本的凝血指标数据之后,还包括对凝血指标数据的预处理,包括:对凝血指标数据进行归一化处理;遍历所述归一化处理后的凝血指标数据,查找缺失值,并利用正向填充策略对所述缺失值进行填充;进行异常值去除。3.如权利要求1所述的基于XGBoost的凝血检测中血液样本的分类方法,其特征在于,各个凝血指标的权重的确定方法,包括:获取包括凝血指标数据的数据集;对所述数据集按照是否含有血栓凝块进行手动标记;利用双侧T检验比较数据集中有血栓凝块的数据均值和无血栓凝块的数据均值;在有血栓凝块的数据和无血栓凝块的数据两组数据之间以及两组数据中分别计算皮尔逊相关系数;根据所述皮尔逊相关系数,利用Logistic回归估计确定各个凝血指标与是否存在血栓凝块间的相关性;根据各个凝血指标与是否存在血栓凝块间的相关性确定进行特征提取的权重。4.如权利要求1所述的基于XGBoost的凝血检测中血液样本的分类方法,其特征在于,所述基于XGBoost的分类器通过贝叶斯网络,采用5折交叉验证的方式进行参数优化的步骤,包括:实施5折交叉验证,得到5个XGBoost分类器模型;利用训练集对所述5个XGBoost分类器模型进行训练,实现对血液样本状态的检测;其中,将所述预处理后的待检测血液样本的凝血指标数据划分为测试集和训练集;所述训练集分成五个子集,每个子集轮流用作内部验证集;利用内部验证集对其他子集训练的XGBoost分类器模型进行预测精度评估;使用贝叶斯网络对所述XGBoost分类器模型进行参数优化。5.如权利要求4中所述的基于XGBoost的凝血检测中血液样本的分类方法,其特征在于,还包括对于训练好的基于XGBoost的凝血检测中血液样本的分类模型进...

【专利技术属性】
技术研发人员:李登旺洪亭轩黄浦陆华高祝敏王醒李玉玲周顺风赵本靖
申请(专利权)人:山东师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1