生物标志物的参考区间计算方法及设备技术

技术编号:36401510 阅读:61 留言:0更新日期:2023-01-18 10:08
本发明专利技术提供一种生物标志物的参考区间计算方法及设备,包括:从多个数据库中分别获得同一生物标志物的检测结果,得到多个检测结果集;分别利用多种去重算法和多种剔除算法对所述多个检测结果集进行处理,得到所述生物标志物的多个目标数据集;分别确定所述多个目标数据集的所述生物标志物的数值的数值分布状态,进而确定其中最符合正态分布的一个所述目标数据集;分别利用多种参考区间算法,基于所述目标数据集计算出所述生物标志物的参考区间;计算全部参考区间计算结果的一致性数据,并判断一致性数据是否达到预定条件;如果一致性数据达到预定条件,则根据各个所述参考区间的置信区间确定一个所述参考区间作为最终结果。信区间确定一个所述参考区间作为最终结果。信区间确定一个所述参考区间作为最终结果。

【技术实现步骤摘要】
生物标志物的参考区间计算方法及设备


[0001]本专利技术涉及生化检验数据处理领域,具体涉及一种生物标志物的参考区间计算方法及设备。

技术介绍

[0002]在医学领域中,临床指标参考区间是指健康人群中检验指标95%测量值的分布范围,是包含两个端点的一个区间,建立合适的参考区间对于临床决策至关重要。
[0003]针对各种生物标志物需要分别确定参考区间,为了确定参考区间所使用的数据来源、算法有很多种选择。目前,国内大部分临床实验室使用的参考区间多为国外的参考区间。尽管目前行业标准发布常规生物标志物的参考区间,但是仅仅覆盖了少部分生物标志物。所以实验室建立适合自己实验室的参考区间至关重要。
[0004]直接募集健康人建立参考区间成本高,对于大部分实验室而言是不可行的。而每天临床实验室产生海量的真实世界数据,通过合理的数据清洗和挖掘流程,可以建立稳定、且可靠的参考区间。这种方法成本低、对于大部分实验室而言是可行的。然而,使用真实数据建立参考区间存在多种算法,涉及多个环节,目前没有一个明确的指南或者系统的方法理论指导研究者使用大数据建立参考区间。此外,在建立参考区间前,需要考虑使用数据类型,样本量、病理数据比例,检验项目分析特点等一系列问题。这对于临床工作者而言无疑是非常困难的。

技术实现思路

[0005]有鉴于此,本专利技术一种生物标志物的参考区间计算方法,包括:
[0006]从多个数据库中分别获得同一生物标志物的检测结果,得到多个检测结果集,其中每个所述检测结果集中分别包括大量个体的所述生物标志物的检测结果;
[0007]分别利用多种去重算法和多种剔除算法对所述多个检测结果集进行处理,得到所述生物标志物的多个目标数据集,其数量是所述检测结果集的数量、所述去重算法的数量与所述剔除算法的数量的乘积;
[0008]分别确定所述多个目标数据集的所述生物标志物的数值的数值分布状态,进而确定其中最符合正态分布的一个所述目标数据集;
[0009]分别利用多种参考区间算法,基于所述目标数据集计算出所述生物标志物的参考区间;
[0010]计算全部参考区间计算结果的一致性数据,并判断一致性数据是否达到预定条件;
[0011]如果一致性数据达到预定条件,则根据各个所述参考区间的置信区间确定一个所述参考区间作为最终结果;
[0012]如果一致性数据未达到预定条件,则根据所述目标数据集的数值分布状态选择一种参考区间算法,将与其相应的参考区间作为最终结果。
[0013]可选地,分别确定所述多个目标数据集的所述生物标志物的数值的正态分布状态,进而确定其中正态分布最佳的一个所述目标数据集,具体包括:
[0014]分别计算各个目标数据集的峰度系数和偏度系数;
[0015]分别计算各个目标数据集的正态分布数值,正态分布数值=|偏度系数|+|峰度系数

3|;
[0016]确定具有最小所述正态分布数值的目标数据集。
[0017]可选地,计算全部参考区间计算结果的一致性数据,并判断一致性数据是否达到预定条件,具体包括:
[0018]计算全部参考区间的偏倚矩阵,进而计算偏倚矩阵中的偏倚中位数;
[0019]所述预定条件为所述偏倚中位数达到阈值。
[0020]可选地,根据各个所述参考区间的置信区间确定一个所述参考区间作为最终结果,具体包括:
[0021]分别计算各个所述参考区间的置信区间的宽度;
[0022]将置信区间宽度最小的所述参考区间作为最终结果。
[0023]可选地,所述多个数据库包括如下7个:
[0024]体检个体数据库;
[0025]门诊患者数据库;
[0026]住院患者数据库;
[0027]体检个体与门诊患者的组合数据库;
[0028]体检个体与住院患者的组合数据库;
[0029]门诊患者与住院患者的组合数据库;
[0030]体检个体、门诊患者及住院患者的组合数据库。
[0031]可选地,所述多种去重算法包括如下4种:
[0032]针对同一数据库中同一个体的多次检测结果仅保留首次检测结果;
[0033]针对同一数据库中同一个体的多次检测结果仅保留末次检测结果;
[0034]针对同一数据库中同一个体的多次检测结果随机保留一次检测结果;
[0035]针对同一数据库保留同一个体的全部检测结果。
[0036]可选地,所述多种剔除算法包括如下5种:
[0037]采用Tukey法剔除单个检测结果的值;
[0038]采用Tukey法剔除个体的检测结果;
[0039]采用循环4SD法剔除单个检测结果的值;
[0040]采用循环4SD法剔除个体的检测结果;
[0041]不剔除任何检测结果。
[0042]可选地,所述多种参考区间算法包括如下7种:
[0043]Box

Cox算法与Hoffmann算法的组合;
[0044]Box

Cox算法与Bhattacharya算法的组合;
[0045]Box

Cox算法与期望最大化算法的组合;
[0046]kosmic算法;
[0047]refineR算法;
[0048]Box

Cox算法与参数法的组合;
[0049]非参数法。
[0050]本专利技术还提供一种生物标志物的参考区间计算方法,包括:
[0051]针对每个数据库分别按照个体年龄和/或个体性别信息,将数据库分为多个区;
[0052]利用上述计算方法针对每一分区计算出所述生物标志物的参考区间。
[0053]相应地,本专利技术还提供一种生物标志物的参考区间计算设备,包括:处理器以及与所述处理器连接的存储器;其中,所述存储器存储有可被所述处理器执行的指令,所述指令被所述处理器执行,以使所述处理器执行上述生物标志物的参考区间计算方法。
[0054]根据本专利技术提供的生物标志物的参考区间计算方法及设备,针对需要建立参考区间的生物标志物,通过从多个数据库中提取数据、结合多种可选去重算法和多种可选剔除算法的处理,可以得到多个目标数据集,尽可能地覆盖了各种数据库和算法的组合;然后根据数据集中生物标志物的数值分布状态,确定最符合正态分布的一个数据集,获得良好的数据基础;再使用所有可用的参考区间算法分别基于该数据集计算参考区间,如果所有的参考区间的一致性足够高,则进一步根据置信区间筛选出一个最优的参考区间,如果一致性不够高,则根据预先建立的知识库采用推荐的某种算法得到的参考区间作为最终结果,本方案通过数值分布状态、一致性等客观因素得到可靠的参考区间,避免主观或片面地通过某种方法建立参考区间,降低了获得参考区间的成本并具有较高效率。
附图说明
[0055]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种生物标志物的参考区间计算方法,其特征在于,包括:从多个数据库中分别获得同一生物标志物的检测结果,得到多个检测结果集,其中每个所述检测结果集中分别包括大量个体的所述生物标志物的检测结果;分别利用多种去重算法和多种剔除算法对所述多个检测结果集进行处理,得到所述生物标志物的多个目标数据集,其数量是所述检测结果集的数量、所述去重算法的数量与所述剔除算法的数量的乘积;分别确定所述多个目标数据集的所述生物标志物的数值的数值分布状态,进而确定其中最符合正态分布的一个所述目标数据集;分别利用多种参考区间算法,基于所述目标数据集计算出所述生物标志物的参考区间;计算全部参考区间计算结果的一致性数据,并判断一致性数据是否达到预定条件;如果一致性数据达到预定条件,则根据各个所述参考区间的置信区间确定一个所述参考区间作为最终结果;如果一致性数据未达到预定条件,则根据所述目标数据集的数值分布状态选择一种参考区间算法,将与其相应的参考区间作为最终结果。2.根据权利要求1所述的参考区间计算方法,其特征在于,分别确定所述多个目标数据集的所述生物标志物的数值的正态分布状态,进而确定其中正态分布最佳的一个所述目标数据集,具体包括:分别计算各个目标数据集的峰度系数和偏度系数;分别计算各个目标数据集的正态分布数值,正态分布数值=|偏度系数|+|峰度系数

3|;确定具有最小所述正态分布数值的目标数据集。3.根据权利要求1所述的参考区间计算方法,其特征在于,计算全部参考区间计算结果的一致性数据,并判断一致性数据是否达到预定条件,具体包括:计算全部参考区间的偏倚矩阵,进而计算偏倚矩阵中的偏倚中位数;所述预定条件为所述偏倚中位数达到阈值。4.根据权利要求1所述的参考区间计算方法,其特征在于,根据各个所述参考区间的置信区间确定一个所述参考区间作为最终结果,具体包括:分别计算各个所述参考区间的置信区间的宽度;将置信区间宽度最小的所述参考区间作为最终结果。5.根据权利要求1

4中任一项所述的参考区间计算方法,其特征在于,所述多个数据库包括如下7个:体检个体数据库;门诊...

【专利技术属性】
技术研发人员:邱玲马超超夏良裕侯立安罗薇
申请(专利权)人:中国医学科学院北京协和医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1