本发明专利技术公开了一种用于预测个体未来健康状况的基于计算机的系统,该系统包括:(a)一个含有处理器的计算机,包含有从被试总体的个体成员中得到的纵向采集的生物标识值数据库,所述成员的亚总体D确定为在特定时间段或年龄间隔内获得特定生物状况,亚总体D确定为在特定时间段或年龄间隔内未获得特定生物状况;以及(b)一个计算机程序,包括如下步骤:(1)从所述生物标识中选择生物标识子集,以便判别属于亚总体D和D的成员,其中生物标识子集的选择基于被试总体个体成员的生物标识值的分布;以及(2)采用所选生物标识的分布来进展统计过程,这样可用于:(i)将被测总体的成员分类成或者属于在特定时间段或年龄间隔内获得特定生物状况具有指示性高概率的亚总体PD;或者属于在特定时间段或年龄间隔内获得特定生物状况具有指示性低概率的亚总体PD;或(ii)对每个被试总体成员进行定量判断,推算在特定时间段或年龄间隔内获得特定生物状况的概率。(*该技术在2018年保护过期,可自由使用*)
【技术实现步骤摘要】
本专利技术涉及用于预测一个体的未来健康的基于计算机的系统和方法。具体地说,本专利技术通过从大量被试总体中获得纵向数据,从而得到大量生物标识,以统计方法来选择预测生物标识,并根据所选择的生物标识确定和评定适当的多元计算函数,从而来预测一个体的未来健康状况。可以想象,如果可以足够准确、长远地预测一个体的未来健康出现问题,则与等待疾病实际发作然后处理该症状相比,可以增加防止个体未来健康出现问题的机会。目前,医学研究基金中的绝大多数用于提高诊断和治疗疾病的方法,而不是用于发现可在任何典型可见的疾病症状出现之前减少疾病危险性的预防性测定方法。尽管对疾病治疗的重视可大大地推动医疗科技的进步,从而使对所存在的疾病的诊断以及在诊断之后对疾病的治疗技术和方法得以大大提高,诊断和治疗方式增多,但这种进步仍会导致治疗的费用日益增加。这些费用对个人和整个社会来说其结果是惊人的财政花费。这一惊人的费用导致公众压力增加,从而需更好的途径来减少医疗费用。这样,除了个体由于被预先告知将来某种疾病发作的可能性高,从而可采取预防措施而受益之外,还可能使整个社会和/或国家的整个医疗费用大大地降低。迄今为止,想要预测一个体的未来健康状况本身存在两个问题(1)这些预测是不严密的,因为它们依据的数据库是从相对较少,即由几百或几千个被试者组成的研究样本中得到的,以及(2)这些预测需从样本平均值(和其它参数)中推断出个体情况。这种推断在可靠地评估特定个体的危险性时存在很大问题,甚至在特定个体属于某一特定疾病的高危人群时也同样。这是一个事实,其部分是由于一般采用的统计程序均设计成参照总体平均值,而不是对总体中的个体进行判断。为了获得定量预测,“个体未来健康”应表示为在特定时间框架内发生的特定事件。两个例子为(a)持续五年时间内心肌梗塞的发生,(b)下一年个体的死亡。对这些事件的预测实际上必然是概率性的。在本文的上下文中,两种类型的概率是重要的。事件的先验概率是在事件发生或未发生这一事实之前的事件概率。事件的后验概率是事件出现之后,即事件发生或未发生之后的事件概率。显然,如果事件发生,则事件的后验概率为1;如果事件未发生,则后验概率为0。先验概率和后验概率之间的区别是值得注意的。事件在后来的年月或其它时间间隔内发生的先验概率可能是重要的信息。对事件概率的了解可改变行为,换句话说,人采取的行动(行为)可依赖于事件的先验概率。这一原理可通过考虑两个极端的情况得到自身验证。几乎可以确信,人们在以下两种情况下可呈现不同的行为(采取不同的行动)被告知来年的死亡概率是(a)0.9999,或(b)0.0001。事件的先验概率取决于在判断概率的该时间段可以使用的信息。为了说明这一点,来看看下面的假想“游戏”。从所有美国居民中随机选出一个健在的人,然后跟踪他一年的时间。在年终调查该人的生存状态(活着或死亡)。“事件”为“该人在这一年内死亡”。年终时事件或者发生(人死亡),或者未发生(人活着),其后验概率分别为1和0。在选择跟踪的人前,可利用美国死亡率统计来估计该人在这一年将死亡的先验概率。这一概率可通过p=d/N来计算,其中N为在危险组中的总人数(这里为在年初时活着的美国人群中的总人数),d为在危险组中死亡的总人数。例如,1993年的数据为(近似)d=2,268,000,N=257,932,000,则事件的先验概率约为p=0.0088。在该游戏中,事件的先验概率基于很小的信息量,简单地说,跟踪的人可能是危险组中的一员,该信息包括来自活着的所有人和在选择期间的美国居民的信息。上述危险组(从中随机选择被试者)的其它信息包含被试者的其它信息和事件先验概率的变更。例如,继续基于1993年数据的“游戏”·如果危险组为美国男性组,即如果在选择前已知被试者为男性,则事件先验概率约为p=0.0093,它高于性别不详或不确定的情况约为6%。·如果危险组为年龄在75~84岁的美国男性组,即如果在选择前已知被试者为年龄在75-84之间的男性,则事件先验概率约为p=0.0772,或约为年龄不详或不确定的男性的情况的8.3倍。这些例子表明,一般的原理是事件的先验概率取决于评估概率期间的可用信息。先验概率最精确的判断一般是根据所有可用信息得到的判断。先验概率的十分精确计算可能并不能保证得到特定的结果这就是说,特定人体的先验概率可能不十分接近后验概率。考虑上述的极端情况,即一特定个体在来年死亡的先验概率为0.0001。尽管他生存的可能性很高,但不能担保对该“游戏”中的所有个体来说,每10,000人中有约9,999人在该年将活着,后验概率为0(该值接近于为0.0001的先验概率),而每10,000人中有约1人将死亡,后验概率为1,该值与先验概率完全不同。为了进一步说明该原理,下面来看一个投掷硬币的事件,该事件中“头像面”出现的先验概率精确地为0.5。“头像面”的后验概率或者为0,或者为1,但不可能十分接近于0.5。因此,一个体的先验概率不应认为近似于该个体的后验概率。但是,如果由非常多的个体来“玩游戏”,则后验概率的平均值(也是事件发生的个体百分比)将十分接近先验概率。在一些情况下,个人可通过在具有不同先验概率的组间“移动”而改变先验概率。例如,流行病学家已指出,若一个中年男性美国居民,总胆固醇水平很高,包括具有较高的低密度脂蛋白,与胆固醇水平低得多的对照个体相比,他在未来五年中死于心肌梗塞的先验概率较高。临床试验表明,如果高胆固醇的人可在总体上降低他的胆固醇水平,即“移动”到胆固醇低得多的“组”中,则他大大降低了其在未来五年中死于心肌梗塞的先验概率。在后面的段落和章节中,将采用“危险率”一词来代替词组“一特定事件在特定时间框架内的先验概率”。这对应于在统计学中将“危险率”定义为预期损失,其中如果事件发生,则损失函数的值为1,如果事件不发生,则值为0。前述内容说明的原理是,不同的信息量导致不同的先验概率。一个已知很多情况(即具有许多已知特性的一些小亚总体)的人的危险率可能与已知很少特性的大亚总体的危险率十分不同。但是仍有另一个问题使人怀疑对总体的传统科学探索研究,从而确定个体疾病危险率的能力。这个问题的产生归因于对疾病发生的一般过于简单的了解,特别是对不断变性的疾病,如癌症、心血管疾病、糖尿病等的了解。这就是说,出于种种原因,一种倾向是相信这些疾病或者可以通过开一个单一的药剂组分处方来得到控制,或者通过单一的组成部分得到临床指征。例如,人们被建议适当减少对脂肪的摄入可控制乳腺癌;增加特定饮食中的纤维成分可控制结肠癌;对血液中胆固醇含量的测定可得到心脏病的临床指征;而胃癌的临床指征是血液中维生素C水平很低。这些过于简单的观点往往被证实不能恰当地确定疾病的发生,特别是对一个个体而言。需要考虑的疑惑很多,以至于无法指出从总体数据推断出总体中个体情况的最大困难是什么。仅对成千上万数量中单一一个组成部分,而不是对可能发生的百万种组成部分进行试验和调查,将伴随大量不确定成分,特别是当企图从这些数据中推断出个体疾病危险率时。现在存在双重困难(a)将针对实验个体的总体得出的数据推断到随机选出的个体上,以及(b)依据单一的指征或病因事件来严格地折衷推算出随机选出的个体的未来疾病危险。如果能够更可靠地确定本文档来自技高网...
【技术保护点】
一种用于预测个体未来健康的基于计算机的系统,包括:(a)一个含有处理器的计算机,该处理器包含有从被试总体的个体成员中纵向得到的生物标识值数据库,所述成员的子总体D确定为在特定时间段或年龄间隔内已获得特定生物状况,子总体*确定为在特定时间 段或年龄间隔内未获得特定生物状况;以及(b)一个计算机程序,包括的步骤用于:(1)从所述生物标识中选择生物标识子集,以便判别属于子总体D和*的成员,其中生物标识子集的选择基于被试总体个体成员的生物标识值的分布;以及(2)采用所选 生物标识的分布来进展统计过程,这样可用于:(i)将被测总体的成员分级成或者属于在特定时间段或年龄间隔内获得特定生物状况具有指示性高概率的子总体PD,或者属于在特定时间段或年龄间隔内获得特定生物状况具有指示性低概率的子总体*;或(ii )对每个被试总体成员进行定量判断,推算在特定时间段或年龄间隔内获得特定生物状况的概率。
【技术特征摘要】
...
【专利技术属性】
技术研发人员:TC坎贝尔,RW赫尔姆斯,L托马斯科,
申请(专利权)人:拜奥马尔国际公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。