当前位置: 首页 > 专利查询>尤尼维公司专利>正文

用于从多个来源产生保健相关经验证预测模型的方法技术

技术编号:20291538 阅读:23 留言:0更新日期:2019-02-10 22:33
本发明专利技术提供一种用于从多个保健中心产生预测模型的方法。所述方法允许第三方使用来自多个来源的数据集合来建立预测模型。通过将所述数据集合输入模型解构和传送(MDT)平台中,保健中心可将数据提供给第三方,而无需去识别数据或物理上从所述保健中心传送任何识别或经去识别数据。所述MDT平台包含变量库,其允许所述保健中心选择将用以产生和验证所述预测模型的变量。本发明专利技术还提供一种用于基于用以产生预测模型的临床数据的百分比来补偿贡献数据集合的来源的方法。

A Method for Producing Health-related Empirical Prediction Models from Multiple Sources

The invention provides a method for generating prediction models from multiple health centers. The method allows third parties to use data sets from multiple sources to build prediction models. By deconstructing and transferring the data set into the MDT platform, the health care center can provide data to third parties without having to identify data or physically transmit any identified or identified data from the health care center. The MDT platform includes a variable library that allows the health center to select variables that will be used to generate and validate the predictive model. The invention also provides a method for compensating the source of the contribution data set based on the percentage of clinical data used to generate the prediction model.

【技术实现步骤摘要】
【国外来华专利技术】用于从多个来源产生保健相关经验证预测模型的方法相关申请案的交叉参考本申请案主张2011年9月30申请的第61/541,468号美国临时申请案的优先权,所述临时申请案全文并入本文中。
本专利技术大体上涉及保健预测模型。更具体地说,本专利技术涉及从多个来源产生的保健相关预测模型。
技术介绍
近年来,保健行业已投入了大量精力来通过提供基于证据的个人化决策支持系统且建立处理个别患者和患者群两者的特性的临床协议来改进患者的临床结果。保健行业还已打算通过在推荐治疗方案时使用基于证据的个人化决策支持系统来考虑健康益处和成本效应,来向患者及其付款人(即,其承保人和雇主)提供更大价值。保健行业的上文所提到的努力已通过健康相关信息技术(IT)的实施和采用而得以促进,所述技术引起患者和医师对电子医疗记录的存取,以及电子数据在保健提供者、实验室、药房、保健管理者和保健行政人员之间的交换。保健相关IT平台也已在进行生物发现、遗传和分子数据到临床应用的转化以及用于识别保健相关问题和/或疾病疗效的预测模型的开发中起作用。理论上,保健相关预测模型的实施应对保健质量和递送具有重大影响;然而,实际上,迄今为止EMR产生的预测模型的类型及其效用一直是有限的。通常需要从多个数据来源(例如,保健设施)积累的大数据集合来建立具有临床效用的有意义预测模型。因为此些大数据集合的收集、处理和分析需要花费大量的人力和金钱资源,因此此些预测模型的益处仍是大小和/或资源不太大的实体无法实现的。除物理上积累大量数据所固有的挑战之外,预测模型的实施还面临与数据集合中存在的个人识别符的保护有关的挑战。目前,处理来自多个保健设施的保健信息以建立预测模型需要越过每一保健设施的物理和网络边界传送健康数据。数据中个人识别符的存在对保健设施以及数据处理或分析中所涉及的任何第三方实体造成较大的管理、后勤和合约障碍。个人识别符的存在还引起赔偿责任问题,且增加了所述设施防范赔偿责任的成本。尽管可去除个人识别符,但还存在因产生去识别的数据集合同时保留所述数据的完整性而招致的相当大的后勤、技术和金融成本。因为此些过程耗时且成本高,所以它们抑制了保健预测模型的发展。
技术实现思路
本专利技术通过提供用以基于从多个来源获得的保健数据来产生和验证保健预测模型而无需去识别或传送临床数据超过保健设施的物理和网络边界的方法来对此项技术中已知的方法进行改进。本专利技术的经验证预测模型是基于能够应用于不同患者群体的多个变量。在本专利技术的一个实施例中,提供一种用于产生感兴趣的健康结果的预测模型的方法,其包括以下步骤:(a)向一个以上保健中心提供具有由变量库(variablelibrary)(VL)组成的模型解构传送(ModelDeconstructionTransfer)(MDT)平台,其中每一保健中心将与所述感兴趣的健康结果相关的至少一个数据集合输入到所述MDT平台中,且从所述VL选择与所述感兴趣的健康结果相关的变量;以及(b)从所述MDT平台产生每一保健中心的至少一个预测模型(predictionmodel)(PM0),其中每一PM0是基于所述选定变量。在另一实施例中,所述方法进一步包括以下步骤:(c)从每一PM0产生模型组件库(ModelComponentLibrary)(MCL),其中所述MCL包括因每一PM0的解构而产生的组件,以及(d)从所述MCL产生至少一个第二预测模型(PM1),其中所述至少一个PM1经设计以预测共同代表每一保健中心的患者群体中的所述感兴趣的健康结果的概率。通过使用个别MCL组件作为具有差分加权的所述至少一个PM1中的变量来从所述MCL产生所述至少一个PM1。单个MCL组件可在单个PM1中使用一次以上。另外,单个MCL组件的每次使用均可经受不同统计函数。在本专利技术的另一实施例中,提供一种用于产生感兴趣的健康结果的预测模型的方法,其包括以下步骤:(a)从一个以上保健中心获得与所述感兴趣的健康结果相关的至少一个数据集合;(b)从所述至少一个数据集合选择与所述感兴趣的健康结果相关的变量;(c)基于所述至少一个数据集合变量的差分加权来产生每一保健中心的至少一个第一预测模型(PM0),其中使用计算装置来产生所述至少一个PM0;(d)从每一PM0产生模型组件库(MCL),其中所述MCL包括因每一PM0的解构而产生的组件;以及(e)基于与所述感兴趣的健康结果相关的所述MCL组件的差分加权从所述MCL产生至少一个第二预测模型(PM1)。在一个实施例中,所述一个以上保健中心可将所述至少一个数据集合输入到包括变量库(VL)的模型解构传送(MDT)平台中。在另一实施例中,前述方法进一步包括以下步骤:从所述一个以上保健中心的至少一者获得至少一个第二数据集合,其中所述至少一个第二数据集合包括与来自所述MCL中未表示的保健中心的患者群组有关且对用以产生所述MCL的数据非冗余并与用以产生所述MCL的数据无关的保健数据。在另一实施例中,前述方法进一步包括以下步骤:从所述一个以上保健中心的至少一者获得至少一个第二数据集合,其中所述至少一个第二数据集合包括与来自MCL中所表示的保健中心的患者群组有关的保健数据,其中所述至少一个第二数据集合对步骤(a)的所述至少一个数据集合非冗余,且包括所述至少一个第二数据集合的所述保健数据与用以产生所述MCL的所述保健数据无关。在进一步实施例中,所述至少一个第二数据集合包括训练集合(trainingset)、测试集合(testset)或测试集合与训练集合的组合。在一个实施例中,可根据所述保健数据的起源年份按时间顺序将所述至少一个第二数据集合分成训练集合和测试集合。在另一实施例中,所述至少一个PM1包括基于所述至少一个PM1的所述性能来选择的MCL组件,以预测所述训练集合或所述测试集合中的所述保健结果的概率。在进一步实施例中,通过使用个别MCL组件作为具有差分加权的所述至少一个PM1中的变量来从所述MCL产生所述至少一个PM1。单个MCL组件可在单个PM1中使用一次以上。另外,单个MCL组件的每次使用均经受不同统计函数。在另一实施例中,所述VL包括选自由以下各项组成的群组的变量:患者人口统计、患者保单状态(patientinsurancepolicystatus)、患者记账数据(patientbillingdata)、患者家族史、患者实验结果、患者成像结果、患者病理学结果(组织活检)、患者免疫病理学结果、患者细胞学结果、患者细胞遗传学结果、患者基因表达、患者代谢功能全套试验(patientmetabolicpanels)、患者代谢功能简档(patientmetabolicprofiles)、患者基因组数据、患者对程序的反应、患者药物治疗、患者治疗方案、患者紧急护理参数、患者流动监视;门诊访问的频率、急诊访问的频率、入院频率、再入院频率;生活质量评定;临床特性(临床标志和症状)、临床诊断、临床住院程序、临床门诊程序;监视癌症复发、精神病评定;以及CPT(当前程序技术)诊断代码。在另一实施例中,所述MCL组件是选自由以下各项组成的群组:患者人口统计、患者保单状态、患者记账数据、患者家族史、患者实验结果、患者成像结果、患者病理学结果(组织活检)、患者免疫病理学结果、患者细胞学结果、患者细本文档来自技高网
...

【技术保护点】
1.一种产生感兴趣的健康结果的预测模型的方法,其包括以下步骤:(a)为一个以上保健中心提供具有由变量库组成的模型解构与传送平台,其中每一保健中心将与所述感兴趣的健康结果相关的至少一个数据集合输入到所述模型解构与传送平台 中,且从所述变量库选择与所述感兴趣的健康结果相关的变量;(b)从所述模型解构与传送平台产生每一保健中心的至少一个第一预测模型,其中所述至少一个第一预测模型是基于所述选定变量并且通过使用计算装置来产生,以及进一步其中所述至少一个第一预测模型提供较广群体中的个人的感兴趣的健康结果的预测,所述较广群体由所述至少一个数据集合表示,所述方法扩展不具有充足数据来形成其自己对感兴趣的健康结果的预测的保健中心的预测范围。

【技术特征摘要】
【国外来华专利技术】2011.09.30 US 61/541,4681.一种产生感兴趣的健康结果的预测模型的方法,其包括以下步骤:(a)为一个以上保健中心提供具有由变量库组成的模型解构与传送平台,其中每一保健中心将与所述感兴趣的健康结果相关的至少一个数据集合输入到所述模型解构与传送平台中,且从所述变量库选择与所述感兴趣的健康结果相关的变量;(b)从所述模型解构与传送平台产生每一保健中心的至少一个第一预测模型,其中所述至少一个第一预测模型是基于所述选定变量并且通过使用计算装置来产生,以及进一步其中所述至少一个第一预测模型提供较广群体中的个人的感兴趣的健康结果的预测,所述较广群体由所述至少一个数据集合表示,所述方法扩展不具有充足数据来形成其自己对感兴趣的健康结果的预测的保健中心的预测范围。2.根据权利要求1所述的方法,其进一步包括以下步骤:(c)从所述至少一个第一预测模型中的每者产生模型组件库,其中所述模型组件库包括因所述至少一个第一预测模型中的每者的解构而产生的组件,其中所述至少一个第一预测模型解构成所述模型组件库是通过服务器进行的,以及(d)从所述模型组件库产生至少一个第二预测模型,其中所述至少一个第二预测模型经设计以预测共同代表每一保健中心的患者群体中的所述感兴趣的健康结果的概率。3.根据权利要求1所述的方法,其中所述感兴趣的健康结果选自由以下各项组成的群组:较差的治疗反应、病症的恶化、病程进展的速度、干预程序之后的成功概率、干预程序之后的失败概率、干预程序之后的并发症概率、因为特定病症而重新回到急救服务、因为特定病症而再入院、合并症的发展以及前述任何项的组合。4.根据权利要求1所述的方法,其中所述变量库包括选自由以下各项组成的群组的变量:患者人口统计、患者保单状态、患者记账数据、患者家族史、患者实验结果、患者成像结果、患者病理学结果、患者免疫病理学结果、患者细胞学结果、患者细胞遗传学结果、患者基因表达、患者代谢功能全套试验、患者代谢功能简档、患者基因组数据、患者对程序的反应、患者药物治疗、患者治疗方案、患者紧急护理参数、患者流动监视;门诊访问的频率、急诊访问的频率、入院频率、再入院频率;生活质量评定;临床特性、临床诊断、临床住院程序、临床门诊程序;监视癌症复发、精神病评定;以及当前程序技术诊断代码。5.根据权利要求2所述的方法,其中所述模型组件库组件选自由以下各项组成的群组:患者人口统计、患者保单状态、患者记账数据、患者家族史、患者实验结果、患者成像结果、患者病理学结果、患者免疫病理学结果、患者细胞学结果、患者细胞遗传学结果、患者基因表达、患者代谢功能全套试验、患者代谢功能简档、患者基因组数据、患者对程序的反应、患者药物治疗、患者治疗方案、患者紧急护理参数、患者流动监视;门诊访问的频率、急诊访问的频率、入院频率、再入院频率;生活质量评定;临床特性、临床诊断、临床住院程序、临床门诊程序;监视癌症复发、精神病评定;以及当前程序技术诊断代码。6.根据权利要求1所述的方法,其中在电子存储媒体中提供所述模型解构与传送平台。7.根据权利要求6所述的方法,其中所述电子存储媒体选自由以下各项组成的群组:外部硬盘驱动器、CDROM、USB存储器装置、电子移动装置、桌上型计算机、服务器、VPN、安全因特网网站以及可通过安全特征从因特网下载的软件产品。8.根据权利要求7所述的方法,其中所述服务器选自所述保健中心处的现场本地服务器以及由所述保健中心控制的场外共站或云服务器。9.根据权利要求1所述的方法,其中使用选自由以下各项组成的群组的统计技术来产生所述至少一个第一预测模型:机器学习、逻辑回归、线性回归、非线性回归以及前述任何项的组合。10.根据权利要求9所述的方法,其中所述机器学习技术选自由以下各项组成的群组:分类树方法、最小绝对收缩和选择算子、贝叶斯网络建模以及前述任何项的组合。11.根据权利要求10所述的方法,其中所述分类树方法为升高树方法。12.根据权利要求1所述的方法,其中通过源自所述至少一个保健中心中的至少一者的验证测试来验证至少一个第一预测模型。13.根据权利要求12所述的方法,其中通过对照控制模型的性能进行比较来测量所述经验证的至少一个第一预测模型的性能。14.根据权利要求2所述的方法,其中对照源自所述至少一个第二预测模型将应用于的保健中心的测试数据集合来验证所述至少一个第二预测模型。15.根据权利要求14所述的方法,其中通过对照控制模型的性能进行比较来测量所述经验证的至少一个第二预测模型的性能。16.根据权利要求13所述的方法,其中通过应用选自由以下各项组成的群组的统计准则来进行所述比较:基于后验对数似然的预测能力、基于事件的后验概率的预测能力、基于所估计预测误差的预测能力、所预测概率的动态范围、重新分类、所预测概率的频率、交叉验证误差、所需的模型组件的数目以及辨别力。17.根据权利要求15所述的方法,其中通过应用选自由以下各项组成的群组的统计准则来进行所述比较:基于后验对数似然的预测能力、基于事件的后验概率的预测能力、基于所估计预测误差的预测能力、所预测概率的动态范围、重新分类、所预测概率的频率、交叉验证误差、所需的模型组件的数目以及辨别力。18.根据权利要求2所述的方法,其中通过使用个别模型组件库组件作为具有差分加权的所述至少一个第二预测模型中的变量来从所述模型组件库产生所述至少一个第二预测模型。19.根据权利要求18所述的方法,其中单个模型组件库组件可在来自所述至少一个第二预测模型的单个预测模型中使用一次以上。20.根据权利要求19所述的方法,其中单个模型组件库组件的每次使用均经受不同统计函数。21.根据权利要求2所述的方法,其进一步包括以下步骤:(e)从所述一个以上保健中心的至少一者获得至少一个第二数据集合,其中所述至少一个第二数据集合包括与来自所述模型组件库中未表示的保健中心的患者群组有关且对用以产生所述模型组件库的数据非冗余并与用以产生所述模型组件库的数据无关的保健数据。22.根据权利要求2所述的方法,其进一步包括以下步骤:(e)从所述一个以上保健中心的至少一者获得至少一个第二数据集合,其中所述至少一个第二数据集合包括与来自所述模型组件库中所表示的保健中心的患者群组有关的保健数据,其中所述至少一个第二数据集合对步骤(a)的所述至少一个数据集合非冗余,且包括所述至少一个第二数据集合的所述保健数据与用以产生所述模型组件库的所述保健数据无关。23.根据权利要求21所述的方法,其中所述至少一个第二数据集合包括训练集合。24.根据权利要求22所述的方法,其中所述至少一个第二数据集合包括训练集合。25.根据权利要求21所述的方法,其中所述至少一个第二数据集合包括测试集合。26.根据权利要求22所述的方法,其中所述至少一个第二数据集合包括测试集合。27.根据权利要求21所述的方法,其中所述至少一个第二数据集合包括测试集合与训练集合的组合。28.根据权利要求22所述的方法,其中所述至少一个第二数据集合包括测试集合与训练集合的组合。29.根据权利要求27所述的方法,其中根据所述保健数据的起源年份按时间顺序将所述至少一个第二数据集合分成训练集合和测试集合。30.根据权利要求28所述的方法,其中根据所述保健数据的起源年份按时间顺序将所述至少一个第二数据集合分成训练集合和测试集合。31.根据权利要求23所述的方法,其中所述至少一个第二预测模型包括基于所述至少一个第二预测模型的所述性能来选择的模型组件库组件,以预测所述训练集合中的所述保健结果的概率。32.根据权利要求24所述的方法,其中所述至少一个第二预测模型包括基于所述至少一个第二预测模型的所述性能来选择的模型组件库组件,以预测所述训练集合中的所述保健结果的概率。33.根据权利要求25所述的方法,其中所述至少一个第二预测模型包括基于所述至少一个第二预测模型的所述性能来选择的模型组件库组件,以预测所述测试集合中的所述保健结果的概率。34.根据权利要求26所述的方法,其中所述至少一个第二预测模型包括基于所述至少一个第二预测模型的所述性能来选择的模型组件库组件,以预测所述测试集合中的所述保健结果的概率。35.根据权利要求2所述的方法,其中根据选自由以下各项组成的群组的模型性能参数来产生、排列和选择所述至少一个第二预测模型中的至少两者:后验对数似然、基于事件的后验概率的预测能力、基于所估计预测误差的预测能力、所预测概率的动态范围、重新分类、所预测概率的频率、交叉验证误差、所需的模型组件的数目以及辨别力。36.一种用于产生感兴趣的健康结果的预测模型的方法,其包括以下步骤:(a)从一个以上保健中心获得与所述感兴趣的健康结果相关的至少一个数据集合,其中所述一个以上保健中心各自提供单个数据集合,所述单个数据集合当合并时包括所述至少一个数据集合;(b)从所述至少一个数据集合选择与所述感兴趣的健康结果相关的变量;(c)基于所述至少一个数据集合变量的差分加权来产生每一保健中心的至少一个第一预测模型,其中使用计算装置来产生所述至少一个第一预测模型;(d)从所述至少一个第一预测模型中的每者产生模型组件库,其中所述模型组件库包括因所述至少一个第一预测模型中的每者的解构而产生的组件,其中所述至少一个第一预测模型解构成所述模型组件库是通过服务器进行的;(e)基于与所述感兴趣的健康结果相关的所述模型组件库组件的差分加权从所述模型组件库产生至少一个第二预测模型,以及(f)基于所述至少一个第二预测模型识别有所述感兴趣的健康结果危险的患者以及产生用于治疗处于危险中的患者的管理计划。37.根据权利要求36所述的方法,其中在步骤(a)中,每一保健中心将所述至少一个数据集合输入到包括变量库的模型解构与传送平台中。38.根据权利要求3...

【专利技术属性】
技术研发人员:梅林·姚W·H·王B·崔
申请(专利权)人:尤尼维公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1