用于从多个来源产生保健相关经验证预测模型的方法技术

技术编号：20291538 阅读：23 留言：0更新日期：2019-02-10 22:33

本发明专利技术提供一种用于从多个保健中心产生预测模型的方法。所述方法允许第三方使用来自多个来源的数据集合来建立预测模型。通过将所述数据集合输入模型解构和传送（MDT）平台中，保健中心可将数据提供给第三方，而无需去识别数据或物理上从所述保健中心传送任何识别或经去识别数据。所述MDT平台包含变量库，其允许所述保健中心选择将用以产生和验证所述预测模型的变量。本发明专利技术还提供一种用于基于用以产生预测模型的临床数据的百分比来补偿贡献数据集合的来源的方法。

A Method for Producing Health-related Empirical Prediction Models from Multiple Sources

The invention provides a method for generating prediction models from multiple health centers. The method allows third parties to use data sets from multiple sources to build prediction models. By deconstructing and transferring the data set into the MDT platform, the health care center can provide data to third parties without having to identify data or physically transmit any identified or identified data from the health care center. The MDT platform includes a variable library that allows the health center to select variables that will be used to generate and validate the predictive model. The invention also provides a method for compensating the source of the contribution data set based on the percentage of clinical data used to generate the prediction model.

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于从多个来源产生保健相关经验证预测模型的方法相关申请案的交叉参考本申请案主张2011年9月30申请的第61/541,468号美国临时申请案的优先权，所述临时申请案全文并入本文中。
本专利技术大体上涉及保健预测模型。更具体地说，本专利技术涉及从多个来源产生的保健相关预测模型。
技术介绍
近年来，保健行业已投入了大量精力来通过提供基于证据的个人化决策支持系统且建立处理个别患者和患者群两者的特性的临床协议来改进患者的临床结果。保健行业还已打算通过在推荐治疗方案时使用基于证据的个人化决策支持系统来考虑健康益处和成本效应，来向患者及其付款人(即，其承保人和雇主)提供更大价值。保健行业的上文所提到的努力已通过健康相关信息技术(IT)的实施和采用而得以促进，所述技术引起患者和医师对电子医疗记录的存取，以及电子数据在保健提供者、实验室、药房、保健管理者和保健行政人员之间的交换。保健相关IT平台也已在进行生物发现、遗传和分子数据到临床应用的转化以及用于识别保健相关问题和/或疾病疗效的预测模型的开发中起作用。理论上，保健相关预测模型的实施应对保健质量和递送具有重大影响；然而，实际上，迄今为止EMR产生的预测模型的类型及其效用一直是有限的。通常需要从多个数据来源(例如，保健设施)积累的大数据集合来建立具有临床效用的有意义预测模型。因为此些大数据集合的收集、处理和分析需要花费大量的人力和金钱资源，因此此些预测模型的益处仍是大小和/或资源不太大的实体无法实现的。除物理上积累大量数据所固有的挑战之外，预测模型的实施还面临与数据集合中存在的个人识别符的保护有关的挑战。目前，处理来自多...

【技术保护点】
1.一种产生感兴趣的健康结果的预测模型的方法，其包括以下步骤：(a)为一个以上保健中心提供具有由变量库组成的模型解构与传送平台，其中每一保健中心将与所述感兴趣的健康结果相关的至少一个数据集合输入到所述模型解构与传送平台中，且从所述变量库选择与所述感兴趣的健康结果相关的变量；(b)从所述模型解构与传送平台产生每一保健中心的至少一个第一预测模型，其中所述至少一个第一预测模型是基于所述选定变量并且通过使用计算装置来产生，以及进一步其中所述至少一个第一预测模型提供较广群体中的个人的感兴趣的健康结果的预测，所述较广群体由所述至少一个数据集合表示，所述方法扩展不具有充足数据来形成其自己对感兴趣的健康结果的预测的保健中心的预测范围。

【技术特征摘要】
【国外来华专利技术】2011.09.30 US 61/541,4681.一种产生感兴趣的健康结果的预测模型的方法，其包括以下步骤：(a)为一个以上保健中心提供具有由变量库组成的模型解构与传送平台，其中每一保健中心将与所述感兴趣的健康结果相关的至少一个数据集合输入到所述模型解构与传送平台中，且从所述变量库选择与所述感兴趣的健康结果相关的变量；(b)从所述模型解构与传送平台产生每一保健中心的至少一个第一预测模型，其中所述至少一个第一预测模型是基于所述选定变量并且通过使用计算装置来产生，以及进一步其中所述至少一个第一预测模型提供较广群体中的个人的感兴趣的健康结果的预测，所述较广群体由所述至少一个数据集合表示，所述方法扩展不具有充足数据来形成其自己对感兴趣的健康结果的预测的保健中心的预测范围。2.根据权利要求1所述的方法，其进一步包括以下步骤：(c)从所述至少一个第一预测模型中的每者产生模型组件库，其中所述模型组件库包括因所述至少一个第一预测模型中的每者的解构而产生的组件，其中所述至少一个第一预测模型解构成所述模型组件库是通过服务器进行的，以及(d)从所述模型组件库产生至少一个第二预测模型，其中所述至少一个第二预测模型经设计以预测共同代表每一保健中心的患者群体中的所述感兴趣的健康结果的概率。3.根据权利要求1所述的方法，其中所述感兴趣的健康结果选自由以下各项组成的群组：较差的治疗反应、病症的恶化、病程进展的速度、干预程序之后的成功概率、干预程序之后的失败概率、干预程序之后的并发症概率、因为特定病症而重新回到急救服务、因为特定病症而再入院、合并症的发展以及前述任何项的组合。4.根据权利要求1所述的方法，其中所述变量库包括选自由以下各项组成的群组的变量：患者人口统计、患者保单状态、患者记账数据、患者家族史、患者实验结果、患者成像结果、患者病理学结果、患者免疫病理学结果、患者细胞学结果、患者细胞遗传学结果、患者基因表达、患者代谢功能全套试验、患者代谢功能简档、患者基因组数据、患者对程序的反应、患者药物治疗、患者治疗方案、患者紧急护理参数、患者流动监视；门诊访问的频率、急诊访问的频率、入院频率、再入院频率；生活质量评定；临床特性、临床诊断、临床住院程序、临床门诊程序；监视癌症复发、精神病评定；以及当前程序技术诊断代码。5.根据权利要求2所述的方法，其中所述模型组件库组件选自由以下各项组成的群组：患者人口统计、患者保单状态、患者记账数据、患者家族史、患者实验结果、患者成像结果、患者病理学结果、患者免疫病理学结果、患者细胞学结果、患者细胞遗传学结果、患者基因表达、患者代谢功能全套试验、患者代谢功能简档、患者基因组数据、患者对程序的反应、患者药物治疗、患者治疗方案、患者紧急护理参数、患者流动监视；门诊访问的频率、急诊访问的频率、入院频率、再入院频率；生活质量评定；临床特性、临床诊断、临床住院程序、临床门诊程序；监视癌症复发、精神病评定；以及当前程序技术诊断代码。6.根据权利要求1所述的方法，其中在电子存储媒体中提供所述模型解构与传送平台。7.根据权利要求6所述的方法，其中所述电子存储媒体选自由以下各项组成的群组：外部硬盘驱动器、CDROM、USB存储器装置、电子移动装置、桌上型计算机、服务器、VPN、安全因特网网站以及可通过安全特征从因特网下载的软件产品。8.根据权利要求7所述的方法，其中所述服务器选自所述保健中心处的现场本地服务器以及由所述保健中心控制的场外共站或云服务器。9.根据权利要求1所述的方法，其中使用选自由以下各项组成的群组的统计技术来产生所述至少一个第一预测模型：机器学习、逻辑回归、线性回归、非线性回归以及前述任何项的组合。10.根据权利要求9所述的方法，其中所述机器学习技术选自由以下各项组成的群组：分类树方法、最小绝对收缩和选择算子、贝叶斯网络建模以及前述任何项的组合。11.根据权利要求10所述的方法，其中所述分类树方法为升高树方法。12.根据权利要求1所述的方法，其中通过源自所述至少一个保健中心中的至少一者的验证测试来验证至少一个第一预测模型。13.根据权利要求12所述的方法，其中通过对照控制模型的性能进行比较来测量所述经验证的至少一个第一预测模型的性能。14.根据权利要求2所述的方法，其中对照源自所述至少一个第二预测模型将应用于的保健中心的测试数据集合来验证所述至少一个第二预测模型。15.根据权利要求14所述的方法，其中通过对照控制模型的性能进行比较来测量所述经验证的至少一个第二预测模型的性能。16.根据权利要求13所述的方法，其中通过应用选自由以下各项组成的群组的统计准则来进行所述比较：基于后验对数似然的预测能力、基于事件的后验概率的预测能力、基于所估计预测误差的预测能力、所预测概率的动态范围、重新分类、所预测概率的频率、交叉验证误差、所需的模型组件的数目以及辨别力。17.根据权利要求15所述的方法，其中通过应用选自由以下各项组成的群组的统计准则来进行所述比较：基于后验对数似然的预测能力、基于事件的后验概率的预测能力、基于所估计预测误差的预测能力、所预测概率的动态范围、重新分类、所预测概率的频率、交叉验证误差、所需的模型组件的数目以及辨别力。18.根据权利要求2所述的方法，其中通过使用个别模型组件库组件作为具有差分加权的所述至少一个第二预测模型中的变量来从所述模型组件库产生所述至少一个第二预测模型。19.根据权利要求18所述的方法，其中单个模型组件库组件可在来自所述至少一个第二预测模型的单个预测模型中使用一次以上。20.根据权利要求19所述的方法，其中单个模型组件库组件的每次使用均经受不同统计函数。21.根据权利要求2所述的方法，其进一步包括以下步骤：(e)从所述一个以上保健中心的至少一者获得至少一个第二数据集合，其中所述至少一个第二数据集合包括与来自所述模型组件库中未表示的保健中心的患者群组有关且对用以产生所述模型组件库的数据非冗余并与用以产生所述模型组件库的数据无关的保健数据。22.根据权利要求2所述的方法，其进一步包括以下步骤：(e)从所述一个以上保健中心的至少一者获得至少一个第二数据集合，其中所述至少一个第二数据集合包括与来自所述模型组件库中所表示的保健中心的患者群组有关的保健数据，其中所述至少一个第二数据集合对步骤(a)的所述至少一个数据集合非冗余，且包括所述至少一个第二数据集合的所述保健数据与用以产生所述模型组件库的所述保健数据无关。23.根据权利要求21所述的方法，其中所述至少一个第二数据集合包括训练集合。24.根据权利要求22所述的方法，其中所述至少一个第二数据集合包括训练集合。25.根据权利要求21所述的方法，其中所述至少一个第二数据集合包括测试集合。26.根据权利要求22所述的方法，其中所述至少一个第二数据集合包括测试集合。27.根据权利要求21所述的方法，其中所述至少一个第二数据集合包括测试集合与训练集合的组合。28.根据权利要求22所述的方法，其中所述至少一个第二数据集合包括测试集合与训练集合的组合。29.根据权利要求27所述的方法，其中根据所述保健数据的起源年份按时间顺序将所述至少一个第二数据集合分成训练集合和测试集合。30.根据权利要求28所述的方法，其中根据所述保健数据的起源年份按时间顺序将所述至少一个第二数据集合分成训练集合和测试集合。31.根据权利要求23所述的方法，其中所述至少一个第二预测模型包括基于所述至少一个第二预测模型的所述性能来选择的模型组件库组件，以预测所述训练集合中的所述保健结果的概率。32.根据权利要求24所述的方法，其中所述至少一个第二预测模型包括基于所述至少一个第二预测模型的所述性能来选择的模型组件库组件，以预测所述训练集合中的所述保健结果的概率。33.根据权利要求25所述的方法，其中所述至少一个第二预测模型包括基于所述至少一个第二预测模型的所述性能来选择的模型组件库组件，以预测所述测试集合中的所述保健结果的概率。34.根据权利要求26所述的方法，其中所述至少一个第二预测模型包括基于所述至少一个第二预测模型的所述性能来选择的模型组件库组件，以预测所述测试集合中的所述保健结果的概率。35.根据权利要求2所述的方法，其中根据选自由以下各项组成的群组的模型性能参数来产生、排列和选择所述至少一个第二预测模型中的至少两者：后验对数似然、基于事件的后验概率的预测能力、基于所估计预测误差的预测能力、所预测概率的动态范围、重新分类、所预测概率的频率、交叉验证误差、所需的模型组件的数目以及辨别力。36.一种用于产生感兴趣的健康结果的预测模型的方法，其包括以下步骤：(a)从一个以上保健中心获得与所述感兴趣的健康结果相关的至少一个数据集合，其中所述一个以上保健中心各自提供单个数据集合，所述单个数据集合当合并时包括所述至少一个数据集合；(b)从所述至少一个数据集合选择与所述感兴趣的健康结果相关的变量；(c)基于所述至少一个数据集合变量的差分加权来产生每一保健中心的至少一个第一预测模型，其中使用计算装置来产生所述至少一个第一预测模型；(d)从所述至少一个第一预测模型中的每者产生模型组件库，其中所述模型组件库包括因所述至少一个第一预测模型中的每者的解构而产生的组件，其中所述至少一个第一预测模型解构成所述模型组件库是通过服务器进行的；(e)基于与所述感兴趣的健康结果相关的所述模型组件库组件的差分加权从所述模型组件库产生至少一个第二预测模型，以及(f)基于所述至少一个第二预测模型识别有所述感兴趣的健康结果危险的患者以及产生用于治疗处于危险中的患者的管理计划。37.根据权利要求36所述的方法，其中在步骤(a)中，每一保健中心将所述至少一个数据集合输入到包括变量库的模型解构与传送平台中。38.根据权利要求3...

【专利技术属性】
技术研发人员：梅林·姚，W·H·王，B·崔，
申请(专利权)人：尤尼维公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人