临床终点裁定系统和方法技术方案

技术编号:38817758 阅读:15 留言:0更新日期:2023-09-15 19:56
本披露涉及一种用于执行临床终点裁定的系统和方法,以提供以下各者:高效、自动化的临床事件分类和医疗审查归类;减少识别临床事件的时间;用于对临床事件进行分类的统一、一致的过程;以及近乎实时地主动识别事件。以及近乎实时地主动识别事件。以及近乎实时地主动识别事件。

【技术实现步骤摘要】
【国外来华专利技术】临床终点裁定系统和方法
专利

[0001]本披露涉及一种用于执行临床终点裁定的系统和方法。

技术介绍

[0002]结果试验是对心血管、肾脏和代谢(CVRM)项目的监管要求,以证明其安全性和功效/益处。结果试验需要大的样本量(几千名患者)并且运行成本高昂。临床终点事件裁定是这样的一个过程,即,独立的、不知情的专家委员会审查在试验期间发生的临床事件。对照一组预定义的标准对这些临床事件进行评估(裁定)以对事件进行分类。这是因为原本当地调查员或医生可能对患者发生的事件类型有自己的看法,从而可能导致高度的可变性。通过使用不知情的专家委员会,可以减少这种可变性。终点裁定可以用于评估功效结果以及安全性结果两者,并且已在整个行业并由所有主要制药公司使用了25

30年。终点裁定提供了对事件的独立审查,从而避免因地区差异和个别调查员造成偏见。
[0003]然而,事件裁定代表平均CVRM结果试验成本的5%。事件裁定是人工且迭代的过程。事件裁定需要高度熟练的临床医生,这些临床医生忙于易于评估的事件。事件裁定跨越多个系统生成裁定数据的重复。因此,这对发起人来说既费时又费钱,并且会延迟药物开发的生命周期。
[0004]临床终点事件裁定是昂贵且资源密集型的(每个大型CVRM结果研究粗略地需要850万美元)。这可能导致延迟大约4

5个月,延迟包括事件捕获和人工裁定过程。它依赖于二级或三级报告,并且主要是人工且迭代的过程。捕获所有事件至关重要,因为缺失的事件会影响试验的结果。当执行大型、多中心和多国家研究时,这个问题被放大。

技术实现思路

[0005]本专利技术的各方面如独立权利要求中陈述的那样,并且在从属权利要求中陈述了可选的特征。本专利技术的各方面可以彼此结合提供,并且一个方面的特征可以应用于其他方面。
[0006]在本披露的第一方面,提供了一种用于执行临床试验终点裁定的计算机实施的方法。该方法包括:在计算机系统或装置处,从多个医疗保健相关的数据源接收数据。可选地,该方法包括:分析每个数据源以确定由该数据源保存的数据是否包括结构化和/或非结构化数据。在数据包括非结构化数据的情况下,该方法包括:将自然语言处理模型应用于非结构化数据以获得涉及非结构化数据中的特征的嵌入。在数据包括结构化数据的情况下,该方法包括:从该数据中提取特征。该方法进一步包括:将机器学习分类模型应用于来自非结构化数据的嵌入和从结构化数据中提取的特征以基于嵌入和从结构化数据中提取的特征对是否已发生医疗保健事件进行分类。
[0007]可选地,该方法进一步包括:将概率分数作为属性归因于分类,其中,概率分数提供事件已发生的可能性的指示;以及向用户提供通知以审查其中概率分数小于选定阈值的分类。
[0008]应用自然语言处理模型可以包括:应用多个自然语言处理模型,例如包括针对可
从数据源获得的文本进行训练的第一专用模型以及针对例如进行训练的第二通用模型。
[0009]在数据包括非结构化数据的情况下,该方法可以包括:将命名实体辨识模型应用于非结构化数据以从非结构化数据获得正式事件特性;以及将机器学习分类模型应用于经由命名实体辨识模型获得的正式事件特性。
[0010]该方法可以进一步包括:基于(i)数据源和(ii)基于应用于非结构化数据的光学字符辨识过程的确定的置信度中的至少一者将置信度分数作为属性归因于数据;以及由机器学习分类模型将置信度分数用作权重。例如,与从未知或不可靠源获取的数据相比,从已知或可信源获取的数据可以被给予更高的权重。在一些示例中,可以仅使用具有高于选定阈值的权重的数据—例如,使得不使用可能使该方法扭曲的错误或不可靠的数据。因此,该方法可以包括:排除具有低于选定阈值的置信度分数的数据。
[0011]在一些示例中,从数据中提取特征并将自然语言处理模型应用于非结构化数据以获得涉及非结构化数据中的特征的嵌入包括:获得预定义的特征集以用于临床终点裁定中并将被提取特征和/或嵌入映射到预定义的特征集;以及放弃不涉及预定义的特征集的特征和/或嵌入。
[0012]机器学习分类模型可以提供参与对是否已发生医疗保健事件进行分类的特征的重要性排名。这可以有助于监管目的和/或诊断目的,以示出模型如何执行以及正在对什么特征做出决策。提供特征的重要性排名可以包括:确定每个特征的SHAP值。附加地,或替代性地,提供特征的重要性排名可以包括:将局部代理模型应用于机器学习分类模型以确定每个特征对分类的相对贡献。
[0013]当可用的数据量超过选定阈值时,可以执行该方法。以这种方式,仅当足够的数据可用于执行终点裁定决策时才可以执行分类。附加地,或替代性地,可以响应于由用户提供的事件已发生的指示来执行该方法。
[0014]在另一个方面,提供了一种训练机器学习分类模型以用于执行临床试验终点裁定的方法。该方法包括:从多个医疗保健相关的数据源接收数据,该数据包括来自先前临床试验的裁定档案和涉及那些裁定档案的裁定决策;以及分析每个数据源以确定由该数据源保存的数据是否包括结构化和/或非结构化数据。在数据包括非结构化数据的情况下,将自然语言处理模型应用于非结构化数据以获得涉及非结构化数据中的特征的嵌入。在数据包括结构化数据的情况下,从该数据中提取特征。该方法进一步包括:基于来自裁定档案的数据来提供裁定决策的指示;基于裁定决策和来自裁定档案的数据来更新机器学习分类模型;以及将更新后的机器学习分类模型存储在关系数据库中。
[0015]在另一个方面,提供了一种监测临床试验终点裁定的方法。该方法包括:从临床试验终点裁定系统接收裁定决策的多个通知,其中,裁定决策包括概率分数,该概率分数提供事件已发生的可能性的指示;基于事件的(i)概率分数和(ii)严重度中的至少一者对通知进行排名;获得用于执行裁定的数据档案;以及向用户提供裁定决策清单和对应的数据档案以审查裁定决策的正确性,其中,该清单的次序是基于排名。此类方法可以有助于确保临床试验终点裁定过程保持高效并有助于确保当需要输入时(例如,来自医疗保健专业人员)得以及时获得该输入。
[0016]该方法可以进一步包括:获得参与对是否已发生医疗保健事件进行分类的特征的
重要性排名;以及向用户提供这些特征的重要性排名以及裁定决策清单和对应的数据档案。它们可以有助于识别所需的任何输入是否逾期和/或例如是否迫切需要来自医疗保健专业人员的输入。
[0017]在另一个方面,提供了一种协调和整理来自多个医疗保健相关的源的数据以便进行临床试验终点裁定的计算机实施的方法。该方法包括:分析每个数据源以确定由该数据源保存的数据是否包括结构化和/或非结构化数据。在数据包括非结构化数据的情况下,该方法包括:对数据的还没有呈机器可读格式的一个或多个区域执行光学字符辨识。该方法进一步包括:基于(i)数据源和(ii)基于光学字符辨识过程的确定的置信度中的至少一者将置信度分数作为属性归因于数据;对数据执行特征分析以从数据中提取特征;将被提取特征映射到预定义的特征集;以及以json格式发布映射本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于执行临床试验终点裁定的计算机实施的方法,该方法包括:在计算系统处,从多个医疗保健相关的数据源接收数据;在该数据包括非结构化数据的情况下,将自然语言处理模型应用于该非结构化数据以获得涉及该非结构化数据中的特征的嵌入;在该数据包括结构化数据的情况下,从该数据中提取特征;将机器学习分类模型应用于来自该非结构化数据的这些嵌入和从该结构化数据中提取的这些特征以基于这些嵌入和从该结构化数据中提取的这些特征对是否已发生医疗保健事件进行分类;将概率分数作为属性归因于该分类,其中,该概率分数提供该事件已发生的可能性的指示;向用户提供通知以审查其中该概率分数小于选定阈值的分类。2.如权利要求1所述的计算机实施的方法,其中,应用自然语言处理模型包括:应用多个自然语言处理模型,包括针对可从这些数据源获得的文本进行训练的第一专用模型以及第二通用模型。3.如权利要求1或2所述的计算机实施的方法,进一步包括:在该数据包括非结构化数据的情况下,将命名实体辨识模型应用于该非结构化数据以从该非结构化数据获得正式事件特性;以及将该机器学习分类模型应用于经由该命名实体辨识模型获得的正式事件特性。4.如前述权利要求中任一项所述的计算机实施的方法,基于(i)该数据源和(ii)基于应用于该非结构化数据的光学字符辨识过程的确定的置信度中的至少一者将置信度分数作为属性归因于该数据;以及由该机器学习分类模型将该置信度分数用作权重。5.如权利要求4所述的计算机实施的方法,进一步包括:排除具有低于选定阈值的置信度分数的数据。6.如前述权利要求中任一项所述的计算机实施的方法,其中,从该数据中提取特征并将自然语言处理模型应用于该非结构化数据以获得涉及该非结构化数据中的特征的嵌入包括:获得预定义的特征集以用于该临床终点裁定中并将这些被提取特征和/或嵌入映射到该预定义的特征集;以及放弃不涉及该预定义的特征集的特征和/或嵌入。7.如前述权利要求中任一项所述的计算机实施的方法,其中,该机器学习分类模型提供参与对是否已发生医疗保健事件进行分类的这些特征的重要性排名。8.如权利要求7所述的计算机实施的方法,其中,提供特征的重要性排名包括:确定每个特征的SHAP值。9.如权利要求7或8所述的计算机实施的方法,其中,提供特征的重要性排名包括:将局部代理模型应用于该机器学习分类模型以确定每个特征对该分类的相对贡献。10.如前述权利要求中任一项所述的计算机实施的方法,其中,当可用的数据量超过选定阈值时,执行该方法。11.如前述权利要求中任一项所述的计算机实施的方法,其中,响应于由用户提供的事件已发生的指示来执行该方法。12.一种训练机器学习分类模型以用于执行临床试验终点裁定的方法,该方法包括:
在计算系统处,从多个医疗保健相关的数据源接收数据,该数据包括来自先前临床试验的裁定档案和涉及那些裁定档案的裁定决策;分析每个数据源以确定由该数据源保存的数据是否包括结构化和/或非结构化数据;在该数据包括非结构化数据的情况下,将自然语言处理模型应用于该非结构化数据以获得涉及该非结构化数据中的特征的嵌入;在该数据包括结构化数据的情况下,从该数据中提取特征;基于来自该裁定档案的数据来提供该裁定决策的指示;基于该裁定决策和来自该裁定档案的数据来更新该机器学习分类模型;将该更新后的机器学习分类模型存储在关系数据库中。13.一种监测临床试验终点裁定的方法,该方法包括:在计算系统处,从临床试验终点裁定系统接收裁定决策的多个通知,其中,该裁定决策包括概率分数,该概率分数提供事件已发生的可能性的指示;基于该事件的(i)概率分数和(ii)严重度中的至少一者对这些通知进行排名;获得用于执行该裁定的数据档案;向用户提供裁定决策清单和该对应的数据档案以审查该裁定决策的正确性,其中,该清单的次序是基于该排名。14.如权利要求13所述的方法,进一步包括:获得参与对是否已发生医疗保健事件进行分类的特征的重要性排名;以及向该用户提供这些特征的重要性排名以及该裁定决策清单和该对应的数据档案。15.一种协调和整理来自多个医疗保健相关的源的数据以便进行临床试验终点裁定的计算机实施的方法,该方法包括:在计算系统处,分析每个数据源以确定由该数据源保存的数据是否包括结构化和/或非结构化数据;在该数据包括非结构化数据的情况下,对该数据的还没有呈机器可读格式的一个或多个区域执行光学字符辨识;基于(i)该数据源和(ii)基于该光学字符辨识过程的确定的置信度中的至少一者将置信度分数作为属性归因于该数据;对该数据执行特征分析以从该数据中提取特征;将这些被提取特征映射到预定义的特征集;以json格式发布这些映射的被提取特征以供由机器学习模型用于执行该临床试验终点裁定,其中,该置信度分数是该特征的属性。16.如权利要求15所述的方法,进一步包括:当该置信度分数高于选定的置信度阈值时,以json格式发布这些映射的被提取特征。17.如权利要求15或16所述的方法,进一步包括:获得临床试验终点裁定所需的特征集,其中,该所需的特征集是基于该终点;将从该多个数据源获得的这些特征与临床试验终点裁定所需的该特征集进行比较,以确定是否有任何特征缺失或不完整;在确定有任何特征缺失或不完整的情况下,向用户提供特征缺失的通知,该通知提供这些缺失或不完整特征的指示。
18.如前述权利要求中任一项所述的方法,进一步包括:在对该数据执行特征分析并选择与该预定义的特征集相关的正式事件特性之前,对该数据执行命名实体辨识。19.如前述权利要求中任一项所述的方法,进一步包括:获得应由数据源提供的特征集,并确定对于该数据源是否有任何特征缺失,并且在对于该数据源有特征缺失的情况下,向用户提供特征缺失的通知。20.如前述权利要求中任一项所述的方法,其中,对该数据执行特征分析以从该数据中提取特征进一步包括检查并去除任何重复的、不一致的或不适用的特征。21.一种用于确定临床试验中的参与者是否已发生医疗保健事件的监测系统,该监测系统包括:通信接口,被配置为从多个源接收涉及多个参与者的数据信号,其中,这些数据信号各自包括指示与参与者相关联的参数的信息;以及处理器;其中,对于每个参与者,该处理器被配置为处理每个接收到的数据信号并且基于该数据信号的源将第一权重应用于每个数据信号;其中,该处理器被配置为基于以下各者中的至少一者来对医疗保健事件发生的概率做出确定:(i)该数据信号指示与患者相关联的参数超过该参与者的选定阈值,以及(ii)该第一权重超过选定的触发阈值。22.如权利要求11所述的系统,其中,该处理器被配置...

【专利技术属性】
技术研发人员:F
申请(专利权)人:阿斯利康瑞典有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1