在一个示例中,一种为医疗应用提取患者信息的方法包括:接收患者的患者数据;使用具有人工智能(AI)辅助的临床提取工具的学习系统来处理所述患者数据,所述处理包括:基于反映语言语义和用户先前输入其他患者数据的习惯的经训练的语言提取模型,从所述患者数据中提取数据元素和由所述数据元素表示的数据类别;以及基于所述数据类别将所提取的数据元素中的至少一些数据元素映射到预先确定的数据表示;基于所述预先确定的数据表示填充所述患者的数据记录的字段;以及将所填充的数据记录存储在所述医疗应用能够访问的数据库中。储在所述医疗应用能够访问的数据库中。储在所述医疗应用能够访问的数据库中。
【技术实现步骤摘要】
【国外来华专利技术】结构化患者数据记录的自动生成
[0001]相关申请的交叉引用本申请要求于2019年2月20日提交的美国临时专利申请号62/807,898的优先权,该临时专利申请全文以引用方式并入本文。
技术介绍
[0002]每天,医院在全球范围内产生大量的临床数据。对此数据的分析对于理解医疗保健供给和护理质量方面的详细见解以及提供改进个性化医疗保健的基础是至关重要的。不幸的是,大部分记录的数据都难以访问和分析,因为大多数数据是以非结构化形式捕获的。非结构化数据可包括例如医疗保健提供方说明、成像或病理报告,或既不与结构化数据模型相关联也不以预定义方式组织以定义数据的上下文和/或含义的任何其他数据。结构化数据可包括被映射到定义所映射数据的上下文和/或含义的某些字段、代码等的数据,使得可基于映射来确定数据的含义/上下文。
[0003]医院和/或其他医疗保健提供方试图通过使用作为基于人类的摘录的一部分的自动或半自动和手动过程的组合来将非结构化数据摘录为可基于映射容易地解释的结构化数据来解决此限制。作为摘录过程的一部分,摘录者阅读各种文档,包括记录临床诊疗的多种格式的非结构化数据(通常是电子健康记录、病理报告、成像报告和实验室报告),解释这些文档,以及将相关信息结构化成结构化患者数据记录,诸如癌症登记。如本文所用,癌症登记可以包括设计用于收集、管理和分析关于诊断有恶性或肿瘤性疾病(诸如癌症)的人的数据的信息系统。存储在癌症登记中的数据可用于许多应用,诸如执行护理质量分析、癌症研究等。但是,将此类信息手动提取和/或摘录到结构化医疗数据记录中的过程是费力、缓慢、昂贵且易于出错的。
技术实现思路
[0004]本文公开了用于将非结构化患者数据转换为结构化患者数据记录诸如癌症登记以用于医疗应用的工作流的技术。该医疗应用可以包括例如用于评估给予患者的护理的质量的护理质量评估工具、用于确定患者的各种信息(例如,人口统计信息)和患者的肿瘤信息(例如,预后或预期存活期)之间的相关性的医疗研究工具等。该技术还可以应用于其他登记、应用等(例如,肿瘤学工作流),以及其他类型的疾病领域中。
[0005]在一些实施方案中,该技术包括接收或检索患者的患者数据。患者数据可以源自各种主要来源(在一个或更多个医疗机构处),包括例如EMR(电子医疗记录)系统、PACS(影像归档和通信系统)、数字病理学(DP)系统、包括基因组数据的LIS(实验室信息系统)、RIS(放射科信息系统)、患者报告结局、可穿戴和/或数字技术、社交媒体等。患者数据可以包括来自主要来源的原始结构化患者数据和非结构化患者数据,以及从原始患者数据导出的经处理的数据(例如,摄取的、归一化的、标记的等)。
[0006]作为工作流的一部分,该技术还可以包括使用具有人工智能(AI)辅助的临床提取工具的学习系统来处理患者数据。学习系统可以包括例如基于规则的提取系统、机器学习
(ML)模型(其可以包括深度学习神经网络或其他机器学习模型)、自然语言处理器(NLP)等,该自然语言处理器可以从非结构化患者数据中提取数据元素、对数据元素进行分类(例如,作为归一化处理的一部分)以及将数据元素映射到预定义的数据表示(例如,代码、字段等)以基于分类形成结构化数据。数据表示可包括格式化/转换为特定标准/协议的数据,使得数据表示可容易地映射到登记(例如,癌症登记)的各种数据字段。此外,作为归一化过程的一部分,学习系统还可以检测和校正数据错误。该技术还可以包括基于数据元素的映射来创建/更新结构化医疗记录,诸如癌症登记,并且将该结构化医疗记录提供给医疗应用以用于附加处理。结构化医疗记录也可以提供给其他组织以更新包含结构化医疗记录的其他数据库,诸如国家癌症登记。
[0007]作为工作流的一部分,AI辅助的临床提取工具可以基于新的患者数据连续地调整。例如,可以对来自主要来源的原始非结构化患者数据中的一些进行后处理(例如,标记),以将某些数据元素的映射指示为基础事实(ground truth)。标记的非结构化患者数据可用于训练ML模型和NLP以执行提取、分类和映射。此外,基于规则的提取系统的规则还可以基于处理的患者数据进行调整,以改进错误检测和校正处理。标记操作中的至少一些标记操作可以由摘录者执行以训练AI辅助的临床提取工具。然后,AI辅助的临床提取工具可以自动对其他患者数据执行提取、分类、映射和校正。
[0008]以下详细描述了本专利技术的这些和其他实施方案。例如,其他实施方案涉及与本文描述的方法相关联的系统、装置和计算机可读介质。
[0009]参考以下具体实施方式和附图,可以更好地理解本专利技术的实施方案的性质和优点。
附图说明
[0010]参考附图给出详细说明。
[0011]图1A和图1B示出了结构化患者数据记录及其潜在应用的示例。
[0012]图2示出了根据本公开的某些方面的用于将非结构化患者数据转换成结构化患者数据记录并对该结构化患者数据记录提供数据分析的系统。
[0013]图3A、图3B、图3C和图3D示出了根据本公开的某些方面的图2的系统的内部组件和操作。
[0014]图4A至图4G示出了根据本公开的某些方面的用于与图2的系统进行交互以将非结构化患者数据转换成结构化患者数据记录的示例性显示界面。
[0015]图5、图6A和图6B示出了根据本公开的某些方面的用于与图2的系统进行交互以对结构化患者数据记录执行数据分析的示例性显示界面。
[0016]图7示出了根据本公开的某些方面的将非结构化患者数据转换成结构化患者数据记录的方法。
[0017]图8示出了可用于实现本文所公开的技术的示例性计算机系统。
具体实施方式
[0018]本文公开了用于基于具有AI辅助的临床摘录的学习系统和数据归一化操作将信息自动摘录到结构化患者数据记录(诸如癌症登记)中,并将结构化患者数据记录提供给医
疗应用的技术。该医疗应用可以包括例如用于评估给予患者的护理的质量的护理质量评估工具、用于确定患者的各种信息(例如,人口统计信息)和患者的肿瘤信息(例如,预后结果)之间的相关性的医疗研究工具等。该技术还可以应用于其他登记、应用等(例如,肿瘤学工作流),以及其他类型的疾病领域中。
[0019]更具体地,可以从多个来源接收或检索患者的患者数据。患者数据可以源自各种主要来源(在一个或更多个医疗机构处),包括例如EMR(电子医疗记录)系统、PACS(影像归档和通信系统)、数字病理学(DP)系统、包括基因组数据的LIS(实验室信息系统)、RIS(放射科信息系统)、患者报告结局、可穿戴和/或数字技术、社交媒体等。患者数据可以包括来自主要来源的原始结构化患者数据和非结构化患者数据,以及从原始患者数据导出的经处理的数据(例如,摄取的、归一化的、标记的等)。
[0020]作为工作流的一部分,可以使用具有人工智能(AI)辅助的临床提取工具的学习系统来处理患者数据。学习系统可以包括例如基于规则的提取系统、机器学习(ML)模型(其可以包括深度学习神经网络或其他机器学习模型)、本文档来自技高网...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种为医疗应用提取患者信息的方法,所述方法包括:接收患者的患者数据;使用具有人工智能(AI)辅助的临床提取工具的学习系统来处理所述患者数据,所述处理包括:基于反映语言语义和用户的先前输入其他患者数据的习惯的经训练的语言提取模型,从所述患者数据中提取数据元素和由所述数据元素表示的数据类别,以及基于所述数据类别将所提取的数据元素中的至少一些数据元素映射到预先确定的数据表示;基于所述预先确定的数据表示填充所述患者的数据记录的字段;以及将所填充的数据记录存储在由所述医疗应用可访问的数据库中。2.如权利要求1所述的方法,其中AI辅助的临床提取工具包括自然语言处理器;其中所述语言提取模型是使用包括以下项中的至少一项的训练数据的集合来训练的:通用文本数据模型、字典、分层文本数据或标记文本数据;其中所述语言提取模型指示表示多个数据类别的数据元素的概率,所述概率由所述训练生成或更新;并且其中从所述多个数据类别中为所述数据元素选择与最高概率相关联的数据类别。3.如权利要求2所述的方法,其中所述语言提取模型是使用所述标记文本数据来训练的,并且其中所述标记文本数据是从所述其他患者数据导出的并且指示以下项中的至少一项:所述文本数据的数据类别、或映射到所述文本数据的数据表示。4.如权利要求2或3所述的方法,其中所述处理包括基于将表示相同信息的多个另选表述映射到单个标准化表述的数据表将所提取的数据元素转换成标准化数据格式。5.如权利要求2、3或4中的任一项所述的方法,其中所述处理包括基于将所提取的数据元素与阈值进行比较来检测所提取的数据元素中的错误,以及更新所提取的数据元素以消除所述错误;并且其中所述方法还包括基于所更新的提取的数据元素填充所述患者的数据记录的字段。6.如权利要求1
‑
5中的任一项所述的方法,其还包括:在用户界面中显示第一字段;在所述用户界面中显示用于手动填充所述数据记录的所述第一字段的第一选项和用于基于所述数据表示自动填充所述第一字段的第二选项;从所述界面接收对所述第一选项或所述第二选项的选择;基于所述选择,使用经由所述界面的第二字段接收到的数据或使用所述数据表示来填充所述第一字段。7.如权利要求6所述的方法,其中所述语言提取模型指示表示多个数据类别的数据元素的概率;并且其中所述方法还包括:基于所述语言提取模型中指示的概率,确定基于所述数据表示填充所述第一字段的置信水平;以及在所述第二选项附近显示所述置信水平。
8.如权利要求1
‑
7中的任一项所述的方法,其还包括:识别负责将患者的集合的患者数据摘录到所述患者的集合的...
【专利技术属性】
技术研发人员:M,
申请(专利权)人:豪夫迈,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。