System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 能够提取非结构化临床数据的机器学习制造技术_技高网

能够提取非结构化临床数据的机器学习制造技术

技术编号:41745729 阅读:2 留言:0更新日期:2024-06-21 21:32
本发明专利技术涉及能够提取非结构化临床数据的机器学习。该方法可以包括从一个或更多个数据系统接收包括非结构化临床数据的消息。可以应用机器学习模型以识别存在于非结构化临床数据的第一实体和第二实体。第一实体和第二实体可以占据非结构化临床数据的同一行或同一列的连续行。机器学习模型可以训练为至少基于包括第一实体的非结构化临床数据确定出第二实体是最有可能占据非结构化临床数据的同一行中的下一个位置或同一列的下一行的实体。可以从结构化临床数据中提取临床上有意义的数据。至少基于临床上有意义的数据,可以控制至少一个医疗装置来执行一个或更多个任务。

【技术实现步骤摘要】

本文中所描述的主题总体上涉及机器学习,并且更具体地,涉及基于用于提取非结构化临床数据的技术的机器学习。


技术介绍

1、实验室自动化是多学科的工作,旨在研究并开发优化实验室工作流程的速度、效率和效果的技术。例如,实验室信息系统(laboratory information system,lis)可以包括硬件和软件,这些硬件和软件配置成为实验室活动(诸如,接种、孵化、平板成像、培养物读数、结果报告等)提供支持。实验室信息系统可以记录、分析、存储并且共享由各种实验室活动生成的数据。这样,无论是在关注倾向于患者的特定标本的临床设置中,还是在诸如研究实验室等的非临床设置中,实验室信息系统都可以致力于传送及时、准确和相关的信息。


技术实现思路

1、提供了包括计算机程序产品的系统、方法和制造物品,其用于基于提取引擎的机器学习。在一些示例性实施方案中,提供了一种包括至少一个处理器和至少一个存储器的系统。至少一个存储器可以包括指令,当由至少一个处理器执行所述指令时,使得执行操作。所述操作可以包括:从一个或更多个数据系统接收包括非结构化临床数据的消息;应用机器学习模型以识别存在于非结构化临床数据的第一实体和第二实体,所述第一实体和第二实体占据非结构化临床数据的同一行或非结构化临床数据的同一列的连续行,所述机器学习模型训练为至少基于包括第一实体的非结构化临床数据确定出第二实体是最有可能占据非结构化临床数据的同一行中的下一个位置或同一列的下一行的实体;从结构化临床数据中提取临床上有意义的数据;以及至少基于临床上有意义的数据来控制至少一个医疗装置以执行一个或更多个任务。

2、在另一方面,提供了一种基于提取引擎的机器学习的方法。所述方法可以包括:从一个或更多个数据系统接收包括非结构化临床数据的消息;应用机器学习模型以识别存在于非结构化临床数据的第一实体和第二实体,所述第一实体和第二实体占据非结构化临床数据的同一行或非结构化临床数据的同一列的连续行,所述机器学习模型训练为至少基于包括第一实体的非结构化临床数据确定出第二实体是最有可能占据非结构化临床数据的同一行中的下一个位置或同一列的下一行的实体;从结构化临床数据中提取临床上有意义的数据;以及至少基于临床上有意义的数据来控制至少一个医疗装置以执行一个或更多个任务。

3、在另一方面,提供了一种计算机程序产品,其包括存储指令的非易失性计算机可读介质。当由至少一个数据处理器执行所述指令时,可以使得执行操作。所述操作可以包括:从一个或更多个数据系统接收包括非结构化临床数据的消息;应用机器学习模型以识别存在于非结构化临床数据的第一实体和第二实体,所述第一实体和第二实体占据非结构化临床数据的同一行或非结构化临床数据的同一列的连续行,所述机器学习模型训练为至少基于包括第一实体的非结构化临床数据确定出第二实体是最有可能占据非结构化临床数据的同一行中的下一个位置或同一列的下一行的实体;从结构化临床数据中提取临床上有意义的数据;以及至少基于临床上有意义的数据来控制至少一个医疗装置以执行一个或更多个任务。

4、在方法、系统和计算机程序产品的一些变体中,以下的一个或更多个特征可以选择地包括在任何可行的组合中。

5、在一些变体中,机器学习模型训练为通过至少以下步骤来识别包括在非结构化临床数据中的第二实体:至少基于包括第一实体的非结构化临床数据,确定第二实体是最有可能占据非结构化临床数据的同一行中的下一个位置或同一列的下一行的实体的第一概率;至少基于包括第一实体的非结构化临床数据,确定第三实体是最有可能占据非结构化临床数据的同一行中的下一个位置或同一列的下一行的实体的第二概率;至少基于第一概率和第二概率的比较来识别第二实体。

6、在一些变体中,可以至少基于非结构化临床数据中的第一实体和第二实体之间的对齐,生成包括第一实体和第二实体的实体图。

7、在一些变体中,可以至少基于第一实体和第二实体之间的水平对齐,生成包括第一实体和第二实体的实体图的水平链,使得第一实体和第二实体占据单个行。

8、在一些变体中,可以至少基于第一实体和第二实体之间的竖直对齐,生成包括第一实体和第二实体的实体图的竖直链,使得第一实体和第二实体占据单个列的连续行。

9、在一些变体中,机器学习模型可以通过至少向第一实体和第二实体的每一个分配相应的实体标记来识别第一实体和第二实体。

10、在一些变体中,可以基于包括第一实体和/或第二实体的标题、生物体名称、药物名称、浓度值和解译值的至少一个来控制至少一个医疗装置。

11、在一些变体中,可以至少基于包括带注释的非结构化临床数据的训练数据对机器学习模型进行训练,以学习存在于带注释的非结构化临床数据的一个或更多个实体模式。所述带注释的非结构化临床数据可以包括利用相应的基准真实值实体标记进行注释的多个实体。

12、在一些变体中,一个或更多个实体模式可以包括在单个行中或单个列的连续行中的第一实体和第二实体的共同出现。

13、在一些变体中,一个或更多个任务可以包括:至少基于临床上有意义的数据,识别与一个或更多个消息相关的临床工作流程的阶段;至少基于与一个或更多个消息相关的时间戳,确定临床工作流程的两个或更多个连续阶段之间的时间量;以及响应于临床工作流程的两个或更多个连续阶段之间的时间量超过阈值,确定用于至少一个医疗装置的一个或更多个校正配置。

14、在一些变体中,一个或更多个校正动作可以包括:修改与临床工作流程相关的一个或更多个活动的调度和/或调整与一个或更多个活动相关的资源的分配。

15、在一些变体中,识别临床工作流程的阶段可以包括:识别微生物测试工作流程和/或病毒学化验的阶段。

16、在一些变体中,识别临床工作流程的阶段可以包括:识别用于微生物的培养过程的开始、用于微生物的革兰氏阳性或革兰氏阴性识别、用于微生物的物种和/或生物体识别、或者微生物的抗微生物敏感性。

17、在一些变体中,一个或更多个任务可以包括至少基于临床上有意义的数据来确定一个或更多个数据系统处的资源的分配。

18、在一些变体中,资源的分配可以包括:至少基于临床上有意义的数据,确定临床工作流程的后续阶段和临床工作流程的后续阶段的时间,以及根据临床工作流程的后续阶段的时间,调度临床工作流程的后续阶段所需的资源量。

19、在一些变体中,可以应用一个或更多个第二机器学习模型以从结构化临床数据中提取临床上有意义的数据。

20、在一些变体中,一个或更多个第二机器学习模型可以训练为识别并标记包括在结构化临床数据中的临床上有意义的数据。一个或更多个第二机器学习模型可以进一步训练为:响应于结构化临床数据的超过阈值的部分被标记为临床上有意义,确定出与结构化临床数据相关的消息能够执行。

21、在一些变体中,一个或更多个第二机器学习模型可以进一步训练为至少基于包括消息的消息序列来确定消息序列是否能够执行。

22、在一些变体本文档来自技高网...

【技术保护点】

1.一种计算机实现的方法,其包括:

2.根据权利要求1所述的计算机实现的方法,其中,机器学习模型训练为通过至少以下步骤来识别包括在非结构化临床数据中的第二实体:

3.根据权利要求1所述的计算机实现的方法,进一步包括:

4.根据权利要求3所述的计算机实现的方法,进一步包括:

5.根据权利要求3所述的计算机实现的方法,进一步包括:

6.根据权利要求1所述的计算机实现的方法,其中,机器学习模型通过至少向第一实体和第二实体的每一个分配相应的实体标记来识别第一实体和第二实体。

7.根据权利要求1所述的计算机实现的方法,其中,基于包括第一实体和/或第二实体的标题、生物体名称、药物名称、浓度值和解译值的至少一个来控制至少一个医疗装置。

8.根据权利要求1所述的计算机实现的方法,进一步包括:

9.根据权利要求8所述的计算机实现的方法,其中,一个或更多个实体模式包括在单个行中或单个列的连续行中的第一实体和第二实体的共同出现。

10.根据权利要求1所述的计算机实现的方法,其中,一个或更多个任务包括:

11.根据权利要求10所述的计算机实现的方法,其中,一个或更多个校正动作包括:修改与临床工作流程相关的一个或更多个活动的调度和/或调整与一个或更多个活动相关的资源的分配。

12.根据权利要求10所述的计算机实现的方法,其中,识别临床工作流程的阶段包括识别微生物测试工作流程和/或病毒学化验的阶段。

13.根据权利要求10所述的计算机实现的方法,其中,识别临床工作流程的阶段包括:识别用于微生物的培养过程的开始、用于微生物的革兰氏阳性或革兰氏阴性识别、用于微生物的物种和/或生物体识别、或者微生物的抗微生物敏感性。

14.根据权利要求10所述的计算机实现的方法,其中,一个或更多个任务包括至少基于临床上有意义的数据来确定一个或更多个数据系统处的资源的分配。

15.根据权利要求14所述的计算机实现的方法,其中,资源的分配包括:

16.根据权利要求1所述的计算机实现的方法,进一步包括:

17.根据权利要求16所述的计算机实现的方法,其中,一个或更多个第二机器学习模型训练为识别并标记包括在结构化临床数据中的临床上有意义的数据,并且其中,一个或更多个第二机器学习模型进一步训练为:响应于结构化临床数据的超过阈值的部分被标记为临床上有意义,确定出与结构化临床数据相关的消息能够执行。

18.根据权利要求17所述的计算机实现的方法,其中,一个或更多个第二机器学习模型进一步训练为至少基于包括消息的消息序列来确定消息序列是否能够执行。

19.根据权利要求1所述的计算机实现的方法,其中,控制至少一个医疗装置包括:向至少一个医疗装置发送一个或更多个消息以调整至少一个医疗装置的操作状态和/或功能元件。

20.根据权利要求19所述的计算机实现的方法,其中,一个或更多个消息包括一个或更多个指令,当由与至少一个医疗装置相关联的处理器执行所述一个或更多个指令时,调整至少一个医疗装置的操作状态和/或功能元件。

21.根据权利要求19所述的计算机实现的方法,其中,一个或更多个消息包括一个或更多个值,当所述一个或更多个值应用于至少一个医疗装置时,调整至少一个医疗装置的操作状态和/或功能元件。

22.根据权利要求19所述的计算机实现的方法,其中,至少一个医疗装置包括包含泵送功能元件的输注泵,并且其中,所述方法包括生成一个或更多个消息以调整泵送功能元件的泵送速率。

23.根据权利要求19所述的计算机实现的方法,其中,至少一个医疗装置包括包含一个或更多个容器的分配柜或废物站,并且其中,所述方法包括生成一个或更多个消息以控制对一个或更多个容器的访问。

24.一种系统,其包括:

25.一种非易失性计算机可读介质,其存储指令,当由至少一个数据处理器执行所述指令时,使得执行包括权利要求1至23的任意一项所述的方法的步骤。

...

【技术特征摘要】

1.一种计算机实现的方法,其包括:

2.根据权利要求1所述的计算机实现的方法,其中,机器学习模型训练为通过至少以下步骤来识别包括在非结构化临床数据中的第二实体:

3.根据权利要求1所述的计算机实现的方法,进一步包括:

4.根据权利要求3所述的计算机实现的方法,进一步包括:

5.根据权利要求3所述的计算机实现的方法,进一步包括:

6.根据权利要求1所述的计算机实现的方法,其中,机器学习模型通过至少向第一实体和第二实体的每一个分配相应的实体标记来识别第一实体和第二实体。

7.根据权利要求1所述的计算机实现的方法,其中,基于包括第一实体和/或第二实体的标题、生物体名称、药物名称、浓度值和解译值的至少一个来控制至少一个医疗装置。

8.根据权利要求1所述的计算机实现的方法,进一步包括:

9.根据权利要求8所述的计算机实现的方法,其中,一个或更多个实体模式包括在单个行中或单个列的连续行中的第一实体和第二实体的共同出现。

10.根据权利要求1所述的计算机实现的方法,其中,一个或更多个任务包括:

11.根据权利要求10所述的计算机实现的方法,其中,一个或更多个校正动作包括:修改与临床工作流程相关的一个或更多个活动的调度和/或调整与一个或更多个活动相关的资源的分配。

12.根据权利要求10所述的计算机实现的方法,其中,识别临床工作流程的阶段包括识别微生物测试工作流程和/或病毒学化验的阶段。

13.根据权利要求10所述的计算机实现的方法,其中,识别临床工作流程的阶段包括:识别用于微生物的培养过程的开始、用于微生物的革兰氏阳性或革兰氏阴性识别、用于微生物的物种和/或生物体识别、或者微生物的抗微生物敏感性。

14.根据权利要求10所述的计算机实现的方法,其中,一个或更多个任务包括至少基于临床上有意义的数据来确定一个或更多个数据系统处的资源的分配。

15.根据权利要求14...

【专利技术属性】
技术研发人员:A·内格C·赫尔G·桑帕斯
申请(专利权)人:康尔福盛三零三公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1