【技术实现步骤摘要】
【国外来华专利技术】识别解剖学短语
本文描述的实施例总体上涉及用于识别文本中的解剖学短语的系统和方法,并且更具体地但非排他地涉及用于使用句法方法来识别文本中的解剖学短语的系统和方法。
技术介绍
为了自动地从医学文档(例如,放射学报告、肿瘤学临床记录等)中提取信息和数据,算法通常需要识别文档中描述临床概念的所有短语。识别这些短语的一种方法是通过使用医学本体(如或)来执行词汇匹配技术。这些词汇匹配技术通常具有良好的精度。即,如果识别出匹配,则通常是正确的匹配。但是,由于若干原因,查全率通常较低。例如,本体在其同义词列表中通常不完整。一个示例是“CAT扫描”概念。此概念的同义词包括“计算机化,计算机的,以及计算”与“轴向,跨轴,断层摄影和断层扫描”的所有组合。但是,例如SNOMED-CT仅列出了可能的12种组合中的9种。词法匹配可能不起作用的另一个原因是,本体永远都不会完整。对于更复杂的概念尤其如此。例如,在医学报告中,一个人可能会遇到相当复杂的结构,例如“右侧心室前角”或“右前上乳”。这些类型的完整短语通常不存在于本体中。另外,如果部分术语与上下文结合提供足够的信息,则临床医师通常不会写完整的短语。因此,需要一种克服现有系统和方法的缺点的、用于识别文本中的解剖学短语的系统和方法。
技术实现思路
提供本
技术实现思路
以用简化形式介绍一些概念,这些概念将在下面的具体实施例部分进一步描述。本
技术实现思路
并非旨在识别或排除要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定要求保护的主题的范围。 ...
【技术保护点】
1.一种用于识别医学文本中的解剖学短语的方法,所述方法包括:/n使用接口来访问包括医学信息的一个或多个数据源;/n使用配置的处理器来执行存储在存储器中的指令,从所述数据源中的至少一个数据源的子集中提取一组概念;/n使用所述配置的处理器,识别与所述概念中的每个概念相关联的多个术语;/n使用所述配置的处理器来将识别出的术语分类到一个或多个解剖列表和一个或多个一般列表中;/n使用所述配置的处理器来将至少一个语法规则应用于解剖列表中的至少一个术语和一般列表中的至少一个术语以生成至少一个复合术语;并且/n使用所述配置的处理器来在使用所述接口访问的医学文本中识别所述至少一个复合术语。/n
【技术特征摘要】
【国外来华专利技术】20180314 US 62/642,9331.一种用于识别医学文本中的解剖学短语的方法,所述方法包括:
使用接口来访问包括医学信息的一个或多个数据源;
使用配置的处理器来执行存储在存储器中的指令,从所述数据源中的至少一个数据源的子集中提取一组概念;
使用所述配置的处理器,识别与所述概念中的每个概念相关联的多个术语;
使用所述配置的处理器来将识别出的术语分类到一个或多个解剖列表和一个或多个一般列表中;
使用所述配置的处理器来将至少一个语法规则应用于解剖列表中的至少一个术语和一般列表中的至少一个术语以生成至少一个复合术语;并且
使用所述配置的处理器来在使用所述接口访问的医学文本中识别所述至少一个复合术语。
2.根据权利要求1所述的方法,其中,所述一个或多个解剖列表包括解剖名词列表和解剖形容词列表;并且所述一个或多个一般列表包括一般名词列表和一般形容词列表。
3.根据权利要求2所述的方法,其中,所述识别出的术语是基于词性标注或字典查找的部分的结果而被分类的。
4.根据权利要求2所述的方法,其中,所述识别出的术语是基于加权多数投票而被分类的。
5.根据权利要求1所述的方法,其中,识别出的术语包括至少两个词。
6.根据权利要求1所述的方法,其中,识别与每个概念相关联的多个术语包括识别每个概念的同义词。
7.一种用于识别医学文本中的解剖学短语的系统,所述系统包括:
接口,其用于至少访问包括医学信息的一个或多个数据源并且用于接收医学文本;以及
至少一个配置的处理器,其执行存储在存储器中的指令以:
从所述数据源中的至少一个数据源的子集中提取一组概念;
识别与所述概念中的每个概念相关联的多个术语;
将识别出的术语分类到一个或多个解剖列表和一个或多个一般列表中;
将至少一个语法规则应用于解剖列表中的至少一个术语和一般列表中的至少一个术语以生成至少一个复合术语;并且
在由所述接口接收的医学文本中识别所述至少...
【专利技术属性】
技术研发人员:P·普林森,R·C·范奥明,
申请(专利权)人:皇家飞利浦有限公司,
类型:发明
国别省市:荷兰;NL
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。