在文本输入期间建议相关术语制造技术

技术编号:8886492 阅读:207 留言:0更新日期:2013-07-05 03:22
一种用于在报告的文本输入期间建议自动补全术语的系统。文本输入单元(2)用于使得用户能够将文本输入到当前报告(1)中。术语选择器(11)用于基于提取术语(8)、提取术语节段(9)、当前节段(10)、以及同现统计(7)来选择至少一个频繁同现术语(12)。指示器(13)给所述用户提供所述至少一个频繁同现术语(12)的指示。一种用于分析报告的系统包括同现统计生成器(26),用于生成多个同现统计,同现统计指示第一术语、第一节段、第二术语、第二节段,以及报告在所述第一节段中包含所述第一术语连同在所述第二节段中包含所述第二术语的频率。

【技术实现步骤摘要】
【国外来华专利技术】在文本输入期间建议相关术语
本专利技术涉及在报告的文本输入期间建议自动补全术语。本专利技术进一步涉及分析多个报告。
技术介绍
临床遭遇,例如患者检查,通常以文本报告的形式记录。这些报告可以由临床医师,例如医师或者护士口述或者键入。这种报告的例子是放射学报告,其典型地包含患者病史的一些要素(用于研究的临床迹象和/或原因)、对所执行成像过程的描述,以及放射学调查的结果(发现和印象)。为了加速文本输入,可使用自动补全来预测下一词语(word)或者各词语。这可借助于字符串模式匹配来实现。当键入词语的开头时,可建议那一词语的补全。为此,自动补全算法可在词典中找出一个或者更多词语,该词语的开头具有与刚刚键入的字符相同的字符。例如,输入“pros”可以匹配例如“prostate”或者“prostaglandin”的字符串。更复杂精密的算法可以匹配短语:例如,“enlargedpros”将匹配“enlargedprostate”而不是“prostaglandin”,因为第一个短语在统计上看起来是远远更常用的。这些匹配通常作为可能性菜单被呈现给用户,从而可以快速地选定正确的可能性。和的在ProceedingsofthefirstAsiaSemanticWebConference(ASWC2006),Beijing,Springer-Verlag,NewYork,August4-9,2006中题名为“Semanticautocompletion”的论文(在下文中:等)公开了基于将输入字符串与词汇表中的可用词语列表匹配的自动补全。该论文进一步公开了不仅将用户书写的文本补全为类似的词语,而且补全为其标引在字面水平上可能不涉及输入的匹配的本体论概念。
技术实现思路
在报告的文本输入期间改善自动补全术语将是有利的。为了更好地解决这一问题,本专利技术的第一方面提供了一种系统包括:-文本输入单元,用于使得用户能够将文本输入当前报告中;-节段分析器,用于确定所述当前报告的多个节段;-当前节段检测器,用于检测所述当前报告中所述用户正在操作的节段,从而获得当前节段;-术语提取器,用于提取在所述当前报告中出现的术语,从而获得提取术语,以及识别所述当前报告中出现所述提取术语的节段,从而获得提取术语节段,其中所述提取术语节段和所述当前节段是不同的节段;-同现访问单元,用于访问多个同现统计,同现统计指示至少一个第一术语、至少一个第一节段、第二术语、第二节段,以及报告在所述至少一个第一节段中包括所述至少一个第一术语连同在所述第二节段中包含所述第二术语的频率;-术语选择器,用于基于所述提取术语、所述提取术语节段、所述当前节段、以及至少一个所述同现统计来选择至少一个频繁同现术语;以及-指示器,用于给所述用户提供所述至少一个频繁同现术语的指示。被指示给用户的频繁同现术语具有相对高的概率是用户想要输入该报告中的词语,因为术语的选择是基于将其中同现术语经常出现的节段考虑在内的同现统计。该同现统计对于给定的领域背景(例如,放射学、心脏病学、神经学)是特定的。与常规的字符串匹配相比,通过考虑在报告的其他节段中写下的术语而获得了改进,其使得能够建议对于正在被输入的报告而言是更加特定的自动补全术语。这一改进是基于这样的洞察:报告的特定节段可能包括特定类型信息,该信息可能与当前节段中的术语不同地相关联。作为具体例子,在放射学报告的患者病史节段中出现的术语与当在该报告的发现节段中出现同一术语时相比,可能与诊断节段中的术语不同地相关联。在另一方面中,本专利技术提供一种用于分析多个报告的系统,包括-节段分析器,用于确定将所述报告划分为节段的划分;-通用节段确定器,用于确定在多个所述报告中通用的多个节段;-术语提取器,用于从所述报告的所述通用节段中提取出多个术语,以及将每个术语与其所出现的所述节段和报告相关联;-同现统计生成器,用于生成多个同现统计,同现统计指示至少一个第一术语、至少一个第一节段、第二术语、第二节段,以及报告在所述至少一个第一节段中包含所述至少一个第一术语连同在所述第二节段中包含所述第二术语的频率,其中至少一个第一节段不同于所述第二节段。这一系统生成可由所提出的自动补全系统使用的同现统计。该同现统计使得能够生成更加有用的自动补全建议,因为该同现统计提供了关于在报告的特定的不同节段中同现的同现术语的信息。用于分析多个报告的系统可与用于建议自动补全术语的系统合并;可选地,该系统可在不同的环境中实现。当同现统计指示多个第一术语和多个第一节段时,该多个第一节段的至少一个第一节段不同于第二节段。报告可包括文档,其中节段包括节段标题和节段主体。节段标题允许检测节段的存在,并且这便于所提出的系统提取术语并且将所提取的术语与适当的节段相关联。可选地或者另外地,报告可包括多个文件,其中不同的文件包括报告的不同节段。这使得在自动补全处理中包含来自更早日期或者由一个或多个不同临床医师创建的信息变得更加容易。这样,可给用户提供更加相关的自动补全术语。报告可包括数字化形式,其中域需要由用户填入。用于填入一些域中的信息可来自不同的系统并且可以被存储作为一个或者多个数据库中的记录。术语可包括单个的词语或者由多个词语组成的短语。例如,提取术语和/或第一术语可包括包含多个词语的表达。这允许改进建议,因为针对提取术语和/或第一术语的多个词语的组合可生成更加特定的同现统计。该系统可包括自然语言处理器,用于将提取术语和/或第一术语与本体论中的本体论概念相关联,并且其中该同现统计涉及本体论概念与第二术语同现的概率。这改进了同现统计和/或所建议术语的准确性。术语选择器操作性耦接至文本输入单元并且被布置为接收由用户输入的术语的一部分,并且被布置为基于术语的该接收部分来选择频繁同现的术语。这样,所建议的术语与已经由用户部分输入的词语是相关的。术语选择器可被布置为选择其开头与术语的该接收部分相匹配的频繁同现术语。这提供了自然的自动补全处理,其中用户输入术语的开头并且被提供有与所输入的开头匹配的完整术语。报告可包括患者医学报告,并且节段可包括患者病史节段、临床发现节段,和/或诊断节段。这描述了典型的医学报告方案。在另一方面中,本专利技术提供一种工作站包括一个或多个所提出系统。在仍另一方面中,本专利技术提供一种在报告的文本输入期间建议自动补全术语的方法,包括-使得用户能够将文本输入当前报告中;-确定所述当前报告的多个节段;-检测所述当前报告中所述用户正在操作的节段,从而获得当前节段;-提取在所述当前报告中出现的术语,从而获得提取术语,以及识别所述当前报告的其中出现所述提取术语的节段,从而获得提取术语节段,其中所述提取术语节段和所述当前节段是不同的节段;-访问多个同现统计,同现统计指示至少一个第一术语、至少一个第一节段、第二术语、第二节段,以及报告在所述第一节段中包含所述第一术语连同在所述第二节段中包含所述第二术语的频率;-基于所述提取术语、所述提取术语节段、所述当前节段、以及至少一个所述同现统计来选择至少一个频繁同现术语;以及-给所述用户提供所述至少一个频繁同现术语的指示。在另一方面中,本专利技术提供一种分析多个报告的方法,包括-确定将所述报告划分为节段的划分;-确定在多个所述报告中通用的多个节段;-从所述报告的所述通用节段中提取本文档来自技高网
...
在文本输入期间建议相关术语

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2010.11.01 US 61/408,6991.一种用于在报告的文本输入期间建议自动补全术语的系统,包括:-文本输入单元(2),用于使得用户能够将文本输入到当前报告(1)中;-节段分析器(3),用于确定所述当前报告的多个节段,所述多个节段对于多个所述报告是通用的;-当前节段检测器(4),用于检测所述当前报告中所述用户正在操作的节段,从而获得当前节段(10);-术语提取器(5),用于提取在所述当前报告中出现的术语,从而获得提取术语(8),以及识别所述当前报告的其中出现所述提取术语的节段,从而获得提取术语节段(9),其中,所述提取术语节段(9)和所述当前节段(10)是不同的节段;-同现访问单元(6),用于访问多个同现统计(7),同现统计指示至少一个第一术语、至少一个第一节段、第二术语、第二节段,以及在知识领域中的报告在所述至少一个第一节段中包含所述至少一个第一术语连同在所述第二节段中包含所述第二术语的频率,其中,所述至少一个第一节段与所述第二节段不同;-术语选择器(11),用于基于所述提取术语(8)、所述提取术语节段(9)、所述当前节段(10)、以及至少一个所述同现统计(7)来选择至少一个频繁同现术语(12),其中,所述术语选择器(11)基于与在所述提取术语节段(9)中的所述提取术语(8)相关联的至少一个所述同现统计(7),针对在所述当前节段中输入的术语的一部分来选择所述至少一个频繁同现术语(12);-指示器(13),用于给所述用户提供所述至少一个频繁同现术语(12)的指示。2.一种用于分析报告的系统,包括-节段分析器(22),用于确定将多个报告(21)划分为节段的划分;-通用节段确定器(23),用于确定在多个所述报告(21)中通用的多个节段;-术语提取器(24),用于从所述报告的所述通用节段中提取出多个术语(25),从而获得提取术语,并且将每个所述提取术语与其所出现的所述节段和报告相关联;-同现统计生成器(26),用于生成多个同现统计(7),同现统计指示至少一个第一术语、至少一个第一节段、第二术语、第二节段,以及报告在所述至少一个第一节段中包含所述至少一个第一术语连同在所述第二节段中包含所述第二术语的频率,其中,所述至少一个第一节段不同于所述第二节段。3.如权利要求1或2所述的系统,其中,报告包括文档,并且其中,节段包括节段标题和节段主体。4.如权利要求1或2所述的系统,其中,所述报告(1,21)包括多个文件,并且其中,不同的文件包括所述报告的不同节段。5.如权利要求1或2所述的系统,其中,所述提取术语和/或所述至少一个第一术语包括包含多个词语的表述。6.如权利要求1或2所述的系统,包括自然语言处理器(14),用于将所述提取术语和/或所述至少一个第一术语与本体论中的至少一个相应的本体论概念相关联,并且其中,所述同现统计涉及所述至少一个本体论概念与所述第二术语同现的概率。7.如权利要求1所述的系统,其中,所述术语选择器(11)操作性耦接至所述文本输入单元(2)并且被布置为接收由所述用户输入的所述术语的所述部分,并且被布置为基于所述术语的所接收的部分来选择所述频繁同现术语(12)。8.如权利要求7所述的系统,其中,所述术语选择器(11)被布置为选择其开头与所述术语的所接收的部分相匹配的至少一个频繁同现术语(12)。9.如权利要求1或2所述的系统,其中,所述报告(1,21)包括患者医学报告,并且所述节段包括患者病史节段、临床发现节段,和/或诊断节段。10.一种用于处理报告的工作站,包括如权利要求1和2中任一项或者两者所述的系统。11.一种在报告的文本输入期间...

【专利技术属性】
技术研发人员:M·CC·李E·科昂索拉尔钱悦晨
申请(专利权)人:皇家飞利浦电子股份有限公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1