【技术实现步骤摘要】
语句生成
本专利技术涉及语句生成,并且更具体地涉及通过使用计算机实现的文本分析过程的语句生成。
技术介绍
医学文本报告、例如放射学报告被使用在医学领域中用以在医学专业人士之间传送信息。例如,患者的医师可以建议患者进行某种医学成像,例如计算机断层扫描血管造影术(CTA)。放射科技师然后实施对患者的医学成像,并且放射科医师然后读取或解释结果得到的图像以产生他们的发现的基于文本的放射学报告,其典型地通过使用自然语言语句来被编写。放射学报告然后被提供给咨询医师。咨询医师然后可以基于放射学报告而做出对患者的状况的诊断。已知的基于人工智能(AI)的图像分析算法分析医学图像以检测异常,检测解剖实体,对器官尺寸进行分割和量化,或将异常分类成各种类型等等。为不同的特定任务训练不同的AI算法。给定AI算法的输出一般包括:包括数值或类别变量的发现的经结构化且定量的表。US9767557B1(西门子保健有限责任公司)公开了基于递归神经网络(RNN)长短期记忆(LSTM)的斑块检测AI算法,其可以被应用到冠状CT血管造影术图像以检测斑块,并且输出与图像有关的分类结果。分类结果可以是多类标签,例如针对斑块类型分类(例如钙化的、非钙化的、混合的),或连续的值,例如针对狭窄分级退化。然而,对于咨询医师或信息的其他消费者而言可以难以解释AI算法的输出。将AI图像处理算法输出转换成自然语言语句将减轻该问题。用于将放射学发现转换成自然语言语句的已知方法是供放射科医师使用听写系统中的预定义的宏,所述听写系统基于关键字而自动地 ...
【技术保护点】
1.一种用于为放射学报告生成自然语言语句的方法,所述方法包括:/n获得(102)一个或多个词(206),所述一个或多个词已经基于对放射学图像(202)的图像处理而被产生;/n通过使用计算机实现的文本分析过程来分析(104)所述一个或多个词,用于生成表示放射学图像(202)的自然语言语句(232);以及/n输出(106)自然语言语句(232);/n其中所述计算机实现的文本分析过程包括:/n对于所述一个或多个词中的每一个并且通过使用经修改的词嵌入(228)而确定表示词的向量;以及/n基于所确定的一个或多个向量并且通过使用文本生成器模型(230)来确定自然语言语句(232);并且/n其中所述经修改的词嵌入(228)是已经通过基于第一数据而修改第一词嵌入所生成的词嵌入,所述第一词嵌入已经基于第一语料库(220)和第二语料库(224)中之一而被生成,所述第一数据已经基于所述第一语料库(220)和第二语料库(224)中的另一个而被生成,所述第一语料库(220)包括来自一个或多个放射学报告的文本,所述第二语料库(224)不同于第一语料库(220)并且包括明语文本。/n
【技术特征摘要】
20181012 EP 18200204.81.一种用于为放射学报告生成自然语言语句的方法,所述方法包括:
获得(102)一个或多个词(206),所述一个或多个词已经基于对放射学图像(202)的图像处理而被产生;
通过使用计算机实现的文本分析过程来分析(104)所述一个或多个词,用于生成表示放射学图像(202)的自然语言语句(232);以及
输出(106)自然语言语句(232);
其中所述计算机实现的文本分析过程包括:
对于所述一个或多个词中的每一个并且通过使用经修改的词嵌入(228)而确定表示词的向量;以及
基于所确定的一个或多个向量并且通过使用文本生成器模型(230)来确定自然语言语句(232);并且
其中所述经修改的词嵌入(228)是已经通过基于第一数据而修改第一词嵌入所生成的词嵌入,所述第一词嵌入已经基于第一语料库(220)和第二语料库(224)中之一而被生成,所述第一数据已经基于所述第一语料库(220)和第二语料库(224)中的另一个而被生成,所述第一语料库(220)包括来自一个或多个放射学报告的文本,所述第二语料库(224)不同于第一语料库(220)并且包括明语文本。
2.根据权利要求1所述的方法,其中所述第一数据包括第二词嵌入,所述第二词嵌入已经基于与已经基于其生成了第一词嵌入的第一语料库和第二语料库中之一相比的第一(220)和第二(224)语料库中的不同的那个而被生成,并且其中所述经修改的词嵌入(228)是已经通过基于第二词嵌入而修改第一词嵌入所生成的词嵌入(228)。
3.根据权利要求2所述的方法,其中所述经修改的词嵌入(228)是已经通过如下而被生成的词嵌入:对于针对给定词的给定词嵌入,连接针对给定词的第一词嵌入的向量与针对给定词的第二词嵌入的向量以产生针对给定词的经修改的向量。
4.根据权利要求1所述的方法,其中所述第一数据包括语义词典,所述语义词典已经基于与已经基于其生成了第一词嵌入的第一语料库(220)和第二语料库(224)中之一相比的第一(220)和第二语料库(224)中的不同的那个而被生成,并且其中经修改的词嵌入(228)是已经通过基于所述语义词典而修改第一词嵌入的向量的值所生成的词嵌入。
5.根据权利要求1至权利要求4中任...
【专利技术属性】
技术研发人员:许娟,P沙马,
申请(专利权)人:西门子医疗有限公司,
类型:发明
国别省市:德国;DE
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。