一种实体链接方法及装置、存储介质、计算机设备制造方法及图纸

技术编号:38492555 阅读:6 留言:0更新日期:2023-08-15 17:05
本发明专利技术公开了一种实体链接方法及装置、存储介质、计算机设备,属于数字医疗技术领域,主要解决现有技术中实体链接的准确度不高的问题,包括:确定输入文本中待链接实体的多个候选实体,所述候选实体绑定有实体描述信息和实体关联关系;对所述输入文本与所述实体描述信息进行文本匹配处理,得两者之间的信息匹配度,并确定所述输入文本与所述实体描述信息之间的上下文相关度;基于所述实体关联关系对所述候选实体的平稳度进行评估,得到所述候选实体的平稳概率值;基于所述信息匹配度、所述平稳概率值和所述上下文相关度确定所述候选实体的链接评估结果,并基于所述链接评估结果将所述待链接实体链接至目标实体名称。所述待链接实体链接至目标实体名称。所述待链接实体链接至目标实体名称。

【技术实现步骤摘要】
一种实体链接方法及装置、存储介质、计算机设备


[0001]本专利技术涉及数字医疗
,特别是涉及一种实体链接方法及装置、存储介质、计算机设备。

技术介绍

[0002]实体链接是指将自由文本中已识别的实体对象(例如:人名、地名、机构名、药名、病症名称等),正确的指向知识库中目标实体的过程。在实际应用中通常将实体指称(mention)链接到知识库中的正确实体(entity)来实现实体链接,在医疗领域中,实体链接的使用需求也越来越广。
[0003]在医疗领域中,现有的基于中文数据的实体链接方法采用相似性计算对候选实体中的实体进行评分,然后排序后选出最相似的实体作为链接内容。但是,现有的方法往往受到中文数据资源不足的影响,如数字病例资料不足、诊疗记录数据不足等,且传统的基于中文数据的实体链接方法对实体信息的特征挖掘不够全面,导致基于中文数据的实体链接的准确性不高,降低了基于中文数据的实体链接的整体性能。

技术实现思路

[0004]有鉴于此,本专利技术提供一种实体链接方法及装置、存储介质、计算机设备,主要目的在于解决现有基于中文数据的实体链接方法对实体信息的特征挖掘不够全面,导致实体链接的准确度不高的问题。
[0005]依据本专利技术一个方面,提供了一种实体链接方法,包括:
[0006]确定输入文本中待链接实体的多个候选实体,所述候选实体绑定有实体描述信息和实体关联关系;
[0007]对所述输入文本与所述实体描述信息进行文本匹配处理,得到所述输入文本与所述实体描述信息之间的信息匹配度,并确定所述输入文本与所述实体描述信息之间的上下文相关度;
[0008]基于所述实体关联关系对所述候选实体的平稳度进行评估,得到所述候选实体的平稳概率值;
[0009]基于所述信息匹配度、所述平稳概率值和所述上下文相关度确定所述候选实体的链接评估结果,并基于所述链接评估结果将所述待链接实体链接至目标实体名称。
[0010]进一步的,所述确定输入文本中待链接实体的多个候选实体,包括:
[0011]识别所述输入文本中的所有实体作为所述待链接实体;
[0012]在所述待链接实体与实体别名之间构建索引,并基于所述索引在预设知识库中进行查询,确定所述待链接实体的多个候选实体。
[0013]进一步的,所述对所述输入文本与所述实体描述信息进行文本匹配处理之前,所述方法还包括:
[0014]获取所述输入文本中所有所述待链接实体,确定所述待链接实体在所述输入文本
中出现的词频率;
[0015]基于所述词频率确定所述待链接实体在所述输入文本中的词权重,以使得基于所述词权重进行文本匹配处理。
[0016]进一步的,所述所述输入文本与所述实体描述信息进行文本匹配处理,得到所述输入文本与所述实体描述信息之间的信息匹配度,包括;
[0017]获取所述候选实体的所述实体描述信息;
[0018]在所述输入文本中添加所述词权重,得到加权输入文本;
[0019]基于文本匹配模型对所述加权输入文本与所述实体描述信息进行文本匹配处理,得到所述加权输入文本与所述实体描述信息之间的信息匹配度。
[0020]进一步的,所述确定所述输入文本与所述实体描述信息之间的上下文相关度,包括:
[0021]对所述输入文本与所述实体描述信息进行编码处理,得到表征文本语义的编码信息;
[0022]基于所述编码信息运算得到所述输入文本与所述实体描述信息之间的上下文相关度。
[0023]进一步的,所述基于所述实体关联关系对所述候选实体的平稳度进行评估,得到所述候选实体的平稳概率值,包括:
[0024]获取所述候选实体的所述实体关联关系;
[0025]基于随机游走模型对所述候选实体进行随机访问处理,以使得所述候选实体的随机访问信息收敛到平稳分布;
[0026]确定收敛到平稳分布后所述候选实体的平稳概率值。
[0027]进一步的,所述基于所述信息匹配度、所述平稳概率值和所述上下文相关度确定所述候选实体的链接评估结果,包括:
[0028]基于排序模型对所述信息匹配度、所述平稳概率值和所述上下文特征进行排序评分处理,得到所述候选实体的评估得分;
[0029]基于所述评估得分确定所述待链接实体的目标候选实体,以使得所述待链接实体链接到目标候选实体。
[0030]依据本专利技术另一个方面,提供了一种实体链接装置,包括:
[0031]候选实体确定模块,用于确定输入文本中待链接实体的多个候选实体,所述候选实体绑定有实体描述信息和实体关联关系;
[0032]文本匹配模块,用于对所述输入文本与所述实体描述信息进行文本匹配处理,得到所述输入文本与所述实体描述信息之间的信息匹配度,并确定所述输入文本与所述实体描述信息之间的上下文相关度;
[0033]平稳度评估模块,用于基于所述实体关联关系对所述候选实体的平稳度进行评估,得到所述候选实体的平稳概率值;
[0034]实体链接模块,基于所述信息匹配度、所述平稳概率值和所述上下文相关度确定所述候选实体的链接评估结果,并基于所述链接评估结果将所述待链接实体链接至目标实体名称。
[0035]进一步的,所述候选实体确定模块还包括:
[0036]实体识别单元,用于识别所述输入文本中的所有实体作为所述待链接实体;
[0037]查询单元,用于在所述待链接实体与实体别名之间构建索引,并基于所述索引在预设知识库中进行查询,确定所述待链接实体的多个候选实体。
[0038]进一步的,所述装置还包括:
[0039]词权重确定模块,用于获取所述输入文本中所有所述待链接实体,确定所述待链接实体在所述输入文本中出现的词频率;
[0040]基于所述词频率确定所述待链接实体在所述输入文本中的词权重,以使得基于所述词权重进行文本匹配处理。
[0041]进一步的,所述文本匹配模块还包括:
[0042]匹配度确定单元,用于获取所述候选实体的所述实体描述信息;
[0043]在所述输入文本中添加所述词权重,得到加权输入文本;
[0044]基于文本匹配模型对所述加权输入文本与所述实体描述信息进行文本匹配处理,得到所述加权输入文本与所述实体描述信息之间的信息匹配度。
[0045]进一步的,所述文本匹配模块还包括:
[0046]相关度确定单元,用于对所述输入文本与所述实体描述信息进行编码处理,得到表征文本语义的编码信息;
[0047]基于所述编码信息运算得到所述输入文本与所述实体描述信息之间的上下文相关度。
[0048]进一步的,所述平稳度评估模块还包括:
[0049]关联关系获取单元,用于获取所述候选实体的所述实体关联关系;
[0050]随机访问处理单元,用于基于随机游走模型对所述候选实体进行随机访问处理,以使得所述候选实体的随机访问信息收敛到平稳分布;
[0051]平稳概率确定单本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种实体链接方法,其特征在于,包括:确定输入文本中待链接实体的多个候选实体,所述候选实体绑定有实体描述信息和实体关联关系;对所述输入文本与所述实体描述信息进行文本匹配处理,得到所述输入文本与所述实体描述信息之间的信息匹配度,并确定所述输入文本与所述实体描述信息之间的上下文相关度;基于所述实体关联关系对所述候选实体的平稳度进行评估,得到所述候选实体的平稳概率值;基于所述信息匹配度、所述平稳概率值和所述上下文相关度确定所述候选实体的链接评估结果,并基于所述链接评估结果将所述待链接实体链接至目标实体名称。2.根据权利要求1所述的方法,其特征在于,所述确定输入文本中待链接实体的多个候选实体,包括:识别所述输入文本中的所有实体作为所述待链接实体;在所述待链接实体与实体别名之间构建索引,并基于所述索引在预设知识库中进行查询,确定所述待链接实体的多个候选实体。3.根据权利要求1所述的方法,其特征在于,所述对所述输入文本与所述实体描述信息进行文本匹配处理之前,所述方法还包括:获取所述输入文本中所有所述待链接实体,确定所述待链接实体在所述输入文本中出现的词频率;基于所述词频率确定所述待链接实体在所述输入文本中的词权重,以使得基于所述词权重进行文本匹配处理。4.根据权利要求3所述的方法,其特征在于,所述对所述输入文本与所述实体描述信息进行文本匹配处理,得到所述输入文本与所述实体描述信息之间的信息匹配度,包括;获取所述候选实体的所述实体描述信息;在所述输入文本中添加所述词权重,得到加权输入文本;基于文本匹配模型对所述加权输入文本与所述实体描述信息进行文本匹配处理,得到所述加权输入文本与所述实体描述信息之间的信息匹配度。5.根据权利要求1所述的方法,其特征在于,所述确定所述输入文本与所述实体描述信息之间的上下文相关度,包括:对所述输入文本与所述实体描述信息进行编码处理,得到表征文本语义的编码信息;基于所述编码信息运算得到所述输入文本与所述实体描述信息之间的上下文相关度。6.根据权...

【专利技术属性】
技术研发人员:张倩
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1