用于实体链接的神经符号方法技术

技术编号:39426160 阅读:6 留言:0更新日期:2023-11-19 16:12
提供了一种用于逻辑神经网络

【技术实现步骤摘要】
【国外来华专利技术】用于实体链接的神经符号方法

技术介绍

[0001]本专利技术涉及一种使用人工智能(AI)和机器学习的计算机系统、计算机程序产品和计算机实现的方法,用于通过将文本中的提及链接到知识图中的实体来消除它们的歧义。更特别地,实施例涉及使用可解释规则进行逻辑神经网络实体链接,并学习对应的连接性权重和规则。
[0002]实体链接是通过将文本提及链接到由知识图提供的规范实体来消除文本提及的歧义的任务。一般方法针对由多个句子组成的长文本,其中提取度量提及与一个或多个候选实体之间的某种程度或相似性的特征,并且通过非学习试探法进行消除歧义步骤以将提及链接到实际实体。实体链接中的挑战针对诸如单个句子或问题的短文本以及提及周围的有限的上下文。支持短文本的平台包括对话系统,诸如聊天机器人。本文所示和所述的实施例针对人工智能(AI)平台到实体的链接,以减轻与短文本及其(多个)对应平台相关联的挑战。

技术实现思路

[0003]本文公开的实施例包括用于通过使用可解释规则将文本中的提及链接到逻辑神经网络中的实体来消除文本中的提及的歧义的计算机系统、计算机程序产品和计算机实现的方法。这些实施例将在以下详细描述中进一步描述。本
技术实现思路
既不旨在标识所要求保护的主题的关键特征或必要特征或概念,也不旨在以将限制所要求保护的主题的范围的任何方式来使用。
[0004]在一个方面,计算机系统具有操作地耦合到存储器的处理器,以及操作地耦合到处理器的人工智能(AI)平台。AI平台被配置有特征管理器、评估器和机器学习(ML)管理器,所述ML管理器被配置有支持逻辑神经网络(LNN)中的实体链接的功能。特征管理器被配置为生成针对经注释的数据集中的一个或多个实体

提及对的特征集合。评估器可操作地耦合到特征管理器,被配置为针对具有以分层结构被组织的一个或多个逻辑连接规则和对应的连接性权重的实体链接LNN规则模板来评估所生成的特征集合。操作地耦合到评估器的ML管理器被配置成利用人工神经网络和对应的ML算法来学习连接性权重。ML管理器还被配置为选择性地更新与逻辑连接规则相关联的连接性权重。利用经学习的阈值和针对逻辑连接规则的经学习的连接性权重来生成经学习的模型。
[0005]在另一方面,提供了一种具有计算机可读存储介质的计算机程序产品,该计算机可读存储介质具有体现的程序代码。程序代码可由处理单元执行,具有针对经注释的数据集中的一个或多个实体

提及对生成特征集合的功能。针对链接LNN规则模板的实体来评估所生成的特征集合,该LNN规则模板具有以分层结构被组织的一个或多个逻辑连接规则和对应的连接性权重。该程序代码支持利用人工神经网络和对应的机器学习算法来学习连接性权重的功能。选择性地更新与逻辑连接规则相关联的连接性权重,并且利用经学习的阈值和针对逻辑连接规则的经学习的连接性权重来生成经学习的模型。
[0006]在又一方面,提供了一种方法。针对经注释的数据集中的一个或多个实体

提及对
生成特征集合。针对链接LNN规则模板的实体来评估所生成的特征集合,该LNN规则模板具有以分层结构被组织的一个或多个逻辑连接规则和对应的连接性权重。人工神经网络与对应的机器学习算法一起被用来学习连接性权重。选择性地更新与逻辑连接规则相关联的连接性权重,并且利用经学习的阈值和针对逻辑连接规则的经学习的连接性权重来生成经学习的模型。
[0007]从下面结合附图对当前优选实施例的详细描述中,这些和其他特征和优点将变得显而易见。
附图说明
[0008]本文参考的附图形成说明书的一部分。附图中所示的特征仅是一些实施例的说明,而不是所有实施例的说明,除非另有明确指示。
[0009]图1描述了示出具有支持对实体链接的神经符号解决方案的工具的计算机系统的框图,在示例性实施例中,该实体链接是短文本场景的应用。
[0010]图2描述了框图,提供了示出图1所示的工具及其相关联的API的框图。
[0011]图3A至3C描述了说明在实体链接算法中学习阈值化操作和权重的过程的流程图。
[0012]图4描述了描述了使用LNN来学习具有逻辑连接词的合适的权重的新规则的处理的流程图。
[0013]图5示出了用于例示EL算法的示例LNN重新公式化的框图。
[0014]图6是描绘用于实现以上关于图1至5描述的系统和过程的基于云的支持系统的计算机系统/服务器的示例的框图。
[0015]图7描述了示出云计算机环境的框图。
[0016]图8描述了示出由云计算环境提供的功能抽象模型层集合的框图。
具体实施方式
[0017]容易理解,如在本文的附图中一般性描述和示出的,本实施例的部件可以以各种不同的配置来布置和设计。因此,如附图中所呈现的,以下对本实施例的装置、系统、方法和计算机程序产品的实施例的详细描述不旨在限制如所要求保护的实施例的范围,而仅仅是所选实施例的代表。
[0018]在整个说明书中,对“选择实施例”、“一个实施例”或“实施例”的引用意味着结合该实施例描述的特定特征、结构或特性被包括在至少一个实施例中。因此,在本说明书中各处出现的短语“选择实施例”、“在一个实施例中”或“在实施例中”不一定是指同一实施例。
[0019]通过参考附图,将更好地理解所示实施例,其中,相同的部件始终由相同的附图标记表示。以下描述仅意在作为示例,并且仅示出与本文要求保护的实施例一致的设备、系统和过程的某些所选实施例。
[0020]人工智能(AI)涉及计算机和与人类相关的计算机行为的计算机科学领域。AI是指机器基于信息能够做出决策时的智能,其最大化了在给定主题中成功的机会。更特别地,AI能够从数据集学习以解决问题并提供相关的推荐。例如,在人工智能计算机系统领域中,自然语言(NL)系统(例如IBM 人工智能计算机系统或其他自然语言问答系统)基于系统获得的知识来处理NL。
[0021]在AI计算机系统领域中,自然语言处理(NLP)系统基于所获取的知识来处理自然语言。NLP是AI的一个领域,其用作计算机语言与人类语言之间的翻译平台。更特别地,NLP使计算机能够分析和理解人类语言。自然语言理解(NLU)是一种NLP,其针对根据自然语言原理解析和翻译输入。这种NLP系统的示例是IBM 人工智能计算机系统和其他自然语言问答系统。
[0022]机器学习(ML)是AI的子集,其利用算法来从数据学习并基于数据创建预见。ML是通过创建模型来应用AI的,例如,可以通过执行未明确编程的任务来证明学习行为的人工神经网络。存在不同类型的ML,包括诸如监督式、无监督式和强化学习之类的学习问题,诸如半监督式、自监督式和多实例学习之类的混合学习问题,诸如归纳式、演绎式和转换式学习之类的统计推断,以及诸如多任务、主动、在线、传输和集成学习之类的学习技术。
[0023]AI和相关推理的核心在于相似性的概念。包括静态结构和动态结构的结构规定了对于给定的确定输入的确定的输出或动作。更特别地,所确定的输出或动作是基于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种计算机系统,包括:处理器,操作地被耦合到存储器;人工智能(AI)平台,操作地被耦合到所述处理器,所述人工智能平台包括:特征管理器,用以生成针对经注释的数据集中的一个或多个实体

提及对的特征集合;评估器,被配置为针对实体链接(EL)LNN规则模板评估所生成的所述一个或多个实体

提及对的所述特征集合,所述模板具有以分层结构被组织的一个或多个逻辑连接规则和对应的连接性权重;机器学习(ML)管理器,操作地被耦合到所述评估器,所述ML管理器被配置为利用人工神经网络(ANN)和对应的ML算法来学习所述连接性权重;所述ML管理器被配置为选择性地更新与所述逻辑连接规则相关联的所述连接性权重;以及生成具有经学习的阈值和针对所述逻辑连接规则的经学习的所述连接性权重的经学习的模型。2.根据权利要求1所述的系统,其中所述评估还包括所述评估器以将由析取规则集合组成的实体链接算法重新公式化成LNN表示。3.根据权利要求2所述的系统,其中所述实体

提及对评估还包括所述评估器以计算针对经标记的实体

提及对的子集的一个或多个特征,其中所述特征中的每个特征具有对应相似性谓词。4.根据权利要求3所述的系统,还包括所述ML管理器以利用所述ANN和所述ML算法来学习针对所计算的所述一个或多个特征中的每个特征的、与所述对应相似性谓词有关的合适的阈值。5.根据权利要求4所述的系统,还包括所述评估器以基于所计算的所述一个或多个特征的对应的经学习的阈值来过滤所计算的所述一个或多个特征,以及响应于所述过滤,将所计算的所述一个或多个特征选择性地合并到所述LNN规则模板中,所述选择性地合并包括移除特征,或者向所述特征指派非零得分。6.根据权利要求2所述的系统,还包括操作地被耦合到所述评估器的规则管理器,所述规则管理器被配置为:学习所述逻辑连接规则中的一个或多个逻辑连接规则;动态地生成针对所述分层结构的模板;基于动态生成的所述模板来学习逻辑规则;在经标记的数据集上评估选择的规则;以及向所述分层结构中的对应节点选择性地指派所述选择的规则。7.根据权利要求6所述的系统,其中所述模板是二叉树,并且所述对应节点是内部节点,并且所述系统还包括所述规则管理器以向所述内部节点选择性地指派合取或析取LNN操作符。8.一种计算机程序产品,被配置为与计算机可读存储介质对接,所述计算机可读存储介质具有随其体现的程序代码,所述程序代码由处理器可执行以:生成针对经注释的数据集中的一个或多个实体

提及对的特征;针对实体链接(EL)LNN规则模板评估所生成的所述一个或多个实体

提及对的所述特
征,所述模板具有以分层结构被组织的一个或多个逻辑连接规则和对应的连接性权重;利用人工神经网络(ANN)和对应的ML算法来学习所述连接性权重;选择性地更新与所述逻辑连接规则相关联的所述连接性权重;以及生成具有经学习的阈值和针对所述逻辑连接规则的经学习的所述连接性权重的经学习的模型。9.根据权利要求8所述的计算机程序产品,其中针对LNN规则模板的每个实体

提及对的所述评估还包括被配置为将由析取规则集合组成的实体链接算法重新公式化成LNN表示的程序代码。10.根据权利要求9所述...

【专利技术属性】
技术研发人员:江航S
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1