【技术实现步骤摘要】
一种基于共享编码和协同注意力的知识图谱问答方法
[0001]本专利技术属于知识图谱智能问答领域,具体涉及一种基于共享编码和协同注意力的知识图谱问答方法。
技术介绍
[0002]知识图谱(knowledge graph,KG)是指把海量客观世界信息表示为相互连接的三元组形式,从而形成庞大的知识网络,其具有强大的语义表达、存储和推理能力。从2012年被谷歌提出以来,知识图谱被广泛应用于智能问答、推荐系统和搜索引擎等领域,极大地加速了人工智能的发展与应用。知识图谱问答(knowledge graph question answer,KGQA)作为智能问答领域的重要分支,通过对问句进行语义理解和内容解析,进而到知识图谱进行查询并得出答案。
[0003]知识图谱问答,分为实体链接和答案推理两个部分。实体链接技术旨在先从问句中识别出主题词,然后从知识图谱中多个实体中识别出与主题词对应的主题词实体。相对地,答案推理以实体链接任务识别出的主题词实体为中心,把周围K跳范围内的实体都作为候选答案,使用自然语言处理技术得到候选答案图谱信息与问句的匹配程度,以此得出预测答案。
[0004]关于知识图谱问答方法中的实体链接任务,当前研究领域大多通过引入外部的实体链接工具来实现,例如,DBpedia lookup、Freebase Search API和S_MART等。然而,它们具有准确率不高的缺点。当前自主训练的实体链接方法忽略了候选主题词实体的邻居信息,导致特征提取不够充分。例如,关于问句“苹果14的产品参数是”,在知识图谱 ...
【技术保护点】
【技术特征摘要】
1.一种基于共享编码和协同注意力的知识图谱问答方法,其特征在于,包括:构建知识图谱;获取待问答的问句,根据问句从知识图谱中获取候选主题词集合和候选主题词实体的图谱信息;将问句、候选主题词集合和候选主题词实体的图谱信息输入到训练好的实体链接E
‑
GCNR模型中,得到候选主题词实体;根据候选主题词实体从知识图谱中获取候选答案集合和候选答案实体的图谱信息;将问句、候选答案集合和候选答案实体的图谱信息输入到训练好的答案推理CA
‑
BiLSTM模型中,得到问句的答案。2.根据权利要求1所述的一种基于共享编码和协同注意力的知识图谱问答方法,其特征在于,对实体链接E
‑
GCNR模型进行训练的过程包括:S1、获取原始问答数据集和对应的知识图谱,将原始问答数据集按照7:2:1的比例划分为训练数据集、验证数据集和测试数据集;S2、根据原始问答数据集中的问答数据在知识图谱中查找每条问句的候选主题词和候选主题词实体的图谱信息;S3、将训练数据集和验证数据集中的候选主题词和候选主题词实体的图谱信息输入到实体链接E
‑
GCNR模型中,进行K次训练,得到的K次训练好的模型;S4:将测试数据集中的数据分别输入到K个训练好的模型中进行检测,从K个模型中选取性能最优的实体链接E
‑
GCNR模型,该模型作为训练好的实体链接E
‑
GCNR模型。3.根据权利要求2所述的一种基于共享编码和协同注意力的知识图谱问答方法,其特征在于,原始问答数据集为WebQusetions数据集。4.根据权利要求2所述的一种基于共享编码和协同注意力的知识图谱问答方法,其特征在于,采用实体链接E
‑
GCNR模型对输入的数据进行处理的过程包括:实体链接E
‑
GCNR模型包括特征提取模块、信息交流模块以及匹配模块;在特征提取模块中,通过共享编码的方式提取问句与候选主题词图谱信息的特征表示;在信息交流模块,通过协同注意力机制促进问句与候选主题词图谱信息的特征表示的信息交互,并采用子图聚合机制将候选主题词的邻居信息进行聚合,得到特征增强后的问句特征表示;在匹配模块,通过拼接并计算各类图谱信息与问句特征表示的相似度分数,预测出问句主题词。5....
【专利技术属性】
技术研发人员:吴涛,张浩然,先兴平,蒲晓,宋秀丽,姜丰,游小琳,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。