知识图谱构建方法、装置和可读存储介质制造方法及图纸

技术编号:33245303 阅读:12 留言:0更新日期:2022-04-27 17:55
本发明专利技术公开了知识图谱构建方法、装置和可读存储介质,其方法包括获取待标注数据,利用知识获取模型从所述待标注数据中提取图谱知识,并将所述图谱知识转换成待确认的问题;利用信息传播网络将所述待确认问题推送给用户进行作答;获取用户作答结果,基于所述用户作答结果构建知识图谱。本发明专利技术公开实施例提供的技术方案,能够针对用户之间的信息的动态交互生成信息传播网络,并利用信息传播网络构建社交知识图谱。交知识图谱。交知识图谱。

【技术实现步骤摘要】
知识图谱构建方法、装置和可读存储介质


[0001]本专利技术涉及计算机
,具体是知识图谱构建方法、装置和可读存储介质。

技术介绍

[0002]作为人工智能技术的一项重要分支,知识图谱是将海量、庞杂的知识信息,转化为实体、关系、属性等构成的结构化的三元组的形式,从而有利于知识的检索、分析、可视化等方面的应用。
[0003]目前,知识图谱的构建主要是基于语料库,基于预定义的图谱结构,利用标注工具对语料文本中的知识进行大量人工标注,继而利用标注的语料文本进行知识提取模型的训练;经训练合格后,利用知识提取模型从未经标注的其它语料中自动提取结构化的三元组形态的知识信息,再将提取的知识信息构建为知识图谱。
[0004]随着技术的发展,公开号为CN111753021A、CN111753022A等现有专利公开了知识获取模型利用标注的语料文本提取图谱知识,并将其转换为待确认的问题,推送给用户进行作答,基于做答结果构建知识图谱。以上问答式的知识图谱构建机制简化了知识图谱构建的复杂程度,提高构建效率。
[0005]随着以电子邮件、微博、即时聊天等为代表的社交网络媒体应用迅速普及,用户参与踊跃,正成为人们获取信息,表达意见和交流观点的重要场所。由于社交网络与用户社会关系的高度结合性及其信息传播的快速实时性,因此也成为了生成、传播、获取知识信息的重要途径。如果能够对社交网络媒体上面传播的知识信息构建知识图谱,显然能够极大扩展知识图谱的应用场景和覆盖范围,
[0006]然而,由于社交网络兼具关系网络和动态交互网络,社交网络上面传播的知识信息,具备多变性、实效性、碎片化的特征,传统的知识图谱构建方面无法充分适应其中的知识信息及其传播的规律。
[0007]可见,如何针对社交网络媒体中用户之间的信息动态交互,准确高效构建知识图谱,成为了现有技术中亟待解决之问题。

技术实现思路

[0008]为了解决上述技术问题或者至少部分地解决上述技术问题,本专利技术公开提供了知识图谱构建方法、装置和可读存储介质。
[0009]为了实现上述专利技术目的,在第一个方面,本专利技术提供了知识图谱构建方法,包括:
[0010]获取待标注数据,利用知识获取模型从所述待标注数据中提取图谱知识,并将所述图谱知识转换成待确认的问题;
[0011]利用信息传播网络将所述待确认问题推送给用户进行作答;
[0012]获取用户作答结果,基于所述用户作答结果构建知识图谱。
[0013]在一些实施例中,所述利用知识获取模型从所述待标注数据中提取图谱知识,并将所述图谱知识转换成待确认的问题,包括:
[0014]获取待标注数据,通过人工标注界面对所述待标注数据中的部分信息数据进行标注,生成数据标注结果;
[0015]基于所述数据标注结果对知识获取模型进行训练,并利用训练后的知识获取模型从所述待标注数据中提取图谱知识;
[0016]将所述图谱知识转换成待确认的问题。
[0017]在一些实施例中,所述利用信息传播网络将所述待确认问题推送给用户进行作答,包括:
[0018]获取用户数据,基于所述用户数据与所述待标注数据计算传播影响力,并基于所述传播影响力确定传播数据;
[0019]将所述传播数据与所述待确认问题进行绑定,生成转发信息;
[0020]利用所述信息传播网络将所述转发信息推送给所述用户。
[0021]在一些实施例中,所述基于所述用户数据与所述待标注数据计算传播影响力,并基于所述传播影响力确定传播数据,包括:
[0022]基于所述用户数据确定用户影响力;
[0023]基于所述待标注数据确定数据影响力;
[0024]利用所述用户影响力与所述数据影响力计算所述传播影响力;
[0025]基于所述传播影响力,利用预设算法确定所述传播数据。
[0026]在一些实施例中,在利用所述信息传播网络将所述转发信息推送给所述用户前,还包括:
[0027]将所述转发信息添加至用户注意力队列,基于所述用户注意力队列生成信息传播网络。
[0028]在一些实施例中,所述获取用户作答结果,基于所述用户作答结果构建知识图谱,包括:
[0029]获取用户作答结果,统计不同的用户作答结果数量;
[0030]将所述不同的用户作答结果数量与预设数量范围进行比较;
[0031]若所述不同的用户作答结果数量符合所述预设数量范围,则基于所述用户作答结果构建所述知识图谱。
[0032]在一些实施例中,所述若所述不同的用户作答结果数量符合所述预设数量范围,则基于所述用户作答结果构建所述知识图谱,包括:
[0033]若所述不同的用户作答结果数量符合所述预设数量范围,则基于所述用户作答结果,在利用所述知识获取模型从所述待标注数据中提取的图谱知识性能参数值大于或等于预设阈值时,基于所述图谱知识构建知识图谱。
[0034]第二方面,本专利技术还提供知识图谱构建装置,包括:
[0035]转换模块,用于获取待标注数据,利用知识获取模型从所述待标注数据中提取图谱知识,并将所述图谱知识转换成待确认的问题;
[0036]推送模块,用于利用信息传播网络将所述待确认问题推送给用户进行作答;
[0037]构建模块,用于获取用户作答结果,基于所述用户作答结果构建知识图谱。
[0038]在一些实施例中,所述转换模块,包括:
[0039]标注子模块,用于获取待标注数据,通过人工标注界面对所述待标注数据中的部
分信息数据进行标注,生成数据标注结果数据;
[0040]提取子模块,用于基于所述数据标注结果数据对知识获取模型进行训练,并利用训练后的知识获取模型从所述待标注数据中提取图谱知识;
[0041]转换子模块,用于将所述图谱知识转换成待确认的问题。
[0042]在一些实施例中,所述推送模块,包括:
[0043]计算子模块,用于获取用户数据,基于所述用户数据与所述待标注数据计算传播影响力,并基于所述传播影响力确定传播数据;
[0044]绑定子模块,用于将所述传播数据与所述待确认问题进行绑定,生成转发信息;
[0045]推送子模块,用于利用所述信息传播网络将所述转发信息推送给所述用户。
[0046]在一些实施例中,所述计算子模块,包括:
[0047]第一确定单元,用于基于所述用户数据确定用户影响力;
[0048]第二确定单元,用于基于所述待标注数据确定数据影响力;
[0049]计算单元,用于利用所述用户影响力与所述数据影响力计算所述传播影响力;
[0050]第三确定单元,用于基于所述传播影响力,利用预设算法确定所述传播数据。
[0051]在一些实施例中,所述在利用所述信息传播网络将所述转发信息推送给所述用户前,还包括:
[0052]添加子模块,用于将所述转发信息添加至用户注意力队列,基于所述用户注意力队列生成信息传播本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.知识图谱构建方法,其特征在于,包括:获取待标注数据,利用知识获取模型从所述待标注数据中提取图谱知识,并将所述图谱知识转换成待确认的问题;利用信息传播网络将所述待确认问题推送给用户进行作答;获取用户作答结果,基于所述用户作答结果构建知识图谱。2.如权利要求1所述的方法,其特征在于,所述利用知识获取模型从所述待标注数据中提取图谱知识,并将所述图谱知识转换成待确认的问题,包括:获取待标注数据,通过人工标注界面对所述待标注数据中的部分信息数据进行标注,生成数据标注结果;基于所述数据标注结果对知识获取模型进行训练,并利用训练后的知识获取模型从所述待标注数据中提取图谱知识;将所述图谱知识转换成待确认的问题。3.如权利要求1所述的方法,其特征在于,所述利用信息传播网络将所述待确认问题推送给用户进行作答,包括:获取用户数据,基于所述用户数据与所述待标注数据计算传播影响力,并基于所述传播影响力确定传播数据;将所述传播数据与所述待确认问题进行绑定,生成转发信息;利用所述信息传播网络将所述转发信息推送给所述用户。4.如权利要求3所述的方法,其特征在于,所述基于所述用户数据与所述待标注数据计算传播影响力,并基于所述传播影响力确定传播数据,包括:基于所述用户数据确定用户影响力;基于所述待标注数据确定数据影响力;利用所述用户影响力与所述数据影响力计算所述传播影响力;基于所述传播影响力,利用预设算法确定所述传播数据。5.如权利要求3所述的方法,其特征在于,利用所述信息传播网络将所述转发信息推送给所述用户前,还包括:将所述转发信息添加至用...

【专利技术属性】
技术研发人员:陈伟陶冶
申请(专利权)人:第四范式北京技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1