多模态知识图谱构建方法、装置、服务器以及存储介质制造方法及图纸

技术编号:22594763 阅读:49 留言:0更新日期:2019-11-20 11:07
本发明专利技术提供了一种多模态知识图谱构建方法、装置、服务器以及存储介质,应用于多模态知识图谱构建系统的构建层,构建层包括流式构建拓扑模块、微服务集合模块以及工具集模块,流式构建拓扑模块获取游戏领域的结构化数据,并对游戏领域的结构化数据进行在线流式处理,生成图谱构建拓扑图;微服务集合模块获取游戏领域的非结构化数据,并对游戏领域的非结构化数据进行处理,以在所述图片构建拓扑图的基础上构建粗粒度的多模态知识图谱;工具集模块按照预设周期对粗粒度的多模态知识图谱进行校正,以构建精细化的多模态知识图谱。基于上述方案,能够实现快速构建多模态知识图谱。

Construction method, device, server and storage medium of multimodal knowledge map

The invention provides a construction method, device, server and storage medium of multi-modal knowledge map, which is applied to the construction layer of multi-modal knowledge map construction system. The construction layer includes flow construction topology module, micro service collection module and tool set module. The flow construction topology module obtains the structured data in the game field, and carries out Online flow processing generates maps to build topology map; micro service collection module obtains unstructured data in the game field and processes unstructured data in the game field to build coarse-grained multimodal knowledge map based on the topology map constructed by the pictures; tool set module corrects the coarse-grained multimodal knowledge map according to preset period to build Refined multimodal knowledge map. Based on the above scheme, the multi-modal knowledge map can be constructed quickly.

【技术实现步骤摘要】
多模态知识图谱构建方法、装置、服务器以及存储介质
本专利技术涉及知识图谱
,更具体的说,是涉及一种多模态知识图谱构建方法、装置、服务器以及存储介质。
技术介绍
知识图谱于2012年由Google正式提出,其初衷是为了提高搜索引擎的能力,改善用户的搜索质量以及搜索体验。随着AI(ArtificialIntelligence,人工智能)技术发展和应用,知识图谱作为关键技术之一,已被广泛应用。知识图谱能够把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制抽象成实体而显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。知识图谱可以为信息推荐、语义理解、问题回答等提供支持,针对知识图谱的研究有重要意义。本专利技术的专利技术人发现,随着技术的发展,越来越多的游戏被开发出来,为实现游戏推荐等目的,利用知识图谱了解不同游戏之间的相关性非常必要,因此,如何实现游戏的知识图谱的构建,成为了本领域技术人员需要考虑的问题。
技术实现思路
有鉴于此,本专利技术提供了一种多模态知识图谱构建方法、装置、服务器以及存储介质,以实现多模态知识图谱的构建。为实现上述目的,一方面,本申请提供了一种多模态知识图谱构建方法,应用于多模态知识图谱构建系统的构建层,所述构建层包括流式构建拓扑模块、微服务集合模块以及工具集模块,所述方法包括:所述流式构建拓扑模块获取游戏领域的结构化数据,并对所述游戏领域的结构化数据进行在线流式处理,生成图谱构建拓扑图;所述微服务集合模块获取游戏领域的非结构化数据,并对所述游戏领域的非结构化数据进行处理,以在所述图片构建拓扑图的基础上构建粗粒度的多模态知识图谱;所述工具集模块按照预设周期对所述粗粒度的多模态知识图谱进行校正,以构建精细化的多模态知识图谱。又一方面,本申请还提供了一种多模态知识图谱构建装置,包括流式构建拓扑模块、微服务集合模块以及工具集模块;所述流式构建拓扑模块,用于获取游戏领域的结构化数据,并对所述游戏领域的结构化数据进行在线流式处理,生成图谱构建拓扑图;所述微服务集合模块,用于获取游戏领域的非结构化数据,并对所述游戏领域的非结构化数据进行处理,以在所述图片构建拓扑图的基础上构建粗粒度的多模态知识图谱;所述工具集模块,用于按照预设周期对所述粗粒度的多模态知识图谱进行校正,以构建精细化的多模态知识图谱。又一方面,本申请还提供了一种电子终端,包括:处理器和存储器;所述处理器中包括流式构建拓扑模块、微服务集合模块以及工具集模块;其中,所述处理器用于执行所述存储器中存储的程序;所述存储器用于存储程序,所述程序至少用于:所述流式构建拓扑模块获取游戏领域的结构化数据,并对所述游戏领域的结构化数据进行在线流式处理,生成图谱构建拓扑图;所述微服务集合模块获取游戏领域的非结构化数据,并对所述游戏领域的非结构化数据进行处理,以在所述图片构建拓扑图的基础上构建粗粒度的多模态知识图谱;所述工具集模块按照预设周期对所述粗粒度的多模态知识图谱进行校正,以构建精细化的多模态知识图谱。又一方面,本申请还提供了一种存储介质,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现如上所述的多模态知识图谱构建方法。经由上述的技术方案可知,与现有技术相比,本专利技术提供了一种多模态知识图谱构建方法、装置、服务器以及存储介质,应用于多模态知识图谱构建系统的构建层,构建层包括流式构建拓扑模块、微服务集合模块以及工具集模块,流式构建拓扑模块获取游戏领域的结构化数据,并对游戏领域的结构化数据进行在线流式处理,生成图谱构建拓扑图;微服务集合模块获取游戏领域的非结构化数据,并对游戏领域的非结构化数据进行处理,以在所述图片构建拓扑图的基础上构建粗粒度的多模态知识图谱;工具集模块按照预设周期对粗粒度的多模态知识图谱进行校正,以构建精细化的多模态知识图谱。基于上述方案,能够实现快速构建多模态知识图谱。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本申请提出的一种多模态知识图谱构建系统的架构示意图;图2为本申请实施例提供的一种多模态知识图谱构建方法的流程示意图;图3为本申请实施例提供的另一种多模态知识图谱构建方法的流程示意图;图4为本申请实施例提供的一种多模态知识图谱构建系统的应用例示意图;图5为本申请实施例提供的一种多模态知识图谱示意图;图6为本申请实施例提供的一种多模态知识图谱构建装置的结构示意图;图7为本申请实施例提供的一种电子终端的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本申请专利技术人发现,如果要利用知识图谱了解不同游戏之间的相关性,需要构建一个涵盖游戏行业内所有游戏的多模态知识图谱,该知识图谱需要尽可能的包括每个游戏生命周期内的所有信息,除了包含每个游戏的基本属性,如开发商、发行时间等,还要包含游戏的一些热度指标,如下载量、同时在线人数、直播热度等。爬虫每天从互联网上爬取的游戏最新数据达百万条级别,并且针对不同的数据类型甚至实体属性都有不同的处理方式。如,文本类数据就需要用NLP(NaturalLanguageProcessing,自然语言处理)算法进行处理,提取出实体、关系及属性甚至事件;图片类文件就需要用到深度学习算法CNN(ConvolutionalNeuralNetworks,卷积神经网络)进行特征提取等。如何对这些数据分而治之,并有序的链接和融合在一起实现一个涵盖游戏行业内所有游戏的多模态知识图谱的构建,成为本申请专利技术人首先想要解决的问题。为解决上述问题,本申请专利技术人首先提出采用批量式方式构建多模态知识图谱,批量方式构建知识图谱即间隔一段时间批量清洗数据,批量知识抽取、批量实体消歧、批量知识链接、批量知识融合等几个阶段构建知识图谱。但是采用批量式方式构建多模态知识图谱,必须等到在前一次知识图谱构建操作之后爬取的游戏数据达到一定的量,或者,距离前一次知识图谱构建操作的间隔时间达到一定的时长才会触发后一次知识图谱构建操作,这样会导致多模态知识图谱的更新不够及时。另外,目前常用的批量式构建知识图谱的系统中的功能模块之间没有有效的通信机制,不同的功能模块处理的中间结果的存储位置不同,比如有的存储至数据库,有的存储至磁盘,因此,会导致知识图谱的构建效率不高。为避免出现上述采用批量式方式构本文档来自技高网...

【技术保护点】
1.一种多模态知识图谱构建方法,其特征在于,应用于多模态知识图谱构建系统的构建层,所述构建层包括流式构建拓扑模块、微服务集合模块以及工具集模块,所述方法包括:/n所述流式构建拓扑模块获取游戏领域的结构化数据,并对所述游戏领域的结构化数据进行在线流式处理,生成图谱构建拓扑图;/n所述微服务集合模块获取游戏领域的非结构化数据,并对所述游戏领域的非结构化数据进行处理,以在所述图片构建拓扑图的基础上构建粗粒度的多模态知识图谱;/n所述工具集模块按照预设周期对所述粗粒度的多模态知识图谱进行校正,以构建精细化的多模态知识图谱。/n

【技术特征摘要】
1.一种多模态知识图谱构建方法,其特征在于,应用于多模态知识图谱构建系统的构建层,所述构建层包括流式构建拓扑模块、微服务集合模块以及工具集模块,所述方法包括:
所述流式构建拓扑模块获取游戏领域的结构化数据,并对所述游戏领域的结构化数据进行在线流式处理,生成图谱构建拓扑图;
所述微服务集合模块获取游戏领域的非结构化数据,并对所述游戏领域的非结构化数据进行处理,以在所述图片构建拓扑图的基础上构建粗粒度的多模态知识图谱;
所述工具集模块按照预设周期对所述粗粒度的多模态知识图谱进行校正,以构建精细化的多模态知识图谱。


2.根据权利要求1所述的方法,其特征在于,所述流式构建拓扑模块获取游戏领域的结构化数据,包括:
所述流式构建拓扑模块订阅卡夫卡消息总线中的属性值订阅号,获取游戏领域的结构化数据,所述游戏领域的结构化数据包括所述属性值订阅号中的属性值。


3.根据权利要求2所述的方法,其特征在于,所述微服务集合模块获取游戏领域的非结构化数据,包括:
所述微服务集合模块订阅所述卡夫卡消息总线中的新闻文本订阅号、评论文本订阅号、图片及视频链接订阅号获取游戏领域的非结构化数据,所述游戏领域的非结构化数据包括所述新闻文本订阅号中的新闻文本数据、所述评论文本订阅号中的评论文本数据、所述图片及视频链接订阅号中的图片、音频及视频文件。


4.根据权利要求1或2所述的方法,其特征在于,所述流式构建拓扑模块对所述游戏领域的结构化数据进行在线流式处理,生成图谱构建拓扑图,包括:
所述流式构建拓扑模块对所述游戏领域的结构化数据进行数据清洗、知识融合及图谱数据落地处理,生成构建多模态知识图谱所需的知识;其中,所述流式构建拓扑模块对所述游戏领域的结构化数据进行知识融合处理,包括:所述流式构建拓扑模块对所述游戏领域的结构化数据进行实体链接处理以及属性融合;
将所述构建多模态知识图谱所需的知识录入图数据库,生成所述图谱构建拓扑图。


5.根据权利要求1所述的方法,其特征在于,所述微服务集合模块中包含多个微服务,所述微服务集合模块对所述游戏领域的非结构化数据进行处理,包括:
通过所述微服务集合模块中的知识抽取微服务对新闻文本订阅号中的新闻文本数据进行知识抽取处理;
通过所述微服务集合模块中的游戏语料提取微服务对新闻文本订阅号中的新闻文本数据进行游戏语料抽取处理;
通过所述微服务集合模块中的事件提取微服务对新闻文本订阅号中的新闻文本数据进行事件抽取处理;<...

【专利技术属性】
技术研发人员:江小琴刘文强程序谢思发张涵宇
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1