基于图数据库的食品安全知识图谱构建方法和展示模式技术

技术编号:22974700 阅读:15 留言:0更新日期:2019-12-31 23:25
本发明专利技术提供了基于图数据库的食品安全知识图谱构建方法和展示模式。方法为:从不同数据源获取食品安全原始数据;利用开源的词法工具和食品安全词典进行命名实体识别;关系抽取获得食品安全实体之间的关系;构建食品安全知识图谱,将其存储在Neo4j数据库;根据需求设计食品安全领域的动态知识展示模式;启动Neo4j数据库服务,修改Django平台数据库配置文件;将Neo4j数据库与Django平台连接,将Neo4j数据库中存储的知识图谱展示在Web层。本发明专利技术将Neo4j数据库与Django平台进行集成,实现食品安全领域构建食品安全知识图谱,动态重组知识图谱展示模式,提升食品安全领域数据管理效率以及使用的灵活性。

Construction method and display mode of food safety knowledge map based on graph database

【技术实现步骤摘要】
基于图数据库的食品安全知识图谱构建方法和展示模式
本专利技术涉及数据库处理技术和计算机
,具体涉及基于图数据库的食品安全知识图谱构建方法和展示模式。
技术介绍
Neo4j是一个高性能的非关系型图形数据库。Neo4j使用图相关的概念来描述数据模型,把数据保存为图中的节点以及节点之间的关系。很多应用中数据之间的关系,可以很直接地使用图中节点和关系的概念来建模。对于这样的应用,使用Neo4j来存储数据会非常的自然,要优于使用关系型数据库。Neo4j使用“图”这种最通用的数据结构来对数据进行建模使得Neo4j的数据模型在表达能力上非常强。链表、树和散列表等数据结构都可以抽象成用图来表示。Neo4j同时具有一般数据库的基本特性,包括事务支持、高可用性和高性能等。Neo4j已经在很多生产环境中得到了应用。流行的云应用开发平台Heroku也提供了Neo4j作为可选的扩展。Django是一个高级的Pythonweb开发平台框架,它鼓励快速开发和干净、实用的设计。它由经验丰富的开发人员构建,可以解决Web开发的许多麻烦,而且是免费和开源的。知识图谱本质上是一种叫做语义网络的知识库,即具有有向图结构的一个知识库,其中图的节点代表实例或者概念,而图的边代表实例/概念之间的各种语义关系。知识图谱的出现,为人们提供了一种更好地组织、管理和理解海量信息的方法,同时,也成为知识检索、智能问答、个性化推荐等应用的基础。目前尚未有成熟的食品安全知识图谱构建方式。食品安全领域所涉及的食品安全问题面广而且复杂,该领域涉及食品对象本身,也会涉及该食品所属类别,即它的物理性质、化学性质。在加工食品的过程中仍然包含食品工程的加工工艺与技术,而保证食品安全远远不止这些,食品可能为动、植物原料,在种植和养殖过程中,会受到环境污染,还可能受到农药残留,兽药残留污染,添加剂超标和食源性微生物污染,在加工过程中,可能会微生物污染,所以会引发多种食品安全事件,而一旦发生食品安全事件,就会获取该事件的各种信息比如事件发生的时间、地点、事件规模、事件原因、事件损失程度、涉及企业与负责人以及涉及的产品等等。因此,构建一个完整的食品安全领域的知识图谱是很困难的。首先领域知识组织结构复杂,其次有些领域知识可以直接建立知识图谱,而有些领域知识结构不明显,无法直接构建,还需利用模型、算法支持构建,再就是对问题的知识表示,都是从需求而来,不需要都全部展示。
技术实现思路
有鉴于此,本专利技术提供了基于图数据库的食品安全知识图谱构建方法和展示模式,通过将Neo4j数据库与Django平台进行集成,较简单地存储了知识图谱并可以灵活配置,按需求动态重组知识图谱展示模式。本专利技术提供了基于图数据库的食品安全知识图谱构建方法和展示模式,所述方法包括:从不同数据源获取大量食品安全原始数据;利用开源的词法工具和食品安全词典进行命名实体识别;关系抽取获得食品安全实体之间的关系;根据需求设计食品安全领域的动态知识展示模式;构建食品安全知识图谱,并将其存储在Neo4j数据库中;启动Neo4j数据库服务,修改Django平台数据库配置文件;将Neo4j数据库与Django平台连接,将Neo4j数据库中存储的知识图谱展示在Web层。其中所述从不同数据源获取大量食品安全原始数据包括:结构化的食品安全数据和半结构化食品安全数据。结构化食品安全数据大多来自于网络上百科信息和食品网站规则数据,半结构化食品安全数据则来自于食品安全学这类电子文档。优选地,所述从不同数据源获取大量食品安全原始数据步骤包括:对网页结构化数据进行页面解析,基于需要的内容设定解析规则,获取食品安全知识实体,及其分类信息;对食品安全学这类电子文档,利用已建立的关键实体抽取规则,获取相应的实体。优选地,所述利用开源的词法工具和食品安全词典进行命名实体识别包括:利用预设的词法工具,根据食品安全领域的特点,利用食品安全词典库,进行命名实体识别。优选地,所述关系抽取获得食品安全实体之间的关系步骤包括:对所得的食品安全领域知识进行解析,得到语义信息,利用已建立的食品安全关系提取模型,抽取实体之间的关系。优选地,所述根据需求设计食品安全领域的动态知识展示模式包括:依据需求,重组知识图谱的展示与组织。首先,依据需求划分食品安全领域知识图谱的知识域,在多问题域中划分为不可再分的独立于,再以不可再分的独立域,构建各子知识图谱。其次,依据不同需求,重组知识图谱。优选地,所述构建食品安全知识图谱,并将其存储在Neo4j数据库中步骤包括:将上述食品安全领域的实体,以及实体之间的关联关系,以csv格式导入Neo4j数据库中。优选地,所述启动Neo4j数据库服务,修改Django平台数据库配置文件包括:启动Neo4j数据库服务,对所述Neo4j数据库的数据信息:所述Neo4j数据库连接信息、用户名、密码、sql语句模板进行修改配置。优选地,所述将Neo4j数据库与Django平台连接,将Neo4j数据库中存储的知识图谱展示在Web层包括:自动读取所述配置文件,将所述Neo4j数据库与所述Django平台连接;将cypher语句执行的结果返回的数据转换成前端展示所需要的JSON格式;利用可视化技术将存储的知识图谱以知识树,图谱等多种形式展示。基于图数据库的食品安全知识图谱构建方法和展示模式,包括:获取模块,从不同数据源获取大量食品安全原始数据;识别模块,利用开源的词法工具和食品安全词典进行命名实体识别;抽取模块,用于关系抽取获得食品安全实体之间的关系;重组模块,用于根据需求设计食品安全领域的动态知识展示模式;存储模块,用于将上述食品安全知识图谱存储在Neo4j数据库中;配置模块,用于启动Neo4j数据库服务,并且修改Django平台数据库配置文件;展示模块,用于将Neo4j数据库与Django平台连接,将Neo4j数据库中存储的知识图谱展示在Web层。优选地,所述获取模块还包括:获取其他非结构化食品安全领域知识。优选地,所述识别模块具体用于:根据已有的开源词法分析工具,加载食品安全领域词典,进行命名实体识别,获取更多实体概念。优选地,所述抽取模块具体用于:利用已有的关系抽取模型,对食品安全实体进行关系提取。优选地,所述重组模块具体用于:根据需求设计食品安全领域的动态知识展示模式,依据需求,重组知识图谱的展示与组织。优选地,所述存储模块具体用于:将上述食品安全领域的实体,以及实体之间的关联关系,以csv格式导入Neo4j数据库中。优选地,所述配置模块具体包括:配置Neo4j数据库的数据信息包括:所述Neo4j数据库连接信息、用户名、密码、sql语句模块。优选地,所述展示模块具体包括:连接Neo4j与Django平台;将cypher语句执行的结果返回的数据转换成前端展示所需要的JSON格式;前端利用本文档来自技高网
...

【技术保护点】
1.基于图数据库的食品安全知识图谱构建方法和展示模式,其特征在于,所述方法包括:/n从不同数据源获取大量食品安全原始数据;/n利用开源的词法工具和食品安全词典进行命名实体识别;/n关系抽取获得食品安全实体之间的关系;/n根据需求设计食品安全领域的动态知识展示模式;/n构建食品安全知识图谱,并将其存储在Neo4j数据库中;/n启动Neo4j数据库服务,修改Django平台数据库配置文件;/n将Neo4j数据库与Django平台连接,将Neo4j数据库中存储的知识图谱展示在Web层。/n

【技术特征摘要】
1.基于图数据库的食品安全知识图谱构建方法和展示模式,其特征在于,所述方法包括:
从不同数据源获取大量食品安全原始数据;
利用开源的词法工具和食品安全词典进行命名实体识别;
关系抽取获得食品安全实体之间的关系;
根据需求设计食品安全领域的动态知识展示模式;
构建食品安全知识图谱,并将其存储在Neo4j数据库中;
启动Neo4j数据库服务,修改Django平台数据库配置文件;
将Neo4j数据库与Django平台连接,将Neo4j数据库中存储的知识图谱展示在Web层。


2.根据权利要求1所述的基于图数据库的食品安全知识图谱构建方法和展示模式,其特征在于,不同数据源包括:
结构化的食品安全领域知识和半结构化食品安全领域知识。


3.根据权利要求1或2所述的基于图数据库的食品安全知识图谱构建方法和展示模式,其特征在于,利用开源的词法工具和食品安全词典进行命名实体识别包括:
根据食品安全领域特点,利用预设的开源词法工具,利用食品领域词典库,对领域中其他实体进行命名实体识别。


4.根据权利要求1所述的基于图数据库的食品安全知识图谱构建方法和展示模式,其特征在于,关系抽取获得食品安全实体之间的关系包括:
对所得的食品安全领域知识进行解析,得到语义信息,利用已建立的食品安全关系提取模型,抽取实体之间的关系。


5.根据权利要求1所述的基于图数据库的食品安全知识图谱构建方法和展示模式,其特征在于,根据需求设计食品安全领域的动态知识展示模式包括:
首先,依据需求划分食品安全领域知识图谱的知识域,在多问题域中划分为不可再分的独立域,再以不可再分的独立域,构建各子知识图谱;其次,依据不...

【专利技术属性】
技术研发人员:郑丽敏于志远杨璐
申请(专利权)人:中国农业大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1