存储数据、检索数据的方法及相关设备技术

技术编号:27581578 阅读:40 留言:0更新日期:2021-03-09 22:36
本申请实施例公开了一种存储数据、检索数据的方法及相关设备,属于信息处理技术领域。在该方法中,先判断待存储数据的类型属于实体数据、还是属于关系数据或者是属于事件数据,然后基于判断结果将不同类型的待存储数据存储到图数据库或事件数据库中。本申请实施例通过提供的存储系统实现知识图谱时,知识图谱可以保留事件本身的完整性,实现对现实生活的准确性描述。另外,减少了知识图谱的图数据库的存储空间的占用,有利于知识图谱中图数据库的查询。查询。查询。

【技术实现步骤摘要】
存储数据、检索数据的方法及相关设备


[0001]本申请实施例涉及信息处理
,特别涉及一种存储数据、检索数据的方法及相关设备。

技术介绍

[0002]随着信息的不断增加,用于表征信息的数据呈现爆炸式增长的态势。目前诸如知识图谱(knowledge graph)这类存储系统可以把复杂的数据通过数据挖掘、信息处理、知识计量和图形绘制等方式显示出来,给数据工作者和科学家探求数据更深层次内容提供了便利。其中,如何向存储系统存储数据是当前关注的热点。
[0003]相关技术中,知识图谱用于将现实生活中的信息映射为实体以及实体与实体之间的关系这类数据,然后在知识图谱中存储实体以及关系。其中,实体是指现实生活中的客观物体,关系是指描述两个实体之间的实际关系。知识图谱存储的实体以及关系构成一个网络结构,该网络结构由实体作为节点、关系作为连接节点的边所构成。
[0004]但是,由于当前知识图谱只关注实体和关系的存储,导致现实生活中的事件需要被拆解为实体和/或关系存储,因此,在知识图谱中没有保留事件特有的完整性和灵活性,从而使得知识图谱中缺少了对现实生活准确性的描述。另外若在两个实体之间发生了多个事件,则会在知识图谱中被拆解为这两个实体之间的多个关系进行存储,不仅占用大量的存储空间,而且不利于知识图谱的查询。

技术实现思路

[0005]本申请实施例提供了一种存储数据、检索数据的方法及相关设备,可以使得构建的存储系统能够满足对现实生活准确性描述,并且还可以减少数据存储压力。所述技术方案如下:
[0006]一方面,提供了一种存储数据的方法,所述方法包括:
[0007]获取待存储数据,所述待存储数据为用于指示实体的实体数据、或者为用于指示关系的关系数据、或者为用于指示事件的事件数据;
[0008]在所述待存储数据为所述实体数据或所述关系数据的情况下,将所述待存储数据写入存储系统中的图数据库;
[0009]在所述待存储数据为所述事件数据的情况下,将所述待存储数据写入存储系统中的事件数据库。
[0010]可选地,所述实体数据包括与实体元数据中的定义的数据格式对应的数据,所述实体元数据中定义的数据格式包括实体的标签、实体的主键字段以及实体的多个属性的数据格式,所述实体的主键字段用于唯一标识一个实体,所述实体的标签用于指示实体的类型;
[0011]可选地,所述关系数据包括与关系元数据中的定义的数据格式对应的数据,所述关系元数据中定义的数据格式包括关系的标签、关系关联的主体的标签和主键字段、关系
关联的客体的标签和主键字段、以及关系的多个属性的数据格式;
[0012]可选地,所述事件数据包括与事件元数据中的定义的数据格式对应的数据,所述事件元数据中定义的数据格式包括事件的标签、事件关联的实体的标签和主键字段、事件的多个属性的数据格式。
[0013]所述事件数据包括事件类型,所述事件类型用于指示检索过程中关注的事件属性是否包括时间信息或空间信息,所述事件数据库包括与不同事件类型分别对应的子数据库;
[0014]所述在所述待存储数据为所述事件数据的情况下,将所述待存储数据写入存储系统中的事件数据库,包括:
[0015]根据所述事件数据中包括的事件类型,从所述事件数据库中选择相应的子数据库;
[0016]将所述事件数据写入选择的子数据库中。
[0017]可选地,所述事件类型包括普通事件,所述普通事件是指检索过程中关注的属性中均不包括时间信息和空间信息的事件,所述事件数据库中与所述普通事件对应的子数据库包括第一列式数据库和索引数据库;
[0018]所述将所述事件数据写入选择的子数据库中,包括:
[0019]根据所述事件数据确定事件标识;
[0020]将所述事件标识和所述事件数据中的事件的多个属性写入所述第一列式数据库中;
[0021]将所述事件标识、所述事件数据中与事件关联的实体的标签和主键字段、和/或所述多个属性中的检索属性写入所述索引数据库中,所述检索属性是指用于检索事件的属性;
[0022]可选地,所述事件类型包括时序事件,所述时序事件是指检索过程中关注的属性中包括时间信息但不包括空间信息的事件,所述事件数据库中与所述时序事件对应的子数据库包括时序数据库,所述时序数据库中包括时间序列数据表;
[0023]所述将所述事件数据写入选择的子数据库中,包括:
[0024]根据所述事件数据生成行键,所述行键中的监控项指示所述事件数据中的事件标签,所述行键中的时间戳指示所述事件数据中的时间信息,所述行键中的值指示所述事件数据中统计的指标的监控结果,所述行键中的键值对指示所述事件数据中的其他属性;
[0025]将所述行键写入所述时间序列数据表。
[0026]可选地,所述事件类型包括时空事件,所述时空事件是指检索过程中关注的属性中包括空间信息的事件,所述事件数据库中与所述时空事件对应的子数据库包括时空数据库,所述时空数据库包括空间属性索引表、时间属性索引表以及普通属性索引表;
[0027]所述将所述事件数据写入选择的子数据库中,包括:
[0028]从所述事件数据中获取与所述空间属性索引表对应的空间索引字段、与所述时间属性索引表对应的时间索引字段、以及普通属性索引表对应的普通属性索引字段中的两者或多者;
[0029]将所述事件数据写入所述时空数据库中的全量数据库中,将所述空间索引字段写入所述空间属性索引表,将所述时间索引字段写入所述时间属性索引表,将所述普通属性
索引字段写入所述普通属性索引表,其中,所述时空数据库中配置有所述空间索引字段和所述事件数据之间的对应关系,所述时间索引字段和所述事件数据之间的对应关系,以及所述普通属性索引字段和所述事件数据之间的对应关系。
[0030]可选地,所述在所述待存储数据为所述实体数据或所述关系数据的情况下,将所述待存储数据写入存储系统中的图数据库,包括:
[0031]根据所述待存储数据确定实体或关系的标识;
[0032]将所述待存储数据中的部分数据和所述实体或关系的标识写入所述图数据库,将所述待存储数据中的其他数据和所述实体或关系的标识写入第二列式数据库。
[0033]另一方面,提供了一种检索数据的方法,所述方法包括:
[0034]根据检索请求确定待检索的元素类型以及检索条件,所述元素类型包括实体、关系或事件,所述检索条件包括针对实体的检索条件和/或针对事件属性的检索条件;
[0035]在所述元素类型为实体或关系的情况下,从存储系统中的图数据库中基于所述检索条件获取检索结果;
[0036]在所述元素类型为事件的情况下,从存储系统中的事件数据库中基于所述检索条件获取检索结果。
[0037]可选地,所述事件数据库包括与不同事件类型分别对应的子数据库,所述事件类型用于指示检索过程中关注的事件属性是否包括时间信息或空间信息;
[0038]所述在所述元素类型为事件的情本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种存储数据的方法,其特征在于,所述方法包括:获取待存储数据,所述待存储数据为用于指示实体的实体数据、或者为用于指示关系的关系数据、或者为用于指示事件的事件数据;在所述待存储数据为所述实体数据或所述关系数据的情况下,将所述待存储数据写入存储系统中的图数据库;在所述待存储数据为所述事件数据的情况下,将所述待存储数据写入所述存储系统中的事件数据库。2.如权利要求1所述的方法,其特征在于,所述实体数据包括与实体元数据中的定义的数据格式对应的数据,所述实体元数据中定义的数据格式包括实体的标签、实体的主键字段以及实体的多个属性的数据格式,所述实体的主键字段用于唯一标识一个实体,所述实体的标签用于指示实体的类型;所述关系数据包括与关系元数据中的定义的数据格式对应的数据,所述关系元数据中定义的数据格式包括关系的标签、关系关联的主体的标签和主键字段、关系关联的客体的标签和主键字段、以及关系的多个属性的数据格式;所述事件数据包括与事件元数据中的定义的数据格式对应的数据,所述事件元数据中定义的数据格式包括事件的标签、事件关联的实体的标签和主键字段、事件的多个属性的数据格式。3.如权利要求1或2所述的方法,其特征在于,所述事件数据包括事件类型,所述事件类型用于指示检索过程中关注的事件属性是否包括时间信息或空间信息,所述事件数据库包括与不同事件类型分别对应的子数据库;所述在所述待存储数据为所述事件数据的情况下,将所述待存储数据写入存储系统中的事件数据库,包括:根据所述事件数据中包括的事件类型,从所述事件数据库中选择相应的子数据库;将所述事件数据写入选择的子数据库中。4.如权利要求3所述的方法,其特征在于,所述事件类型包括普通事件,所述普通事件是指检索过程中关注的属性中均不包括时间信息和空间信息的事件,所述事件数据库中与所述普通事件对应的子数据库包括第一列式数据库和索引数据库;所述将所述事件数据写入选择的子数据库中,包括:根据所述事件数据确定事件标识;将所述事件标识和所述事件数据中的事件的多个属性写入所述第一列式数据库中;将所述事件标识、所述事件数据中与事件关联的实体的标签和主键字段、和/或所述多个属性中的检索属性写入所述索引数据库中,所述检索属性是指用于检索事件的属性。5.如权利要求3所述的方法,其特征在于,所述事件类型包括时序事件,所述时序事件是指检索过程中关注的属性中包括时间信息但不包括空间信息的事件,所述事件数据库中与所述时序事件对应的子数据库包括时序数据库,所述时序数据库中包括时间序列数据表;所述将所述事件数据写入选择的子数据库中,包括:根据所述事件数据生成行键,所述行键中的监控项指示所述事件数据中的事件标签,所述行键中的时间戳指示所述事件数据中的时间信息,所述行键中的值指示所述事件数据
中统计的指标的监控结果,所述行键中的键值对指示所述事件数据中的其他属性;将所述行键写入所述时间序列数据表。6.如权利要求3所述的方法,其特征在于,所述事件类型包括时空事件,所述时空事件是指检索过程中关注的属性中包括空间信息的事件,所述事件数据库中与所述时空事件对应的子数据库包括时空数据库,所述时空数据库包括空间属性索引表、时间属性索引表以及普通属性索引表;所述将所述事件数据写入选择的子数据库中,包括:从所述事件数据中获取与所述空间属性索引表对应的空间索引字段、与所述时间属性索引表对应的时间索引字段、以及普通属性索引表对应的普通属性索引字段中的两者或多者;将所述事件数据写入所述时空数据库中的全量数据库中,将所述空间索引字段写入所述空间属性索引表,将所述时间索引字段写入所述时间属性索引表,将所述普通属性索引字段写入所述普通属性索引表,其中,所述时空数据库中配置有所述空间索引字段和所述事件数据之间的对应关系,所述时间索引字段和所述事件数据之间的对应关系,以及所述普通属性索引字段和所述事件数据之间的对应关系。7.如权利要求1所述的方法,其特征在于,所述在所述待存储数据为所述实体数据或所述关系数据的情况下,将所述待存储数据写入存储系统中的图数据库,包括:根据所述待存储数据确定实体或关系的标识;将所述待存储数据中的部分数据和所述实体或关系的标识写入所述图数据库,将所述待存储数据中的其他数据和所述实体或关系的标识写入第二列式数据库。8.一种检索数据的方法,其特征在于,所述方法包括:根据检索请求确定待检索的元素类型以及检索条件,所述元素类型包括实体、关系或事件,所述检索条件包括针对实体的检索条件和/或针对事件属性的检索条件;在所述元素类型为实体或关系的情况下,从存储系统中的图数据库中基于所述检索条件获取检索结果;在所述元素类型为事件的情况下...

【专利技术属性】
技术研发人员:吴镁姜伟浩
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1