一种基于事件图谱的事件链接压缩方法技术

技术编号:32647387 阅读:16 留言:0更新日期:2022-03-12 18:32
本发明专利技术公开了一种基于事件图谱的事件链接压缩方法,涉及数据处理领域,针对大量的相似事件型链接数据给图数据库带来存储压力的同时并没有提升实际业务价值,反而会导致查询性能的降低等问题,现提出如下方案,包括事件链接数据处理系统以及以下步骤:S1、所述事件链接数据处理系统构建数组A,并确定数组A中所需要保留的特征属性B,所述数组A包括头实体以及尾实体,所述头实体指向尾实体;S2、所述事件链接数据处理系统读取事件图谱中的所有事件链接C,并判断事件链接C的指向。本发明专利技术提出一种基于事件图谱的事件链接压缩方法,能够减少事件图谱的邻接关系数据体积,有效的降低存储资源的占用,极大的提升图谱数据查询性能。极大的提升图谱数据查询性能。极大的提升图谱数据查询性能。

【技术实现步骤摘要】
一种基于事件图谱的事件链接压缩方法


[0001]本专利技术涉及数据处理领域,尤其涉及一种基于事件图谱的事件链接压缩方法。

技术介绍

[0002]随着大数据时代的到来,知识工程受到了广泛关注,而如何从海量的数据中提取有用的知识,成为大数据分析的关键。知识图谱的概念由谷歌2012年正式提出,旨在实现更智能的搜索引擎。知识图谱本质上并不是一个新概念,它是一种语义网络的知识库,即具有有向图结构的一个知识库,其中图的顶点代表实体/概念,而图的边代表实体/概念之间的各种语义关系。知识图谱的来源于对海量的结构化数据和非结构或半结构化数据的挖掘和分析,根据基础数据语料集覆盖范围的不同,可分为通用知识图谱和特定领域的知识图谱。
[0003]挖掘分析得到图谱数据,通常用(头实体,关系,尾实体)的三元组形式表达事物的属性以及事物之间的语义关系,这种形式的数据很适合用图数据库进行存储和处理。其中,图谱实体之间的关系按其语义可分为描述某种状态是否成立的关系链接和描述实体之间交互事件的链接。在特定领域的知识图谱中,实体、关系型链接和事件型链接的数据量呈指数级上升的分布关系,给存储知识图谱的图数据库带来巨大的读写压力和资源消耗。
[0004]然而,特定领域的知识图谱中,某些事件型链接的主要应用价值在于其发生的事件和某一两个特征值,并且上层分析应用,在执行分析计算时通常只关心事件的该特征值的统计结果和分布情况。因此大量的相似事件型链接数据给图数据库带来存储压力的同时并没有提升实际业务价值,反而会导致查询性能的降低。
专利技术内容
[0005](一)专利技术目的
[0006]为解决
技术介绍
中存在的技术问题,本专利技术提出一种基于事件图谱的事件链接压缩方法,能够减少事件图谱的邻接关系数据体积,有效的降低存储资源的占用,极大的提升图谱数据查询性能。
[0007](二)技术方案
[0008]本专利技术提供了一种基于事件图谱的事件链接压缩方法,提供事件链接数据处理系统以及以下步骤:
[0009]S1、通过所述事件链接数据处理系统构建数组A,并确定数组A中所需要保留的特征属性B,所述数组A包括头实体以及尾实体,所述头实体指向尾实体;
[0010]S2、通过所述事件链接数据处理系统读取事件图谱中的所有事件链接C,并判断事件链接C的指向,对同一指向的事件链接C标识为事件链接D;
[0011]S3、通过所述事件链接数据处理系统遍历事件链接D,并提取具有特征属性B的事件链接D标识为事件链接E,去除不具有特征属性B的事件链接D,并记录事件链接E的频次F;
[0012]S4、通过所述事件链接数据处理系统提取事件链接E中除特征属性B的其他特征G,所述其他特征G包括事件链接E的发生时间H、中间时间I以及结束时间J,并对事件链接E进
行压缩,得到事件链接L;
[0013]S5、将事件链接L插入进数组A中,并从对应头实体指向对应尾实体,得到数组N。
[0014]S6、将多个所述数组N组合,得到压缩图谱M。
[0015]进一步而言:步骤S1中,所述头实体和尾实体为两个独立的账户,所述头实体为发起事件链接的账户,所述尾实体为接收事件链接的账户。
[0016]进一步而言:步骤S2中,所述事件链接D为同一头实体指向尾实体的事件链接C,所述事件链接D为事件链接C的子集。
[0017]进一步而言:步骤S3中,通过所述事件链接数据处理系统创建一个外部存储单元,不具有特征属性B的时间链接D储存在外部存储单元内。
[0018]进一步而言:步骤S4中,对所述其他特征G中的中间时间I进行删除,保留发生时间H以及结束时间J。
[0019]进一步而言:步骤S4中,所述频次F插入到所述事件链接L中,用于记录特征属性B的数量。
[0020]进一步而言:步骤S4中,在对事件链接E的压缩过程中,同一特征属性B的事件链接E被压缩成具有具有特征属性B以及发生时间H指向结束时间J的事件链接L。
[0021]进一步而言:步骤S5中,将事件链接L发出的账号与头实体相对应,将事件链接L接收的账号与尾实体相对应。
[0022]进一步而言:步骤S5中,所述数组N的内容包括事件链接L的指向、发生时间H与结束时间J、特征属性B以及频次F。
[0023]进一步而言:所述图谱M中的账户A在数组N1和数组N2中为头实体,在数组N3中为尾实体,所述账户B在数组数组N1和数组N2中为尾实体,在数组N3和数组N4中为头实体,所述账户C在数组N4中为尾实体。
[0024]与现有技术相比,本专利技术的上述技术方案具有如下有益的技术效果:
[0025]本专利技术通过以及对事件链接C、事件链接D、事件链接E以及事件链接L进行处理,将事件图谱中八个事件链接C压缩成图谱M中的四个数组N,在实际应用场景中的通常一份图谱数据中实体之间的事件链接C数量随着时间图谱覆盖时间范围的扩大而变大,整体压缩效果将会更好。本专利技术提出一种基于事件图谱的事件链接压缩方法,能够减少事件图谱的邻接关系数据体积,有效的降低存储资源的占用,极大的提升图谱数据查询性能。
附图说明
[0026]图1为数组A框架结构示意图;
[0027]图2为事件链接C框架结构示意图;
[0028]图3为事件链接D框架结构示意图;
[0029]图4为实施例一中事件链接E框架结构示意图;
[0030]图5为实施例二中事件链接E框架结构示意图;
[0031]图6为实施例一事件链接L框架结构示意图;
[0032]图7为实施例二中事件链接L框架结构示意图;
[0033]图8为数组N框架结构示意图;
[0034]图9为图谱M框架结构示意图。
具体实施方式
[0035]为使本专利技术的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本专利技术进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本专利技术的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本专利技术的概念。
[0036]通过图1

9所示,本专利技术提出的一种基于事件图谱的事件链接压缩方法,包括事件链接数据处理系统以及以下步骤:
[0037]S1、通过事件链接数据处理系统构建数组A,并确定数组A中所需要保留的特征属性B,数组A包括头实体以及尾实体,头实体指向尾实体,头实体和尾实体为两个独立的账户,头实体为发起事件链接的账户,尾实体为接收事件链接的账户;
[0038]S2、通过事件链接数据处理系统读取事件图谱中的所有事件链接C,并判断事件链接C的指向,对同一指向的事件链接C标识为事件链接D,事件链接D为同一头实体指向尾实体的事件链接C,事件链接D为事件链接C的子集;
[0039]S3、通过事件链接数据处理系统遍历事件链接D,并提取具有特征属性B的事件链接D标识为事件链接E,去除不具有特征属性B的事件链接D,并记录事件链接E的频次F,通过事件本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于事件图谱的事件链接压缩方法,提供事件链接数据处理系统,其特征在于,包括以下步骤:S1、通过所述事件链接数据处理系统构建数组A,并确定数组A中所需要保留的特征属性B,所述数组A包括头实体以及尾实体,所述头实体指向尾实体;S2、通过所述事件链接数据处理系统读取事件图谱中的所有事件链接C,并判断事件链接C的指向,对同一指向的事件链接C标识为事件链接D;S3、通过所述事件链接数据处理系统遍历事件链接D,并提取具有特征属性B的事件链接D标识为事件链接E,去除不具有特征属性B的事件链接D,并记录事件链接E的频次F;S4、通过所述事件链接数据处理系统提取事件链接E中除特征属性B的其他特征G,所述其他特征G包括事件链接E的发生时间H、中间时间I以及结束时间J,并对事件链接E进行压缩,得到事件链接L;S5、将事件链接L插入进数组A中,并从对应头实体指向对应尾实体,得到数组N。S6、将多个所述数组N组合,得到压缩图谱M。2.根据权利要求1所述的一种基于事件图谱的事件链接压缩方法,其特征在于:步骤S1中,所述头实体和尾实体为两个独立的账户,所述头实体为发起事件链接的账户,所述尾实体为接收事件链接的账户。3.根据权利要求1所述的一种基于事件图谱的事件链接压缩方法,其特征在于:步骤S2中,所述事件链接D为同一头实体指向尾实体的事件链接C,所述事件链接D为事件链接C的子集。4.根据权利要求1所述的一种基于事件图谱的事件链接压缩方法,其...

【专利技术属性】
技术研发人员:史晔翎
申请(专利权)人:南京微著信息科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1