基于结构化数据表的交互式图数据构建方法技术

技术编号：39663845 阅读：29 留言：0更新日期：2023-12-11 18:26

本发明专利技术公开了一种基于结构化数据表的交互式图数据构建方法，包括：获取包含多个数据表的原始数据；基于原始数据中的字段构建对应的节点实体和节点实例；将字段与对应的节点实体和节点实例组成图数据组件；根据用户选取的若干字段生成对应的图数据组件，并基于两个图数据组件之间的相似度匹配，以获得两个图数据组件之间边实体以及相应的边实例，将图数据组件下所有的节点实例与边实例输出至显示界面，以获得可视化的图数据

全部详细技术资料下载

【技术实现步骤摘要】
基于结构化数据表的交互式图数据构建方法、系统及装置

[0001]本专利技术属于图数据构建的
，尤其涉及一种基于结构化数据表的交互式图数据构建方法
、
系统及装置
。

技术介绍

[0002]图是一种常见的非线性数据结构，由节点和连接节点的边组成
。
在现实世界中，很多问题都可以通场景中的实体和关系抽象成图结构的方式进行分析
。
例如，在分析某个群体的社交网络时，将群体中的每个成员视为节点，成员之间的关系视为边，便可以得到该群体的单节点类型图结构；在电商分析场景中，将生产商
、
仓库
、
商品
、
门店
、
物流
、
顾客等实体抽象为节点，各种实体之间的交互关系抽象为边，便可以得到整个电商场景下的供应链图网络结构
。
得到图数据后，数据工作者可以非常方便地查询图中的节点和边，或者调用常见的图算法进行分析，例如最短路径算法
、
社团检测算法等
。
[0003]图数据的广泛应用催生了一批专门用于存储图数据的数据库，例如
Neo4j、JanusGraph、HugeGraph、TigerGraph、NebulaGraph
等
。
图数据库是一种非关系型数据库，它使用节点
、
边
、
属性来表示和存储图数据，与传统的关系型数据库相比，图数据库直接将图中的节点
、
节...

【技术保护点】

【技术特征摘要】
1.
一种基于结构化数据表的交互式图数据构建方法，其特征在于，包括：步骤
1、
获取包含多个数据表的原始数据，并提取每个数据表中所有字段以及字段下的数据项，将提取获得的字段
、
数据项以及所在数据表组成关系库；步骤
2、
根据目标字段创建对应的节点实体，并通过所述关系库检索目标字段所在的数据表以及数据表内其他字段，将其他字段作为属性添加至所述节点实体的
schema
，同时将所有字段下的数据项注入所述节点实体，以构建所述节点实体下的节点实例；步骤
3、
重复步骤2以构建原始数据中所有目标字段对应的节点实体与节点实例，以生成对应的图数据组件；步骤
4、
根据用户选取的若干字段生成对应的图数据组件，并基于两个图数据组件之间的相似度匹配，以获得两个图数据组件之间边实体以及相应的边实例，将图数据组件下所有的节点实例与边实例输出至显示界面，以获得可视化的图数据
。2.
根据权利要求1所述的基于结构化数据表的交互式图数据构建方法，其特征在于，所述节点实体的
schema
还包括实体主键
、
实体属性
、
实体颜色
、
实体大小
、
实体名称以及实体标签
。3.
根据权利要求1所述的基于结构化数据表的交互式图数据构建方法，其特征在于，所述两个图数据组件之间通过各自节点实体和对应节点实例中的属性值进行相似度匹配
。4.
根据权利要求3所述的基于结构化数据表的交互式图数据构建方法，其特征在于，所述相似度匹配采用文本相似度算法和字段值匹配算法，其具体过程如下：采用
word2vec
模型将两个节点实体中的属性名转化为对应的词向量；根据两个节点实体下所有属性名的词向量进行余弦相似度计算，筛选相似度高于阈值的词向量并降序排序，以获得第一匹配结果；筛选两个节点实体中存在相同字段值的属性，将其两两分组后计算每个分组内可匹配的相同字段值的数目占总字段值数目的比例，筛选出高于阈值的分组并降序排序，以获得第二匹配结果；根据第...

【专利技术属性】
技术研发人员：葛晓东，罗实，王永恒，巫英才，刘念，李炳强，周宇，
申请(专利权)人：之江实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人