一种结构化数据的知识抽取方法技术

技术编号：31230046 阅读：15 留言：0更新日期：2021-12-08 10:00

本发明专利技术公开了一种结构化数据的知识抽取方法，包括下列步骤：S1、构件抽取组件；S2、按照每条抽取规则指定的表格，构造一种字典数据结构，其中键为表格ID，值为对应表格的一组抽取组件；S3、遍历步骤S2中构造的字典，对于每个键值对，基于键构造数据库连接，获取表格数据，然后将这些数据逐条发送给当前键对应的抽取组件；S4、抽取组件对接收的数据进行处理，依次进行全局唯一ID、业务标识ID、类型、属性信息抽取；S5、对于节点抽取组件和关系抽取组件进行进一步抽取。有益效果：可用于构建知识图谱，有良好的扩展性和自适应能力，能够满足多源异构数据的知识抽取需要。数据的知识抽取需要。数据的知识抽取需要。

全部详细技术资料下载

【技术实现步骤摘要】
一种结构化数据的知识抽取方法

[0001]本专利技术涉及信息抽取领域，具体来说，涉及一种结构化数据的知识抽取方法。

技术介绍

[0002]在大数据时代，互联网及各类信息系统中存储了海量的多种类型的数据，如何有效地利用这些数据、挖掘数据价值，成为各行业探索的重要话题。随着人工智能技术逐步应用，知识图谱作为人工智能的核心技术，逐步受到重视。
[0003]作为知识图谱构建的关键步骤，知识抽取是从各种形式数据中提取知识元素的过程。针对结构化数据，一般采用定制开发的方法进行知识抽取，但缺乏扩展性和自适应能力，不能满足多源异构数据的知识抽取需要。
[0004]针对相关技术中的问题，目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术的目的在于提供一种结构化数据的知识抽取方法，以解决上述
技术介绍
中提出的问题。
[0006]为实现上述目的，本专利技术提供如下技术方案：
[0007]一种结构化数据的知识抽取方法，包括下列步骤：
[0008]S1、构件抽取组件；
[0009]S2、按照每条抽取规则指定的表格，构造一种字典数据结构，其中键为表格ID，值为对应表格的一组抽取组件；
[0010]S3、遍历步骤S2中构造的字典，对于每个键值对，基于键构造数据库连接，获取表格数据，然后将这些数据逐条发送给当前键对应的抽取组件；
[0011]S4、抽取组件对接收的数据进行处理，依次进行全局唯一ID、业务标识ID、类型、属性信息抽取；
[0012]S...

【技术保护点】

【技术特征摘要】
1.一种结构化数据的知识抽取方法，其特征在于，包括下列步骤：S1、构件抽取组件；S2、按照每条抽取规则指定的表格，构造一种字典数据结构，其中键为表格ID，值为对应表格的一组抽取组件；S3、遍历步骤S2中构造的字典，对于每个键值对，基于键构造数据库连接，获取表格数据，然后将这些数据逐条发送给当前键对应的抽取组件；S4、抽取组件对接收的数据进行处理，依次进行全局唯一ID、业务标识ID、类型、属性信息抽取；S5、对于节点抽取组件和关系抽取组件进行进一步抽取；S6、重复执行上述步骤S4和步骤S5，直到所有抽取组件处理完成，每个抽取组件的结果发送给会话管理器；S7、重复执行上述步骤S3，直到所有表格数据处理完成；S8、从会话管理器中收集所有结果数据，作为结果进行...

【专利技术属性】
技术研发人员：陈波，姚建林，余智华，
申请(专利权)人：中科天玑数据科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人