一种知识驱动的企业信息管理方法、系统及存储介质技术方案

技术编号:29527310 阅读:24 留言:0更新日期:2021-08-03 15:13
本发明专利技术公开了一种知识驱动的企业信息管理方法、系统及存储介质,涉及人工智能技术领域;其中构建领域知识本体包含以下步骤:从数据源中抽取待分析数据;确定本体的领域和范围,构建数据字典;从待分析数据中抽取层次关系与非层次关系;对数据属性增加约束函数;从数据库中导入数据,创建个体;建立推理规则,进行知识推理,发掘并补全数据间关联。面向高新技术园区的企业管理需求,本发明专利技术通过构建的领域本体,实现园区内企业信息的快速查询、企业上报数据纠错、园区内企业关系建立,面向企业的精准招商与研判,并对园区内企业的发展前景进行预测;本发明专利技术可有效提高高新技术园区内企业管理效率,同时对园区内部分企业进行过滤。

【技术实现步骤摘要】
一种知识驱动的企业信息管理方法、系统及存储介质
本专利技术属于信息管理的
,特别是涉及一种知识驱动的企业信息管理方法、系统及存储介质。
技术介绍
随着人工智能技术和机器认知智能的飞速发展,高新技术产业园区对企业数据的管理需求由传统的存储需求上升为智能分析需求,对企业信息数据的查询速度、数据信息关联度、企业数据信息解读有了更高层次的要求。在传统的数据管理方法中,使用计算机解决问题主要采用数据驱动的方法,也就是从样本数据中建立统计模型,挖掘统计规律来解决问题。为了提高效果,数据驱动的方法通常需要较多样本数据。但是,即使样本数据量再大,单纯的数据驱动方法的效果也会受到限制,数据质量同样深刻的影响着数据驱动方法的应用,需要通过知识引导的方法突破数据驱动的“天花板”。
技术实现思路
本专利技术为解决上述
技术介绍
中存在的技术问题,通过本体建模的方式高新技术园区提供一种知识驱动的企业信息管理方法、系统及介质,有效提高园区内企业信息的快速查询、企业信息纠错、园区内企业关系计算出,并对园区内企业的发展前景进行预测,提高高新技术园区内企业管理效率。本专利技术采用以下技术方案:一种知识驱动的企业信息处理方法,包括:从数据库的原始数据(企业信息数据库、报表等)中提取待分析数据;构建数据字典,规范待分析数据中的数据本体的概念和语义;基于数据字典,从待分析数据中抽取层次关系和非层次关系;对数据本体的属性增加约束函数;导入数据库中的其他原始数据,经转换创建数据本体的个体实例;构建模型实现原始数据之间潜在关系的挖掘与补全。根据本专利技术的一个方面,所述构建数据字典是根据本体的范围和领域,罗列出本体中重要的概念,并将概念梳理成数据字典,确定概念的数据类型和取值范围。在进一步的实施例中,所述构建数据字典具体包括以下步骤:对待分析数据进行术语抽取;对抽取的数据进行语义分析;在语义分析后的数据中进行概念抽取,形成数据字典。根据本专利技术的一个方面,所述术语抽取的步骤具体包括:要对数据进行预处理,包括格式转换、去噪、分词、词性标注;采用统计或规则的方法从数据中提取候选术语,通过统计参数或规则过滤候选术语以获取领域术语列表。根据本专利技术的一个方面,所述语义分析采用LPIR-Parser大数据语义智能分析平台,实现精准采集,文档格式转换、新词发现、批量分词、语言统计、文本聚类、文本分类、摘要实体、智能过滤、情感分析、文档去重。根据本专利技术的一个方面,所述概念抽取,将领域文档集通过分词工具进行分词、词性标注,通过单字合并法得到一部分含有单字的概念集合,经领域专家审核后形成概念集合。在进一步的实施例中,所述层次关系表示:概念间的结构性上下层关系;所述非层次关系表示:除上下层关系外所有的其他关系。具体包括:因果关系、整体部分关系、序列关系、领域专有关系。在进一步的实施例中,对数据属性增加约束函数,增加约束函数是对概念的范围进行限制,使用手动的方式实现对数据属性约束函数的编辑。在进一步的实施例中,创建数据本体的个体实例具体包括:建议原始数据与数据本体之间的映射,导入个体实例。具体包括:将存储在数据库中的数据转换为RDF数据,建立数据库文件到定义好的本体之间的映射。在进一步的实施例中,构建模型具体包括:在已经建立的数据本体基础上,从数据库中显式包含的知识推导出隐含表示的知识,对有空缺值的数据进行补全,或者根据客户需求对指定项目进行知识挖掘。具体包括:根据企业的财务,人力等显式包含的知识,计算出出企业的经营状况、企业规模、企业发展态势。一种知识驱动的企业信息处理系统,包括:第一模块,所述第一模块被设置为从数据库的原始数据中提取待分析数据;第二模块,所述第二模块被设置为构建数据字典,规范待分析数据中的数据本体的概念和语义;第三模块,被设置为基于数据字典,从待分析数据中抽取层次关系和非层次关系;第四模块,被设置为对数据本体的属性增加约束函数;导入数据库中的其他原始数据,经转换创建数据本体的个体实例;第五模块,被设置为构建模型实现原始数据之间潜在关系的挖掘与补全。有益效果:大幅提高园区内企业信息的管理效率、管理质量,有效实现园区内企业信息纠错、企业发展前景预测,有利于推动园区内企业内循环合作,改善园区内合作环境;通过对园区内企业信息的建模已经知识计算出,解决了园区对企业真实运作情况进行监控把握的问题,为如何调整园区内企业扶持政策提供了依据与决策建议。附图说明图1是根据本专利技术实施例的本体建模流程图。图2是根据本专利技术实施例的本体建模流程中数据字典构建流程图。图3是根据本专利技术实施例的本体可视化图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供一种知识驱动的企业信息处理方法,包括:从数据库的原始数据(企业信息数据库、报表等)中提取待分析数据;构建数据字典,规范待分析数据中的数据本体的概念和语义;基于数据字典,从待分析数据中抽取层次关系和非层次关系;对数据本体的属性增加约束函数;导入数据库中的其他原始数据,经转换创建数据本体的个体实例;构建模型实现原始数据之间潜在关系的挖掘与补全。在一个实施例中,从数据源中抽取待分析数据,使用数据仓储技术ETL(ExtractionTransformationLoading)技术从分散在不同地区、种类繁多的异构数据源中进行数据整合,获取待治理数据。在一个实施例中,确定本体的领域和范围,构建数据字典;构建数据字典是用于存储有关数据的来源、说明、与其他数据的关系、用途和格式等信息,目的是为了提高开发效率,促进数据共享,控制数据的使用。在一个实施例中,抽取层次关系与非层次关系;关系抽取是将非结构化或半结构化描述的自然语言文本转化成结构化数据,关系抽取主要负责从文本中识别出实体,抽取实体间的语义关系。在另一个实施例中,层次关系表示概念间的结构性上下层关系,非层次关系是除上下层关系外所有的其他关系,具体包括:因果关系、整体部分关系、序列关系、领域专有关系。在一个实施例中,对数据属性增加约束函数;设置约束函数的目的是描述个体之间的关系,基本关系包括:函数关系、逆函数关系、传递关系、逆传递关系、对称关系、反对称关系、自反性关系、非自反性关系、否定关系。在一个实施例中,从数据库中导入数据,创建个体;创建个体是建立数据库数据与本体之间的映射,导入实例,具体包括:将存储在数据库中的数据转换为RDF数据,建立数据库文件到本专利技术中已经建立好的本体之间的映射本文档来自技高网...

【技术保护点】
1.一种知识驱动的企业信息处理方法,其特征在于,包括:/n从数据库的原始数据中提取待分析数据;/n构建数据字典,规范待分析数据中的数据本体的概念和语义;/n基于数据字典,从待分析数据中抽取层次关系和非层次关系;/n对数据本体的属性增加约束函数;导入数据库中的其他原始数据,经转换创建数据本体的个体实例;/n构建模型实现原始数据之间潜在关系的挖掘与补全。/n

【技术特征摘要】
1.一种知识驱动的企业信息处理方法,其特征在于,包括:
从数据库的原始数据中提取待分析数据;
构建数据字典,规范待分析数据中的数据本体的概念和语义;
基于数据字典,从待分析数据中抽取层次关系和非层次关系;
对数据本体的属性增加约束函数;导入数据库中的其他原始数据,经转换创建数据本体的个体实例;
构建模型实现原始数据之间潜在关系的挖掘与补全。


2.根据权利要求1所述的一种知识驱动的企业信息处理方法,其特征在于,
构建数据字典是依据数据本体的范围和领域构建而成。


3.根据权利要求2述的一种知识驱动的企业信息处理方法,其特征在于,
所述构建数据字典具体包括以下步骤:
对待分析数据进行术语抽取;
对抽取的数据进行语义分析;
在语义分析后的数据中进行概念抽取,形成数据字典。


4.根据权利要求1所述的一种知识驱动的企业信息处理方法,其特征在于,
所述层次关系表示:概念间的结构性上下层关系;
所述非层次关系表示:除上下层关系外所有的其他关系。


5.根据权利要求1所述的一种知识驱动的企业信息处理方法,其特征在于,
增加约束函数是对概念的范围进行限制,使用手动的方式实现对数据属性约...

【专利技术属性】
技术研发人员:王铁鑫孙进宇李成
申请(专利权)人:南京德奈特系统科技有限责任公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1