一种异构数据的类型名称分配方法及系统技术方案

技术编号:13378470 阅读:73 留言:0更新日期:2016-07-21 07:28
本发明专利技术实施例公开了一种异构数据的类型名称分配方法及系统,该方法包括:读取原始异构数据,将所述原始异构数据分解成对象、属性和连接三类基本元素,并构建对象、属性和连接的三元模型,所述三元模型通过对象表、属性表及连接表来实现;为每一对象表分配至少一个对象类型名称,为每一属性表分配至少一个属性类型名称,及为每一连接表分配至少一个连接类型名称以实现原始数据与类型名称间的多对多的对应关系。解决原始数据在调用过程中由于类型名称不匹配导致出错的问题。

【技术实现步骤摘要】

本专利技术实施例涉及计算机应用领域,尤其涉及一种异构数据的类型名称分配方法及系统
技术介绍
随着信息化建设的推进与发展,许多企业、政府部门内部逐步实现了业务、信息的计算机管理,并将多种应用系统集中统一管理,来满足共享应用逻辑以及应用数据。但这些应用存在开发平台、操作系统、所采用的数据库管理系统等的差异,很难把他们集中起来进行分析和展现;查找和处理数据需要花费大量的时间和人力,进行有效信息的整理和传递工作显得非常困难,系统多样、信息分散等问题也就更为突显。通常,每一原始数据仅对应一个类型名称,在面对异构环境,如松散耦合、数据格式不同、跨平台、跨地域的分布环境时,为避免原始数据在调用过程中出错,往往需要将应用进行相应的手工修改,才能正常调用该类型名称对应的原始数据,因此大大降低信息传递的速度和信息处理效率。
技术实现思路
本专利技术实施例提供一种异构数据的类型名称分配方法及系统,以提高原始数据调用的效率。本专利技术实施例提供了一种异构数据的类型名称分配方法,包括:读取原始异构数据,将所述原始异构数据分解成对象、属性和连接三类基本元素,并构建对象、属性和连接的三元模型,所述三元模型通过对象表、属性表及连接表来实现;为每一对象表分配至少一个对象类型名称,为每一属性表分配至少一个属性类型名称,及为每一连接表分配至少一个连接类型名称以实现原始数据与类型名称间的多对多的对应关系。<br>本专利技术实施例提供了一种异构数据的类型名称分配系统,包括:数据处理模块,用于读取原始异构数据,将所述原始异构数据分解成对象、属性和连接三类基本元素,并构建对象、属性和连接的三元模型,所述三元模型通过对象表、属性表及连接表来实现;类型名称分配模块,用于为每一对象表分配至少一个对象类型名称,为每一属性表分配至少一个属性类型名称,及为每一连接表分配至少一个连接类型名称以实现原始数据与类型名称间的多对多的对应关系。本专利技术实施例通过读取原始异构数据,将所述原始异构数据分解成对象、属性和连接三类基本元素,并构建对象、属性和连接的三元模型,所述三元模型通过对象表、属性表及连接表来实现;为每一对象表分配至少一个对象类型名称,为每一属性表分配至少一个属性类型名称,及为每一连接表分配至少一个连接类型名称以实现原始数据与类型名称间的多对多的对应关系。由于本发明实施例可将分别为每一对象表、属性表及连接表分配多个类型名称,每个应用对应不同的类型名称,因此所述应用需要调用原始数据时,可通过与该应用适配的类型名称来进行查找并调用,以此来避免原始数据调用过程中的出错,从而提高原始数据的调用效率。附图说明图1是本专利技术实施例一提供的一种异构数据的类型名称分配方法的流程示意图;图2是本专利技术实施例一提供原始异构数据的结构示意图;图3是本专利技术实施例二提供的一种异构数据的类型名称分配系统的结构示意图。具体实施方式下面结合附图并通过具体实施方式来进一步说明本专利技术的技术方案。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各项步骤的顺序可以被重新安排。当其步骤完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。实施例一图1为本专利技术实施例一提供的一种异构数据的类型名称分配方法,该方法可以由异构数据的类型名称分配系统执行,其中该整合系统可由软件和/或硬件实现,一般可集成在计算机中。参见图1,本实施例的异构数据的类型名称分配方法包括如下步骤:步骤S110、读取原始异构数据,并将所述原始异构数据分解成对象、属性和连接三类基本元素,并构建对象、属性和连接的三元模型,所述三元模型通过对象表、属性表及连接表来实现。在信息社会,信息可以划分为两大类。一类信息能够用数据或统一的结构加以表示,我们称之为结构化数据,如数字、符号;而另一类信息无法用数字或统一的结构表示,如文本、图像、声音、网页等,我们称之为非结构化数据。结构化数据属于非结构化数据,是非结构化数据的特例。具体的,读取原始的异构数据,即将各种格式的结构化数据或非结构化数据读取并导入至计算机中以准备进行分解。其中,所述的结构化数据可以直接进行分解,而非结构化数据需要经过数据抽取、数据清洗后转换为结构化数据才能分解。所述结构化数据可参照图2所示,在数据库中,包括多个结构化数据,对象A、对象B及对象C对应的原始数据。优选的,在本实施例中,针对结构化数据或非结构化数据分别以如下方式进行读取及分解:读取原始结构化数据,并将所述原始结构化数据分解成对象、属性和连接三类基本元素,并构建对象、属性和连接的三元模型,所述三元模型通过对象表、属性表及连接表来实现;或读取原始非结构化数据,将所述原始非结构化数据经过数据抽取、数据清洗转换为结构化数据,将所述转换所得的结构化数据分解成对象、属性和连接三类基本元素,并构建对象、属性和连接的三元模型,所述三元模型通过对象表、属性表及连接表来实现。所述对象代表基本的数据单位,对应结构化数据的一个“行”。对象包括实体和事件两类,常见的实体如人物、组织、文档等,事件是指由实体参与的行为或活动,例如乘某一个架次的航班,某个号码的一次电话通话等。所述属性代表对象的具体信息,对应结构化数据的一个“行”数据的一个字段。每个对象由一组属性来表示,例如人物对象可以由姓名,电话号码,性别,出生日期,籍贯来表示,而一次打电话的行为可以用电话主叫方,电话被叫方,通话时间,通话时长来表示。所述连接代表对数据关联利用的基础,将属性值相同的两个对象建立连接。例如两个对象的某些属性相同时,则可以在所述两对象间建立一个连接,例如:人物的电话号码属性和打电话的电话主叫号码属性相同,人物对象和打电话事件对象之间就可以建立称为“电话主叫方”的连接。在分解成对象、属性和连接三类基本元素后,构建对象、属性和连接的三元模型,所述三元模型通过对象表、属性表及连接表来实现。具体的,在对象表中,无需保存关于这个对象的具体信息,只需保存关于<本文档来自技高网...

【技术保护点】
一种异构数据的类型名称分配方法,其特征在于,包括:读取原始异构数据,将所述原始异构数据分解成对象、属性和连接三类基本元素,并构建对象、属性和连接的三元模型,所述三元模型通过对象表、属性表及连接表来实现;为每一对象表分配至少一个对象类型名称,为每一属性表分配至少一个属性类型名称,及为每一连接表分配至少一个连接类型名称以实现原始数据与类型名称间的多对多的对应关系。

【技术特征摘要】
1.一种异构数据的类型名称分配方法,其特征在于,包括:
读取原始异构数据,将所述原始异构数据分解成对象、属性和连接三类基
本元素,并构建对象、属性和连接的三元模型,所述三元模型通过对象表、属
性表及连接表来实现;
为每一对象表分配至少一个对象类型名称,为每一属性表分配至少一个属
性类型名称,及为每一连接表分配至少一个连接类型名称以实现原始数据与类
型名称间的多对多的对应关系。
2.根据权利要求1所述的方法,其特征在于,还包括:
当接收到一个应用调用原始数据的指令时,依据所述指令包括的与所述应
用适配的对象类型名称、属性类型名称或连接类型名称查找对应的对象表、属
性表或连接表,再调用与所述对象表、属性表或连接表对应的原始数据。
3.根据权利要求1所述的方法,其特征在于,所述读取原始异构数据,将
所述原始异构数据分解成对象、属性和连接三类基本元素,并构建对象、属性
和连接的三元模型,所述三元模型通过对象表、属性表及连接表来实现,包括:
读取原始结构化数据,将所述原始结构化数据分解成对象、属性和连接三
类基本元素,并构建对象、属性和连接的三元模型,所述三元模型通过对象表、
属性表及连接表来实现;或
读取原始非结构化数据,将所述原始非结构化数据经过数据抽取、数据清
洗转换为结构化数据,将所述转换所得的结构化数据分解成对象、属性和连接
三类基本元素,并构建对象、属性和连接的三元模型,所述三元模型通过对象
表、属性表及连接表来实现。
4.根据权利要求1所述的方法,其特征在于:
所述对象代表基本的数据单位;
所述属性代表对象的具体信息;及
所述连接代表对数据关联利用的基础,将属性值相同的两个对象建立连接。
5.根据权利要求1所述的方法,其特征在于,其特征在于:
所述对象表存储有对象的标识、对象类型、创建时间及指针列表;
所述属性表存储有对象的每一个属性的属性类型、及属性值;
所述连接表存储有连接类型...

【专利技术属性】
技术研发人员:许中兴
申请(专利权)人:北京天广汇通科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1