生成关系数据转换为RDF格式数据的映射规则的方法和装置制造方法及图纸

技术编号:13105640 阅读:80 留言:0更新日期:2016-03-31 11:54
本发明专利技术涉及数据库,其提供了一种生成关系型数据转换为RDF格式数据的映射规则的方法和装置,该方法包括:获取第一关系型数据库中的关系数据转换为RDF格式数据的第一映射规则,其中所述第一映射规则的URI模式表达了第一关系型数据库中的关系数据的特征;解析所述第一映射规则的URI模式的生成规则;确定所述第二关系型数据库的第二关系模型与所述第一关系型数据库的第一关系模型符合模式匹配;根据所述生成规则和所述第一关系模型和第二关系模型的模式匹配的映射关系生成第二关系型数据库的所述关系数据转换为RDF格式数据的第二映射规则。按照该方法的映射规则生成的URI能够表达RDF格式数据的特征,更符合用户期望的效果。

【技术实现步骤摘要】

本专利技术涉及数据库,更具体地,涉及生成关系数据转换为RDF格式数据的映射规 则的方法和装置。
技术介绍
语义网是由万维网之父Tim Berners-Lee在1998年提出的一个概念。语义网 的核必是让计算机能力理解文档中的数据和数据之间的关联关系,从而使得计算机可W 自动的处理语义网上的信息。语义网的愿景是将全球的数据发布并关联起来。语义网采 用畑F(resource description framework,资源描述框架)来描述数据。畑F的基本思想 是:(1)将一切可W在Web上标识的事物(具体的或抽象的,存在的或不存的)统称为"资 源";似用URI (Universal Resource Identifier,通用资源标识)来标识资源;(3)用属 性(propedy)和属性值来描述资源。在RDF中任何表达式的基本结构是一个Η元组的 集合,每个Η元组由主语,谓语和宾语构成。主语对应于资源,是可拥有URI的任何事物, 比如http://化pedia. org/resource/化ina ;谓语对应于属性,是拥有名称的资源,比如 author, firstname ;宾语对应于属性值,可W是字符串或者另外一个资源,比如david或者 http://dbpeida. org/resource/United_States。 随着语义网的快速发展,越来越多的数据提供者和Web应用开发者将数据发布成 RDF的形式,并且与其他数据源关联起来,形成巨大的关联数据网络化inked data)。比如 W化ipedia被发布成DBpedia,IMDB数据集,GeoSpacial数据集都被发布成畑F。迄今为止, linked data上共有6化illions的Η兀组。 不仅仅是化blic Web,随着企业2.0的到来,企业内部也迫切需要越来越多的数 据与Web上的数据关联,从而构建更好的应用与服务。而现有的数据,尤其是企业内部的 数据,大多数存在于关系型数据库中,因此,我们需要一个工具将关系型数据发布成RDF数 据。目前已经存在将关系数据发布成RDF数据的工具,例如D2R是使用最广泛的工具,它包 括D2R服务器,D2RQ引擎和D2RQ映射语言,D2RQ映射语言的主要功能是定义将关系型数据 转换成RDF格式的映射规则。然而,根据映射规则自动生成的URI没有任何含义,不能表达 关系型数据的特征,需要人工手动修改映射规则,按照修改后的映射规则能够表达关系型 数据的特征,然而对于复杂的关系型数据库,通常包含上千个映射规则,修改映射规则通常 需要大量繁琐的人工劳动。 因此需要一种自动生成将关系数据转换成RDF格式数据的映射规则的方法。
技术实现思路
根据本专利技术的一个方面,提供了生成关系数据转换为RDF格式数据的映射规则的 方法,包括:获取第一关系型数据库中的关系数据转换为RDF格式数据的第一映射规则,其 中所述第一映射规则的URI模式表达了第一关系型数据库中的关系数据的特征;解析所述 第一映射规则的URI模式的生成规则;确定所述第二关系型数据库的第二关系模型与所述 第一关系型数据库的第一关系模型符合模式匹配;根据所述生成规则和所述第一关系模型 和第二关系模型的模式匹配的映射关系生成第二关系型数据库的所述关系数据转换为RDF 格式数据的第二映射规则。 根据本专利技术的另一个方面,提供了生成关系数据转换为RDF格式数据的映射规则 的装置,包括:获取模块,被配置为获取第一关系型数据库中的关系数据转换为RDF格式数 据的第一映射规则,其中所述第一映射规则的URI模式表达了第一关系型数据库中的关系 数据的特征;解析模块,被配置为解析所述第一映射规则的URI模式的生成规则;第一确定 模块,被配置为确定所述第二关系型数据库的第二关系模型与所述第一关系型数据库的第 一关系模型符合模式匹配;生成模块,被配置为根据所述生成规则和所述第一关系模型和 第二关系模型的模式匹配的映射关系生成第二关系型数据库的所述关系数据转换为RDF 格式数据的第二映射规则。 根据本专利技术实施例的生成关系数据转换为RDF格式数据的映射规则的方法和装 置,自动生成的映射规则能够表达由关系数据库中的关系数据转化的RDF格式数据的特 征,按照该映射规则生成的URI,用户可W很容易的知道所对应的RDF数据的关键特征和信 息。该映射规则更符合用户期望的效果,减轻了用户对自动生成的映射规则修改的工作。【附图说明】 通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述W及其 它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号 通常代表相同部件。 图1示出了适于用来实现本专利技术实施方式的示例性计算机系统/服务器12的框 图。 图2示出根据本专利技术实施例的生成关系型数据转换为RDF格式数据的映射规则的 方法。 图3示出根据本专利技术实施例的解析所述第一映射规则的URI模式的生成规则的方 法。 图4示出根据本专利技术实施例的生成第二关系型数据库的所述关系数据转换为RDF 格式数据的第二映射规则的方法。 图5示出根据本专利技术实施例的生成关系型数据转换为RDF格式数据的映射规则的 装置500。【具体实施方式】 下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开 的优选实施方式,然而应该理解,可W W各种形式实现本公开而不应被送里阐述的实施方 式所限制。相反,提供送些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的 范围完整地传达给本领域的技术人员。 图1示出了适于用来实现本专利技术实施方式的示例性计算机系统/服务器12的框 图。图1显示的计算机系统/服务器12仅仅是一个示例,不应对本专利技术实施例的功能和使 用范围带来任何限制。 如图1所示,计算机系统/服务器12 W通用计算设备的形式表现。计算机系统 /服务器12的组件可W包括但不限于;一个或者多个处理器或者处理单元16,系统存储器 28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。 总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器, 外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举 例来说,送些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC) 总线,增强型ISA总线、视频电子标准协会(VESA)局域总线W及外围组件互连(PCI)总线。 计算机系统/服务器12典型地包括多种计算机系统可读介质。送些介质可W是 任何能够被计算机系统/服务器12访问的可用介质,包括易失性和非易失性介质,可移动 的和不可移动的介质。 系统存储器28可W包括易失性存储器形式的计算机系统可读介质,例如随机存 取存储器(RAM) 30和/或高速缓存存储器32。计算机系统/服务器12可W进一步包括其 它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34 可W用于读写不可移动的、非易失性磁介质(图1未显示,通常称为"硬盘驱动器")。尽管 图1中未示出,可W提供用于对可移动非易失性磁盘(例如"软盘")读写的磁盘驱动器, W及对可移动非易失性光盘(例如CD-ROM, DVD-ROM或者其本文档来自技高网
...

【技术保护点】
一种生成关系数据转换为RDF资源描述框架格式数据的映射规则的方法,包括:获取第一关系型数据库中的关系数据转换为RDF格式数据的第一映射规则,其中所述第一映射规则的URI通用资源标识模式表达了第一关系型数据库中的关系数据的特征;解析所述第一映射规则的URI模式的生成规则;确定所述第二关系型数据库的第二关系模型与所述第一关系型数据库的第一关系模型符合模式匹配;以及根据所述生成规则和所述第一关系模型和第二关系模型的模式匹配的映射关系生成第二关系型数据库的所述关系数据转换为RDF格式数据的第二映射规则。

【技术特征摘要】

【专利技术属性】
技术研发人员:蔡鹏曹锋倪渊祝慧佳
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1