用于确定要被物化的节点的方法和系统技术方案

技术编号:5086318 阅读:224 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及数据库查询及规则推理系统,尤其涉及确定推理系统中要被物化的规则谓词的技术。本发明专利技术提供了一种用于确定要被物化的规则谓词的方法,包括:获取规则谓词的不包含强连通子图的依赖关系图,所述依赖关系图指示所述规则谓词间的依赖关系;计算所述依赖关系图中的节点的更新频率;计算所述依赖关系图中的节点的查询频率;根据所述查询频率和更新频率计算所述节点的实时查询代价值和物化代价值;以及根据所述节点的实时查询代价值与物化代价值的差值,确定要被物化的节点,所述要被物化的节点所对应的规则谓词是要被物化的规则谓词。通过本发明专利技术的方法和系统,可以实现在构建有规则谓词的关系数据推理系统中进行查询时,既节约实时查询的结果返回时间,又减少数据更新的影响的技术效果。

【技术实现步骤摘要】

本专利技术涉及数据库查询及规则推理系统,尤其涉及确定推理系统中要被物化的节 点的技术。
技术介绍
随着关系数据库技术的发展,大量的数据以关系表的形式存储在数据库中。如何 有效的应用这些数据已经成为数据管理领域进一步的发展方向。在商业智能的应用中,企 业需要对现有的数据进行处理和分析,以帮助企业做出明智的业务经营决策。关系数据库 上所支持的基本的查询不能回答一些决策支持中复杂的问题,而且数据的组织是针对底层 的存储而非上层的应用。举例而言,数据库的基本表中只定义了关于“客户(customer)”和 “保险合同(contract) ”的基本表,而在这些基本表上又定义了一些规则,比如“什么样的客 户属于高价值客户(high value customer) ”,或者“什么样的保险合同属于不良保险合同 (unhealthy contract) 那么当企业想根据数据库系统中的数据查询“高价值客户(high value customer)”或者“不良保险合同(unhealthy contract) ”时,由于数据库的基本表中 没有“高价值客户(high value customer) ”或者“不良保险合同(unhealthy contract)” 的数据项,因此关系数据库就无法查询这些非直观的概念,而必须借助推理系统才能够很 好地解决这个问题。推理系统的基础是基于规则的一阶逻辑(又称数理逻辑)。通过在关 系数据上引入逻辑操作,灵活的扩展了关系数据,并支持更加复杂的查询。在推理系统中,用户在关系数据上通过规则定义新的谓词(Predicate)。可以独 立存在的客体(句子中的主语、宾语等)称为客体词或个体词andividual),而谓词是指 用以刻画客体的性质或客体之间的关系的词(Predicate)。上段文字中的基本表可以称作 基本谓词(Basic Predicate),而在基本表(基本谓词)之上定义的规则可以称作规则谓词 (Rule Predicate) 0因为对规则定义的谓词的查询无法直接调用数据库中的查询语言,这 就要求系统要有推理的能力来处理规则中的逻辑关系。目前现有技术中实现推理的方法有两种,实时(Runtime)推理和基于物化 (Materialization)的推理。所谓实时推理,是指推理在实时查询的时候进行。所谓基于物 化(Materialization)的推理,是指预先计算出所有的推理结果并将其存在关系表中。这 两种推理方法各有优劣。具体而言,前者的优点是无需事先计算推理结果,不受数据更新的 影响,而其缺点是,由于要在接收到查询请求后必须先做推理才能返回查询结果,因此回答 查询的时间较长。后者的优点是在实时数据查询的过程中不用计算推理结果,而可以直接 利用预先计算的推理结果获得查询结果,因此节省了实时查询的结果返回时间。但是其缺 点是面临数据更新的问题,也就是说,当数据更新时,预先计算出的推理结果即必须重新计 笪弁。
技术实现思路
考虑到单纯地依靠现有技术中的实时推理方法或者基于物化的推理方法中的任一种,都不能很好地实现既节约实时查询的结果返回时间,又不受数据更新的影响的技术 效果,本专利技术提供了一种用于确定要被物化的节点的方法和系统,以便克服现有技术中的 问题。本专利技术的构思是基于下面的考虑采取一种新的混合推理的模式,通过代价模型选出 应当被物化的那些规则谓词(应当被物化的那些规则谓词是全体规则谓词中的一部分或 全部),并物化那些规则谓词的推理结果,从而使推理系统既可提高查询的效率,又可以有 效的控制更新所带来的维护操作。如果将基于混合推理模式的推理引擎引入到现有的商业 智能软件中,将使系统的性能得到显著提高。根据本专利技术的一个方面,提供了一种用于确定要被物化的规则谓词的方法,包括 获取规则谓词的不包含强连通子图的依赖关系图,所述依赖关系图指示所述规则谓词间的 依赖关系;计算所述依赖关系图中的节点的更新频率;计算所述依赖关系图中的节点的查 询频率;根据所述查询频率和更新频率计算所述节点的实时查询代价值和物化代价值;以 及根据所述节点的实时查询代价值与物化代价值的差值,确定要被物化的节点,所述要被 物化的节点所对应的规则谓词是要被物化的规则谓词。在本专利技术的一个实施方式中,所述用于确定要被物化的节点的方法还包括获取 所述规则谓词的原始依赖关系图;以及用伪节点替换所述原始依赖关系图中的强连通子 图,以获取规则谓词的不包含强连通子图的依赖关系图。根据本专利技术的另一方面,提供了一种用于确定要被物化的规则谓词的系统,包括 依赖关系图获取装置,用于获取规则谓词的不包含强连通子图的依赖关系图,所述依赖关 系图指示所述规则谓词间的依赖关系;更新频率计算装置,用于计算所述依赖关系图中的 节点的更新频率;查询频率计算装置,用于计算所述依赖关系图中的节点的查询频率;代 价值计算装置,用于根据所述查询频率和更新频率计算所述节点的实时查询代价值和物化 代价值;以及物化确定装置,用于根据所述节点的实时查询代价值与物化代价值的差值,确 定要被物化的节点,所述要被物化的节点所对应的规则谓词是要被物化的规则谓词。在本专利技术的一个实施方式中,所述依赖关系图获取装置被进一步配置为获取所 述规则谓词的原始依赖关系图;以及用伪节点替换所述原始依赖关系图中的强连通子图, 以获取规则谓词的不包含强连通子图的依赖关系图。通过本专利技术的方法和系统,可以选择性地应用实时推理方法和物化推理方法对建 立于关系数据库的基本谓词之上的规则谓词进行推理,实现在构建有规则谓词的关系数据 推理系统中进行查询时,既节约实时查询的结果返回时间,又减少数据更新的影响的技术 效果。附图说明通过对结合附图所示出的实施方式进行详细说明,本专利技术的上述以及其他特征将 更加明显,本专利技术附图中相同的标号表示相同或相似的部件。在附图中,图1示出了根据本专利技术一实施方式的用于确定要被物化的节点的的方法的流程 图;图2示出了根据本专利技术另一实施方式的用于确定要被物化的节点的方法的流程 图;图3A至图;3B示出了根据本专利技术一实施方式的计算节点的更新频率的示意图;6图4A至图4B示出了根据本专利技术一实施方式的计算节点的查询频率的示意图;图5A至图5F示出了根据本专利技术一实施方式的确定要被物化的节点的实例;图6示出了根据本专利技术一实施方式的确定要被物化的节点的系统的框图。具体实施例方式在下文中,将参考附图通过实施方式对本专利技术提供的用于确定要被物化的节点的 方法和系统进行详细地描述。图1示出了根据本专利技术一实施方式的用于确定要被物化的节点的方法的流程图。 在图1中,步骤从101开始,获取规则谓词的依赖关系图(D印endency Graph)。依赖关系 图指示了推理系统中的规则谓词彼此间的依赖关系。举例而言,如果定义规则谓词“不良保 险合同”是指付款逾期超过3个月的“欠款保险合同”,并且定义规则谓词“欠款保险合同” 是指付款状态为“未付款”的“保险合同”,而“保险合同”则是关系数据库中已经定义的基 本谓词(基本表)。“保险合同”这个基本谓词(基本表)中包含若干列,如签订日期、客户 名称、付款状态等。在这个例子下,根据所定义的规则可以看出,规则谓词“不良保险合同” 是依赖于规则谓词“欠款保险合同”的,这样的一种依赖关本文档来自技高网
...

【技术保护点】
一种用于确定要被物化的规则谓词的方法,包括:获取规则谓词的不包含强连通子图的依赖关系图,所述依赖关系图指示所述规则谓词间的依赖关系;计算所述依赖关系图中的节点的更新频率;计算所述依赖关系图中的节点的查询频率;根据所述查询频率和更新频率计算所述节点的实时查询代价值和物化代价值;以及根据所述节点的实时查询代价值和物化代价值,确定要被物化的节点,所述要被物化的节点所对应的规则谓词是要被物化的规则谓词。

【技术特征摘要】

【专利技术属性】
技术研发人员:孙行智徐林昊潘越
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1