在关系数据库中组织数据记录的方法和设备技术

技术编号：7718677 阅读：275 留言：0更新日期：2012-08-30 02:48

本发明专利技术的实施方式提供了用于在关系数据库中组织数据记录的方法和设备，其中该方法包括：为多个数据记录分别建立索引项，其中每个索引项包括计数器；对于受到随机访问的数据记录，更新相应索引项中的计数器的数值；以及基于多个计数器的数值，重组所述多个数据记录。利用本发明专利技术的实施方式的方法和设备，可以有效地提高加载数据记录的缓冲池的命中率而不影响对数据记录的顺序访问和插入操作的性能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术的各实施方式涉及数据记录的处理，并且更具体地涉及在关系数据库中组织数据记录的方法、设备和相关计算机程序产品。
技术介绍
当前已经开发了许多数据管理系统来对数据记录进行有效地访问和组织。在这些数据管理系统中，关系数据库是企业级市场中占主导地位的数据管理系统。随着访问的数据量的不断増加，对该关系数据库的性能要求也变得越来越高。以大型银行的银行卡业务为例，由于使用银行卡的客户众多，每天关系数据库可能需要处理数以百万计的在线交易处理(简称“0LTP”)，例如对账户信息的查询和更新。通过分析这些事务，可以发现关系数据库的性能瓶颈通常在于将账户信息加载进存储器(所谓的缓冲池)时的同步I/O操作。因此，如何有效提高缓冲池的命中率以便改进访问数据的效率是克服这ー性能瓶颈的关键。另外，现有的数据组织策略是将数据记录以数据页为最小单位进行组织。尽管随机数据访问通常仅需要读取或写入ー个数据记录，但关系数据库不得不将整个数据页加载进缓冲池。这样，可能许多内存将被分配给不常被访问的数据记录，这无疑造成了缓冲池的浪费，从而降低了缓冲池的命中率。为了提高缓冲池的命中率，已经提出了如下的多种可能解决方案，其中包括I)数据预取机制，该机制将所需的数据记录预先加载到缓冲池中。然而，由于该数据预取机制要求数据库的优化器预先知道数据访问的模式，而对于如上所述的账户信息查询和更新的数据访问情形来说，由于下一次的数据访问行为(可以称之为随机数据访问)很难预测，优化器无法预先准确知道数据访问的模式，因此改进此类的随机数据访问性能仍是ー个巨大的挑战。2)增加缓冲池大小或优化缓冲池。通过增加加...

【技术保护点】

【技术特征摘要】
1.一种用于在关系数据库中组织数据记录的方法，包括为多个数据记录分别建立索引项，其中每个索引项包括计数器；对于受到随机访问的数据记录，更新相应索引项中的计数器的数值；以及基于多个计数器的数值，重组所述多个数据记录。2.根据权利要求I所述的方法，其中重组所述多个数据记录包括将所述多个数据记录安排到相应的物理分区。3.根据权利要求I所述的方法，还包括根据随机访问的预定限制条件、在未设有计数器的索引项中增加计数器。4.根据权利要求I所述的方法，其中基于多个计数器的数值，重组所述多个数据记录还包括定期归档所述多个计数器的数值，以便根据所述多个计数器的历史数值，重组所述多个数据记录。5.根据权利要求I所述的方法，其中基于多个计数器的数值，重组所述多个数据记录还包括响应于所述多个计数器的数值达到预定阈值，归档所述多个计数器的数值，以便根据所述多个计数器的历史数值，重组所述多个数据记录。6.根据权利要求I到5的任意一项所述的方法，其中重组所述多个数据记录基于以下至少ー项所述多个计数器的至少ー个阈值；以及所述多个计数器的至少ー个数值区间分配比例。7.根据权利要求I到5的任意一项所述的方法，其中重组所述多个数据记录是利用聚类算法进行的。8.一种用于在...

【专利技术属性】
技术研发人员：魏可伟，傅毓勤，杨新颖，周祥，周婧，张建伟，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人