The invention discloses a method and apparatus, and data file LSM tree structure in which data file records with a plurality of data pairs stored in the LSM tree structure in the data entry and element information items; the method comprises the following steps: according to a data item in a data file, find the data entries corresponding to the element information item in the cache; if the cache did not find the data entry corresponding to the element information items, in the data file to find the data entry corresponding to the element information item, corresponding to the data items in the data file and will find the element information item according to the write cache; data entry corresponding to the element information items, to determine whether the data entry should retain data entry, if not, delete the data items in the data file merging process. According to the technical proposal provided by the invention, the speed of searching the meta information article is accelerated, the efficiency of the combined data file is effectively improved, and the method of merging the data file is optimized.
【技术实现步骤摘要】
本专利技术涉及互联网
,具体涉及一种LSM-tree结构中数据文件的合并方法及装置。
技术介绍
LSM-tree(日志结构的合并树,Log-StructuredMerge-Tree)通过批量存储技术规避了磁盘随机写入问题,大幅度地提高了写性能。具体地,可利用LSM-tree来存储数据条目和元信息条目。在LSM-tree结构中,通过数据文件来记录数据条目和元信息条目。当需要对数据文件进行合并时,针对数据文件中的每一条数据条目,都需要在数据文件中查找该数据条目对应的元信息条目,然后根据该数据条目对应的元信息条目来确定该数据条目是否为在合并过程中应该保留的数据条目。因此,现有技术中的这种合并方式存在着效率低下的问题。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的LSM-tree结构中数据文件的合并方法及装置。根据本专利技术的一个方面,提供了一种LSM-tree结构中数据文件的合并方法,数据文件中记录有若干个以数据键值对形式存储在LSM-tree结构中的数据条目和元信息条目,该方法包括:针对数据文件中的一条数据条目,在缓存中查找该数据条目对应的元信息条目;若在缓存中未查找到该数据条目对应的元信息条目,则在数据文件中查找该数据条目对应的元信息条目,并将在数据文件中查找到的该数据条目对应的元信息条目写入缓存;根据数据条目对应的元信息条目,确定数据条目是否为应该保留的数据条目,若否,则在数据文件合并过程中删除数据条目。根据本专利技术的另一方面,提供了一种LSM-tree结构中数据文件的合并装置,数据文件中记录有若干 ...
【技术保护点】
一种LSM‑tree结构中数据文件的合并方法,所述数据文件中记录有若干个以数据键值对形式存储在LSM‑tree结构中的数据条目和元信息条目,所述方法包括:针对数据文件中的一条数据条目,在缓存中查找该数据条目对应的元信息条目;若在所述缓存中未查找到该数据条目对应的元信息条目,则在数据文件中查找该数据条目对应的元信息条目,并将在数据文件中查找到的该数据条目对应的元信息条目写入缓存;根据数据条目对应的元信息条目,确定所述数据条目是否为应该保留的数据条目,若否,则在数据文件合并过程中删除所述数据条目。
【技术特征摘要】
1.一种LSM-tree结构中数据文件的合并方法,所述数据文件中记录有若干个以数据键值对形式存储在LSM-tree结构中的数据条目和元信息条目,所述方法包括:针对数据文件中的一条数据条目,在缓存中查找该数据条目对应的元信息条目;若在所述缓存中未查找到该数据条目对应的元信息条目,则在数据文件中查找该数据条目对应的元信息条目,并将在数据文件中查找到的该数据条目对应的元信息条目写入缓存;根据数据条目对应的元信息条目,确定所述数据条目是否为应该保留的数据条目,若否,则在数据文件合并过程中删除所述数据条目。2.根据权利要求1所述的方法,其中,数据条目的数据键和与该数据条目对应的元信息条目的数据键的至少一部分相同。3.根据权利要求1或2所述的方法,所述缓存用于存储至少一条元信息条目;所述在数据文件中查找该数据条目对应的元信息条目,将在数据文件中查找到的该数据条目对应的元信息条目写入缓存进一步包括:若所述缓存中已存储有元信息条目,则在数据文件中查找该数据条目对应的元信息条目,将所述缓存中存储的元信息条目更新为在数据文件中查找到的该数据条目对应的元信息条目;若所述缓存中未存储有元信息条目,则在数据文件中查找该数据条目对应的元信息条目,将在数据文件中查找到的该数据条目对应的元信息条目存储至缓存中。4.根据权利要求1-3任一项所述的方法,所述根据数据条目对应的元信息条目,确定所述数据条目是否为应该保留的数据条目进一步包括:判断所述数据条目中的版本信息是否与所述数据条目对应的元信息条目中的版本信息相符;若否,则确定所述数据条目不为应该保留的数据条目。5.根据权利要求1-3任一项所述的方法,所述根据数据条目对应的元信息条目,确定所述数据条目是否为应该保留的数据条目进一步包括:根据数据条目对应的元信息条目中的过期时间信息,判断所述数据条目是否为过期数据条目;若是,则确定所述数据条目...
【专利技术属性】
技术研发人员:赵安安,陈宗志,
申请(专利权)人:北京奇虎科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。