【技术实现步骤摘要】
数据采集中的存储方法及装置
本专利技术涉及数据挖掘
,特别是涉及一种数据采集中的存储方法及装置。
技术介绍
在数据挖掘
中,需要采样得到大量数据才能根据采集的数据进行数据分 析,在传统技术中,如图1和图2所示,通常由多个采样服务器各自按照预设的周期T (例如 周期T可以是1天,采样服务器每天采集一次数据)进行采集,采样服务器采集数据的时间 即为采集数据的产生时间(如图1中的TO、T0+T等),采样服务器再不定期将采集数据发送 给统计服务器汇总存储,统计服务器接收到该采集数据的时间即为该采集数据的采集时间 (如图1中的T0+4T和T0+2T)。 统计服务器在将采集数据进行存储时,通常对同一类型的采集数据根据采集时间 建立目录,然后在该目录中根据采集数据的产生时间建立子目录。 专利技术人经研究发现上述存储方式至少存在以下问题:当需要根据产生时间进行检 索时,则需要遍历所有存储采集数据的目录并根据产生时间进行查找,使得遍历的目录数 量较多,使得读取效率不高。
技术实现思路
基于此,有必要提供一种能够提高读取效率的数据采集中的存储方法。 -种数据采集中的存储方法,包括: 获取采集数据,获取所述采集数据的产生时间和采集时间; 通过计算所述产生时间和采集时间的差得到偏移值; 获取预设的偏移阈值,判断所述偏移值是否小于所述偏移阈值,若是,则获取所述 采集数据对应的集中存储目录,获取在所述集中存储目录下的与所述产生时间对应的产生 时间子目录,获取所述产生时间子目录下的与所述偏移值对应的偏移子 ...
【技术保护点】
一种数据采集中的存储方法,包括:获取采集数据,获取所述采集数据的产生时间和采集时间;通过计算所述产生时间和采集时间的差得到偏移值;获取预设的偏移阈值,判断所述偏移值是否小于所述偏移阈值,若是,则获取所述采集数据对应的集中存储目录,获取在所述集中存储目录下的与所述产生时间对应的产生时间子目录,获取所述产生时间子目录下的与所述偏移值对应的偏移子目录中,并将所述采集数据存储在所述偏移子目录中。
【技术特征摘要】
1. 一种数据采集中的存储方法,包括: 获取采集数据,获取所述采集数据的产生时间和采集时间; 通过计算所述产生时间和采集时间的差得到偏移值; 获取预设的偏移阔值,判断所述偏移值是否小于所述偏移阔值,若是,则获取所述采集 数据对应的集中存储目录,获取在所述集中存储目录下的与所述产生时间对应的产生时间 子目录,获取所述产生时间子目录下的与所述偏移值对应的偏移子目录中,并将所述采集 数据存储在所述偏移子目录中。2. 根据权利要求1所述的数据采集中的存储方法,其特征在于,所述判断所述偏移值 是否小于偏移阔值的步骤之后还包括: 若所述偏移值大于或等于所述偏移阔值,则获取所述采集数据对应的非集中存储目 录,获取在所述非集中存储目录下的与所述采集时间对应的采集时间子目录,将所述采集 数据存储到所述采集时间子目录中。3. 根据权利要求2所述的数据采集中的存储方法,其特征在于,所述获取所述采集数 据对应的集中存储目录/非集中存储目录步骤包括: 获取所述采集数据的数据类型; 获取所述数据类型对应的类型目录; 获取所述类型目录下的集中存储目录/非集中存储目录。4. 根据权利要求2所述的数据采集中的存储方法,其特征在于,所述方法还包括: 获取输入的采集时间关键字,提取第一输入时间; 在所述集中存储目录中,获取其包含的产生时间子目录对应的产生时间与所述第一输 入时间的差小于所述偏移阔值,且所述产生时间子目录对应的产生时间与其包含的偏移子 目录对应的偏移值之和等于所述第一输入时间的偏移子目录,读取所述偏移子目录中存储 的采集数据; 在所述非集中存储目录中,获取其包含的采集时间子目录对应的采集时间与所述第一 输入时间相同的采集时间子目录,读取所述采集时间子目录中存储的采集数据。5. 根据权利要求2所述的数据采集中的存储方法,其特征在于,所述方法还包括: 获取输入的产生时间关键字,提取第二输入时间; 在所述集中存储目录中,获取其包含的产生时间子目录对应的产生时间与所述第二输 入时间相同的产生时间子目录,读取所述产生时间子目录及其包含的偏移子目录中存储的 采集数据; 在所述非集中存储目录中,遍历所述采集时间子目录,读取采集时间子目录下的产生 时间与所述第二输入时间对应的采集数据。6. 根据权利要求2所述的数据采集中的存储方法,其特征在于,所述方法还包括: 遍历所述集中存储目录及其子目录、非集中存储目录及其子目录下存储的采集数据; 获取所述采集数据对应的产生时间和采集时间,并计算相应的偏移值; 根据公式: /',(71)=迅。xlOO% N 生成偏移值概率分布;其中,S(T)为偏移值小于T的采集数据的数量么和,N为采集数 据的总数量,P(T)为偏移值概率分布; 获取预设的概率阔值,根据所述概率阔值更新所述偏移阔值。7. -种数...
【专利技术属性】
技术研发人员:邱跃鹏,廖建魁,章猛,范成涛,李恭伟,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。