The embodiment of the invention provides a method for screening large data, the method comprises the following steps: according to the dimensions of screening screening analysis to dimensions of big data big data in the screening group; will meet the requirements, the corresponding preset to the target selection under the dimension of at least one dimension sub data saved as the next round of the screening data and target screening group; according to the number of dimensions of the design requirements, to determine whether the number of screening round ends meet preset screening number; if it is the end of the screening process, the big data. The embodiment of the invention, the invention through the analysis of data of stepwise selection of several rounds of screening, not because of the large amount of data caused by the excessive burden to the collapse of the system, and the objectives and requirements according to the screening data set value is set on the basis of analysis of the round of screening reference, improve the accuracy of the analysis of the selected screen.
【技术实现步骤摘要】
一种大数据的筛选方法
本专利技术涉及数据处理领域,特别是涉及一种大数据的筛选方法。
技术介绍
随着信息化的高速发展,大数据应运而生,为了弥补传统方法无法处理如此量大且非结构的大数据的缺陷,人们研究出了云计算,以云计算为基础的信息存储、分享和挖掘手段,可以便宜、有效地将这些大量、高速、多变化的终端大数据存储下来,然而如何对这些数据进行筛选分析,并且使用筛选结果从不同维度对企业决策进行指导已经成为热门话题。现有技术中,对数据的筛选分析方法仅是对数据在某单一维度下进行展开分析,或者在多个维度下进行组合筛选。单一维度下的筛选缺陷在于如果数据信息点隐藏在多个筛选维度下,则很难被找到;组合筛选的缺陷在于确定某一维度子项以进行数据分析时,子项的选择很大程度取决于做出判断的人的经验,导致容易出现错误的判断情况。无论是单一维度的筛选方式或是组合维度的筛选方式,针对筛选过程中因选择了错误的筛选维度而无法得到最终的筛选结果时,均需要重新进行筛选,严重影响筛选效率。例如,在视频领域,通常在操作平台上通过不同筛选维度的组合实现对目标信息的流量或者卡顿情况的监测分析,筛选维度包括:地域、城市、操作系统、浏览器、性别、年龄段等,现有技术的监测方法是根据先前经验在所有筛选维度中分别选取其子项对目标信息进行组合筛选分析,如果该目标信息恰好为问题信息点,则完成监测,否则重新选取筛选维度子项的其它排列组合进行筛选分析完成监测。该方法虽然能实现对视频流量、视频卡顿等信息的监测,但整个处理过程信息处理量大,导致处理器负担较大,处理效率低,不利于推广应用。并且,即使利用该方法找到了疑似问题的信息点, ...
【技术保护点】
一种大数据的筛选方法,其特征在于,所述方法包括:按照目标维度筛选维度对待筛选的大数据组中的大数据进行筛选分析;将满足预设条件要求的、对应于所述目标筛选维度下的至少一个维度子项的数据保存为下一轮的待筛选数据组;根据预设的筛选维度的数量和目标要求,确定筛选轮数是否结束满足预设筛选数量;如果是,结束所述大数据的筛选过程。
【技术特征摘要】
1.一种大数据的筛选方法,其特征在于,所述方法包括:按照目标维度筛选维度对待筛选的大数据组中的大数据进行筛选分析;将满足预设条件要求的、对应于所述目标筛选维度下的至少一个维度子项的数据保存为下一轮的待筛选数据组;根据预设的筛选维度的数量和目标要求,确定筛选轮数是否结束满足预设筛选数量;如果是,结束所述大数据的筛选过程。2.根据权利要求1所述的大数据筛选方法,其特征在于,根据预设的筛选维度的数量和目标要求,确定筛选轮数是否结束满足预设筛选数量之前,在所述方法还包括:建立查询结果表,将每一轮的筛选结果放入所述查询结果表中;所述根据预设的筛选维度的数量和目标要求,确定筛选轮数是否结束满足预设筛选数量,包括:根据预设的筛选维度的数量和目标要求,根据所述查询结果表确定筛选轮数是否...
【专利技术属性】
技术研发人员:徐秋养,
申请(专利权)人:佛山市深研信息技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。