The application embodiment discloses a data index statistical method and a device. The method comprises: obtaining user data, data index and using the calculation of user data types required the data index calculation; according to the calculation of the data type will be allocated to the user and the calculation module matches the type in which the statistical calculation module can be used with the the calculation of multiple index data of the same type. By using the application example, not only can we save the resources of computing engine, but also improve the flexibility of adding new data index in computing engine, and reduce the complexity of adding new data index in computing engine.
【技术实现步骤摘要】
一种数据指标统计方法及装置
本申请涉及数据处理
,特别涉及一种数据指标统计处理方法及装置。
技术介绍
近几年,随着大数据处理技术的快速发展,在很多业务场景下需要对大量用户数据进行实时分析处理。在实时数据分析过程中,通常需要对某些数据指标进行实时统计。典型的业务场景如网络购物平台,在某些重要的购物促销活动日,通常需要对平台中的某些数据指标进行统计。从大方向来说,所述数据指标可以包括交易量、交易金额、广告页面访问次数;从小方向来说,其中,交易量指标又可以包括平台整体交易量、各个城市交易量、行业交易量、商户交易量、门店交易量等多个维度的交易量。为了满足大数据的实时处理需求,现有技术中出现多个如Storm、Spark、Samza等流式大数据处理框架以及基于上述框架所构建的流式大数据处理引擎,典型的如阿里巴巴的Galaxy计算引擎等。在利用上述流式大数据处理引擎进行数据指标计算时,可以划分多个计算模块分别统计所述数据指标,其中所述计算模块与所述数据指标具有一一对应的关系,即一个计算模块统计一个数据指标。在实际的业务场景中,需要统计的数据指标往往在不断地扩展,例如,已经统计了北京的交易量,发现还需要统计上海的交易量。针对上述情况,利用现有技术中的流式大数据处理引擎进行数据指标统计时,每增加一个数据指标就需要增加一个新的计算模块进行处理。但是,在大数据处理引擎中每增加一个计算模块,所述引擎的整体性能可能降低很多。并且,在流式大数据处理引擎中增加一个新的计算模块,需要编写代码后重新发布上线,开发周期长,任务稳定性较低。因此,现有技术中亟需一种能够在大数据处理引擎中快 ...
【技术保护点】
一种数据指标统计方法,所述方法包括:获取用户数据、数据指标以及利用所述用户数据计算所述数据指标时所需的计算类型;根据所述计算类型将所述用户数据分配至与所述计算类型相匹配的计算模块中,其中,所述计算模块可用于与所述计算类型相同的多个数据指标的统计。
【技术特征摘要】
1.一种数据指标统计方法,所述方法包括:获取用户数据、数据指标以及利用所述用户数据计算所述数据指标时所需的计算类型;根据所述计算类型将所述用户数据分配至与所述计算类型相匹配的计算模块中,其中,所述计算模块可用于与所述计算类型相同的多个数据指标的统计。2.根据权利要求1所述的方法,所述根据所述计算类型将所述用户数据分配至与所述计算类型相匹配的计算模块中包括:将所述数据指标和所述计算类型转换成预设格式的配置信息;将所述用户数据和所述配置信息发送至计算引擎中,所述计算引擎中包括多个计算模块;所述计算引擎被设置为执行下述步骤:根据所述配置信息中的计算类型,将所述用户数据分配至与所述计算类型相匹配的计算模块。3.根据权利要求2所述的方法,所述配置信息中还包括利用所述用户数据计算所述数据指标时所需的统计时间间隔信息。4.根据权利要求1所述的方法,所述获取用户数据、数据指标以及利用所述用户数据计算所述数据指标时所需的计算类型包括:获取用户数据以及需要根据所述用户数据统计的数据指标;根据所述数据指标确定计算方式,并根据所述计算方式确定所述数据指标的计算类型。5.一种数据指标统计装置,所述装置包括:数据获取单元,用于获取用户数据、数据指标以及利用所述用户数据计算所述数据指标时所需的计算类型;数据分配单元,用于根据所述计算类型将所述用户数据分配至与所述计算类型相匹配的计算模块中,其中,所述计算模块可用于与所述计算类型相同的多个数据指标的统计。6.根据权利要求5所述的装置,所述数据分...
【专利技术属性】
技术研发人员:马文琪,程磊,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。