System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据处理方法、装置、电子设备及可读介质制造方法及图纸_技高网

数据处理方法、装置、电子设备及可读介质制造方法及图纸

技术编号:41417773 阅读:7 留言:0更新日期:2024-05-21 20:50
本发明专利技术实施例提供了一种数据处理方法、装置、电子设备及可读介质。方法包括:获取至少一个第一活跃用户数据,第一活跃用户数据记载有活跃日期以及与活跃日期对应的数值型用户标识;针对活跃日期构建位图信息;位图信息中包含若干二进制位,二进制位分别与数值型用户标识对应;基于第一活跃用户数据,确定在活跃日期下活跃的用户的数值型用户标识,作为目标数值型用户标识;在活跃日期对应的位图信息中,将目标数值型用户标识对应的二进制位从预设的初始状态调整为活跃状态,得到目标位图信息。从而可以实现采用位图信息表示不同日期下不同用户的状态,有效地压缩了用户活跃数据存储所占用的存储空间,数据的扫描效率以及分析效率可以有效地提高。

【技术实现步骤摘要】

本专利技术涉及数据处理,特别是涉及一种数据处理方法、一种数据处理装置、一种电子设备以及一种计算机可读介质。


技术介绍

1、一般来说,在产品运营过程中,产品价值通常可以体现在一系列数据上,特别是用户数相关的数据,其通常可以是产品运营过程中需要频繁查看的关键指标。为了计算用户数相关的数据,通常需要在数据库中存储过去较长一段时间内的用户行为数据,从而数据库中的数据通常较大,导致对存储资源的消耗较大。同时,为了对庞大的数据进行分析计算,通常需要消耗较长的时间对数据进行扫描,使得用户数相关的数据分析效率较低。


技术实现思路

1、本专利技术实施例是提供一种数据处理方法、装置、电子设备以及计算机可读存储介质,以解决数据分析效率较低的问题。

2、本专利技术实施例公开了一种数据处理方法,所述方法包括:

3、获取至少一个第一活跃用户数据,所述第一活跃用户数据记载有活跃日期以及与所述活跃日期对应的数值型用户标识;

4、针对所述活跃日期构建位图信息;所述位图信息中包含若干二进制位,所述二进制位分别与数值型用户标识对应;

5、基于所述第一活跃用户数据,确定在所述活跃日期下活跃的用户的数值型用户标识,作为目标数值型用户标识;

6、在所述活跃日期对应的位图信息中,将所述目标数值型用户标识对应的二进制位从预设的初始状态调整为活跃状态,得到目标位图信息。

7、可选地,所述方法还包括:

8、获取原始用户标识;

9、基于自增序列创建数值型用户标识,并建立所述原始用户标识与所述数值型用户标识之间的标识映射关系;其中,所述数值型用户为由数字组成的用户标识。

10、可选地,所述获取至少一个第一活跃用户数据的步骤,包括:

11、获取至少一个第二活跃用户数据,所述第二活跃用户数据记载有活跃日期以及与所述活跃日期对应的原始用户标识;

12、基于所述标识映射关系,将所述第二活跃用户数据中的所述原始用户标识转换为数值型用户标识,得到第一活跃用户数据。

13、可选地,所述位图信息中具体包含若干分桶;所述分桶中包含若干二进制位;

14、所述在所述活跃日期对应的位图信息中,将所述目标数值型用户标识对应的二进制位从预设的初始状态调整为活跃状态的步骤,包括:

15、将所述目标数值型用户标识转换为预设位数的二进制整型数据;

16、基于所述二进制整型数据中高位部分数据,确定所述目标数值型用户标识对应的分桶;

17、基于所述二进制整型数据中低位部分数据,确定所述目标数值型用户标识在分桶中对应的二进制位,作为目标二进制位;

18、将所述目标二进制位从预设的初始状态调整为活跃状态,得到目标位图信息。

19、可选地,所述方法还包括:

20、基于所述活跃日期对应的目标位图信息中处于活跃状态的二进制位的数量,确定所述活跃日期下活跃用户数量。

21、可选地,所述方法还包括:

22、在所述活跃日期中选取第一初始日期以及在所述第一初始日期预设天数之后的第一留存日期;

23、基于所述第一初始日期对应的目标位图信息中处于活跃状态的二进制位的数量,确定所述第一初始日期下活跃用户数量;

24、确定在所述第一初始日期的目标位图信息以及所述第一留存日期的目标位图信息中皆处于活跃状态的二进制位的数量,作为留存人数数量;

25、根据所述预设天数的留存人数数量以及所述第一初始日期下活跃用户数量,确定预设天数的留存率。

26、可选地,所述方法还包括:

27、在所述活跃日期中选取第二初始日期以及在所述第二初始日期预设天数之后的第二留存日期;

28、基于所述第二初始日期对应的目标位图信息中处于活跃状态的二进制位的数量,确定所述第二初始日期下活跃用户数量;

29、确定所述第二初始日期后一天至所述第二留存日期的目标位图信息中,至少一次处于活跃状态的二进制位的数量,作为预设天数内的留存人数数量;

30、根据所述预设天数内的留存人数数量以及所述第二初始日期下活跃用户数量,确定预设天数内的留存率。

31、本专利技术实施例还公开一种数据处理装置,所述装置包括:

32、数据获取模块,用于获取至少一个第一活跃用户数据,所述第一活跃用户数据记载有活跃日期以及与所述活跃日期对应的数值型用户标识;

33、位图构建模块,用于针对所述活跃日期构建位图信息;所述位图信息中包含若干二进制位,所述二进制位分别与数值型用户标识对应;

34、标识确定模块,用于基于所述第一活跃用户数据,确定在所述活跃日期下活跃的用户的数值型用户标识,作为目标数值型用户标识;

35、位图调整模块,用于在所述活跃日期对应的位图信息中,将所述目标数值型用户标识对应的二进制位从预设的初始状态调整为活跃状态,得到目标位图信息。

36、可选地,所述装置还包括:

37、原始标识获取模块,用于获取原始用户标识;

38、关系建立模块,用于基于自增序列创建数值型用户标识,并建立所述原始用户标识与所述数值型用户标识之间的标识映射关系;其中,所述数值型用户为由数字组成的用户标识。

39、可选地,所述数据获取模块包括:

40、数据获取子模块,用于获取至少一个第二活跃用户数据,所述第二活跃用户数据记载有活跃日期以及与所述活跃日期对应的原始用户标识;

41、转换子模块,用于基于所述标识映射关系,将所述第二活跃用户数据中的所述原始用户标识转换为数值型用户标识,得到第一活跃用户数据。

42、可选地,所述位图信息中具体包含若干分桶;所述分桶中包含若干二进制位;

43、所述位图调整模块包括:

44、整型转换子模块,用于将所述目标数值型用户标识转换为预设位数的二进制整型数据;

45、分桶确定子模块,用于基于所述二进制整型数据中高位部分数据,确定所述目标数值型用户标识对应的分桶;

46、位确定子模块,用于基于所述二进制整型数据中低位部分数据,确定所述目标数值型用户标识在分桶中对应的二进制位,作为目标二进制位;

47、调整子模块,用于将所述目标二进制位从预设的初始状态调整为活跃状态,得到目标位图信息。

48、可选地,所述装置还包括:

49、活跃数量确定模块,用于基于所述活跃日期对应的目标位图信息中处于活跃状态的二进制位的数量,确定所述活跃日期下活跃用户数量。

50、可选地,所述装置还包括:

51、第一日期确定模块,用于在所述活跃日期中选取第一初始日期以及在所述第一初始日期预设天数之后的第一留存日期;

52、第一活跃用户确定模块,用于基于所述第一初始日期对应的目标位图信息中处于活跃状态的二进制位的数量,确定所述第一初始日期下活跃用本文档来自技高网...

【技术保护点】

1.一种数据处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述获取至少一个第一活跃用户数据的步骤,包括:

4.根据权利要求1所述的方法,其特征在于,所述位图信息中具体包含若干分桶;所述分桶中包含若干二进制位;

5.根据权利要求1~4任一项所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1~4任一项所述的方法,其特征在于,所述方法还包括:

7.根据权利要求1~4任一项所述的方法,其特征在于,所述方法还包括:

8.一种数据处理装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口以及所述存储器通过所述通信总线完成相互间的通信;

10.一个或多个计算机可读介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如权利要求1-7任一项所述的方法。

【技术特征摘要】

1.一种数据处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述获取至少一个第一活跃用户数据的步骤,包括:

4.根据权利要求1所述的方法,其特征在于,所述位图信息中具体包含若干分桶;所述分桶中包含若干二进制位;

5.根据权利要求1~4任一项所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1~4任一项所述的方法,其...

【专利技术属性】
技术研发人员:梁稳刘开
申请(专利权)人:浙江菜鸟供应链管理有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1