数据处理方法、装置及存储介质制造方法及图纸

技术编号:28132307 阅读:28 留言:0更新日期:2021-04-19 11:56
本发明专利技术提供一种数据处理方法、装置及存储介质,该方法包括:获取目标群体在第一历史时间段内的历史资源贡献数据和历史留存数据;对所述第一历史时间段内的历史留存数据进行拟合,得到所述目标群体在第一预设时间的目标留存数据;基于所述第一历史时间段内的历史资源贡献数据和历史留存数据,确定所述目标群体在所述第一预设时间的目标平均资源贡献数据;基于所述第一预设时间的目标留存数据和目标平均资源贡献数据,确定所述目标群体在所述第一预设时间的目标资源贡献数据。本发明专利技术能够提高目标群体在该第一预设时间的目标资源贡献数据的预测准确率,使预测结果更加贴合业务实际预测需求。预测需求。预测需求。

【技术实现步骤摘要】
数据处理方法、装置及存储介质


[0001]本专利技术属于计算机
,具体涉及一种数据处理方法、装置及存储介质。

技术介绍

[0002]随着移动互联网和智能手机的发展,多种类型的商业应用(Application,APP)持续涌现,比如手机游戏、社交软件、视频软件等。其中,手机游戏是一类具有代表性的、通过向用户销售APP中内置的道具和增值服务等产品来获得营收和利润的APP。为了良好的发行、运营此类向用户销售道具和增值服务等产品的APP,在其新上线的早期,预测用户群体的远期生命周期价值(LTV)成为了一项十分关键的任务。
[0003]现有技术采用LTV曲线对数线性外推法对远期LTV进行预测(函数形式为LTV=a*(t^b),a和b为参数),该预测方法通过对近期LTV数据进行回归得到参数a和b,进而外推曲线,代入远期的t值来求得远期LTV的预测值。
[0004]然而LTV的对数线性往往只体现在整个APP所有用户的LTV曲线上。而对某一个用户群体而言,APP上线早期的LTV数据可能并不是对数线性的,即模型的函数形式假设可能并不成立,导致预测效果较差,甚至预测出来很多极端值,不符合实际情况。

技术实现思路

[0005]为了解决上述技术问题,本专利技术提供一种数据处理方法、装置及存储介质。
[0006]一方面,本专利技术提出了一种数据处理方法,所述方法包括:
[0007]获取目标群体在第一历史时间段内的历史资源贡献数据和历史留存数据;
[0008]对所述第一历史时间段内的历史留存数据进行拟合,得到所述目标群体在第一预设时间的目标留存数据;
[0009]基于所述第一历史时间段内的历史资源贡献数据和历史留存数据,确定所述目标群体在所述第一预设时间的目标平均资源贡献数据;
[0010]基于所述第一预设时间的目标留存数据和目标平均资源贡献数据,确定所述目标群体在所述第一预设时间的目标资源贡献数据。
[0011]另一方面,本专利技术实施例提供了一种数据处理装置,所述装置包括:
[0012]获取模块,用于获取目标群体在第一历史时间段内的历史资源贡献数据和历史留存数据;
[0013]拟合模块,用于对所述第一历史时间段内的历史留存数据进行拟合,得到所述目标群体在第一预设时间的目标留存数据;
[0014]第一确定模块,用于基于所述第一历史时间段内的历史资源贡献数据和历史留存数据,确定所述目标群体在所述第一预设时间的目标平均资源贡献数据;
[0015]第二确定模块,用于基于所述第一预设时间的目标留存数据和目标平均资源贡献数据,确定所述目标群体在所述第一预设时间的目标资源贡献数据。
[0016]另一方面,本专利技术提出了一种数据处理的电子设备,所述电子设备包括处理器和
存储器,存储器中存储有至少一条指令或至少一段程序,至少一条指令或至少一段程序由处理器加载并执行以实现如上述所述的数据处理方法。
[0017]另一方面,本专利技术提出了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如上述所述的数据处理方法。
[0018]本专利技术实施例提出的数据处理方法、装置及存储介质,首先获取目标群体在第一历史时间段内的历史资源贡献数据和历史留存数据,接着分别对目标留存率数据和目标平均资源贡献数据进预测(其中,目标留存率数据基于对该第一历史时间段内的历史留存数据进行拟合得到,目标平均资源贡献数据基于第一历史时间段内的历史资源贡献数据和历史留存数据而确定),最后根据预测得到的第一预设时间的目标留存数据和目标平均资源贡献数据,确定该目标群体在该第一预设时间的目标资源贡献数据。由于本专利技术实施例可以针对目标留存率数据和目标平均资源贡献数据分别进行预测,从而可以提高目标群体在该第一预设时间的目标资源贡献数据的预测的准确率,使预测结果更加贴合业务实际预测需求。
附图说明
[0019]为了更清楚地说明本专利技术实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
[0020]图1是本专利技术实施例提供的一种数据处理方法的实施环境示意图。
[0021]图2是本专利技术实施例提供的一种数据处理方法的系统示意图。
[0022]图3是本专利技术实施例提供的一种数据处理方法的流程示意图。
[0023]图4是本专利技术实施例提供的另一种数据处理方法的流程示意图。
[0024]图5是本专利技术实施例提供的使用艾宾浩斯遗忘曲线对某目标群体的留存数据进行预测得到的预测曲线与真实曲线的对比示意图。
[0025]图6是本专利技术实施例提供的监测留存率曲线形状的一种流程示意图。
[0026]图7是本专利技术实施例提供的另一种数据处理方法的流程示意图。
[0027]图8是本专利技术实施例提供的另一种数据处理方法的流程示意图。
[0028]图9是本专利技术实施例提供的使用带有天花板的线性增长模型控制ARPU的增长过程的一种流程示意图。
[0029]图10是本专利技术实施例提供的使用带有天花板的线性增长模型对目标群体的ARPU进行预测后得到的ARPU预测曲线和真实ARPU曲线的对比示意图。
[0030]图11是本专利技术实施例提供的另一种数据处理方法的流程示意图。
[0031]图12是本专利技术实施例提供的使用自置的LTV预测值天花板剔除极端预测值的示意图。
[0032]图13是目标群体人数在3000人以上时,传统对数曲线外推法的LTV预测效果。
[0033]图14是目标群体人群在3000人以上时,使用本专利技术实施例中的预测方法的LTV预测效果。
[0034]图15是本专利技术实施例提供的不同人数的目标群体的LTV预测结果。
[0035]图16是本专利技术实施例提供的不同人数的目标群体的预测效果展(MAPE指标)。
[0036]图17是本专利技术实施例提供的不同人数的目标群体的预测效果展(MAE指标)。
[0037]图18是本专利技术实施例提供的一种数据处理装置的结构示意图。
[0038]图19是本专利技术实施例提供的一种服务器的硬件结构框图。
具体实施方式
[0039]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0040]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取目标群体在第一历史时间段内的历史资源贡献数据和历史留存数据;对所述第一历史时间段内的历史留存数据进行拟合,得到所述目标群体在第一预设时间的目标留存数据;基于所述第一历史时间段内的历史资源贡献数据和历史留存数据,确定所述目标群体在所述第一预设时间的目标平均资源贡献数据;基于所述第一预设时间的目标留存数据和目标平均资源贡献数据,确定所述目标群体在所述第一预设时间的目标资源贡献数据。2.根据权利要求1所述的方法,其特征在于,当第二预设时间内不存在用户数量大于第一预设数量阈值的候选群体时,执行所述基于所述第一历史时间段内的历史资源贡献数据和历史留存数据,确定所述目标群体在所述第一预设时间的目标平均资源贡献数据的步骤;所述候选群体与所述目标群体处于同一国家维度和系统平台维度;相应地,所述基于所述第一历史时间段内的历史资源贡献数据和历史留存数据,确定所述目标群体在所述第一预设时间的目标平均资源贡献数据,包括:基于所述第一历史时间段内的历史资源贡献数据和历史留存数据,确定所述目标群体在第二历史时间段内的历史资源贡献数据和历史留存数据;所述第二历史时间段的结束时间与所述第一历史时间段的结束时间相同,所述第二历史时间段的起始时间为位于所述第一历史时间段内;基于所述第二历史时间段内的历史资源贡献数据和历史留存数据,确定所述目标群体在所述第二历史时间段内的历史平均资源贡献数据;将所述第二历史时间段内的历史平均资源贡献数据,作为所述目标群体在所述第一预设时间的目标平均资源贡献数据。3.根据权利要求2所述的方法,其特征在于,当所述第二预设时间内存在至少一个所述候选群体时,所述方法还包括:计算至少一个所述候选群体在各自对应的第三历史时间段内的历史候选资源贡献数据;所述第三历史时间段的时长与所述第一历史时间段的时长相等;将至少一个所述候选群体按照相应的历史候选资源贡献数据进行降序排序,得到候选群体序列;从所述候选群体序列中确定多个目标候选群体;获取所述多个目标候选群体在各自对应的第四历史时间段内的历史候选资源贡献数据和历史候选留存数据;所述第四历史时间段的时长与所述第二历史时间段的时长相等,所述第四历史时间段的结束时间与所述第三历史时间段的结束时间相同,所述第四历史时间段的起始时间为位于所述第三历史时间段内;计算所述多个目标候选群体在各自对应的第四历史时间段内的历史候选资源贡献数据的和,得到历史候选资源贡献数据总和;计算所述多个目标候选群体在各自对应的第四历史时间段内的历史候选留存数据的和,得到历史候选留存数据总和;基于所述历史候选资源贡献数据总和所述历史候选留存数据总和,确定所述目标群体在所述第一预设时间的目标平均资源贡献数据。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:基于所述目标群体在所述第一历史时间段内的历史资源贡献数据和历史留存数据,确定所述目标群体第五历史时间段内的历史资源贡献数据和历史留存数据;所述第五历史时间段的起始时间与所述第一历史时间段的起始时间相同,所述第五历史时间段的结束时间与所述第二历史时间段的起始时间相同;基于所述第五历史时间段内的历史资源贡献数据和历史留存数据,计算所述目标群体在所述第五历史时间段内的历史平均资源贡献数据;基于所述第五历史时间段内的历史平均资源贡献数据和所述第二历史时间段内的历史平均资源贡献数据,确定第一增长斜率;基于所述第二历史时间段内的历史平均资源贡献数据和所述目标平均资源贡献数据,确定第二增长斜率;将所述第一增长斜率和所...

【专利技术属性】
技术研发人员:陈峭霖张宇琪陈浩宇宋超张洁
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1