数据处理方法、系统、电子设备、存储介质及程序产品技术方案

技术编号:35688403 阅读:15 留言:0更新日期:2022-11-23 14:35
本申请实施例提供一种数据处理方法、系统、电子设备、存储介质及程序产品。方法包括:接收到针对目标应用发送的测试任务后,根据多个用户账户的属性信息,将多个用户账户分配至第一数量个第一类数据集;同一用户账户在一个第一类数据集内,不同的第一类数据集所含的用户账户的属性分布一致;基于第一数量个第一类数据集,生成多个第二类数据集;第二类数据集中包含有至少两个第一类数据集;对多个第二类数据集进行分组得到数据分组,所述数据分组对目标应用的待测版本进行测试。本方案可降低系统及随机分组的误差,能有效保证后续测试结果的精准性。的精准性。的精准性。

【技术实现步骤摘要】
数据处理方法、系统、电子设备、存储介质及程序产品


[0001]本申请涉及计算机
,尤其涉及一种数据处理方法、系统、电子设备、存储介质及程序产品。

技术介绍

[0002]随着科技的发展,为了符合用户需求,应用的迭代更新越来越频繁。在对应用进行更新前,常需要对应用的新旧版本进行比较测试分析,以在确定出新版本优于旧版本的情况下,再将应用更新为新版本。
[0003]为完成测试,通常会先将不同用户数据进行随机分组,以分配到需要分析的应用的不同版本(如不同的页面、算法策略等)中,从而支持后续针对应用的不同版本的数据分析。不过,现有应用测试平台,多采用哈希策略对用户数据进行随机分组,由于哈希算法自身的局限性,以及用户是否访问应用的不确定性,往往会导致各分组间存在显著性差异,从而致使后续测试分析结果具有较低的精准性。

技术实现思路

[0004]鉴于上述问题,本申请提供一种解决上述问题或至少部分地解决上述问题的数据处理方法、系统、电子设备、存储介质及程序产品。
[0005]在本申请的一个实施例中,提供了一种数据处理方法。该方法包括:
[0006]接收到针对目标应用的测试任务后,根据多个用户账户的属性信息,将多个所述用户账户分配至第一数量个第一类数据集;其中,同一用户账户在一个第一类数据集内,不同的第一类数据集所含的用户账户的属性分布一致;
[0007]基于所述第一数量个第一类数据集,生成多个第二类数据集;所述第二类数据集中包含有至少两个第一类数据集;
[0008]对所述多个第二类数据集进行分组,得到数据分组;所述数据分组用于对所述目标应用的待测版本进行测试。
[0009]可选地,上述对所述多个第二类数据集进行分组,得到数据分组,包括:确定分组的第二数量;其中,所述第二数量为大于1的正整数;按照所述第二数量对所述多个第二类数据集进行分组,得到所述第二数量个数据分组。
[0010]可选地,上述按照所述第二数量对所述多个第二类数据集进行分组,得到所述第二数量个数据分组,包括:确定所述多个第二类数据集各自对应的第一指标数据;基于所述第一指标数据,利用统计分组模型按照所述第二数量对所述多个第二类数据集进行抽样分组统计分析,得到含有各第二类数据集所属数据分组的分析结果;当确定所述分析结果不满足抽样分组统计分析的结束条件时,记录所述分析结果,并返回执行所述基于所述第一指标数据,利用统计分组模型按照所述第二数量对所述多个第二类数据集进行抽样分组统计分析的步骤;当确定所述分析结果满足所述结束条件时,基于所述分析结果确定所述第二数量个数据分组。
[0011]可选地,上述满足所述结束条件包括:所述第二数量个数据分组中两两数据分组各自对应的第二指标数据之间的差异满足差异要求;
[0012]其中,所述第二指标数据是基于所述数据分组包含的所有第二类数据集对应的第一指标数据确定的,所述第一指标数据是基于所述第二类数据集包含的所有用户账户的历史数据确定的;所述满足差异要求包括如下中的至少一项:所述第二数量个数据分组中两两数据分组各自对应的第二指标数据之间的差值符合设定阈值条件、所述第二数量个数据分组中两两数据分组各自对应的第二指标数据之间的差值的加权和值符合设定和值条件。
[0013]可选地,上述按照所述第二数量对所述多个第二类数据集进行抽样分组,得到所述第二数量个数据分组,包括:确定多个分组样本;其中,所述分组样本中包含的数据分组是按照所述第二数量对所述多个第二类数据集进行随机分组得到的;在使用各分组样本对所述目标应用的待测版本进行测试时,利用预测模型对各分组样本所含第二数量个数据分组各自对应的第二指标数据进行预测,得到预测结果;基于所述预测结果,从所述多个分组样本中确定出目标分组样本,将所述目标分组样本所含的第二数量个数据分组作为得到的所述第二数量个数据分组。
[0014]可选地,上述利用预测模型对各分组样本所含第二数量个数据分组各自对应的第二指标数据进行预测,得到预测结果,包括:根据多个所述用户账户的属性信息,执行所述利用预测模型对各分组样本所含的第二数量个数据分组对应的第二指标数据进行预测,得到预测结果。
[0015]可选地,上述多个用户账户中包括多个第一用户账户,所述第一用户账户为属性信息满足预设条件的用户账户;以及,上述根据多个用户账户的属性信息,将多个所述用户账户分配至第一数量个第一类数据集,包括:根据多个所述第一用户账户的属性信息,对多个第一用户账户进行分层处理,得到多个抽样层;其中,同一抽样层上的不同第一用户账户的属性分布一致;确定所述多个抽样层中各抽样层对应的抽样比例;按照所述抽样比例,对所述多个抽样层上的第一用户账户进行分层抽样,以将多个所述第一用户账户打散分配至第一数量个第一类数据集。
[0016]可选地,上述多个用户账户中还包括第二用户账户,所述第二用户账户为属性信息不满足所述预设条件的用户账户;以及,上述根据多个用户账户的属性信息,将多个所述用户账户分配至第一数量个第一类数据集,还包括:基于所述第一数量个第一类数据集各自所含第一用户账户的属性信息,确定各第一类数据集对应的数据集特征;根据所述数据集特征,从所述第一数量个第一类数据集中选取出与所述第二用户账户匹配的第一类数据集,作为为所述第二用户账户分配的目标第一类数据集。
[0017]在本申请的另一个实施例中,还提供了一种数据处理装置。该装置包括:
[0018]分配模块,用于接收到针对目标应用的测试任务后,根据多个用户账户的属性信息,将多个所述用户账户分配至第一数量个第一类数据集;其中,同一用户账户在一个第一类数据集内,不同的第一类数据集所含的用户账户的属性分布一致;
[0019]生成模块,用于基于所述第一数量个第一类数据集,生成多个第二类数据集;所述第二类数据集中包含有至少两个第一类数据集;
[0020]分组模块,用于对所述多个第二类数据集进行分组,得到数据分组;所述数据分组用于对所述目标应用的待测版本进行测试。
[0021]可选地,上述分组模块,在用于对所述多个第二类数据集进行分组,得到数据分组时,具体用于:确定分组的第二数量;其中,所述第二数量为大于1的正整数;按照所述第二数量对所述多个第二类数据集进行分组,得到所述第二数量个数据分组。
[0022]可选地,上述分组模块,在用于按照所述第二数量对所述多个第二类数据集进行分组,得到所述第二数量个数据分组时,具体用于:确定所述多个第二类数据集各自对应的第一指标数据;基于所述第一指标数据,利用统计分组模型按照所述第二数量对所述多个第二类数据集进行抽样分组统计分析,得到含有各第二类数据集所属数据分组的分析结果;当确定所述分析结果不满足抽样分组统计分析的结束条件时,记录所述分析结果,并返回执行所述基于所述第一指标数据,利用统计分组模型按照所述第二数量对所述多个第二类数据集进行抽样分组统计分析的步骤;当确定所述分析结果满足所述结束条件时,基于所述分析结果确定所述第二数量个数据分组。
[0023]可选本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:接收到针对目标应用的测试任务后,根据多个用户账户的属性信息,将多个所述用户账户分配至第一数量个第一类数据集;其中,同一用户账户在一个所述第一类数据集内,不同的所述第一类数据集所含的用户账户的属性分布一致;基于第一数量个所述第一类数据集,生成多个第二类数据集;所述第二类数据集中包含有至少两个所述第一类数据集;对多个所述第二类数据集进行分组,得到数据分组;所述数据分组用于对所述目标应用的待测版本进行测试。2.根据权利要求1所述的方法,其特征在于,所述对多个所述第二类数据集进行分组,得到数据分组,包括:确定分组的第二数量;其中,所述第二数量为大于1的正整数;按照所述第二数量对多个所述第二类数据集进行分组,得到所述第二数量个数据分组。3.根据权利要求2所述的方法,其特征在于,所述按照所述第二数量对多个所述第二类数据集进行分组,得到所述第二数量个数据分组,包括:确定多个所述第二类数据集各自对应的第一指标数据;基于所述第一指标数据,利用统计分组模型按照所述第二数量对多个所述第二类数据集进行抽样分组统计分析,得到含有各所述第二类数据集所属数据分组的分析结果;当确定所述分析结果不满足抽样分组统计分析的结束条件时,记录所述分析结果,并返回执行所述基于所述第一指标数据,利用统计分组模型按照所述第二数量对多个所述第二类数据集进行抽样分组统计分析的步骤;当确定所述分析结果满足所述结束条件时,基于所述分析结果确定所述第二数量个数据分组。4.根据权利要求3所述的方法,其特征在于,所述分析结果满足所述结束条件包括:所述第二数量个数据分组中两两数据分组各自对应的第二指标数据之间的差异满足差异要求;其中,所述第二指标数据是基于所述数据分组包含的所有第二类数据集对应的第一指标数据确定的,所述第一指标数据是基于所述第二类数据集包含的所有用户账户的历史数据确定的;所述满足差异要求包括如下中的至少一项:所述第二数量个数据分组中两两数据分组各自对应的第二指标数据之间的差值符合设定阈值条件;所述第二数量个数据分组中两两数据分组各自对应的第二指标数据之间的差值的加权和值符合设定和值条件。5.一种数据处理装置,其特征在于,包括:分配模块,用于接收到针对目标应用的测试任务后,根据多个用户账户的...

【专利技术属性】
技术研发人员:汤万万张芹芹
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1