数据预测方法及系统技术方案

技术编号:36608332 阅读:19 留言:0更新日期:2023-02-04 18:34
本申请公开了一种数据预测方法,该方法包括:监听用户事件,并基于所述用户事件统计实时特征;根据离线用户画像数据统计离线特征;将所述实时特征和所述离线特征输入训练好的增量模型,所述增量模型用于预测所述用户的预定指标的增量;在所述增量模型输出的预测增量高于第一预设阈值的情形下,对所述用户进行干预操作,所述干预操作用于提升所述用户的所述预定指标。本申请还公开了一种数据预测系统、电子装置和计算机可读存储介质。由此,能够基于用户事件实现用户的自动化干预,减少人力和时间成本,并且基于用户实时流数据和离线数据结合进行模型预测,可以更好的预测用户预定指标的增量,动态判断是否对该用户进行所述干预操作。操作。操作。

【技术实现步骤摘要】
数据预测方法及系统


[0001]本申请涉及数据分析
,尤其涉及一种数据预测方法、系统、电子装置及计算机可读存储介质。

技术介绍

[0002]随着计算机技术的普及与发展,电商业务不断壮大,业务场景越来越复杂,用户数据积累越来越庞大,当需要对某些用户进行定向的操作时,例如定向补贴,若单靠传统的人为操作,已经不能满足业务需求。

技术实现思路

[0003]本申请的主要目的在于提出一种数据预测方法、系统、电子装置及计算机可读存储介质,旨在自动化进行数据预测并根据预测结果做出相应决策,以解决上述技术问题。
[0004]为实现上述目的,本申请实施例提供了一种数据预测方法,所述方法包括:
[0005]监听用户事件,并基于所述用户事件统计实时特征;
[0006]根据离线用户画像数据统计离线特征;
[0007]将所述实时特征和所述离线特征输入训练好的增量模型,所述增量模型用于预测所述用户的预定指标的增量;
[0008]在所述增量模型输出的预测增量高于第一预设阈值的情形下,对所述用户进行干预操作,所述干预操作用于提升所述用户的所述预定指标。
[0009]可选地,所述方法还包括:
[0010]在所述增量模型输出的预测增量低于第二预设阈值的情形下,对所述用户不进行所述干预操作,其中,所述第二预设阈值小于所述第一预设阈值。
[0011]可选地,所述方法还包括:
[0012]评估所述增量模型的预测效果,在评估结果不符合预期的情形下,继续对所述增量模型进行训练迭代。
[0013]可选地,所述监听用户事件,并基于所述用户事件统计实时特征包括:
[0014]通过实时监听用户事件,记录用户在应用页面的操作行为数据;
[0015]利用预设时长的窗口函数,统计所述用户事件对应的实时特征。
[0016]可选地,所述利用预设时长的窗口函数,统计所述用户事件对应的实时特征包括:
[0017]解析用户事件信息,得到各种事件类型及相应的数据;
[0018]对解析得到的数据按预设时长进行聚合,统计所述用户的实时特征信息;
[0019]将统计得到的所述实时特征信息更新至数据库中。
[0020]可选地,所述评估所述增量模型的预测效果包括:
[0021]记录各个用户的预定指标的预测增量,并定期统计所述用户在所述干预操作之后所述预定指标的实际增量;
[0022]将所述预测增量和所述实际增量进行对比;
[0023]当所述预测增量和所述实际增量的差异率大于第一预设值时,所述增量模型的评估结果不符合预期。
[0024]可选地,所述评估所述增量模型的预测效果还包括:
[0025]基于Z检验法对根据预测结果进行所述干预操作的用户组和随机进行所述干预操作的用户组进行差异显著性判断,当差异率小于第二预设值时,所述增量模型的预测结果不符合预期。
[0026]此外,为实现上述目的,本申请实施例还提供一种数据预测系统,所述系统包括:
[0027]监听模块,用于监听用户事件,并基于所述用户事件统计实时特征;
[0028]统计模块,用于根据离线用户画像数据统计离线特征;
[0029]预测模块,用于将所述实时特征和所述离线特征输入训练好的增量模型,所述增量模型用于预测所述用户的预定指标的增量;
[0030]干预模块,用于在所述增量模型输出的预测增量高于第一预设阈值的情形下,对所述用户进行干预操作,所述干预操作用于提升所述用户的所述预定指标。
[0031]为实现上述目的,本申请实施例还提供一种电子装置,所述电子装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据预测程序,所述数据预测程序被所述处理器执行时实现如上述的数据预测方法。
[0032]为实现上述目的,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有数据预测程序,所述数据预测程序被处理器执行时实现如上述的数据预测方法。
[0033]本申请实施例提出的数据预测方法、系统、电子装置及计算机可读存储介质,能够通过引入用户事件驱动机制,基于用户事件实现自动化干预,扩展了干预操作的适用场景,同时提高了数据预测和决策的效率,减少了人力和时间成本。并且结合用户实时流数据和离线数据进行模型预测,保证了数据的实效性和准确性,能更好的预测出预定指标的增量,从而做出更加准确的决策,动态判断是否对该用户进行干预操作。
附图说明
[0034]图1为实现本申请各个实施例的一种应用环境架构图;
[0035]图2为本申请第一实施例提出的一种数据预测方法的流程图;
[0036]图3为本申请中部分实时特征的示意图;
[0037]图4为本申请中部分离线特征的示意图;
[0038]图5为本申请中一种用户类别和增量值的示意图;
[0039]图6为本申请中一种增量模型的测试集的预测值和实际值的对比示意图;
[0040]图7为本申请第二实施例提出的一种数据预测方法的流程图;
[0041]图8为本申请中一种差异显著性关系表的示意图;
[0042]图9为第二实施例的所述数据预测方法的另一种形式的流程示意图;
[0043]图10为本申请第三实施例提出的一种电子装置的硬件架构示意图;
[0044]图11为本申请第四实施例提出的一种数据预测系统的模块示意图;
[0045]图12为本申请第五实施例提出的一种数据预测系统的模块示意图。
具体实施方式
[0046]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0047]需要说明的是,在本申请实施例中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本申请要求的保护范围之内。
[0048]请参阅图1,图1为实现本申请各个实施例的一种应用环境架构图。本申请可应用于包括,但不仅限于客户端2、服务器4、网络6的应用环境中。
[0049]其中,所述客户端2用于向用户显示当前应用的界面并接收用户的搜索、页面点击、页面查看、商品收藏、加入购物车、下单、支付等操作,将用户事件上报至服务器4。所述客户端2可以为PC(Personal Computer,个人电脑)、手机、平板电脑、便携计算机、可穿戴设备等终端设备。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据预测方法,其特征在于,所述方法包括:监听用户事件,并基于所述用户事件统计实时特征;根据离线用户画像数据统计离线特征;将所述实时特征和所述离线特征输入训练好的增量模型,所述增量模型用于预测所述用户的预定指标的增量;在所述增量模型输出的预测增量高于第一预设阈值的情形下,对所述用户进行干预操作,所述干预操作用于提升所述用户的所述预定指标。2.根据权利要求1所述的数据预测方法,其特征在于,所述方法还包括:在所述增量模型输出的预测增量低于第二预设阈值的情形下,对所述用户不进行所述干预操作,其中,所述第二预设阈值小于所述第一预设阈值。3.根据权利要求1所述的数据预测方法,其特征在于,所述方法还包括:评估所述增量模型的预测效果,在评估结果不符合预期的情形下,继续对所述增量模型进行训练迭代。4.根据权利要求1至3任一项所述的数据预测方法,其特征在于,所述监听用户事件,并基于所述用户事件统计实时特征包括:通过实时监听用户事件,记录用户在应用页面的操作行为数据;利用预设时长的窗口函数,统计所述用户事件对应的实时特征。5.根据权利要求4所述的数据预测方法,其特征在于,所述利用预设时长的窗口函数,统计所述用户事件对应的实时特征包括:解析用户事件信息,得到各种事件类型及相应的数据;对解析得到的数据按预设时长进行聚合,统计所述用户的实时特征信息;将统计得到的所述实时特征信息更新至数据库中。6.根据权利要求3所述的数据预测方法,其特征在于,所述评估所述增量模型的预测效果...

【专利技术属性】
技术研发人员:黄龙平丁玲娟
申请(专利权)人:上海哔哩哔哩科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1