模型更新方法、装置、设备及存储介质制造方法及图纸

技术编号:30327237 阅读:20 留言:0更新日期:2021-10-10 00:13
本发明专利技术涉及人工智能技术,揭露了一种模型更新方法,包括:将业务数据分类,得到实时业务数据及离线业务数据,对实时业务数据进行统计变换,得到第一实时变量,对离线业务数据进行数据分离,得到第一离线变量及第二离线变量,对第一实时变量及第一离线变量进行合并,得到第一合并变量,基于所述第一合并变量得到第二实时变量,汇总第一合并变量、第二离线变量及第二实时变量,得到训练数据,利用训练数据对原始模型进行训练,得到标准模型。此外,本发明专利技术还涉及区块链技术,所述合并变量可存储在区块链的节点中。本发明专利技术还提出一种模型更新装置、电子设备以及计算机可读存储介质。本发明专利技术可以解决模型更新效率较低且精度较低的问题。解决模型更新效率较低且精度较低的问题。解决模型更新效率较低且精度较低的问题。

【技术实现步骤摘要】
模型更新方法、装置、设备及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种模型更新方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]模型更新训练是算法迭代优化的关键操作,替换效果下降的老模型,上线效果更好的新模型,才能不断保持模型的良好性能。现有技术下,广泛使用实际应用中生产数据作为样本数据对模型进行离线再训练,以此来提高模型精度。然而这种方法对于样本经常出现变化的模型效果不佳,例如,在市场营销和风险识别领域,营销模型和风控模型完成一次样本数据准备和模型更新评估迭代,通常要花费数周时间,加上模型部署和测试的时间,等到模型真正能够上线应用,几个月的时间已经过去了,更新效率较低,而用户群经常随时间出现不同程度的波动,模型从训练到上线的时间跨度长,上线时不能及时捕捉当前用户群的特征,使得模型精度变差。

技术实现思路

[0003]本专利技术提供一种模型更新方法、装置、设备及存储介质,其主要目的在于解决模型更新效率较低且精度较低的问题。
[0004]为实现上述目的,本专利技术提供的一种模型更新方法,包括:
[0005]将业务应用的业务数据分类,得到实时业务数据及离线业务数据;
[0006]对所述实时业务数据进行统计变换,得到第一实时变量,利用所述业务数据中的离线用户信息对所述离线业务数据进行数据分离,得到第一离线变量及第二离线变量;
[0007]对所述第一实时变量及所述第一离线变量进行合并,得到第一合并变量,并基于所述第一合并变量得到第二实时变量
[0008]汇总所述第一合并变量、所述第二离线变量及所述第二实时变量,得到训练数据,利用所述训练数据对待训练原始模型进行训练,得到标准模型。
[0009]可选地,所述将业务应用的业务数据分类,得到实时业务数据及离线业务数据,包括:
[0010]提取所述业务数据中的实时数据,利用预设的消息中间件对所述实时数据进行排列,得到实时业务队列,其中,所述实时业务队列中包含所述实时业务数据;
[0011]提取所述业务数据中的离线日志,根据所述实时数据中的用户信息提取所述离线日志中同一用户的离线业务数据。
[0012]可选地,所述对所述实时业务数据进行统计变换,得到第一实时变量,包括:
[0013]利用预设的流计算平台依次从所述实时业务队列中获取实时业务数据;
[0014]在所述流计算平台中,统计所述实时业务数据中的用户浏览操作的时长,并将统计到的时长作为所述第一实时变量。
[0015]可选地,所述利用所述业务数据中的离线用户信息对所述离线业务数据进行数据
分离,得到第一离线变量及第二离线变量,包括:
[0016]利用预设的批处理平台对所述离线业务数据进行批量划分,得到批量离线数据;
[0017]将所述批量离线数据中的离线用户信息作为所述第一离线变量,将所述批量离线数据中的历史用户点击操作作为所述第二离线变量。
[0018]可选地,所述对所述第一实时变量及所述第一离线变量进行合并,得到第一合并变量,并基于所述第一合并变量得到第二实时变量,包括:
[0019]对同一用户的第一实时变量及第一离线变量进行合并,得到第一合并变量;
[0020]将所述第一合并变量合并后所述业务应用反馈的实时用户点击操作作为所述第二实时变量。
[0021]可选地,所述利用所述训练数据对待训练原始模型进行训练,得到标准模型,包括:
[0022]合并所述训练数据中的所述第二离线变量及所述第二实时变量,得到第二合并变量,并将所述第二合并变量作为实时验证数据;
[0023]利用所述待训练原始模型对所述第一合并变量进行预测评分,得到实时预测结果;
[0024]计算所述实时预测结果与所述实时验证数据的差值,并根据所述差值计算损失值,在所述损失值小于预设的损失阈值时,返回所述将业务应用的业务数据分类的步骤,在所述损失值大于等于所述损失阈值时,得到所述标准模型。
[0025]可选地,所述利用所述训练数据对所述原始模型进行训练,得到标准模型之后,所述方法还包括:
[0026]计算所述原始模型的性能评估指标,得到原始评估指标,及计算所述标准模型的性能评估指标,得到标准评估指标;
[0027]计算所述标准评估指标与所述原始评估指标的比值;
[0028]在所述比值小于预设的性能阈值时,不对所述原始模型进行更新;
[0029]在所述比值大于等于预设的性能阈值时,利用所述标准模型更新所述原始模型。
[0030]为了解决上述问题,本专利技术还提供一种模型更新装置,所述装置包括:
[0031]业务数据分类模块,用于将业务应用的业务数据分类,得到实时业务数据及离线业务数据;
[0032]数据分离模块,用于对所述实时业务数据进行统计变换,得到第一实时变量,利用所述业务数据中的离线用户信息对所述离线业务数据进行数据分离,得到第一离线变量及第二离线变量;
[0033]数据合并模块,用于对所述第一实时变量及所述第一离线变量进行合并,得到第一合并变量,并基于所述第一合并变量得到第二实时变量;
[0034]模型训练模块,用于汇总所述第一合并变量、所述第二离线变量及所述第二实时变量,得到训练数据,利用所述训练数据对待训练原始模型进行训练,得到标准模型。
[0035]为了解决上述问题,本专利技术还提供一种电子设备,所述电子设备包括:
[0036]存储器,存储至少一个指令;及
[0037]处理器,执行所述存储器中存储的指令以实现上述所述的模型更新方法。
[0038]为了解决上述问题,本专利技术还提供一种计算机可读存储介质,所述计算机可读存
储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的模型更新方法。
[0039]本专利技术通过对实时业务数据进行统计变换,得到第一实时变量,可以实时采集用户数据,并基于第一合并变量得到第二实时变量,可以提高实时数据的时效性,更快的生成用户的实时特征,并且所述训练数据集包括了用户的历史离线数据,进一步丰富了用户特征,因此可以提高模型更新的精度。同时,利用训练数据可以实时对所述原始模型进行训练,得到标准模型,相对于传统的离线更新方式,本专利技术对实时数据的使用更加充分,可以提高模型更新的效率,并且更能捕捉在线快速变化的趋势特征,也提高了模型的精度。因此本专利技术提出的模型更新方法、装置、电子设备及计算机可读存储介质,可以解决模型更新效率较低且精度较低的问题。
附图说明
[0040]图1为本专利技术一实施例提供的模型更新方法的流程示意图;
[0041]图2为图1中其中一个步骤的详细实施流程示意图;
[0042]图3为图1中另一个步骤的详细实施流程示意图;
[0043]图4为图1中另一个步骤的详细实施流程示意图;
[0044]图5为本专利技术一实施例提供的模型更新装置的功能模块图;
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型更新方法,其特征在于,所述方法包括:将业务应用的业务数据分类,得到实时业务数据及离线业务数据;对所述实时业务数据进行统计变换,得到第一实时变量,利用所述业务数据中的离线用户信息对所述离线业务数据进行数据分离,得到第一离线变量及第二离线变量;对所述第一实时变量及所述第一离线变量进行合并,得到第一合并变量,并基于所述第一合并变量得到第二实时变量;汇总所述第一合并变量、所述第二离线变量及所述第二实时变量,得到训练数据,利用所述训练数据对待训练原始模型进行训练,得到标准模型。2.如权利要求1所述的模型更新方法,其特征在于,所述将业务应用的业务数据分类,得到实时业务数据及离线业务数据,包括:提取所述业务数据中的实时数据,利用预设的消息中间件对所述实时数据进行排列,得到实时业务队列,其中,所述实时业务队列中包含所述实时业务数据;提取所述业务数据中的离线日志,根据所述实时数据中的用户信息提取所述离线日志中同一用户的离线业务数据。3.如权利要求2所述的模型更新方法,其特征在于,所述对所述实时业务数据进行统计变换,得到第一实时变量,包括:利用预设的流计算平台依次从所述实时业务队列中获取实时业务数据;在所述流计算平台中,统计所述实时业务数据中的用户浏览操作的时长,并将统计到的时长作为所述第一实时变量。4.如权利要求1所述的模型更新方法,其特征在于,所述利用所述业务数据中的离线用户信息对所述离线业务数据进行数据分离,得到第一离线变量及第二离线变量,包括:利用预设的批处理平台对所述离线业务数据进行批量划分,得到批量离线数据;将所述批量离线数据中的离线用户信息作为所述第一离线变量,将所述批量离线数据中的历史用户点击操作作为所述第二离线变量。5.如权利要求4所述的模型更新方法,其特征在于,所述对所述第一实时变量及所述第一离线变量进行合并,得到第一合并变量,并基于所述第一合并变量得到第二实时变量,包括:对同一用户的第一实时变量及第一离线变量进行合并,得到第一合并变量;将所述第一合并变量合并后所述业务应用反馈的实时用户点击操作作为所述第二实时变量。6.如权利要求1所述的模型更新方法,其特征在于,所述利用所述训练数据对...

【专利技术属性】
技术研发人员:王志省
申请(专利权)人:平安银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1