模型参数调整方法和装置制造方法及图纸

技术编号:13791599 阅读:66 留言:0更新日期:2016-10-06 01:21
本申请公开了一种模型参数调整方法和装置,通过应用本申请实施例的技术方案,风控决策装置监控当前模型的表现情况,当所述表现情况达到调整阈值时,所述风控决策装置调取所述当前模型的模型参数,并获取最近一个训练周期内的完成预处理的训练数据,所述风控决策装置根据所述训练数据对所述当前模型的模型参数进行调整,并根据调整后的模型参数对所述当前模型进行更新,从而,可以使风控决策装置基于对模型表现情况的监控,在不改变模型结构以及变量的基础上,自动对模型进行调整和更新,增进当前所应用的模型的准确度,从而以低成本实现模型改进与优化。

【技术实现步骤摘要】

本申请涉及系统测试领域,尤其涉及一种模型参数调整方法和装置
技术介绍
风险模型是风控系统的重要组成部分,风险模型往往被直接用来判别用户环境或用户的交易是否存在风险。比如网上银行等涉及个人资产或信息安全的账户是否存在被盗风险,网上银行的每一笔资金交易是否是账户本人自己操作的,等等。而风险模型是根据历史信息训练得来的,随着时间的推移,样本会发生变化迁移导致模型的精度出现下降。精度下降的其中一个表现就是点估计偏高或者偏低。点估计也称定值估计,点估计值偏高意味着模型高估了样本的事件发生概率(在风控模型中,指的是有风险的概率),而偏低则是低估了样本的事件发生概率。这种模型精度的下降会直接导致高危风险交易被漏过(点估计偏低),而这会给账户所有者直接带来经济上的损失;精度的下降还同时意味着正常用户将被误认为是高危用户(点估计偏高),从而被风控系统所打扰,影响到这些正常用户的交易,给用户体验带来较大的负面影响。为了解决这种模型性能下降的问题,目前普遍使用的方法包括以下两种:方法一、在一段时间之后重建模型,对变量参数进行调整,或再开发出一个全新的模型,然后在系统中对原来的模型进行更新或替换。方法二、利用原有模型的分值作为自变量,最新收集到的样本标签作为应变量,通过基于原有模型再新建一个模型。新建模型的建模的方法可以是线性模型,也可以为非线性模型,是实现原有模型分值的再调整的一个过程。由于利用了最新数据信息对分值进行了调整,这样得到的调整后的新的分值可以更好的体现最新数据形态,因此精度会比原始模型高。在实现本申请的过程中,本申请的申请人发现现有技术存在以下缺陷:显然,对于方法一,这种方法的时间成本非常高,需要花费相当长的时间进行数据的收集与清洗,并且需要花很长的时间进行变量选择,这种方法已经抛弃了原有的模型,且原有模型对新模型并无贡献。而对于方法二,这种分值建模再调整的过程,无法保证分值模型的稳定性,并且新分值无法解释为什么相对于旧分值而言被高估或低估了。基于上述的缺陷,如何在低成本的基础上,快速、准确并灵活的进行模型参数的自适应调整,以达到优化原有模型的目的,成为了现有技术方案亟待解决的重要问题。
技术实现思路
本申请提供了一种模型参数调整方法和装置,能够解决现有技术中,无法在低成本的基础上,快速、准确并灵活的进行模型参数的自适应调整的问题。为达到上述目的,本申请实施例一方面提供了一种模型参数调整方法,所述方法包括:风控决策装置监控当前模型的表现情况;当所述表现情况达到调整阈值时,所述风控决策装置调取所述当前模型的模型参数,并获取最近一个训练周期内的完成预处理的训练数据;所述风控决策装置根据所述训练数据对所述当前模型的模型参数进行调整;所述风控决策装置根据调整后的模型参数对所述当前模型进行更新。优选的,所述风控决策装置监控当前模型的表现情况,具体包括:所述风控决策装置调用所述当前模型所对应的预设时间区间范围内的分值数据和标签数据,对所述当前模型进行模型表现评估。优选的,所述当前模型的模型参数,具体包括所述当前模型的模型信息θ和模型结构,所述完成预处理的训练数据,具体包括经过清洗处理的模型变量x以及真实的数据标签y;相应的,所述风控决策装置根据所述训练数据对所述当前模型的模型参
数进行调整,具体包括:所述风控决策装置根据所述模型信息θ、所述模型变量x以及所述真实的数据标签y,计算得到J(θ);所述风控决策装置按照预设的调整规则,通过最小化J(θ),对所述模型信息θ进行调整。优选的,对于逻辑回归模型,所述风控决策装置根据所述训练数据对所述当前模型的模型参数进行调整,具体包括:所述风控决策装置根据所述模型信息θ、所述模型变量x以及所述真实的数据标签y,按照如下公式,计算得到J(θ): J ( θ ) = 1 m Σ i = 1 m Cost ( h θ ( x i ) , y i ) , ]]>其中,m为用来进行自适应参数调整的样本个数,hθ(x)表示研究对象有风险的概率, Cost ( h θ ( x ) , y ) = - log ( h θ ( x ) ) ify = 1 - log ( 1 - h θ ( x ) ) ify = 0 , ]]> h θ ( x ) = g ( θ T x ) = 1 1 + e - θ T 本文档来自技高网
...

【技术保护点】
一种模型参数调整方法,其特征在于,所述方法包括:风控决策装置监控当前模型的表现情况;当所述表现情况达到调整阈值时,所述风控决策装置调取所述当前模型的模型参数,并获取最近一个训练周期内的完成预处理的训练数据;所述风控决策装置根据所述训练数据对所述当前模型的模型参数进行调整;所述风控决策装置根据调整后的模型参数对所述当前模型进行更新。

【技术特征摘要】
1.一种模型参数调整方法,其特征在于,所述方法包括:风控决策装置监控当前模型的表现情况;当所述表现情况达到调整阈值时,所述风控决策装置调取所述当前模型的模型参数,并获取最近一个训练周期内的完成预处理的训练数据;所述风控决策装置根据所述训练数据对所述当前模型的模型参数进行调整;所述风控决策装置根据调整后的模型参数对所述当前模型进行更新。2.如权利要求1所述的方法,其特征在于,所述风控决策装置监控当前模型的表现情况,具体包括:所述风控决策装置调用所述当前模型所对应的预设时间区间范围内的分值数据和标签数据,对所述当前模型进行模型表现评估。3.如权利要求1所述的方法,其特征在于,所述当前模型的模型参数,具体包括所述当前模型的模型信息θ和模型结构,所述完成预处理的训练数据,具体包括经过清洗处理的模型变量x以及真实的数据标签y;相应的,所述风控决策装置根据所述训练数据对所述当前模型的模型参数进行调整,具体包括:所述风控决策装置根据所述模型信息θ、所述模型变量x以及所述真实的数据标签y,计算得到J(θ);所述风控决策装置按照预设的调整规则,通过最小化J(θ),对所述模型信息θ进行调整。4.如权利要求3所述的方法,其特征在于,对于逻辑回归模型,所述风控决策装置根据所述训练数据对所述当前模型的模型参数进行调整,具体包括:所述风控决策装置根据所述模型信息θ、所述模型变量x以及所述真实的数据标签y,按照如下公式,计算得到J(θ): J ( θ ) = 1 m Σ i = 1 m Cost ( h θ ( x i ) , y i ) , ]]>其中,m为用来进行自适应参数调整的样本个数,hθ(x)表示研究对象有风险的概率, Cost ( h θ ( x ) , y ) = - log ( h θ ( x ) ) if y = 1 - log ( 1 - h θ ( x ) ) if y = 0 , ]]> h θ ( x ) = g ( θ T x ) = 1 1 + e - θ T x ; ]]>所述风控决策装置按照如下的调整规则,通过最小化J(θ),对所述模型信息θ进行调整: θ j : = θ j - α ∂ ∂ θ j J ( θ ) = θ j - α Σ i = 1 m ( h θ ( x i ) - y i ) x i , j = 0 , . . . , n , ]]>其中,α为学习步长,n为参数调整迭代次数。5.如权利要求3或4所述的方法,其特征在于,还包括:所述风控决策装置根据距离当前时刻的时间差异,分别为不同的训练数据设置不同的权值;所述风控决策装置根据通过相应的权值进行加...

【专利技术属性】
技术研发人员:陈露佳
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1