模型预测方法、装置、设备及存储介质制造方法及图纸

技术编号:21607074 阅读:31 留言:0更新日期:2019-07-13 18:45
本发明专利技术公开了一种模型预测方法、装置、设备及存储介质,所述的模型预测方法包括:获取N个阶段的预测模型,不同阶段的预测模型是基于不同的数据源训练得到,N为大于1的整数;根据每个阶段的预测模型对样本进行预测;并且若根据第k个阶段的预测模型对样本进行预测,则根据第k个阶段的预测模型对样本的预测结果,从参与本阶段预测的样本中筛选出参与下一个阶段预测的样本,k为小于N的任意的正整数。根据本发明专利技术实施例,能够减少调用外部数据源的数据量,同时还可以保证模型的预测效果。

Model prediction methods, devices, devices and storage media

【技术实现步骤摘要】
模型预测方法、装置、设备及存储介质
本专利技术属于计算机领域,尤其涉及一种模型预测方法、装置、设备及存储介质。
技术介绍
目前的机器学习算法可以接受上千维的特征输入,这些特征来自不同的外部数据源,每次使用预测模型进行样本预测时,需要同时调用所有用到的数据源,不同数据源的接口调用,不仅存在调用的时间成本,还需要支付相应的数据成本。针对以上问题,传统的做法是根据特征筛选技术,将原本上千维的特征删减到可接受的范围,这样能保证尽可能少地调用外部数据源的数据量,但是代价是模型的预测效果下降较为明显。
技术实现思路
本专利技术实施例提供一种模型预测方法、装置、设备及存储介质,能够减少调用外部数据源的数据量,同时还可以保证模型的预测效果。一方面,本专利技术实施例提供一种模型预测方法,包括:获取N个阶段的预测模型,不同阶段的预测模型是基于不同的数据源训练得到,N为大于1的整数;根据每个阶段的预测模型对样本进行预测;并且若根据第k个阶段的预测模型对样本进行预测,则根据第k个阶段的预测模型对样本的预测结果,从参与本阶段预测的样本中筛选出参与下一个阶段预测的样本,k为小于N的任意的正整数。另一方面,本专利技术实施例提供了一种模型预测装置,所述装置包括:模型获取模块,用于获取N个阶段的预测模型,不同阶段的预测模型是基于不同的数据源训练得到,N为大于1的整数;预测模块,用于根据每个阶段的预测模型对样本进行预测;筛选模块,用于若所述预测模块根据第k个阶段的预测模型对样本进行预测,则根据第k个阶段的预测模型对样本的预测结果,从参与本阶段预测的样本中筛选出参与下一个阶段预测的样本,k为小于N的任意的正整数。再一方面,本专利技术实施例提供了一种计算设备,所述设备包括:处理器以及存储有计算机程序指令的存储器;所述处理器执行所述计算机程序指令时实现如上所述的模型预测方法。再一方面,本专利技术实施例提供了一种计算机存储介质,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如上所述的模型预测方法。本专利技术实施例的模型预测方法、装置、设备及存储介质,能够实现数据源的异步调用,不需要调用完所有数据源之后才进行预测生产。而且在异步调用数据源后,根据样本的预测情况剔除部分样本,减少了下一阶段预测的样本数量,从而减少了下一阶段进行预测所调用外部数据源的数据量,节省数据调用时间同时也节省了数据成本。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示出了本专利技术一个实施例提供的模型预测方法的流程示意图;图2示出了本专利技术一个实施例提供的模型预测方法的原理示意图;图3示出了本专利技术一个实施例提供的穷举不同阶段的m和n值时预测模型表现KS和成本之间的关系分布示意图;图4示出了本专利技术另一个实施例提供的模型预测方法的流程示意图;图5示出了本专利技术一个实施例提供的模型预测装置的结构示意图;图6示出了本专利技术实施例提供的计算设备的硬件结构示意图。具体实施方式下面将详细描述本专利技术的各个方面的特征和示例性实施例,为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本专利技术进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本专利技术,并不被配置为限定本专利技术。对于本领域技术人员来说,本专利技术可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本专利技术的示例来提供对本专利技术更好的理解。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。为了解决现有技术问题,本专利技术实施例提供了一种模型预测方法、装置、设备及存储介质。下面首先对本专利技术实施例所提供的模型预测方法进行介绍。图1示出了本专利技术一个实施例提供的模型预测方法的流程示意图。如图1所示,该方法包括:S101,获取N个阶段的预测模型,不同阶段的预测模型是基于不同的数据源训练得到,N为大于1的整数。作为一个示例,第1阶段的预测模型是基于数据源1训练得到,第2阶段的预测模型是基于数据源1和数据源2训练得到,第3阶段的预测模型是基于数据源1、数据源2和数据源3训练得到…以此类推,第N阶段的预测模型是基于数据源1至数据源N训练得到。S102,根据每个阶段的预测模型对样本进行预测;并且若根据第k个阶段的预测模型对样本进行预测,则根据第k个阶段的预测模型对样本的预测结果,从参与本阶段预测的样本中筛选出参与下一个阶段预测的样本,k为小于N的任意的正整数。其中,根据每个阶段的预测模型对样本发生预定事件的概率值进行预测,比如预测样本的用户逾期还款的概率值,或者预测样本的用户在期限内还款的概率值。需要说明的是,得到在不同的阶段下的预测模型,根据不同的阶段下的在实证样本上进行预测,得到每个预测模型的预测概率分布。理论上来说,使用第N阶段的预测模型进行预测是最精确的,但是有时候根据部分的数据源进行预测就已经可以比较准确的预测出部分的样本,标记出足够好或足够坏的样本。比如,如果根据第k个阶段的预测模型预测出一个样本发生预定事件的概率值是99%,即使使用全部N个数据源预测出该样本发生预定事件的概率值是100%或者98%,由于第k个阶段的预测结果已经足够反映出该样本是一个好样本或坏样本,第k+1个阶段及之后阶段的预测结果变化幅度很小,第k+1个阶段及之后阶段的预测并没有特别大的意义,因此在第k个阶段将该样本过滤掉,不参与之后阶段的预测,这种方式减少了数据调用量和时间,加快了预测工作。如果根据第k个阶段的预测模型预测出一个样本发生预定事件的概率值是60%,根据该阶段预测的概率还不能确定样本是否会发生预定事件,因此该样本参与第k+1个阶段及之后阶段的预测,通过之后阶段的预测来确定样本是否会发生预定事件。在本专利技术实施例中,有两种方式从参与本阶段预测的样本中筛选出样本。方式一,从参与本阶段预测的样本中筛选出预测概率值大于第一阈值的样本和筛选出预测概率小于第二阈值的样本。比如,从参与本阶段预测的样本中筛选出预测概率大于95%的样本和筛选出预测概率值小于5%的样本,预测概率大于95%的样本和预测概率值小于5%的样本不参与下一个阶段预测,预测概率在5%-95%之间的样本参与下一个阶段预测。方式二,若本阶段预测的样本个数是Y个,按照本阶段对样本的预测概率值对Y个样本进行排序,根据排序的结果将满足预定条件的样本从所述Y个样本中剔除,未被剔除的样本是从Y个样本中筛选出的样本,即参与下一个阶段预测的样本。在方式二中,从排序后的样本中的第一个样本开始获取m×Y个样本,从排序后的样本中的最后一个样本开始获取n×Y本文档来自技高网...

【技术保护点】
1.一种模型预测方法,其特征在于,包括:获取N个阶段的预测模型,不同阶段的预测模型是基于不同的数据源训练得到,N为大于1的整数;根据每个阶段的预测模型对样本进行预测;并且若根据第k个阶段的预测模型对样本进行预测,则根据第k个阶段的预测模型对样本的预测结果,从参与本阶段预测的样本中筛选出参与下一个阶段预测的样本,k为小于N的任意的正整数。

【技术特征摘要】
1.一种模型预测方法,其特征在于,包括:获取N个阶段的预测模型,不同阶段的预测模型是基于不同的数据源训练得到,N为大于1的整数;根据每个阶段的预测模型对样本进行预测;并且若根据第k个阶段的预测模型对样本进行预测,则根据第k个阶段的预测模型对样本的预测结果,从参与本阶段预测的样本中筛选出参与下一个阶段预测的样本,k为小于N的任意的正整数。2.根据权利要求1所述的方法,其特征在于,所述根据第k个阶段的预测模型对样本的预测结果,从参与本阶段预测的样本中筛选出参与下一个阶段预测的样本,包括:若参与第k个阶段预测的样本个数是Y个,则根据第k个阶段的预测模型预测出的Y个样本发生预定事件的概率值,对所述Y个样本进行排序;根据所述排序的结果将满足预定条件的样本从所述Y个样本中剔除,未被剔除的样本是从所述Y个样本中筛选出的参与下一个阶段预测的样本。3.根据权利要求2所述的方法,其特征在于,所述预定条件包括:从排序后的所述Y个样本中的第一个样本开始获取的m×Y个样本和/或从排序后的所述Y个样本中的最后一个样本开始的获取n×Y个样本;其中,m和n均是0-1之间的小数,且m+n≤1。4.根据权利要求3所述的方法,其特征在于,所述每个阶段的预测模型对应一个m和一个n。5.根据权利要求4所述的方法,其特征在于,还包括:在预定的数值范围内对所述N个阶段的预测模型分别对应的m和n进行穷举操作,以确定所述每个阶段的预测模型对应的m和n。6.根据权利要求2所述的方法,其特征在于,所述预定事件为用户逾期还款,或者所述预定事件为用户在期限内还款。7.根据权利要求1所述的方法,其特征在于,获取每个阶段的预测模型,包括:根据N个数据源的顺序从所述N个数据源中调用至少一个数据源,其中,数据源的前后顺序取决于数据源的性价比;根据调用的至少一个数据源进行训练以得到本阶段的预测模型。8.根据权利要求7所述的方法,其特征在于,如果需要获取第j个阶段的预测模型,其中j为N或者小于N的任意的正整数,则所...

【专利技术属性】
技术研发人员:毛笠陈磊张永兴陈棱刘宾
申请(专利权)人:上海拍拍贷金融信息服务有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1