基于可靠集成模型的数据驱动演化优化方法和系统技术方案

技术编号：41293155 阅读：24 留言：0更新日期：2024-05-13 14:43

本公开提供一种基于可靠集成模型的数据驱动演化优化方法和系统，包括：获得待优化任务，对待优化任务进行迭代，得到并输出待优化任务的目标解，在第m次迭代的情况下：将第m次迭代的候选解集输入至预设的N个基模型中的每一基模型，得到各基模型各自的预测目标值，m为大于等于1的整数，N为大于1的整数，基于第m次迭代的各预测目标值对N个基模型进行可靠性集成，得到第m次迭代的候选解集的可靠性评估值，根据第m次迭代的候选解集的可靠性评估值确定第m+1次迭代的候选解集，以提供准确而鲁棒的候选解集的可靠性评估值，搜索潜在的相对更优解，使更可靠的基模型对指导优化算法做出更多贡献，更加稳定且准确地推动优化算法的进行。

全部详细技术资料下载

【技术实现步骤摘要】

本说明书涉及人工智能，尤其涉及一种基于可靠集成模型的数据驱动演化优化方法。

技术介绍

1、数据驱动优化可以训练预测模型来代替目标黑盒函数，并引导优化器搜索最优的候选解供实际应用。

2、在相关技术的优化过程中，优化系统通过分组随机选择的方式挑选预设数量的基模型，并将所选基模型平均集成作为代理模型，以通过代理模型为优化器提供待优化任务的新候选解的评估，得到新候选解，直至在新候选解满足预设结束条件，从而完成优化的迭代过程，输出待优化任务的最优解。

3、然而，优化系统采用多个基模型平均集成，没有考虑每个单独的基模型的可靠性(如预测是否准确、鲁棒等)，因此，性能较差的基模型可能使得集成结果劣化，从而可能误导优化器搜索到较差的新候选解，造成优化的准确性和可靠性偏低的技术问题。

4、值得说明的是，上述相关技术的内容仅仅是专利技术人个人所知晓的信息，并不代表上述信息在本公开申请日之前已经进入公共领域，也不代表其可以成为本公开的现有技术。

技术实现思路

1、本公开提供一种基于可靠集成模型的数据驱动演化优化方法和系统，用以避免上述技术问题中的至少一种。

2、第一方面，本公开提供一种基于可靠集成模型的数据驱动演化优化方法，所述方法包括：

3、获得待优化任务；

4、对所述待优化任务进行迭代，得到并输出所述待优化任务的目标解；

5、其中，在第m次迭代的情况下：

6、将所述第m次迭代的候选解集输入至预设的n个基模型

7、基于所述第m次迭代的各预测目标值对所述n个基模型进行可靠性集成，得到所述第m次迭代的候选解集的可靠性评估值；

8、根据所述第m次迭代的候选解集的可靠性评估值确定第m+1次迭代的候选解集。

9、在一些实施例中，可靠性评估值用于表征所述第m次迭代的候选解集中各候选解之间的预测支配关系的准确性。

10、在一些实施例中，所述第m次迭代的候选解集包括多个候选解，候选解与预测目标值为一一对应关系；所述基于所述第m次迭代的各预测目标值对所述n个基模型进行可靠性集成，得到所述第m次迭代的候选解集的可靠性评估值，包括：

11、根据获得的各基模型各自对应的第m-1次迭代的预测目标值、以及获得的所述n个基模型对应的第m-1次迭代的可靠性评估值，确定所述当前基模型的所述第m次迭代的可靠性分数；

12、根据所述第m次迭代下各基模型各自的可靠性分数和预测目标值，确定所述第m次迭代的候选解集的可靠性评估值。

13、在一些实施例中，所述根据获得的各基模型各自对应的第m-1次迭代的预测目标值、以及获得的所述n个基模型对应的第m-1次迭代的可靠性评估值，确定所述当前基模型的所述第m次迭代的可靠性分数，包括：

14、针对所述第m-1次迭代的候选解集中的每两个候选解，根据所述每两个候选解各自对应的预测目标值、以及所述第m-1次迭代的可靠性评估值，确定所述每两个候选解之间的预测目标值距离、以及预测误差值之和；

15、针对当前基模型，根据所述当前基模型对应的各预测目标值距离、以及各预测误差值之和，确定所述当前基模型的所述第m次迭代的可靠性分数，其中，所述当前基模型为所述n个基模型中的任意模型。

16、在一些实施例中，所述根据所述当前基模型对应的各预测目标值距离、以及各预测误差值之和，确定所述当前基模型的所述第m次迭代的可靠性分数，包括：

17、根据所述每两个候选解之间预测目标值距离、预测误差值之和，确定所述当前基模型对所述每两个候选解之间的可靠性度量信息，其中，可靠性度量信息用于表征支配关系是否正确；

18、根据各可靠性度量信息，确定所述当前基模型的所述第m次迭代的可靠性分数。

19、在一些实施例中，所述每两个候选解包括第一候选解和第二候选解，所述第一候选解和所述第二候选解之间的支配关系为所述第一候选解支配第二候选解，所述每两个候选解之间的预测目标值距离表征所述第一候选解与所述第二候选解之间的差值；

20、在所述每两个候选解之间的预测目标值距离大于所述每两个候选解之间的预测误差值之和的情况下，所述每两个候选解之间的可靠性度量信息表征支配关系正确；

21、在所述每两个候选解之间的预测目标值距离小于所述每两个候选解之间的预测误差值之和的情况下，所述每两个候选解之间的可靠性度量信息表征支配关系错误。

22、在一些实施例中，所述根据所述第m次迭代下各基模型各自的可靠性分数和预测目标值，确定所述第m次迭代的候选解集的可靠性评估值，包括：

23、基于所述第m次迭代的各基模型各自的可靠性分数，确定所述n个基模型各自对应的权重信息；

24、基于n个权重信息对所述n个基模型各自的预测目标值进行可靠性集成，得到所述第m次迭代的候选解集的可靠性评估值。

25、在一些实施例中，在m为1的情况下，所述第m-1次迭代的预测目标值为预设的历史可靠性评估值。

26、在一些实施例中，所述方法还包括：

27、获得n个样本数据子集，每一样本数据子集中包括已评估解、以及与所述已评估解对应的评估值；

28、将均方差损失函数作为损失函数、并且根据所述n个样本数据子集对预设神经网络进行训练，得到所述n个基模型，其中，一个样本数据子集训练得到一个基模型。

29、在一些实施例中，所述方法应用于风控场景，所述待优化任务包括对获得的用户的信用评分进行分箱的优化任务，所述目标解包括所述信用评分对应的风险等级和切分点。

30、第二方面，本公开提供一种基于可靠集成模型的数据驱动演化优化系统，包括：

31、至少一个存储器，所述存储器包括至少一组指令来数据驱动演化优化；

32、至少一个处理器，同所述至少一个存储器进行通讯；

33、其中，当所述至少一个处理器执行所述至少一组指令时，实施如第一方面任一项所述的方法。

34、第三方面，本公开提供一种处理器可读存储介质，所述处理器可读存储介质存储有计算机程序，所述计算机程序用于使所述处理器执行第一方面任一项所述的方法。

35、第四方面，本公开提供一种电子设备，包括：处理器，以及与所述处理器通信连接的存储器；

36、所述存储器存储计算机执行指令；

37、所述处理器执行所述存储器存储的计算机执行指令，以实现如第一方面任一项所述的方法。

38、第五方面，本公开提供一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现第一方面任一项所述的方法。

39、由以上技术方案可知，本公开提供的基于可靠集成模型的数据驱动演化优化方法和系统，包括：获得待优化任务，对待优化任务进行迭代，得到并输出待优化任务的目标解，其中，在第m本文档来自技高网...

【技术保护点】

1.一种基于可靠集成模型的数据驱动演化优化方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，可靠性评估值用于表征所述第m次迭代的候选解集中各候选解之间的预测支配关系的准确性。

3.根据权利要求2所述的方法，其特征在于，所述基于所述第m次迭代的各预测目标值对所述N个基模型进行可靠性集成，得到所述第m次迭代的候选解集的可靠性评估值，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据获得的各基模型各自对应的第m-1次迭代的预测目标值、以及所述N个基模型对应的第m-1次迭代的可靠性评估值，确定所述当前基模型的所述第m次迭代的可靠性分数，包括：

5.根据权利要求4所述的方法，其特征在于，所述根据所述当前基模型对应的各预测目标值距离、以及各预测误差值之和，确定所述当前基模型的所述第m次迭代的可靠性分数，包括：

6.根据权利要求5所述的方法，其特征在于，所述每两个候选解包括第一候选解和第二候选解，所述第一候选解和所述第二候选解之间的支配关系为所述第一候选解支配第二候选解，所述每两个候选解之间的预测目标

7.根据权利要求5所述的方法，其特征在于，所述当前基模型的所述第m次迭代的可靠性分数用于表征所述当前基模型正确预测的支配关系的数量。

8.根据权利要求3所述的方法，其特征在于，所述根据所述第m次迭代下各基模型各自的可靠性分数和预测目标值，确定所述第m次迭代的候选解集的可靠性评估值，包括：

9.根据权利要求3所述的方法，其特征在于，在m为1的情况下，所述第m-1次迭代的预测目标值为预设的历史可靠性评估值。

10.根据权利要求1所述的方法，其特征在于，所述方法还包括：

11.根据权利要求1所述的方法，其特征在于，所述方法应用于风控场景，所述待优化任务包括对获得的用户的信用评分进行分箱的优化任务，所述目标解包括所述信用评分对应的风险等级和切分点。

12.一种基于可靠集成模型的数据驱动演化优化系统，其特征在于，包括：

...

【技术特征摘要】

1.一种基于可靠集成模型的数据驱动演化优化方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，可靠性评估值用于表征所述第m次迭代的候选解集中各候选解之间的预测支配关系的准确性。

3.根据权利要求2所述的方法，其特征在于，所述基于所述第m次迭代的各预测目标值对所述n个基模型进行可靠性集成，得到所述第m次迭代的候选解集的可靠性评估值，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据获得的各基模型各自对应的第m-1次迭代的预测目标值、以及所述n个基模型对应的第m-1次迭代的可靠性评估值，确定所述当前基模型的所述第m次迭代的可靠性分数，包括：

6.根据权利要求5所述的方法，其特征在于，所述每两个候选解包括第一候选解和第二候选解，所述第一候选解和所述第二候选解之...

【专利技术属性】
技术研发人员：钱鸿，鲁华康，卢星宇，顾咏丰，吴宇鹏，周爱民，周俊，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人