利用整数规划求解器实现的任务处理方法、设备和介质技术

技术编号：34624774 阅读：24 留言：0更新日期：2022-08-20 09:32

本公开提供了一种利用整数规划求解器实现的任务处理方法、设备和介质，涉及计算机技术领域，尤其涉及人工智能。实现方案为：获取与任务相关的多个变量中当前未固定的至少一个变量的分布信息，分布信息包括至少一个变量的类型分布信息和至少一个变量在任务的目标函数中的类型分布信息；少基于至少一个变量的分布信息，从多个候选变量选择策略中确定当前问题的第一目标变量选择策略；以及利用第一目标变量选择策略从多个变量中确定当前问题的至少一个目标变量。少一个目标变量。少一个目标变量。

全部详细技术资料下载

【技术实现步骤摘要】
利用整数规划求解器实现的任务处理方法、设备和介质

[0001]本公开涉及计算机
，尤其涉及人工智能，具体涉及一种利用整数规划求解器实现的任务处理方法、装置、电子设备、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术；人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]混合整数规划是运筹优化领域中非常重要的问题，通过对其进行求解可以解决各种领域内的规划问题。如何改善混合整数规划的问题的求解过程，成为了业界关注的焦点。
[0004]在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明，否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地，除非另有指明，否则此部分中提及的问题不应认为在任何现有技术中已被公认。

技术实现思路

[0005]本公开提供了一种利用整数规划求解器实现的任务处理方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
[0006]根据本公开的一方面，提供了一种利用整数规划求解器实现的任务处理方法，整数规划求解器包括分支模块，任务包括多个层次的问题，该方法包括利用分支模块依次确定每个层次的问题...

【技术保护点】

【技术特征摘要】
1.一种利用整数规划求解器实现的任务处理方法，所述整数规划求解器包括分支模块，所述任务包括多个层次的问题，所述方法包括利用分支模块依次确定每个层次的问题的至少一个目标变量，其中，所述利用分支模块确定当前问题的至少一个目标变量包括：获取与所述任务相关的多个变量中当前未固定的至少一个变量的分布信息，所述分布信息包括所述至少一个变量的类型分布信息和所述至少一个变量在所述任务的目标函数中的类型分布信息；至少基于所述至少一个变量的分布信息，从多个候选变量选择策略中确定所述当前问题的第一目标变量选择策略；以及利用所述第一目标变量选择策略从所述多个变量中确定所述当前问题的至少一个目标变量。2.根据权利要求1所述的方法，还包括：获取与所述任务相关的多个变量的分布信息，其中，至少基于所述至少一个变量的分布信息，从多个候选变量选择策略确定所述当前问题的第一目标变量选择策略包括：基于所述多个变量的分布信息以及所述至少一个变量的分布信息，从多个候选变量选择策略确定所述当前问题的第一目标变量选择策略。3.根据权利要求1或2所述的方法，其中，至少将所述至少一个变量的分布信息输入强化学习模型，利用所述强化学习模型从多个候选变量选择策略确定所述当前问题的目标变量选择策略。4.根据权利要求3所述的方法，还包括：基于当前问题的至少一个目标变量，计算全局最优松弛解和全局最优可行解；基于所述全局最优松弛解和全局最优可行解，计算奖励函数；基于所述奖励函数调整所述强化学习模型的参数；以及利用调参后的强化学习模型从多个候选变量选择策略确定所述当前问题的下一层次问题的第二目标变量选择策略。5.根据权利要求4所述的方法，其中，所述奖励函数为所述全局最优松弛解和全局最优可行解的比值。6.根据权利要求3所述的方法，其中，训练所述强化学习模型的样本数据包括：装箱样本数据和物流样本数据。7.根据权利要1所述的方法，其中，所述多个候选变量选择策略包括至少一个启发式策略和至少一个模仿学习模型。8.根据权利要求7所述的方法，其中，训练所述模仿学习模型的样本数据为利用强分支策略而获得的。9.根据权利要求7所述的方法，其中，训练所述模仿学习模型的样本数据包括：装箱样本数据和物流样本数据。10.根据权利要求1...

【专利技术属性】
技术研发人员：丁建辉，陈珍，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人