System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及车间调度领域,具体涉及基于深度强化学习的一种人员学习效应下的柔性装配作业车间绿色动态多目标调度方法。
技术介绍
1、近年来,随着全球化和计算机技术的发展,众多制造企业逐渐从传统的作业车间模式转向装配作业车间模式,该模式能够降低材料成本,提高工厂生产效率。与经典的柔性作业车间调度问题相比,低碳柔性装配作业车间调度的产品由多个模块化的零部件组成,各个部件在柔性作业车间加工完成后,再运输到装配车间装配完成成品。因此,装配作业生产模式更适合实际生产环境,能更好完成用户个性化定制需求。基于装配车间的深度强化学习调度领域仍处于初中期阶段,这使得设计调度解决方案具有挑战性。另外对于多目标调度算法,很多算法框架不足之处在于在每个重调度点算法只选择了优化某一个目标,无法更好地协调多目标之间的冲突。
2、随着工业制造战略的实施与推进,制造系统正向更加定制化的趋势发展,人机协同成为了智能制造的主流发展趋势。在大型装备制造过程中,复杂的焊接或装配工艺导致难以依靠机器人自动化实现,高素质工人成为关键的生产资源。人员学习效应是影响双资源柔性作业车间调度问题的重要因素,因此,车间管理者需要决定对机器和工人的效率分配。此外,车间作业调度是制造企业减少碳排放的重要手段之一。研究者们针对绿色排产做出了一定的贡献,但这些贡献主要是理论性的,还不能满足实际调度的要求,比如没有考虑机器实际运行时的节能,使用绿色排产指标构建更符合实际生产调度的模型,以及开发解决绿色调度更有效的算法。
3、综上所述,柔性作业车间调度是np-hard问题
技术实现思路
1、本申请提供一种人员学习效应下的柔性装配作业车间绿色动态多目标调度方法,以最小化最大完成时间和加工过程总能耗为优化目标,以基于双智能体的求解方法,解决双资源约束下的柔性装配作业车间动态低碳多目标调度问题;
2、根据本申请公开的第一方面,本申请提供一种人员学习效应下的柔性装配作业车间绿色动态多目标调度方法,包括以下步骤:
3、s1:根据人员学习效应下的柔性装配作业车间绿色动态多目标调度要求,建立人员学习效应下的柔性装配作业车间绿色动态多目标调度规划模型;
4、s2:使用双智能体结构求解人员学习效应下的柔性装配作业车间绿色动态多目标调度规划模型,构建双层深度强化学习框架协调解决多目标冲突;
5、s3:构建与问题模型和算法框架相匹配的状态空间和动作空间,提出即时奖励函数和延时奖励函数。
6、在一种可行的实施方式中,所述步骤s1,根据人员学习效应下的柔性装配作业车间绿色动态多目标调度要求,考虑多个工件在加工和装配作业过程中的最大完成时间和加工过程总能耗,建立人员学习效应下的柔性装配作业车间绿色动态多目标调度规划模型,模型参数如下:
7、(1)目标函数包括计算总加工时间函数和总能源消耗函数:
8、最大完成时间,即所有工件的最后一道工序的结束时间的最大值,函数由所有工件的最大完成时间计算,为工件总数,用于从一组数值中返回最大的值,用于从一组数值中返回最小的值;
9、;
10、加工过程总能耗包括加工能耗和空闲能耗;
11、表示加工能耗:
12、;
13、其中,表示工人操作设备执行工序的初始加工时间,表示工件的第个工序,表示设备的单元加工能耗,表示判断工序是否由工人在设备上执行的0-1决策变量,表示工人用机器加工工序时的实际学习率,表示设备总数,为人员总数,为工件的工序总数;
14、表示计算设备空闲能耗:
15、;
16、其中,表示计算设备闲置能耗,表示设备的单位闲置能耗,表示工序由工人在设备上的开始时间,表示工序由工人在设备上的结束时间,表示判断工序在设备上的后置工序是否为的0-1决策变量,表示判断工序是否由工人在设备上执行的0-1决策变量,为工件的工序总数,为工件的工序总数;
17、(2)系列约束条件包括:
18、限定一道工序只能在一台设备上由一个人员操作;
19、;
20、工序的实际运行加工时间等于运行结束时间减去运行开始时间,是由工人在设备上操作工序的初始加工时间,实际运行加工时间由初始加工时间和学习率得出,是由工人在设备上操作工序的运行结束时间,是由工人在设备上操作工序的运行开始时间,表示工人用机器加工工序时的实际学习率;
21、;
22、工序的加工完成时间等于工序的开始加工时间加上工序加工时间,等于工人操作设备加工工序的结束时间:;
23、每个工件的工序必须遵循从前到后的优先级顺序,即工序由工人在机器上的开始时间不小于同一工件的前一工序由工人在机器上运行的结束时间;
24、;
25、如果要在一台设备上处理不同工件的工序,必须按顺序进行,为1,表示工序在设备上的后置工序为,为1,表示工序在设备上的后置工序为,两种情况有且只有一种成立,工序由工人在机器上操作的开始时间为、结束时间为,工序由工人在机器上操作的开始时间为、结束时间为;
26、
27、;
28、任意机器同一时间只能操作一个工序,即由工人在机器上加工后一道工序的开始时间不小于工人在同一机器上加工前一道工序的结束时间,为一个正数;
29、;
30、任意人员同一时间只能操作一个工序,表示工人先操作机器再操作机器,表示工人可以操作机器的开始时间;
31、;
32、工人操作机器加工工序的开始时间不小于该机器加工上一道工序的结束时间,该结束时间等于工人在机器上可操作的开始时间;
33、;
34、工人再次操作机器前的间隔时长等于从上一次操作完机器的结束时间到再次操作机器的开始时间之间的间隔时间;
35、;
36、工人加工至时的实际学习率与该工人在机器上的已工作次数有关,动态调整学习率,是工人的学习效应系数,是学习效应的不可压缩系数,次数多则降低学习率大小,反之增加;
37、;
38、装配工件的第一个工序的开始时间不早于所有前置工件的结束时间,表示由工人操作机器加工工序的开始时间,表示工件的前置工件集,表示工件的最后一道工序,表示由工人操作加工工序的结束时间;
39、。
40、在一种可行的实施方式中,所述步骤s2,提出双智能体框架求解人员学习效应下的柔性装配作业车间绿色动态多目标调度规划模型,构建双层深度本文档来自技高网...
【技术保护点】
1.一种人员学习效应下的柔性装配作业车间绿色动态多目标调度方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种人员学习效应下的柔性装配作业车间绿色动态多目标调度方法,其特征在于,所述步骤S1,根据人员学习效应下的柔性装配作业车间绿色动态多目标调度要求,考虑多个工件在加工和装配作业过程中的最大完成时间和加工过程总能耗,建立人员学习效应下的柔性装配作业车间绿色动态多目标调度规划模型,模型参数如下;
3.根据权利要求1所述的一种人员学习效应下的柔性装配作业车间绿色动态多目标调度方法,其特征在于,所述步骤S2,提出双智能体框架求解人员学习效应下的柔性装配作业车间绿色动态多目标调度规划模型,构建双层深度强化学习框架协调解决多目标冲突;
4.根据权利要求2所述的一种人员学习效应下的柔性装配作业车间绿色动态多目标调度方法,其特征在于,所述步骤S3,构建与问题模型和算法框架相匹配的状态空间和动作空间,提出即时奖励函数和延时奖励函数;
【技术特征摘要】
1.一种人员学习效应下的柔性装配作业车间绿色动态多目标调度方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种人员学习效应下的柔性装配作业车间绿色动态多目标调度方法,其特征在于,所述步骤s1,根据人员学习效应下的柔性装配作业车间绿色动态多目标调度要求,考虑多个工件在加工和装配作业过程中的最大完成时间和加工过程总能耗,建立人员学习效应下的柔性装配作业车间绿色动态多目标调度规划模型,模型参数如下;
3.根...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。