System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于路面养护领域,具体涉及一种基于强化学习的路面养护决策方法。
技术介绍
1、在当今的大数据时代,路面养护决策的复杂性和挑战性日益增加。伴随着城市化进程的加速和交通网络的持续扩张,海量的数据被生成,这包括了养护措施效益、路面状况以及养护成本等多维度信息。这些信息的有效整合和分析对于提高路面养护的决策效率至关重要。然而,传统的决策方法往往无法有效处理这种规模的数据,无法实时适应快速变化的环境条件。因此,探索一种能够有效处理大数据,同时提高决策效率的方法显得尤为迫切。
2、也有学者提出一种路面养护维修智能决策系统。中国专利号cn113723753a号所公开的“一种路面养护维修智能决策系统”(申请号:202110843921.4)。该系统通过收集道路状态参数,计算各个参考方案的奖励值,针对奖励值达到特定阈值的参考方案,运用强化学习模型进行深入分析,综合考量养护维修参考因素,确定各参考方案的优先级,把优先级最高的参考方案作为最优养护方案。
3、但该系统的运作机制依赖于预先设定的一系列参考方案。若最优的养护方案未被包含在这些预设参考方案中,则系统无法识别并提出真正的全局最优解。
技术实现思路
1、针对上述问题,本专利技术的目的在于提供一种基于强化学习的路面养护决策方法。
2、实现本专利技术目的的具体技术方案为:
3、一种基于强化学习的路面养护决策方法,包括以下步骤:
4、步骤1、构建路面养护决策模型;并设定其约束条件;
...【技术保护点】
1.一种基于强化学习的路面养护决策方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于强化学习的路面养护决策方法,其特征在于,所述步骤1中的路面养护决策模型,具体为:
3.根据权利要求2所述的基于强化学习的路面养护决策方法,其特征在于,所述状态空间用于表征路面状态,采用路段和年份表示路面状态:
4.根据权利要求2所述的基于强化学习的路面养护决策方法,其特征在于,所述动作空间用于表征选择的路面养护措施;
5.根据权利要求4所述的基于强化学习的路面养护决策方法,其特征在于,所述路面养护决策模型的约束条件为:
6.根据权利要求2所述的基于强化学习的路面养护决策方法,其特征在于,所述奖励空间的奖励值函数为:
7.根据权利要求2所述的基于强化学习的路面养护决策方法,其特征在于,所述环境的状态转移函数为:
8.根据权利要求1所述的基于强化学习的路面养护决策方法,其特征在于,所述步骤2中的DDQN强化学习算法具体为:
9.根据权利要求8所述的基于强化学习的路面养护决策方法,其特征在于,所述
...【技术特征摘要】
1.一种基于强化学习的路面养护决策方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于强化学习的路面养护决策方法,其特征在于,所述步骤1中的路面养护决策模型,具体为:
3.根据权利要求2所述的基于强化学习的路面养护决策方法,其特征在于,所述状态空间用于表征路面状态,采用路段和年份表示路面状态:
4.根据权利要求2所述的基于强化学习的路面养护决策方法,其特征在于,所述动作空间用于表征选择的路面养护措施;
5.根据权利要求4所述的基于强化学习的路面养护决策方法,其特征在于,所...
【专利技术属性】
技术研发人员:石文康,王永,刘星,华飞飞,戴仁礼,常伟,陈静,
申请(专利权)人:江苏宁宿徐高速公路有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。