一种基于强化学习的土地规划优化算法制造技术

技术编号:29983986 阅读:37 留言:0更新日期:2021-09-08 10:21
本发明专利技术涉及土地规划技术领域,尤其涉及一种基于强化学习的土地规划优化算法,将地图上自然保护区、耕地、基本农田、已建项目的坐标定义为多边形,多个多边形组成多边形集合,不同规划和土地类型对应的多边形集合对应相应的优先级系数,首先根据报建项目坐标,在地图上根据坐标进行识别,并且标注多边形,多个多边形组成一个目标集合,设置强化学习的学习率为learn_rate,回报延迟参数为gamma,贪心策略系数为e_greedy,每次根据贪心策略,从行动集合action中选择期望回报率最好的行动,最后得到优化后的建议图。本发明专利技术适应多个规则集合,而且训练后的模型可复用,能够优化后续搜索的效率。率。率。

【技术实现步骤摘要】
一种基于强化学习的土地规划优化算法


[0001]本专利技术涉及土地规划
,尤其涉及一种基于强化学习的土地规划优化算法。

技术介绍

[0002]土地规划指一国或一定地区范围内,按照经济发展的前景和需要,对土地的合理使用所作出的长期安排。旨在保证土地的利用能满足国民经济各部门按比例发展的要求。规划的依据是现有自然资源、技术资源和人力资源的分布和配置状况,务使土地得到充分、有效的利用,而不因人为的原因造成浪费。土地利用总体规划是在一定区域内,根据国家社会经济可持续发展的要求和自然、经济、社会条件,对土地的开发、利用、治理和保护在空间上、时间上所做的总体安排和布局。
[0003]土地规划项目报建中,经常存在项目报建地块与土地规划政策,以及现有地块存在冲突,表现为在地理空间上存在重叠或冲突,也成为压盖,当前国土规划领域,对于报建项目,只能提示和哪些地块存在压盖情况,但是无法给出优化建议。

技术实现思路

[0004]有鉴于此,本专利技术的目的是提供一种基于强化学习的土地规划优化算法,本专利技术具体按以下步骤执行,S1: 将地图上自然保护区、耕地、基本农田、已建项目的坐标定义为多边形,多个多边形组成多边形集合,不同规划和土地类型对应的多边形集合对应相应的优先级系数;S2: 首先根据报建项目坐标,在地图上根据坐标进行识别,并且标注多边形,多个多边形组成一个目标集合,将目标集合与地图上已存在的其他多边形进行空间压盖以及邻近分析,根据压盖宗地面积、邻近宗地距离、不同宗地的优先级系数,计算得分为V0,以及已建项目的初始坐标(X0, Y0)形成系统初始状态S0 = (X0, Y0);S3: 计算某一状态S
t
下得分函数如式(1);
ꢀꢀ
式(1)其中是状态下的得分值,P
i
是目标集合与宗地E
i
的压盖面积,T
j
是目标集合和宗地E
j
的邻近距离,和是权重系数,如不考虑邻近的情况,设置为0,和分别为宗地E
i
和E
j
的优先级系数,达到不同地块设为不同的优先级的目的;通过计算目标多边形集合与宗地E
i
多边形集合的交集,再计算交集部分的面积P
i
;P
i
乘以宗地E
i
的优先级系数,再进行逐项求和,得到。计算目标多边形集合与宗地E
j
的最短距离,如果距离小于阈值,则设置邻近距离T
j
值为某一正数,以识别目标与宗地E
j
过于邻近的情况,T乘以宗地E
j
的优先级系数,再进行逐项求和,得到;S4:目标集合的动作集合是一个离散集合,定义为action={M东,M西,M南,M北},分别表示目标集合向东西南北四个方向移动M米,或者使用经纬度为单位;限制最大移动距
离,避免出现不符合实际的规划需求,在移动最大步数后,仍然无法到达终止态,则算法结束,优化结果失败。
[0005]S5:设置强化学习的学习率为learn_rate,回报延迟参数为gamma,贪心策略系数为e_greedy,每次根据贪心策略,从行动集合action中选择期望回报率最好的行动,或者是随机选择一个行动;S6:目标集合完成一个动作a后,系统从状态St进入一个新状态St+1;此时目标的坐标位置从(Xt, Yt)移动到(Xt+1, Yt+1),则该动作a的回报函数如式(2):R(a) = V(St)
ꢀ‑ꢀ
V(St+1)

ʋ
(t+1)
ꢀꢀ
式(2)其中
ʋ
是惩罚系数,用于在算法中减少宗地移动步数;t+1表示t之后的下一步搜索移动的距离绝对值;S7:基于当前状态s,以及每个动作a的回报函数R(a),更新状态

动作函数Q(s,a),如式(3):
ꢀꢀ
式(3)其中Q(s,a)是当前状态

动作函数值,new Q(s,a)是根据动作a以及计算最大奖励后更新的回报函数后的状态

动作函数值,lr是学习效率,gamma是折扣因子,是给定状态和行动下获得的最大奖励,lr越大,学习速度越快,gamma越小,旧Q值占比越大。或者通过强化学习领域通用的蒙特卡洛方法、时序差分方法或者DQN方法更新策略集合。
[0006]进一步,经过步骤S1到S7的搜索后,如果在某一状态,压盖得分函数V(St)的值小于等于某阈值vt,则认为搜索状态达到终止态,一般情况下,将阈值vt设为0,如式(4)。
[0007]V(St) ≤vt
ꢀꢀ
式(4)进一步,河流、水道或道路的线型工程先计算出现压盖的段落,将存在压盖的部分独立为单独的多边形,再执行步骤S1

S7进行局部优化,完成优化后,将修改后的段落和原段落连接起来,恢复项目的完整性,具体按以下步骤执行:S2.1:计算线型工程河流、水道或道路的线型工程先计算出现压盖的段落目标集合地块存在压盖的区域,得到多个子目标多边形到,S2.2:记录子目标多边形和原目标多边形的公共顶点集合;S2.3:对于子目标多边形,使用算法步骤S1到S7进行优化,完成后得到新的多边形;S2.4:根据公共顶点集合,将与原目标多边形的公共顶点连接,并替换中其他顶点,恢复线型工程目标多边形。
[0008]进一步,其中M为可修改的算法参数,执行动作M东后,目标集合横坐标X=X+m;执行动作M西后,目标集合横坐标X=X

m;执行动作M南后,目标集合纵坐标Y=Y

m;执行动作M北后,目标集合纵坐标Y=Y+m。
[0009]本专利技术的一种基于强化学习的土地规划优化算法的有益效果为:1、使用人工智能领域的强化学习技术,创新地将报建的目标地块作为一个智能体,智能体在二维地理空间中移动,可以在有限步骤内得到较优规划建议。和传统的BFS、DFS寻路算法比,本专利技术的算法基于强化学习的算法的最大优势是可以在线学习,以适应多个规则集合,而且训练后的模型可复用,能够优化后续搜索的效率。
[0010]2、本专利技术使用人工智能领域的强化学习技术,创新地将报建的目标地块作为一个
智能体,智能体在二维地理空间中移动,可以在有限步骤内得到较优规划建议。和传统的BFS、DFS寻路算法比,基于强化学习的算法的最大优势是可以在线学习,以适应多个规则集合,而且训练后的模型可复用,能够优化后续搜索的效率。
[0011]3、使用强化学习的方法搜索项目选址优化路径,得到最佳项目选址建议。使用优先级系数、压盖宗地数量、压盖面积等对土地规划政策完成定量分析。对于线型工程(公路、铁路等),实现分段选址优化,从而减少选址修改量。
附图说明
[0012]图1是本专利技术的目标宗地存在压盖图;图2是本专利技术的经过算法优化目标宗地选址解决压盖的最终状态图;图3是本专利技术的从初始态S0到终止态S5的搜索过程图;图4是本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习的土地规划优化算法,其特征在于:具体按以下步骤执行,S1: 将地图上自然保护区、耕地、基本农田、已建项目的坐标定义为多边形,多个多边形组成多边形集合,不同规划和土地类型对应的多边形集合对应相应的优先级系数;S2: 首先根据报建项目坐标,在地图上根据坐标进行识别,并且标注多边形,多个多边形组成一个目标集合,将目标集合与地图上已存在的其他多边形进行空间压盖以及邻近分析,根据压盖宗地面积、邻近宗地距离、不同宗地的优先级系数,计算得分函数V0;根据已建项目的初始坐标(X0, Y0)形成系统初始状态S(0) = (X0, Y0);S3: 计算某一状态S
t
下得分函数如式(1);
ꢀꢀ
式(1)其中是状态下的得分值,P
i
是目标集合与宗地E
i
的压盖面积,T
j
是目标集合和宗地E
j
的邻近距离,和是权重系数,如不考虑邻近的情况,设置为0,和分别为宗地E
i
和E
j
的优先级系数,达到不同地块设为不同的优先级的目的;通过计算目标多边形集合与宗地E
i
多边形集合的交集,再计算交集部分的面积P
i
;P
i
乘以宗地E
i
的优先级系数,再进行逐项求和,得到,计算目标多边形集合与宗地E
j
的最短距离,如果距离小于阈值,则设置邻近距离T
j
值为某一正数,以识别目标与宗地E
j
过于邻近的情况,T乘以宗地E
j
的优先级系数,再进行逐项求和,得到;S4:目标集合的动作集合是一个离散集合,定义为action={M东,M西,M南,M北},分别表示目标集合向东西南北四个方向移动M米,或者使用经纬度为单位;S5:设置强化学习的学习率为lr,回报延迟参数为gamma,贪心策略系数为e_greedy,每次根据贪心策略,从行动集合action中选择期望回报率最好的行动,或者是随机选择一个行动;S6:目标集合完成一个动作a后,系统从状态St进入一个新状态St+1;此时目标的坐标位置从(Xt, Yt)移动到(Xt+1, Yt+1),则该动作a的回报函数如式(2):R(a) = V(S(t))
ꢀ‑ꢀ
V(S(t+1))

ʋ
(t+1)
ꢀꢀ
式(2)其中
ʋ
是惩罚系数,用于在算法中减少宗地...

【专利技术属性】
技术研发人员:叶茂王帆飞汪雯雯高进秋黄骏龙
申请(专利权)人:四川信息职业技术学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1