【技术实现步骤摘要】
一种基于强化学习的土地规划优化算法
[0001]本专利技术涉及土地规划
,尤其涉及一种基于强化学习的土地规划优化算法。
技术介绍
[0002]土地规划指一国或一定地区范围内,按照经济发展的前景和需要,对土地的合理使用所作出的长期安排。旨在保证土地的利用能满足国民经济各部门按比例发展的要求。规划的依据是现有自然资源、技术资源和人力资源的分布和配置状况,务使土地得到充分、有效的利用,而不因人为的原因造成浪费。土地利用总体规划是在一定区域内,根据国家社会经济可持续发展的要求和自然、经济、社会条件,对土地的开发、利用、治理和保护在空间上、时间上所做的总体安排和布局。
[0003]土地规划项目报建中,经常存在项目报建地块与土地规划政策,以及现有地块存在冲突,表现为在地理空间上存在重叠或冲突,也成为压盖,当前国土规划领域,对于报建项目,只能提示和哪些地块存在压盖情况,但是无法给出优化建议。
技术实现思路
[0004]有鉴于此,本专利技术的目的是提供一种基于强化学习的土地规划优化算法,本专利技术具体按以下步骤执行,S1: 将地图上自然保护区、耕地、基本农田、已建项目的坐标定义为多边形,多个多边形组成多边形集合,不同规划和土地类型对应的多边形集合对应相应的优先级系数;S2: 首先根据报建项目坐标,在地图上根据坐标进行识别,并且标注多边形,多个多边形组成一个目标集合,将目标集合与地图上已存在的其他多边形进行空间压盖以及邻近分析,根据压盖宗地面积、邻近宗地距离、不同宗地的优先级系数,计算得分为V0,以及已建 ...
【技术保护点】
【技术特征摘要】
1.一种基于强化学习的土地规划优化算法,其特征在于:具体按以下步骤执行,S1: 将地图上自然保护区、耕地、基本农田、已建项目的坐标定义为多边形,多个多边形组成多边形集合,不同规划和土地类型对应的多边形集合对应相应的优先级系数;S2: 首先根据报建项目坐标,在地图上根据坐标进行识别,并且标注多边形,多个多边形组成一个目标集合,将目标集合与地图上已存在的其他多边形进行空间压盖以及邻近分析,根据压盖宗地面积、邻近宗地距离、不同宗地的优先级系数,计算得分函数V0;根据已建项目的初始坐标(X0, Y0)形成系统初始状态S(0) = (X0, Y0);S3: 计算某一状态S
t
下得分函数如式(1);
ꢀꢀ
式(1)其中是状态下的得分值,P
i
是目标集合与宗地E
i
的压盖面积,T
j
是目标集合和宗地E
j
的邻近距离,和是权重系数,如不考虑邻近的情况,设置为0,和分别为宗地E
i
和E
j
的优先级系数,达到不同地块设为不同的优先级的目的;通过计算目标多边形集合与宗地E
i
多边形集合的交集,再计算交集部分的面积P
i
;P
i
乘以宗地E
i
的优先级系数,再进行逐项求和,得到,计算目标多边形集合与宗地E
j
的最短距离,如果距离小于阈值,则设置邻近距离T
j
值为某一正数,以识别目标与宗地E
j
过于邻近的情况,T乘以宗地E
j
的优先级系数,再进行逐项求和,得到;S4:目标集合的动作集合是一个离散集合,定义为action={M东,M西,M南,M北},分别表示目标集合向东西南北四个方向移动M米,或者使用经纬度为单位;S5:设置强化学习的学习率为lr,回报延迟参数为gamma,贪心策略系数为e_greedy,每次根据贪心策略,从行动集合action中选择期望回报率最好的行动,或者是随机选择一个行动;S6:目标集合完成一个动作a后,系统从状态St进入一个新状态St+1;此时目标的坐标位置从(Xt, Yt)移动到(Xt+1, Yt+1),则该动作a的回报函数如式(2):R(a) = V(S(t))
ꢀ‑ꢀ
V(S(t+1))
‑
ʋ
(t+1)
ꢀꢀ
式(2)其中
ʋ
是惩罚系数,用于在算法中减少宗地...
【专利技术属性】
技术研发人员:叶茂,王帆飞,汪雯雯,高进秋,黄骏龙,
申请(专利权)人:四川信息职业技术学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。