当前位置: 首页 > 专利查询>南京大学专利>正文

一种集成地理大数据和机器学习的城镇开发边界划定方法技术

技术编号:38624417 阅读:14 留言:0更新日期:2023-08-31 18:26
本发明专利技术公开一种集成地理大数据和机器学习的城镇开发边界划定方法,本方法包括以下步骤:S1、收集的大量多源地理大数据进行数据清洗等预处理;S2、从自然要素、生态要素、人文要素三个维度构建指标因子,从单因子角度分析城镇开发边界适宜性,并得到各评价指标的评分标准;S3、构建随机森林模型来确定各指标权重。本发明专利技术基于空间调查数据等基础地理数据,融合夜间灯光、微博签到、房屋地价数据等地理大数据集成多源地理大数据,从自然、人文、生态三个维度选取全面合理的因子构建城镇开发边界适宜性指标体系,以人工绘制的边界为参考,使用机器学习方法确定权重,划定城镇开发边界。划定城镇开发边界。划定城镇开发边界。

【技术实现步骤摘要】
一种集成地理大数据和机器学习的城镇开发边界划定方法


[0001]本专利技术涉及城镇开发
,具体为一种集成地理大数据和机器学习的城镇开发边界划定方法。

技术介绍

[0002]以往研究在指标选择上大多聚焦于自然、生态因素,在人文因子方面也仅局限于人口和交通基础设施等的讨论,所以在获取城市扩张的宏观社会经济驱动力方面有所欠缺,没能充分考虑人类活动和研究区内各区域经济发展水平对城市用地扩张的影响。大量研究表明居民日常动态活动对城市空间结构的塑造能力极大,居民的消费活动和行动轨迹会促进建设用地的需求,因此表征人口活动特征和空间分布的微博签到、大众点评用户评价数据在城市空间扩张的研究中作用突出。此外,经济水平是推动城市发展的重要动力和命脉,它对城市的建设和扩张具有驱动效应,夜间灯光遥感数据和房屋地价数据可以很好地把握研究区的经济状况以全面了解其发展架构和综合水平,应用在UGB划定中能使结果具有更良好的应用价值。融合这些地理大数据,更深入地挖掘人文要素,在对城市全方位的评价和精确表达城市边界方面有一定的研究意义,值得深入研究。
[0003]在UGB划定的过程中,影响因素的权重确定关系到结果的精确性。目前权重确定的方法主要是基于德尔菲专家咨询的层次分析法和熵权法等,然而在较大的数据量、多维度的指标因子,以及影响因素与UGB复杂的关联面前,这些主观赋权的方法有些难以应对。随着人工智能的快速发展,机器学习引起了学者的广泛关注。它智能性强,具有强大的学习能力且可以保证较高的运算速度和准确率,可以在一定程度上避免主观经验带来的误差,已经应用于土地利用分类和与CA模型等结合的城市扩展模拟等UGB相关研究中。综合机器学习的良好表现,可以为开发边界综合评价中的权重确定提供途径,考虑到训练数据,以往人工划定UGB的方式虽然在定量分析上有所欠缺,但充分考虑了自然地物形态、地物边界和现状基数情况,结合了“双评价”结果、资源约束底线,且紧扣政策要求,具有一定合理性和参考价值。结合人工绘制版本,将机器学习运用在UGB划定的因子权重设定中为更有科学依据和精准客观地划定UGB拓宽了思路,有待更进一步的讨论。
[0004]为此,本文聚焦如何客观科学地确定UGB综合评价划定的指标权重这一问题,面向充分发掘人文因素与UGB的关系,从而使边界划定更综合全面的需求,最大化机器学习在权重设定上的潜力,融合微博签到、房屋地价经济数据、夜间灯光等多源地理大数据,从自然、生态、人文全方位地对城市各类土地进行UGB适宜性评价。
[0005][0006]
技术实现思路

[0007]本专利技术的目的在于提供一种集成地理大数据和机器学习的城镇开发边界划定方法,以解决上述
技术介绍
中提出的问题。
[0008]一种集成地理大数据和机器学习的城镇开发边界划定方法,本方法包括以下步骤:
[0009]S1、收集的大量多源地理大数据进行数据清洗等预处理;
[0010]S2、从自然要素、生态要素、人文要素三个维度构建指标因子,从单因子角度分析城镇开发边界适宜性,并得到各评价指标的评分标准;
[0011]S3、构建随机森林模型来确定各指标权重;
[0012]S4、得到评价指标体系和各指标1—4分适宜性分级结果后,根据随机森林模型确定的指标权重进行多因子叠加分析,使用ArcGIS工具将每个格网各指标的适宜性分值按指标权重加权叠加得出研究区各格网最终的城镇开发边界适宜性评价分值,从而综合评价得到各格网划定为城镇开发边界的适宜程度;
[0013]S5、以不同适宜性分值作为划分城镇开发边界的阈值,并讨论不同阈值下划定的城镇开发边界的总体精度和Kappa系数(分类一致性评价指标,值越高表明分类效果越好),选取精度相对最高的分值确定为本研究划分城镇开发边界的阈值,格网适宜性分值大于此分值的划定为城镇开发边界,小于的则不适合划定为城镇开发边界,据此得到本实验最终的城镇开发边界划定结果。
[0014]作为本专利技术的进一步改进,所述自然要素包括地形、水域、景观格局和地质灾害四个因子;
[0015]所述地形包括坡度和高程两个指标;
[0016]所述水域包括其中与河流距离、格网内水域密度和与湖泊、水库距离三个指标;
[0017]所述景观格局包括综合景观指数一个指标;
[0018]所述地质灾害包括与地灾点距离一个指标;
[0019]所述景观格局指数选取斑块面积(AREA)、回旋半径(GYRATE)、形状指数(SHAPE)等景观指数,基于Fragstats平台计算现状建设用地的景观格局。
[0020]作为本专利技术的进一步改进,所述生态要素包括生态用地情况、耕地情况、土壤、植被丰度、大气环境5个因子;
[0021]所述生态用地情况包括与森林公园、风景区、自然保护区等距离,与生态用地(林、园、草、湿地)距离,生态用地覆盖率(林、园、草、湿地)三个指标;
[0022]所述耕地情况包括与耕地距离和耕地占比两个指标;
[0023]所述土壤包括土壤有机质含量和土壤侵蚀敏感性两个指标;
[0024]所述植被丰度包括归一化植被指数NDVI一个指标;
[0025]所述大气环境包括PM
2.5
浓度和PM
10
浓度两个指标。
[0026]作为本专利技术的进一步改进,所述人文要素包括交通条件、区位、公共/商服设施、人口、经济(地价)、产业前景和用地情况七个因子;
[0027]所述交通条件包括与邻近高速路口、火车站、客运站的距离,与邻近机场的距离,铁路和道路网密度和地铁、公交站点密度四个指标;
[0028]所述区位包括与市区县中心的距离一个指标;
[0029]所述公共/商服设施包括科教文卫设施密度和商业服务业设施密度两个指标;
[0030]所述人口包括常住人口密度和人口活动分布两个指标;
[0031]所述经济(地价)包括第二产业增值、住宅房租金、商铺租金和经济活力四个指标;
[0032]所述产业前景包括开发区/产业园区密度一个指标;
[0033]所述用地情况包括城镇用地占比一个指标。
[0034]作为本专利技术的进一步改进,所述步骤S3具体包括以下步骤:
[0035]首先需要用城镇开发边界参考数据对模型进行训练,将训练数据中是城镇开发边界属性的区域赋值为1,其他区域赋值为0,作为用地状态值;
[0036]运用随机分层抽样的方法,分别抽取训练数据中城镇开发边和其他区域各约10%的样本点并获取这些样本点的空间坐标;
[0037]运用ArcGIS的Sample功能读取样本点对应的用地状态值和空间变量值(即所有指标的得分),得到原始训练集X;
[0038]将各个指标的评价分级结果栅格数据统一成tif格式,输入随机森林模型中得到空间变量数据集。
[0039]作为本专利技术的进一步改进,所述随机森林模型使用Python为编程语言,采用机器学习开源工具包Scikit

learn,输本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种集成地理大数据和机器学习的城镇开发边界划定方法,其特征在于:本方法包括以下步骤:S1、收集的大量多源地理大数据进行数据清洗等预处理;S2、从自然要素、生态要素、人文要素三个维度构建指标因子,从单因子角度分析城镇开发边界适宜性,并得到各评价指标的评分标准;S3、构建随机森林模型来确定各指标权重;S4、得到评价指标体系和各指标1—4分适宜性分级结果后,根据随机森林模型确定的指标权重进行多因子叠加分析,使用ArcGIS工具将每个格网各指标的适宜性分值按指标权重加权叠加得出研究区各格网最终的城镇开发边界适宜性评价分值,从而综合评价得到各格网划定为城镇开发边界的适宜程度;S5、以不同适宜性分值作为划分城镇开发边界的阈值,并讨论不同阈值下划定的城镇开发边界的总体精度和Kappa系数,选取精度相对最高的分值确定为本研究划分城镇开发边界的阈值,格网适宜性分值大于此分值的划定为城镇开发边界,小于的则不适合划定为城镇开发边界,据此得到本实验最终的城镇开发边界划定结果。2.根据权利要求1所述的一种集成地理大数据和机器学习的城镇开发边界划定方法,其特征在于:所述自然要素包括地形、水域、景观格局和地质灾害四个因子;所述地形包括坡度和高程两个指标;所述水域包括其中与河流的距离、格网内水域密度和与湖泊、水库的距离三个指标;所述景观格局包括综合景观指数一个指标;所述地质灾害包括与地灾点的距离一个指标;所述景观格局指数选取斑块面积、回旋半径、形状指数,基于Fragstats平台计算现状建设用地的景观格局。3.根据权利要求1所述的一种集成地理大数据和机器学习的城镇开发边界划定方法,其特征在于:所述生态要素包括生态用地情况、耕地情况、土壤、植被丰度、大气环境5个因子;所述生态用地情况包括与森林公园、风景区、自然保护区的距离,与生态用地的距离,生态用地覆盖率三个指标,所述生态用地包括林、园、草、湿地;所述耕地情况包括与耕地的距离和耕地占比两个指标;所述土壤包括土壤有机质含量和土壤侵蚀敏感性两个指标;所述植被丰度包括归一化植被指数NDVI一个指标;所述大气环境包括PM
2.5
浓度和PM
10
浓度两个指标。4.根据权利要求1所述的一种集成地理大数据和机器学习的城镇开发边界划定方法,其特征在于:所述人文要素包括交通条件、区位、公共/商服设施、人口、经济、产业前景和用地情况七个因子;所述交通条件包括与邻近高速路口、火车站、客运站的距离,与邻近机场的距离,铁路和道路网密度和地铁、公交站点密度四个指标;所述区位包括与市区县中心的距离一个指标;所述公共/商服设施包括科教文卫设施密度和商业服务业设施密度两个指标;所述人口包括常住人口密度和...

【专利技术属性】
技术研发人员:夏南高醒赵鑫庄苏丹王梓宇梁加乐李满春
申请(专利权)人:南京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1