一种人口数据空间化动态建模方法,基于各种人口分布影响因素数据,利用遗传规划算法GP与改进遗传算法GA相嵌套的方法进行统一快速人口数据空间化建模及优化,具体实现为:首先归一化处理影响因素数据;后将影响因素归一化值作为GP输入,组成搜索空间,来快速求解具有最佳适应度的模型结构;在GP每代个体选择复制操作过程中利用改进GA对待复制个体进行快速精确优化。本发明专利技术具有建模智能化与自动化、拟合和预测精度高、方法适应性广等优点;可用于环境健康风险诊断、自然灾害损失评估和现场抽样调查等项目中的人口信息精确获取。
【技术实现步骤摘要】
本专利技术涉及,可用于环境健康风险诊断、自然灾害损失评估和现场抽样调查等项目中的人口信息精确获取。
技术介绍
人口增长已经给全球资源、环境承载能力造成了巨大压力耕地和林地面积骤减,生态多样性破坏严重,人类生存条件日益恶化等。及时获取不同尺度上精确的人口空间分布及其变化信息对于解决这些社会、经济和环境问题,提高人口、资源和环境的综合管理能力有着重要意义。而人口数据通常是按照行政单元来逐级统计和汇总的。这种统计方法往往造成研究中人口和其它数据所依附的空间单元尺度不同,使得数据间融合成为难题。另外由于人口的增长和迁移,还需要大量的精力和财力来维持人口信息的实时性。因此非常必要将人口普查数据进行空间化,通过建模来模拟人口真实的空间分布状况和动态变迁的过程。自从1857年第一张人口密度等值线图产生之后,人口数据空间化研究迅速发展起来。人口数据空间化研究方法分为两大类面插值和曲面建模。面插值是将人口数据在不同的面域单元内进行转换,目的是将源区(source zone)的人口普查数据转换到目标区(target zone)上。而人口分布曲面建模则是利用适当的公式将普查数据分配到一个规则的格网系统中去,系统中的每个格网都包含了一个其特定位置的人口估算值。虽然人口空间化方法能提供大量人口空间分布和变化信息,但是它们都不可避免地存在一个难题-寻找影响因子和人口数据之间的数学关系。在国内外很多此类研究中是通过建立因子和人口之间线性或非线性回归模型的方法来实现人口空间化的。逐步回归是求取回归模型最为常用的方法之一。它是一种“有进有出”的许算方法,按照变量的重要性来逐一选出重要变量,而且还考虑到已入选回归方程的某些变量有可能随着其后另一些变量选入而失去原有的重要性,及时地把这些变量从回归方程中剔除出去,最终的回归方程只保留重要的变量。逐步回归分析等常用的建模方法虽然操作简单,结果便于解释,但是要求预先定义模型结构和模型参数,这个往往是很难确定。另外,还有一些其它学科的成熟模型,例如物理学上的重力模型被成功用来人口数据空间化。重力模型在人口空间化中运用的前提是假设人们都趋于在或靠近城市的地方生活,不然其生活区域与城市中心有很好的连接;即使在农村,人口密集区多靠近交通干线,而且越靠近城区,人口密度越要比腹地高。这种建模方法虽然只要对重力模型进行略微调整就能以此得到每个格网上的人口数,但是选择哪些人口分布影响因子变量输入模型同样也是个难题。如果集中分析模型中某一因子变量,往往容易引入偏倚。总体来说,上述有关人口数据空间化的建模方法具有精度低、模型优化效果差的不足。
技术实现思路
本专利技术的技术解决问题是克服现有人口数据空间化建模精度低、模型优化效果差的不足,提供一种在遗传规划算法和改进遗传算法相嵌套基础上的人口数据空间化动态建模方法,该方法具有建模精度高,模型优化效果好的优点。本专利技术的技术解决方案为,其特点在于首先处理对人口空间分布产生影响的n种自然和社会经济因素的原始数据,得出这些数据的归一化值;后将影响因素归一化值作为遗传规划算法(genetic programming,GP)输入,组成搜索空间,来快速求解具有最佳适应度的人口数据空间化模型;在GP算法每代个体选择复制操作过程中利用改进遗传算法(genetic algorithms,GA)对待复制个体进行优化,最终实现人口数据空间化动态建模的目的,其具体步骤如下 (1)利用GIS技术获取对人口分布具有影响的自然和社会经济因素的原始数据,对这些数据进行归一化处理;(2)初始化遗传规划算法和改进遗传算法参数;(3)将各种影响因素的归一化值作为遗传规划算法的输入,组成搜索空间,来求解具有最佳适应度的人口数据空间化模型;在遗传规划算法每代个体选择复制操作过程中利用改进遗传算法对待复制个体进行快速精确优化,最终实现人口数据空间化动态建模。所述的初始化遗传规划算法参数有种群规模,即种群中的个体数GP_Size、样本量GP_N、遗传代数GP_Gen、最大生成深度Max_Dep、最大交叉深度Max_CDep、交叉概率GP_Pc和变异概率GP_Pm;初始化改进遗传算法参数有种群规模,即种群中的个体数GA_Size、样本数目GA_N和遗传代数GA_Gen;然后用遗传规划算法和改进遗传算法相嵌套的方法快速求解具有最佳适应度的人口数据空间化模型,即A.首先确定遗传规划算法搜索空间中的基本组成单元,包括n种影响因素归一化值的基本算子(f1,f2,...,fn)和基本算术运算符,再由基本组成单元随机形成GP_Size个个体。这些个体都是人口数据空间化模型的备选方案,即人口分布和输入影响因素变量之间的可能的数学关系表达式,一般具有以下函数形式POPU=f(X1f1,X2f2,...,Xnfn)(1)式中POPU为人口数据变量;(f1,f2,...,fn)和(X1,X2,...,Xn)分别为各类输入影响因素变量及其系数。B.计算针对个体Kpid(i)_GP(1≤i≤GP_Size)的所有样本计算理论值与实测值之间的决定系数,将其作为第t代(1≤t≤GP_Gen)中该个体的适应度BsJi(i,t)_GP,其计算公式为 BsJi(i,t)_GP=Σj=1GP_N(P_GP(j)-P‾)(P′_GP(j)-P′‾)Σj=1GP_N(P_GP(j)-P‾)2Σj=1GP_N(P′_GP(j)-P′‾)2---(2)]]>式中 和 分别为所有样本实测值和计算理论值的平均值;P′_GP(j)为个体Kpid(i)_GP在样本j(1≤j≤GP_N)的计算理论值;P_GP(j)为样本j的实测值;C.根据公式(2)所确定的适应度,采取竞争选择策略来选择复制个体以产生新个体,即随机从群体中选取一组个体,比较该组每个成员的适应度,选出实际最好的个体Kpid(BesOpt)_GP,即POPU=f(XB1f1,XB2f2,...,XBnfn),在利用改进遗传算法对其进行快速精确地优化后,复制优化后的个体以取代该组最差的。用改进遗传算法对个体组中最优个体进行优化的步骤如下a.首先对模型结构进行判别,若属于已经优化过的结构则不再优化。b.采用实数编码方式,直接用样本中实际数据的实数类型,根据整体误差模型中待优化的模型系数(XB1,XB2,...,XBn),随机生成初始群体中GA_Size个个体;c.建立改进遗传算法的适应度评价函数,计算针对个体Kpid(i)_GA(1≤i≤GA_Size)的所有样本的计算理论值与实测值之间方差的总和,将其作为第t代(1≤t≤GA_Gen)中该个体的适应度BsJi(i,t)_GA,计算公式为BsJi(i,t)_GA=1GA_Size×Σj=1GA_GN(P′_GA(j)-P_GA(j))2Σi=1GA_SizeΣj=1GA_GN(P′_GA(j)本文档来自技高网...
【技术保护点】
一种人口数据空间化动态建模方法,其特征在于包括以下步骤: (1)利用GIS技术获取对人口分布具有影响的自然和社会经济因素的原始数据,对这些数据进行归一化处理; (2)初始化遗传规划算法和改进遗传算法参数; (3)将步骤(1)归一化值后的有关原始数据作为遗传规划算法的输入,组成搜索空间,来求解具有最佳适应度的人口数据空间化模型;在遗传规划算法每代个体选择复制操作过程中利用改进遗传算法对待复制个体进行快速精确优化,最终实现人口数据空间化动态建模。
【技术特征摘要】
【专利技术属性】
技术研发人员:王劲峰,廖一兰,
申请(专利权)人:中国科学院地理科学与资源研究所,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。