当前位置: 首页 > 专利查询>南京大学专利>正文

一种基于图神经网络的城市产业集群发展路径预测方法技术

技术编号:29615831 阅读:26 留言:0更新日期:2021-08-10 18:32
本发明专利技术公开了一种基于图神经网络的城市产业集群发展路径预测方法,包括产业集群历史发展数据库构建,利用Scholl集聚指数进行分行业分区域的集聚指数测度,产业集聚区与集群识别,基于会话将集群内产业的引入序列构建复杂网络,复杂网络的节点为不同的产业,其引入顺序构成有向的会话关系,从而生成产业发展路径网络;而集群内的网络和集群之间的网络共同构成了整体的复杂网络;对整体网络使用社会网络分析方法分析,并采用神经网络模型对产业发展路径进行预测。本发明专利技术可为城市或产业园区进行产业招商、产业规划时的产业选择提供决策依据,为规划工作者和园区管理者在制定产业发展策略时提供更加强有力的数据支撑和方向研判。

【技术实现步骤摘要】
一种基于图神经网络的城市产业集群发展路径预测方法
本专利技术涉及一种基于图神经网络的城市产业集群发展路径预测方法,属于城市产业规划

技术介绍
目前城市产业集群及产业规划在理论方法层面,以“点-轴”、区位论和增长极等理论为产业布局的传统理论基础,而随着信息时代的到来,空间区域的影响降低,流动空间成为城市区域之间的新空间形态,传统产业理论的作用逐渐减弱,亟需一种适应新的地方化和信息化的产业规划理论和模式产生。目前园区的产业及产业布局决策方式仍存在经验主义的掣肘,大量的规划方案趋同,并没有形成科学合理、有数据支撑、可实践的规划方法,从而导致许多产业园区发展并不理想。
技术实现思路
专利技术目的:针对目前城市或园区产业规划的实践技术缺失,本专利技术提供一种基于图神经网络的城市产业集群发展路径预测方法,以海量城市和园区产业招商及产业发展情况作为学习数据,从集聚与联系这两个产业集群成长的核心要素出发,基于海量专利数据、企业位置数据、企业统计数据、海关进出口数据等,利用图神经网络(GNN)等人工智能技术建立城市或园区产业规划推荐和发展模型,实现Al辅助产业决策以期为城市产业规划方案提供科学合理的评价和决策方式。技术方案:为实现上述目的,本专利技术采用的技术方案为:一种基于图神经网络的城市产业集群发展路径预测方法,包括以下步骤:步骤1,产业集群历史发展数据库构建步骤11,获取企业原始数据,企业原始数据包括企业基本信息、企业经营成果信息。企业基本信息包括企业身份、地址、经营范围、经营状态。企业经营成果信息包括资金流量、生产总值和盈亏数额。步骤12,对企业原始数据进行清洗和筛选,保留对网络分析和训练模型有关键作用的企业身份、地址、经营范围和产值利润。步骤13,利用地图API接口(应用程序接口)地址转坐标,获取所有企业的具体坐标信息,得到企业空间分布情况。步骤14,根据企业的经营范围信息,利用朴素贝叶斯算法对企业进行所属行业分类,得到企业所属行业信息。步骤15,按企业的入驻时间进行排序,最后得到构建产业关联网络和训练推荐模型的数据。步骤2,集群分析与集群识别步骤21,分行业区域集聚指数测度:利用Scholl集聚指数进行分行业分区域的集聚指数测度。步骤22,产业集聚区与集群识别步骤221,当企业距离小于等于预设阈值时,直接使用直接距离法确定最终集群。步骤222,当企业距离大于预设阈值时,先使用网格法,再使用直接距离法确定最终集群。步骤3,产业关联分析步骤31,产业关联网络建模基于会话将集群内产业的引入序列构建复杂网络,复杂网络的节点为不同的产业,其引入顺序构成有向的会话关系,从而生成产业发展路径网络。而集群内的网络和集群之间的网络共同构成了整体的复杂网络。步骤32,网络与重要节点分析对整体网络使用社会网络分析方法分析,使用DeepWalk(深度游走)与t-SNE方法(学生t分布的随机邻点嵌入法)对网络中的产业节点进行聚类,得到会话推荐表数据。步骤4,产业发展路径预测步骤41,数据准备对绘画推荐表数据进行数据预处理得到训练集、验证集、测试集。步骤42,模型训练模型训练阶段通过训练集对神经网络模型的进行训练,训练时通过多轮训练过程中反馈loss值函数(损失值函数)来调整模型参数,从而训练出拟合度最优的神经网络模型,并避免过拟合。步骤43,模型验证与测试采用验证集对训练出的拟合度最优的神经网络模型进行验证。通过训练出的拟合度最优的神经网络模型对测试集进行测试。优选的:步骤211中设距离门槛值为200m,小于门槛值的距离均按200m计算。优选的:步骤221中直接使用直接距离法确定最终集群的方法:对于待测的p个点,循环计算每个点至其他点的距离,在距离阈值内的点记录集群,并标记。计算至有标记点时跳过,直至完成循环。再根据邻接状态与行政区划判定最终集群。优选的:步骤222中先使用网格法,再使用直接距离法确定最终集群的方法。在待测区域中划出网格,网格距离由待测区域大小决定。首先根据阈值计算待测网格的密度是否符合要求,再将符合要求的矩形网格通过直接距离法进一步聚合为集聚区。最后根据邻接状态与行政区划判定最终集群。优选的:步骤21中利用Scholl集聚指数进行分行业分区域的集聚指数测度的方法:步骤211,首先计算各样本组企业间的平均距离Di:式中:J为样本组的企业数量,dij为企业间的距离。步骤212,将包括n个企业平均距离Di的数组导入核函数,计算这一数组的概率密度函数曲线:式中:gi(D)为概率密度函数。D为自变量。f()为高斯核函数。h为最优带宽,使用Silverman法计算各样本组的最优带宽,如下式:式中:σ为样本组的标准差。步骤213,通过集聚概率与分散概率的差值计算“净集聚概率”:其中,θ表示净集聚概率,gb(D)为全部服务业企业的分布概率密度函数。m为gb(D)最大值对应的Di值,小于该值为分散区间,大于该值为聚集区间。集聚概率和分散概率即为概率密度曲线上通过定积分计算得到的gi(D)高于gb(D)的面积。优选的:步骤41中数据预处理包括时间戳转换、去单要素session(会话),转换为二进制。优选的:步骤41中处预理后的数据按照6∶2∶2的比例划分为训练集、验证集、测试集。本专利技术相比现有技术,具有以下有益效果:本专利技术利用图神经网络(GNN)等算法建立城市或园区产业规划推荐和发展模型。该模型提出了:①精确化、规范化、可复用的区域产业集聚程度评判方法。②从区域产业发展路径入手的产业发展网络系统分析方法。③可挖掘产业隐含联系和数据支撑下的前景产业推荐方法。④为解决“引入什么产业”的问题提出了新的思路、方案与数据支撑。本专利技术可为城市或产业园区进行产业招商、产业规划时提供一定的数据指导,规划工作者和决策者在制定产业发展策略时将更加具有经验数据支撑和明确的方向。附图说明图1为产业网络拓扑示意图。图2为江苏省产业集群识别结果。图3为江苏省发展路径产业网络。图4为t-SNE降维结果。图5为神经网络推荐模型训练指标。具体实施方式下面结合附图和具体实施例,进一步阐明本专利技术,应理解这些实例仅用于说明本专利技术而不用于限制本专利技术的范围,在阅读了本专利技术之后,本领域技术人员对本专利技术的各种等价形式的修改均落于本申请所附权利要求所限定的范围。一种基于图神经网络的城市产业集群发展路径预测方法,包括以下步骤:1.产业集群历史发展数据库构建:研究所用的原始数据来自于购买的中国工业企业数据库、工商企业注册数据,自有记录注企业始至2013年的全部规上企业,包括企业基本信息如企业身份、生产内容、具体地址、经营状态等。企业经营成果信息如资金流量、生本文档来自技高网...

【技术保护点】
1.一种基于图神经网络的城市产业集群发展路径预测方法,其特征在于,包括以下步骤:/n步骤1,产业集群历史发展数据库构建/n步骤11,获取企业原始数据,企业原始数据包括企业基本信息、企业经营成果信息;企业基本信息包括企业身份、地址、经营范围、经营状态;企业经营成果信息包括资金流量、生产总值和盈亏数额;/n步骤12,对企业原始数据进行清洗和筛选,保留对网络分析和训练模型有关键作用的企业身份、地址、经营范围和产值利润;/n步骤13,利用地图API接口地址转坐标,获取所有企业的具体坐标信息,得到企业空间分布情况;/n步骤14,根据企业的经营范围信息,利用朴素贝叶斯算法对企业进行所属行业分类,得到企业所属行业信息;/n步骤15,按企业的入驻时间进行排序,最后得到构建产业关联网络和训练推荐模型的数据;/n步骤2,集群分析与集群识别/n步骤21,分行业区域集聚指数测度:利用Scholl集聚指数进行分行业分区域的集聚指数测度;/n步骤22,产业集聚区与集群识别/n步骤221,当企业距离小于等于预设阈值时,直接使用直接距离法确定最终集群;/n步骤222,当企业距离大于预设阈值时,先使用网格法,再使用直接距离法确定最终集群;/n步骤3,产业关联分析/n步骤31,产业关联网络建模/n基于会话将集群内产业的引入序列构建复杂网络,复杂网络的节点为不同的产业,其引入顺序构成有向的会话关系,从而生成产业发展路径网络;而集群内的网络和集群之间的网络共同构成了整体的复杂网络;/n步骤32,网络与重要节点分析/n对整体网络使用社会网络分析方法分析,使用DeepWalk与t-SNE方法对网络中的产业节点进行聚类,得到会话推荐表数据;/n步骤4,产业发展路径预测/n步骤41,数据准备/n对会话推荐表数据进行数据预处理得到训练集、验证集、测试集;/n步骤42,模型训练/n模型训练阶段通过训练集对神经网络模型的进行训练,训练时通过多轮训练过程中反馈loss值函数来调整模型参数,从而训练出拟合度最优的神经网络模型,并避免过拟合;/n步骤43,模型验证与测试/n采用验证集对训练出的拟合度最优的神经网络模型进行验证;通过训练出的拟合度最优的神经网络模型对测试集进行测试。/n...

【技术特征摘要】
1.一种基于图神经网络的城市产业集群发展路径预测方法,其特征在于,包括以下步骤:
步骤1,产业集群历史发展数据库构建
步骤11,获取企业原始数据,企业原始数据包括企业基本信息、企业经营成果信息;企业基本信息包括企业身份、地址、经营范围、经营状态;企业经营成果信息包括资金流量、生产总值和盈亏数额;
步骤12,对企业原始数据进行清洗和筛选,保留对网络分析和训练模型有关键作用的企业身份、地址、经营范围和产值利润;
步骤13,利用地图API接口地址转坐标,获取所有企业的具体坐标信息,得到企业空间分布情况;
步骤14,根据企业的经营范围信息,利用朴素贝叶斯算法对企业进行所属行业分类,得到企业所属行业信息;
步骤15,按企业的入驻时间进行排序,最后得到构建产业关联网络和训练推荐模型的数据;
步骤2,集群分析与集群识别
步骤21,分行业区域集聚指数测度:利用Scholl集聚指数进行分行业分区域的集聚指数测度;
步骤22,产业集聚区与集群识别
步骤221,当企业距离小于等于预设阈值时,直接使用直接距离法确定最终集群;
步骤222,当企业距离大于预设阈值时,先使用网格法,再使用直接距离法确定最终集群;
步骤3,产业关联分析
步骤31,产业关联网络建模
基于会话将集群内产业的引入序列构建复杂网络,复杂网络的节点为不同的产业,其引入顺序构成有向的会话关系,从而生成产业发展路径网络;而集群内的网络和集群之间的网络共同构成了整体的复杂网络;
步骤32,网络与重要节点分析
对整体网络使用社会网络分析方法分析,使用DeepWalk与t-SNE方法对网络中的产业节点进行聚类,得到会话推荐表数据;
步骤4,产业发展路径预测
步骤41,数据准备
对会话推荐表数据进行数据预处理得到训练集、验证集、测试集;
步骤42,模型训练
模型训练阶段通过训练集对神经网络模型的进行训练,训练时通过多轮训练过程中反馈loss值函数来调整模型参数,从而训练出拟合度最优的神经网络模型,并避免过拟合;
步骤43,模型验证与测试
采用验证集对训练出的拟合度最优的神经网络模型进行验证;通过训练出的拟合度最优的神经网络模型对测试集进行测试。


2.根据权利要求1所述基于图神经网络的城市...

【专利技术属性】
技术研发人员:沈丽珍崔喆刘梦雨
申请(专利权)人:南京大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1