当前位置: 首页 > 专利查询>北京大学专利>正文

基于手机用户和POI数据的城市入室盗窃犯罪风险评估方法技术

技术编号:30079831 阅读:25 留言:0更新日期:2021-09-18 08:36
本发明专利技术公开了一种基于手机用户和POI数据的城市入室盗窃犯罪风险评估方法。该方法基于移动手机用户数据和城市POI数据,利用随机森林算法构建城市入室盗窃犯罪风险预测评估模型,解决了当前犯罪风险评估模型中主要依赖按行政区划获取的社会经济统计数据来提取建模特征的不足,通过更加精细的移动手机用户网格数据、POI密度分析结果、夜间灯光遥感数据以及道路可达性等来提取多尺度特征,以及利用随机森林算法来优化筛选特征集及其空间尺度,实现不同城市区域犯罪影响因素的更加完整的表达与入室盗窃风险的精细评估预测,提高了城市犯罪风险预测模型精度与泛化能力。罪风险预测模型精度与泛化能力。罪风险预测模型精度与泛化能力。

【技术实现步骤摘要】
基于手机用户和POI数据的城市入室盗窃犯罪风险评估方法


[0001]本专利技术提供一种城市犯罪风险评估方法,具体涉及一种利用移动手机用户数据和城市 POI数据开展城市犯罪风险的监测与评估技术,属于公共安全


技术介绍

[0002]社会经济条件与地理环境通常与犯罪行为的发生密切相关,并影响其空间分布。城市兴趣点(Point of interest,POI)数据能够反映周边地理环境,已经成为研究地理环境对犯罪影响的重要数据源。社会经济要素关注的对象为社区居住的不稳定性、社会经济地位以及居住区的土地使用情况等。因此,邻里、社区的年龄、收入、职业、流动人口等人口结构以及社会联系、集体效能等社会经济要素是犯罪地理学中十分重要的研究视角。
[0003]现有社会经济数据的来源多为政府统计数据,存在数据统计尺度大、更新慢等缺点。随着智能手机的普及和大数据技术的发展,使用手机用户数据获取区域社会经济指标已成为可能。目前在犯罪学领域,手机用户数据背后的属性数据并未深入挖掘,从手机用户数据获得的精细尺度的社会经济特征数据,能够为开展城市犯罪风险评估提供新的手段。

技术实现思路

[0004]为了克服犯罪风险研究中所使用的社会经济统计数据的局限性,本专利技术提出一种新的基于移动手机用户数据和城市兴趣点数据的城市入室盗窃犯罪风险评估方法。该方法涉及如下概念:
[0005]手机用户数据(Mobile phone user data,MPU):是指移动服务商或第三方关联公司在移动手机信令数据和购买电话卡时的用户注册信息基础上,采用算法生成的一定网格大小的手机用户经济和社会特征数据集,每个250米网格通常包括的字段有:居住人口数、本地居住人口数、外地居住人口数、身份未知居住人口数、各年龄段居住人口数、居住人口的富裕指数等。
[0006]POI:“Point of Interest”的缩写,中文翻译为“兴趣点”。每个POI包含四方面信息,名称、类别、坐标、分类。例如:在地理信息系统中,一个POI可以是一栋建筑、一个商铺、一个邮筒、一个公交站等。
[0007]夜间灯光数据:是指由搭载在遥感卫星上的可见光或近红外成像辐射仪,在夜间获取过境地球表面的灯火辐射亮度值,本专利技术所提及的夜间灯光数据是由我国自主发射的LJ

1号卫星系统获取的夜间灯光数据。
[0008]城市路网数据:城市路网数据使用的是OSM(Open Street Map)提供的道路路网,数据包括道路位置、道路等级、道路名称。研究使用道路类别为motorway、trunk、primary、secondary、 tertiary的道路及其连接。将3条及以上的上述等级道路相交的节点作为城市重要节点。
[0009]本专利技术旨在通过引入移动手机用户数据和城市POI数据、卫星夜间灯光数据,克服传统社会经济统计数据按行政单元统计带来的不足,采用随机森林算法构建基于多尺度特
征变量的城市入室盗窃犯罪风险评估预测模型,通过本专利技术可以为城市入室盗窃犯罪防范和警力配置提供支持。
[0010]本专利技术提供的技术方案如下:
[0011]一种基于移动手机用户数据和POI数据的城市入室盗窃犯罪风险评估方法:采用随机森林算法构建基于多尺度特征变量的城市入室盗窃犯罪风险评估预测模型,利用该模型对入室盗窃风险进行评估预测,所述模型的构建包括如下步骤:
[0012]A.提取服务于城市入室盗窃犯罪风险评估模型的多尺度特征变量,即从手机用户数据、城市POI数据、城市路网数据和夜间灯光数据中提取特征变量,具体包括:
[0013]A1.基于手机用户数据的多尺度社会经济特征变量的提取方法为:
[0014]以手机用户数据中的各网格为中心,以多个K
×
K网格的移动窗口进行聚合滤波分析,将移动窗口内的均值作为中心网格在该尺度下的特征值。其中K为奇数,优选为1~11的奇数,例如分别以1
×
1、3
×
3、5
×
5、7
×
7个网格的移动窗口进行聚合滤波分析,得到能反映社会经济特征的多尺度特征变量。为了体现不同区域的年龄构成、经济状况差别、外地人口比例差别,在本专利技术的实施例中,不直接使用居住人口数,而是计算各个年龄段、各级富裕度、本地外地人口占居住人口的比例。共得到20种特征4个空间尺度(1
×
1个网格、3
×
3个网格、5
×
5个网格、7
×
7个网格)的80个特征变量。
[0015]A2.基于城市POI数据的多尺度密度特征提取方法为:
[0016]选择与入室盗窃相关的POI,将POI数据划归为多个类别分别提取各类别的空间密度,在本专利技术的一个实施例中,将POI点数据归为12个类别,包括ATM、餐饮、超市、警务设施、商店、市场、网吧、写字楼、医院、住宅区、娱乐场所、专卖店。
[0017]考虑到不同类别的POI影响范围不同,在本专利技术的一个实施例中提取距离网格250m、 500m、750m、1000m、1500m范围内的各类别POI的密度值。具体实施方式为对每个POI 点生成相应距离的缓冲区,若缓冲区与网格相交则认为该POI点在网格相应距离内。最后计算得到12种POI在5种空间尺度下的共60种POI密度特征。
[0018]A3.路网可达性特征提取方法为:
[0019]城市道路连接犯罪背景空间和犯罪场所空间,同时街道的空间可达性也会影响城市土地利用方式和社会经济活动,从而对入室盗窃犯罪的时空模式产生影响。路网可达性是城市小区或路网节点相互之间居民出行或车辆行驶平均时间的倒数,一定程度上能够反映空间可达性。基于OSM城市路网提取研究区各网格的路网可达性。具体来说,首先将3条及以上重要道路相交的路口作为城市重要节点,将每种不同等级的道路参照研究区实际情况赋予不同的速度。然后基于城市路网计算每个节点到其他城市节点的最短行程时间,计算每个节点到其他节点的平均时间,并将平均时间的倒数作为该节点的路网可达性。最后利用克里金插值生成研究区网格(大小为250m)的路网可达性栅格影像。
[0020][0021]式中,A(i)为节点i的可达性,N为节点总数,t
ij
表示节点i到节点j的最短时长。
[0022]A4.夜间灯光特征提取方法为:
[0023]通过遥感卫星获取城市夜间灯光的影像数据,首先将较低分辨率的夜间灯光影像重采样至较高分辨率,然后计算网格内该较高分辨率的夜间灯光影像均值,以此作为网格
的夜间灯光值。在本专利技术的一个实施例中,由我国自主发射的珞珈一号遥感卫星(LJ

1)获取夜间灯光数据,首先将130m的夜间灯光重采样至10m分辨率,之后再计算250m网格内10m分辨率的夜间灯光影像值的均值,作为1个250m网格的夜间灯光值。
[0024]B.城市入室盗窃犯罪风险评估模型的特征选择与尺度优化,具体实现方法如下:本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种城市入室盗窃犯罪风险评估方法,采用随机森林算法构建基于多尺度特征变量的城市入室盗窃犯罪风险评估预测模型,利用该模型对入室盗窃风险进行评估预测,所述模型的构建包括以下步骤:A.从手机用户数据、城市POI数据、城市路网数据和夜间灯光数据中提取服务于城市入室盗窃犯罪风险评估模型的多尺度特征变量;B.筛选和优化用于构建城市入室盗窃犯罪风险评估预测模型的多尺度特征变量:首先分析每种特征的不同尺度对入室盗窃风险建模精度的影响,确定每种特征的最优空间尺度;之后,利用递归消除法基于OOB误差计算特征重要性,对特征集进行筛选与优化;其中,所述特征重要性的计算是通过迭代训练森林中单颗树t的过程中,随机置换第i个特征,然后比较该特征被置换前后估计器的OOB误差变化,并将变量X
i
被置换前后的模型精度的差值作为衡量该特征对所在估计器的重要程度,记做VI
ti
,即特征i对随机森林中的每一颗树都有一个重要性值;对于整个模型而言,特征i的重要性VI
ti
是森林中所有树对应的特征i重要性的平均值,计算公式如下:式中N代表随机森林中决策树的数量,E
ti
表示变量X
i
被替换前第t颗树的OOB误差,EP
ti
表示将变量X
i
替换后第t颗树的OOB误差;C.将城市区域的入室盗窃样本数据进行四分区域划分,其中两块区域中的网格作为训练集训练模型,一块区域中的网格作为验证集用于模型调参,剩余一块区域中的网格用作为测试集测试模型精度;D.在步骤B确定的最优特征集基础上,通过比较模型在验证集上的精度进行模型训练和参数选取,确定随机森林中最重要的3个参数:决策树的个数、决策树的最大特征数、决策树的最大深度;不断改变参数,通过验证集的表现对模型进行评估得到模型最优参数,完成模型训练;E.对模型精度进行验证与评价。2.如权利要求1所述的城市入室盗窃犯罪风险评估方法,其特征在于,步骤A中从手机用户数据提取多尺度社会经济特征变量,提取方法是:以手机用户数据的网格为中心,以多个K
×
K网格的移动窗口进行聚合滤波分析,其中K为奇数,得到能反映社会经济特征的多尺度特征变量。3.如权利要求2所述的城市入室盗窃犯罪风险评估方法,其特征在于,从手机用户数据提取的多尺度社会经济特征变量包括多个空间尺度下的居住人口数量以及各个年龄段、各级富裕度、本地外地人口占居住人口的比例。4.如权利要求1所述的城市入室盗窃犯罪风险评估方法,其特征在于,步骤A中选择与入室盗窃相关的POI,将POI数据划归为多个类别分别提取各类别的空间密度。5.如权利要求1所述的城市入室盗窃犯罪风险评估方法,其特征在于,步骤A中从城市路网数据提取路网可达性特征,首先将3条及以上重要道路相交的路口作为城市重要节点,将每种不同等级的道路参照研究区实际情况赋予不同的速度;然后基于城市路网计算每个节点到其他城市节点的最短行程时间,计算每个节点到其他节点的平均时间,并将平均时间的倒数作为该节点的路网可达性,如式(1)所示:
式中,A(i)为节点i的可达性,N为节点总数,t
ij
表示节点i到节点j的最...

【专利技术属性】
技术研发人员:张显峰程俊毅黄杰孙权
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1