一种POI数据采集方法及装置制造方法及图纸

技术编号:38195587 阅读:7 留言:0更新日期:2023-07-21 16:31
本申请提供一种POI数据采集方法、装置、电子设备及计算机程序产品,涉及数据处理技术领域,所述方法包括:获取用户终端上传的POI现场采集信息;根据预设的文本识别方法从所述商户门脸图片中识别出所述POI的名称信息和电话属性信息;根据所述拍摄位置信息计算所述POI的坐标信息;基于所述坐标信息从预存的地址信息库中匹配出所述POI的详细地址信息;根据所述商户门脸图片、所述名称信息、所述电话属性信息、所述坐标信息以及所述详细地址信息生成得到所述POI的众包采集数据。通过本申请实施例能够大大简化用户采集POI数据时的操作过程,并有效提高POI数据采集的可靠性和准确性。并有效提高POI数据采集的可靠性和准确性。并有效提高POI数据采集的可靠性和准确性。

【技术实现步骤摘要】
一种POI数据采集方法及装置


[0001]本申请涉及数据处理
,具体涉及一种POI数据采集方法、装置、电子设备及计算机程序产品。

技术介绍

[0002]在万物互联的大背景下,用户消耗越来越多的时间与精力体验各类互联网与物联网的产品。而产品体验的核心即是真实地物抽象而来的兴趣点(即,POI)。过去用户仅关注可导航类的相关POI兴趣点。当前,在“互联网+”等国家行动计划的影响下,位置入口作为各类服务的入口被广泛使用。正因为此,POI的即时采集与处理尤为重要。
[0003]目前POI数据供应商采集POI数据的手段包括:图商数据版本更新,合作数据更新,情报数据更新以及众包数据更新。图商数据版本更新,指的是POI数据更新常规方式,即拥有导航电子地图甲级测绘资质的地图供应商,通过浮动车的方式按一定周期(通常为季度)采集POI数据。合作数据更新,指的是POI数据更新常规方式,即通过合作的方式获取合作伙伴(数据内容供应商)所独有的POI数据,按周期更新。情报数据更新,为POI数据更新常规方式,即通过互联网或移动互联网数据爬重的方式采集POI数据。众包数据更新,为POI数据更新新模式,即发动用户采集POI的数据。
[0004]以上的POI数据采集方式中仅众包数据更新能够即时采集POI数据,但现有技术中,该POI数据采集方式存在以下缺陷:
[0005]1、需要用户提供POI的名称、地址、电话、坐标、图片等信息后,才能作为有效POI进行数据采集,采集过程繁琐复杂,导致用户参与率较低;
[0006]2、由于是人工输入,容易出现输入信息有误的情况,导致采集到的POI属性信息可靠性较低;
[0007]3、仅仅以直接获取到定位信息作为最终的POI属性信息,没有根据实际场景进行相关逻辑处理,导致采集到的POI数据准确性较低。

技术实现思路

[0008]本申请实施例提供一种POI数据采集方法、装置、电子设备及计算机程序产品,以解决上述技术问题,简化用户操作过程,并提高采集数据的可靠性和准确性。
[0009]第一方面,本申请实施例提供一种POI数据采集方法,包括:
[0010]获取用户终端上传的POI现场采集信息;其中,所述现场采集信息包括至少两张商户门脸图片,以及每一所述商户门脸图片对应的拍摄位置信息;
[0011]根据预设的文本识别方法从所述商户门脸图片中识别出所述POI的名称信息和电话属性信息;
[0012]根据所述拍摄位置信息计算所述POI的坐标信息;
[0013]基于所述坐标信息从预存的地址信息库中匹配出所述POI的详细地址信息;
[0014]根据所述商户门脸图片、所述名称信息、所述电话属性信息、所述坐标信息以及所
述详细地址信息生成得到所述POI的众包采集数据。
[0015]在一个实施例中,所述根据预设的文本识别方法从所述商户门脸图片中识别出所述POI的名称信息和电话属性信息,包括:
[0016]识别出所述商户门脸图片中的文字信息,根据预设的过滤规则对所述文字信息进行无效文字信息过滤,获取得到所述POI的名称信息;
[0017]识别出所述商户门脸图片中的连续数字信息,并按预设的号码判定逻辑将所述连续数字信息记录为所述POI的电话属性信息。
[0018]在一个实施例中,所述识别出所述商户门脸图片中的文字信息,根据预设的过滤规则对所述文字信息进行无效文字信息过滤,获取得到所述POI的名称信息,包括:
[0019]根据所述过滤规则,将所述文字信息中的字体大小程度小于预设阈值的文字进行第一次筛除;
[0020]将第一次筛除后剩余的文字信息中不满足预设聚集度的离散文字进行第二次筛除;
[0021]从第二次筛除后剩余的文字信息中选取出字体大小程度最大的聚堆文字;
[0022]从所述聚堆文字中识别出所述POI的名称信息。
[0023]在一个实施例中,所述从所述聚堆文字中识别出所述POI的名称信息,包括:
[0024]当判断所述聚堆文字的字符长度大于预设长度阈值时,基于预设的POI名称字段元素表从所述聚堆文字中识别出所述POI的名称信息。
[0025]在一个实施例中,所述现场采集信息包括从第一拍摄点获取的第一拍摄位置信息以及从第二拍摄点获取的第二拍摄位置信息;所述第一拍摄位置信息包括第一坐标信息和第一镜头指向信息,所述第二拍摄位置信息包括第二坐标信息和第二镜头指向信息;
[0026]所述根据所述拍摄位置信息计算所述POI的坐标信息,包括:
[0027]根据所述第一镜头指向信息以及预设的方向参考系计算与所述第一拍摄点相对应的第一镜头指向夹角,根据所述第二镜头指向信息以及所述方向参考系计算与所述第二拍摄点相对应的第二镜头指向夹角;
[0028]基于所述第一坐标信息、所述第一镜头指向夹角、所述第二坐标信息和所述第二镜头指向夹角计算得到所述POI的坐标信息。
[0029]在一个实施例中,所述基于所述坐标信息从预存的地址信息库中匹配出所述POI的详细地址信息,包括:
[0030]将所述坐标信息与所述地址信息库中的行政区域轮廓数据进行对比计算,匹配得到所述POI的行政区域信息;
[0031]从所述地址信息库中选取出与所述坐标信息所在点相距小于预设距离阈值的候选道路;
[0032]计算所述坐标信息所在点与每一候选道路的道路点的线段长度,将与最短的线段长度对应的第一候选道路作为所述POI的道路信息;
[0033]计算所述坐标信息所在点与所述第一候选道路中每一门牌点的直线距离,选取最短的直线距离对应的第一门牌点,以所述第一门牌点的门牌号作为所述POI的门牌信息;
[0034]根据所述行政区域信息、所述道路信息和所述门牌信息生成得到所述POI的详细地址信息。
[0035]在一个实施例中,所述计算所述坐标信息所在点与所述第一候选道路中每一门牌点的直线距离,选取最短的直线距离对应的第一门牌点,以所述第一门牌点的门牌号作为所述POI的门牌信息,包括:
[0036]根据所述坐标信息所在点与每一候选道路的道路点的线段长度,将次短的线段长度对应的候选道路记录为第二候选道路,并计算所述坐标信息所在点相距所述第二候选道路的最短距离;
[0037]计算所述坐标信息所在点与所述第一候选道路中每一门牌点的直线距离,当最短的直线距离小于或等于所述最短距离时,选取最短的直线距离对应的第一门牌点,以所述第一门牌点的门牌号作为所述POI的门牌信息。
[0038]第二方面,本申请实施例提供一种POI数据采集装置,包括:
[0039]数据获取模块,用于获取用户终端上传的POI现场采集信息;其中,所述现场采集信息包括至少两张商户门脸图片,以及每一所述商户门脸图片对应的拍摄位置信息;
[0040]信息识别模块,用于根据预设的文本识别方法从所述商户门脸图片中识别出所述POI的名称信息和电话属性信息;
[0041]信息计本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种POI数据采集方法,其特征在于,包括:获取用户终端上传的POI现场采集信息;其中,所述现场采集信息包括至少两张商户门脸图片,以及每一所述商户门脸图片对应的拍摄位置信息;根据预设的文本识别方法从所述商户门脸图片中识别出所述POI的名称信息和电话属性信息;根据所述拍摄位置信息计算所述POI的坐标信息;基于所述坐标信息从预存的地址信息库中匹配出所述POI的详细地址信息;根据所述商户门脸图片、所述名称信息、所述电话属性信息、所述坐标信息以及所述详细地址信息生成得到所述POI的众包采集数据。2.根据权利要求1所述的POI数据采集方法,其特征在于,所述根据预设的文本识别方法从所述商户门脸图片中识别出所述POI的名称信息和电话属性信息,包括:识别出所述商户门脸图片中的文字信息,根据预设的过滤规则对所述文字信息进行无效文字信息过滤,获取得到所述POI的名称信息;识别出所述商户门脸图片中的连续数字信息,并按预设的号码判定逻辑将所述连续数字信息记录为所述POI的电话属性信息。3.根据权利要求2所述的POI数据采集方法,其特征在于,所述识别出所述商户门脸图片中的文字信息,根据预设的过滤规则对所述文字信息进行无效文字信息过滤,获取得到所述POI的名称信息,包括:根据所述过滤规则,将所述文字信息中的字体大小程度小于预设阈值的文字进行第一次筛除;将第一次筛除后剩余的文字信息中不满足预设聚集度的离散文字进行第二次筛除;从第二次筛除后剩余的文字信息中选取出字体大小程度最大的聚堆文字;从所述聚堆文字中识别出所述POI的名称信息。4.根据权利要求3所述的POI数据采集方法,其特征在于,所述从所述聚堆文字中识别出所述POI的名称信息,包括:当判断所述聚堆文字的字符长度大于预设长度阈值时,基于预设的POI名称字段元素表从所述聚堆文字中识别出所述POI的名称信息。5.根据权利要求1所述的POI数据采集方法,其特征在于,所述现场采集信息包括从第一拍摄点获取的第一拍摄位置信息以及从第二拍摄点获取的第二拍摄位置信息;所述第一拍摄位置信息包括第一坐标信息和第一镜头指向信息,所述第二拍摄位置信息包括第二坐标信息和第二镜头指向信息;所述根据所述拍摄位置信息计算所述POI的坐标信息,包括:根据所述第一镜头指向信息以及预设的方向参考系计算与所述第一拍摄点相对应的第一镜头指向夹角,根据所述第二镜头指向信息以及所述方向参考系计算与所述第二拍摄点相对应的第二镜头指向夹角;基于所述第一坐标信息、所述第一镜头指向夹角、所述第二坐标信息和所述第二镜头指向夹角计算得到所述P...

【专利技术属性】
技术研发人员:何庆何榕健陈立峰何建文徐海勇陶涛尚晶王世民
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1