基于经纬度及文本比对的地址相似度识别方法及系统技术方案

技术编号:14063172 阅读:85 留言:0更新日期:2016-11-28 01:43
一种基于经纬度及文本比对的地址相似度识别方法及系统,包括:接收用户输入的身份证件号码及待校验的身份证件关联地址的个人信息;从身份证件信息数据库中获取与所述身份证件号码对应的基准身份证件关联地址;根据预先建立的地图数据库中各个地点及各个地点对应的名称集合,确定所述待校验的身份证件关联地址对应在所述地图数据库中的第一地点,及确定所述基准身份证件关联地址对应在所述地图数据库中的第二地点;计算所述第一地点与所述第二地点的距离;及当所述第一地点与所述第二地点的距离大于预设阈值时,提醒用户待校验的身份证件关联地址会有误差风险。本发明专利技术能准确判断多个地址是否为同一地点,减少了误判率,并提高了工作效率。

【技术实现步骤摘要】

本专利技术涉及数据处理的
,特别涉及一种基于经纬度及文本比对的地址相似度识别方法及系统
技术介绍
在金融和保险领域,客户在办理相关业务时,为了规避可能的金融风险,或者为了达到不可告人的目的,会提供虚假的或者不准确的个人地址信息(例如,居住地址、办公地址等信息)。为了规避这类风险,金融和保险的相关企业通常采用人工的方式进行信息审核。然而这种人工审核方式的缺陷:一方面在于审核的精度依然审核人的经验,经常发生错误且效率低下;另一方面在于虽然文本字面上信息不一致,但实际上两者属于同一信息,例如,“深圳市八卦四路10号”和“深圳市中浩大厦”两者虽然文本字面上信息不一致,但两者实际上指向的是同一地址,在上述情况下,人工难以准确审核,经常出现误判。
技术实现思路
鉴于以上内容,有必要提供一种基于经纬度及文本比对的地址相似度识别方法及系统,其能准确判断多个地址是否为同一地点,减少了误判率及避免了用户提供虚假地址的金融风险,并提高了工作效率。一种基于经纬度及文本比对的地址相似度识别方法,应用于电子装置中,所述方法包括:接收用户输入的身份证件号码及待校验的身份证件关联地址的个人信息;从身份证件信息数据库中获取与所述身份证件号码对应的基准身份证件关联地址;根据预先建立的地图数据库中各个地点及各个地点对应的名称集合,确定所述待校验的身份证件关联地址对应在所述地图数据库中的第一地点,及确定所述基准身份证件关联地址对应在所述地图数据库中的第二地点;计算所述第一地点与所述第二地点的距离;及当所述第一地点与所述第二地点的距离大于预设阈值时,提醒用户待校验的身份证件关联地址会有误差风险。优选地,所述方法还包括:接收用户输入的就职公司的名称及待校验的公司地址的个人信息;从工商行政管理数据库中获取与所述就职公司的名称关联的基准公司地址;根据预先建立的地图数据库中各个地点及各个地点对应的名称集合,确定所述待校验的公司地址对应在所述地图数据库中的第三地点,及确定所述基准公司地址对应在所述地图数据库中的第四地点;计算所述第三地点与所述第四地点的距离;及当所述第三地点与所述第四地点的距离大于预设阈值时,提醒用户待校验的公司地址会有误差风险。优选地,所述地图数据库中的各个地点与地球虚拟球面的经纬度数据存在映射关系,其中所述计算所述第一地点与所述第二地点的距离包括:根据所述映射关系确定所述第一地点对应的第一经纬度数据,及所述第二地点对应的第二经纬度数据,基于所述第一经纬度数据和第二经纬度数据,计算所述第一地点和第二地点在地球虚拟球面上的球面距离;或所述计算所述第三地点与所述第四地点的距离包括:根据所述映射关系确定所述第三地点对应的第三经纬度数据,及所述第四地点对应的第四经纬度数据,基于所述第三经纬度数据和第四经纬度数据,计算所述第三地点和第四地点在地球虚拟球面上的球面距离。一种基于经纬度及文本比对的地址相似度识别方法,应用于电子装置中,所述方法包括:接收用户输入的就职公司的名称及待校验的公司地址的个人信息;从工商行政管理数据库中获取与所述就职公司的名称关联的基准公司地址;根据预先建立的地图数据库中各个地点及各个地点对应的名称集合,确定所述待校验的公司地址对应在所述地图数据库中的第一地点,及确定所述基准公司地址对应在所述地图数据库中的第二地点;计算所述第一地点与所述第二地点的距离;及当所述第一地点与所述第二地点的距离大于预设阈值时,提醒用户待校验的公司地址会有误差风险。优选地,所述方法还包括:接收用户输入的身份证件号码及待校验的身份证件关联地址的个人信息;从身份证件信息数据库中获取与所述身份证件号码对应的基准身份证件关联地址;根据预先建立的地图数据库中各个地点及各个地点对应的名称集合,确定所述待校验的身份证件关联地址对应在所述地图数据库中的第三地点,及确定所述基准身份证件关联地址对应在所述地图数据库中的第四地点;计算所述第三地点与所述第四地点的距离;及当所述第三地点与所述第四地点的距离大于预设阈值时,提醒用户待校验的身份证件关联地址会有误差风险。一种基于经纬度及文本比对的地址相似度识别系统,运行于电子装置中,所述系统包括:接收模块,用于接收用户输入的个人信息,所述个人信息包括身份证件号码及待校验的身份证件关联地址;获取模块,用于从身份证件信息数据库中获取与所述身份证件号码对应的基准身份证件关联地址;确定模块,用于根据预先建立的地图数据库中各个地点及各个地点对应的名称集合,确定所述待校验的身份证件关联地址对应在所述地图数据库中的第一地点,及确定所述基准身份证件关联地址对应在所述地图数据库中的第二地点;计算模块,用于计算所述第一地点与所述第二地点的距离;及提示模块,用于当所述第一地点与所述第二地点的距离大于预设阈值时,提醒用户待校验的身份证件关联地址会有误差风险。优选地,所述系统还包括:所述接收模块还用于接收用户输入的个人信息,所述个人信息还包括就职公司的名称及待校验的公司地址;所述获取模块还用于从工商行政管理数据库中获取与所述就职公司的名称关联的基准公司地址;所述确定模块还用于根据预先建立的地图数据库中各个地点及各个地点对应的名称集合,确定所述待校验的公司地址对应在所述地图数据库中的第三地点,及确定所述基准公司地址对应在所述地图数据库中的第四地点;所述计算模块还用于计算所述第三地点与所述第四地点的距离;及所述提示模块还用于当所述第三地点与所述第四地点的距离大于预设阈值时,提醒用户待校验的公司地址会有误差风险。优选地,所述地图数据库中的各个地点与地球虚拟球面的经纬度数据存在映射关系,其中所述计算所述第一地点与所述第二地点的距离包括:根据所述映射关系确定所述第一地点对应的第一经纬度数据,及所述第二地点对应的第二经纬度数据,基于所述第一经纬度数据和第二经纬度数据,计算所述第一地点和第二地点在地球虚拟球面上的球面距离;或所述计算所述第三地点与所述第四地点的距离包括:根据所述映射关系确定所述第三地点对应的第三经纬度数据,及所述第四地点对应的第四经纬度数据,基于所述第三经纬度数据和第四经纬度数据,计算所述第三地点和第四地点在地球虚拟球面上的球面距离。一种基于经纬度及文本比对的地址相似度识别系统,运行于电子装置中,所述系统包括:接收模块,用于接收用户输入的个人信息,所述个人信息包括就职公司的名称及待校验的公司地址;获取模块,用于从工商行政管理数据库中获取与所述就职公司的名称关联的基准公司地址;确定模块,用于根据预先建立的地图数据库中各个地点及各个地点对应的名称集合,确定所述待校验的公司地址对应在所述地图数据库中的第一地点,及确定所述基准公司地址对应在所述地图数据库中的第二地点;计算模块,用于计算所述第一地点与所述第二地点的距离;及提示模块,用于当所述第一地点与所述第二地点的距离大于预设阈值时,提醒用户待校验的公司地址会有误差风险。优选地,所述系统还包括:所述接收模块还用于接收用户输入的个人信息,所述个人信息包括身份证件号码及待校验的身份证件关联地址;所述获取模块还用于从身份证件信息数据库中获取与所述身份证件号码对应的基准身份证件关联地址;所述确定模块还用于根据预先建立的地图数据库中各个地点及各个地点对应的名称集合,确定所述待校验的身份证件关联地址对应在本文档来自技高网...
基于经纬度及文本比对的地址相似度识别方法及系统

【技术保护点】
一种基于经纬度及文本比对的地址相似度识别方法,应用于电子装置中,其特征在于,所述方法包括:接收用户输入的身份证件号码及待校验的身份证件关联地址的个人信息;从身份证件信息数据库中获取与所述身份证件号码对应的基准身份证件关联地址;根据预先建立的地图数据库中各个地点及各个地点对应的名称集合,确定所述待校验的身份证件关联地址对应在所述地图数据库中的第一地点,及确定所述基准身份证件关联地址对应在所述地图数据库中的第二地点;计算所述第一地点与所述第二地点的距离;及当所述第一地点与所述第二地点的距离大于预设阈值时,提醒用户待校验的身份证件关联地址会有误差风险。

【技术特征摘要】
1.一种基于经纬度及文本比对的地址相似度识别方法,应用于电子装置中,其特征在于,所述方法包括:接收用户输入的身份证件号码及待校验的身份证件关联地址的个人信息;从身份证件信息数据库中获取与所述身份证件号码对应的基准身份证件关联地址;根据预先建立的地图数据库中各个地点及各个地点对应的名称集合,确定所述待校验的身份证件关联地址对应在所述地图数据库中的第一地点,及确定所述基准身份证件关联地址对应在所述地图数据库中的第二地点;计算所述第一地点与所述第二地点的距离;及当所述第一地点与所述第二地点的距离大于预设阈值时,提醒用户待校验的身份证件关联地址会有误差风险。2.如权利要求1所述的基于经纬度及文本比对的地址相似度识别方法,其特征在于,所述方法还包括:接收用户输入的就职公司的名称及待校验的公司地址的个人信息;从工商行政管理数据库中获取与所述就职公司的名称关联的基准公司地址;根据预先建立的地图数据库中各个地点及各个地点对应的名称集合,确定所述待校验的公司地址对应在所述地图数据库中的第三地点,及确定所述基准公司地址对应在所述地图数据库中的第四地点;计算所述第三地点与所述第四地点的距离;及当所述第三地点与所述第四地点的距离大于预设阈值时,提醒用户待校验的公司地址会有误差风险。3.如权利要求1或2所述的基于经纬度及文本比对的地址相似度识别方法,其特征在于,所述地图数据库中的各个地点与地球虚拟球面的经纬度数据存在映射关系,其中所述计算所述第一地点与所述第二地点的距离包括:根据所述映射关系确定所述第一地点对应的第一经纬度数据,及所述第二地点对应的第二经纬度数据,基于所述第一经纬度数据和第二经纬度数据,计算所述第一地点和第二地点在地球虚拟球面上的球面距离;或所述计算所述第三地点与所述第四地点的距离包括:根据所述映射关系确定所述第三地点对应的第三经纬度数据,及所述第四地点对应的第四经纬度数据,基于所述第三经纬度数据和第四经纬度数据,计算所述第三地点和第四地点在地球虚拟球面上的球面距离。4.一种基于经纬度及文本比对的地址相似度识别方法,应用于电子装置中,其特征在于,所述方法包括:接收用户输入的就职公司的名称及待校验的公司地址的个人信息;从工商行政管理数据库中获取与所述就职公司的名称关联的基准公司地址;根据预先建立的地图数据库中各个地点及各个地点对应的名称集合,确定所述待校验的公司地址对应在所述地图数据库中的第一地点,及确定所述基准公司地址对应在所述地图数据库中的第二地点;计算所述第一地点与所述第二地点的距离;及当所述第一地点与所述第二地点的距离大于预设阈值时,提醒用户待校验的公司地址会有误差风险。5.如权利要求4所述的基于经纬度及文本比对的地址相似度识别方法,其特征在于,所述方法还包括:接收用户输入的身份证件号码及待校验的身份证件关联地址的个人信息;从身份证件信息数据库中获取与所述身份证件号码对应的基准身份证件关联地址;根据预先建立的地图数据库中各个地点及各个地点对应的名称集合,确定所述待校验的身份证件关联地址对应在所述地图数据库中的第三地点,及确定所述基准身份证件关联地址对应在所述地图数据库中的第四地点;计算所述第三地点与所述第四地点的距离;及当所述第三地点与所述第四地点的距离大于预设阈值时,提醒用户待校验的身份证件关联地址会有误差风险。6.一种基于经纬度及文本比对的地址相似度识别系统,运行于电子装置中,其特征在于,所述系统包括:接收模块,用于接收用户输入的个人信息,所述个人信息包括身份证件号码及待校验的身份证件关联地址;获取模...

【专利技术属性】
技术研发人员:蔡健
申请(专利权)人:深圳前海征信中心股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1