本申请提供了一种地址对比方法、装置及系统,其中,该方法包括:获取第一地址;利用预设行政区划知识图谱对所述第一地址执行标准化操作,获得第一标准地址;对比所述第一标准地址和预设的第二标准地址,获得对比结果。本申请可以借助于预设行政区划知识图谱来规范地址,从而使得第一地址更加标准化;在地址标准化后,可以对比第一标准地址和预设的第二标准地址,从而能够获得更加准确的对比结果。
【技术实现步骤摘要】
地址对比方法、装置及系统
本申请涉及互联网
,尤其涉及地址对比方法、装置及系统。
技术介绍
在互联网领域中,很多应用场景涉及到地址对比,以核实两个地址是否为相同地址。例如,在信贷领域中的反欺诈与信审环节,需要对客户的当前地址与历史地址进行比对,以用于发现潜在关联客户或者欺诈客户。由于地址类信息的不规范性、中文语义的多样性等问题,目前提供的地址对比方法无法高效且精准的进行地址对比。
技术实现思路
鉴于此,本申请提供一种地址对比方法、装置及系统,可以高效且精准的进行地址对比。为了实现上述目的,本申请提供了下述技术特征:一种地址对比方法,其特征在于,包括:获取第一地址;利用预设行政区划知识图谱对所述第一地址执行标准化操作,获得第一标准地址;对比所述第一标准地址和预设的第二标准地址,获得对比结果。可选的,在对比所述第一标准地址和预设的第二标准地址获得对比结果之前,还包括:获取第二地址;利用所述预设行政区划知识图谱对所述第二地址执行标准化操作,获得所述第二标准地址。可选的,所述预设行政区划知识图谱的构建过程包括:依据五级行政区划数据构建基础知识图谱,其中每个行政区划为一实体;于互联网中搜索五级行政区划的多个下属条目;按所属关系添加多个下属条目至所述基础知识图谱;其中每个下属条目为一实体;向所述基础知识图谱中添加实体的近似实体,获得行政区划知识图谱。可选的,所述向所述基础知识图谱中添加实体的近似实体,获得行政区划知识图谱,包括:对于所述基础知识图谱中第四级实体和第五级实体中每个实体而言:获取实体的一个或多个近似实体;添加一个或多个近似实体至该实体。可选的,所述获取实体的一个或多个近似实体包括:获取该实体的一个或多个模糊音实体;获取该实体的一个或多个形近字实体。可选的,所述利用预设行政区划知识图谱对所述第一地址执行标准化操作获得第一标准地址,包括:利用地址分词技术对所述第一地址执行分词操作,获得所述第一地址的多个分词结果,每个分词结果作为一实体;从所述分词结果中确定五级行政区划的第一实体集,以及,其余实体组成的第二实体集;于所述预设行政区划知识图谱中搜索所述第一实体集中的各个实体;判断第一实体集中搜索到的实体是否于所述预设行政区划知识图谱中具有唯一子图;其中,所述预设知识图谱中搜索到的实体组成的链路为子图;若是,则利用所述唯一子图补全所述第一地址,获得第一标准地址;若否,则利用所述第一实体集和所述第二实体集,于所述预设行政区划知识图谱中搜索所述第一实体集和所述第二实体集中的各个实体;判断第二实体集中搜索到的实体是否于所述预设行政区划知识图谱中具有唯一子图;若是,则利用所述唯一子图补全所述第一地址,获得第一标准地址;若否,则确定无法利用预设行政区划知识图谱对所述第一地址执行标准化操作。可选的,在确定无法利用预设行政区划知识图谱对所述第一地址执行标准化操作之后,还包括:于互联网采用模糊匹配机制搜索所述第一地址的多个近似地址;于所述多个近似地址中确定与所述第一地址编辑距离最近的近似地址;将所述近似地址作为第一地址,继续执行地址标准化操作。可选的,还包括:在检测到行政区划数据或五级行政区划的下属条目发生变化,则更新预设行政区划知识图谱。一种地址对比装置,包括:获取单元,用于获取第一地址;标准化单元,用于利用预设行政区划知识图谱对所述第一地址执行标准化操作,获得第一标准地址;对比单元,用于对比所述第一标准地址和预设的第二标准地址,获得对比结果。一种地址对比系统,包括:终端,用于向服务器提供第一地址;服务器,用于获取所述第一地址,利用预设行政区划知识图谱对所述第一地址执行标准化操作获得第一标准地址,对比所述第一标准地址和预设的第二标准地址获得对比结果。通过以上技术手段,可以实现以下有益效果:本申请可以借助于预设行政区划知识图谱来规范地址,从而使得第一地址更加标准化;在地址标准化后,可以对比第一标准地址和第二标准地址,从而能够获得更加准确的对比结果。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例公开的一种构建知识图谱的流程图;图2为本申请实施例公开的一种地址对比方法的流程图;图3为本申请实施例公开的一种行政区划知识图谱的构建流程图;图4为本申请实施例公开的又一种地址对比方法的流程图;图5为本申请实施例公开的一种地址对比装置的结构示意图;图6为本申请实施例公开的一种地址对比系统的结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请首先介绍构建知识图谱的过程,参见图1,包括以下步骤:步骤101:依据五级行政区划数据构建基础知识图谱,其中每个行政区划为一实体。根据国家行政区划的迁移变更后最新行政区划数据(省级-市级-县级/区级-乡级/街道-村级/社区),抽取最新行政区划数据中的省级名称、市级名称、县级名称、乡级/街道名称和村级/社区名称分别作为实体,并依据所属关系构建实体与实体之间的所属关系,生成包含五级行政区划,以及,各级行政区划所属关系的基础知识图谱。例如,以“河北”和“石家庄”两个实体为例,构建“河北”与“石家庄”两个实体的所属关系,即“石家庄”实体属于“河北”实体。步骤S102:于互联网中搜索五级行政区划的多个下属条目。将五级行政区划作为搜索关键词,于互联网中搜索五级行政区划下包含的路、街、小区、门牌号等下属条目,通过自然语言处理技术将路名、街名、小区名、门牌号等下属条目。下属条目可以分为6个级别,分别为:路,弄/胡同/门牌号,小区/大厦/楼名,栋/座/楼号,单元/层/楼,详细地址/房间号。步骤S103:按所属关系添加多个下属条目至所述基础知识图谱;其中每个下属条目为一实体。为了扩展基础知识图谱,在五级行政区划下添加下属条目,即,在基础知识图谱的第五级行政区划下,按所属关系添加下属条目,以用于完善基础知识图谱。步骤S101~S103采用基础知识图谱中的实体表示五级行政区划,五级行政区划的下属条目,并采用实体与实体之间的所属关系,表示各级行政区划的所属关系。其中基础知识图谱中,第1~5级别为行政区划包括:第1级:省级;第2级:市级;第3级:县级/区级;第4级:乡级/街道;第5级:村级/社区;第6~12级分别为:路,弄/胡同/门牌号,小区/大厦/楼名,栋/座/楼号,单元/层/楼,详细地址/房间号。步骤S104:向基础知识图谱中添加实体的近似实体,获得行政区划知识图谱。由于人工拼写地址时可能会出现不准确的情况,以及,采用OCR技术识别地址时可能出现不准确的情况,当然还有其它意外情况,可能会使得用户撰写地址中出现错别字。为了便于后续利用知识图谱来标准化地址,在知识图谱中融入实体的近似实体。本申请可以针对基础知识图谱中每个实体来添加近似实体的操作。考虑到五本文档来自技高网...
【技术保护点】
1.一种地址对比方法,其特征在于,包括:获取第一地址;利用预设行政区划知识图谱对所述第一地址执行标准化操作,获得第一标准地址;对比所述第一标准地址和预设的第二标准地址,获得对比结果。
【技术特征摘要】
1.一种地址对比方法,其特征在于,包括:获取第一地址;利用预设行政区划知识图谱对所述第一地址执行标准化操作,获得第一标准地址;对比所述第一标准地址和预设的第二标准地址,获得对比结果。2.如权利要求1所述的方法,其特征在于,在对比所述第一标准地址和预设的第二标准地址获得对比结果之前,还包括:获取第二地址;利用所述预设行政区划知识图谱对所述第二地址执行标准化操作,获得所述第二标准地址。3.如权利要求1或2所述的方法,其特征在于,所述预设行政区划知识图谱的构建过程包括:依据五级行政区划数据构建基础知识图谱,其中每个行政区划为一实体;于互联网中搜索五级行政区划的多个下属条目;按所属关系添加多个下属条目至所述基础知识图谱;其中每个下属条目为一实体;向所述基础知识图谱中添加实体的近似实体,获得行政区划知识图谱。4.如权利要求3所述的方法,其特征在于,所述向所述基础知识图谱中添加实体的近似实体,获得行政区划知识图谱,包括:对于所述基础知识图谱中第四级实体和第五级实体中每个实体而言:获取实体的一个或多个近似实体;添加一个或多个近似实体至该实体。5.如权利要求4所述的方法,其特征在于,所述获取实体的一个或多个近似实体包括:获取该实体的一个或多个模糊音实体;获取该实体的一个或多个形近字实体。6.如权利要求3所述的方法,其特征在于,所述利用预设行政区划知识图谱对所述第一地址执行标准化操作获得第一标准地址,包括:利用地址分词技术对所述第一地址执行分词操作,获得所述第一地址的多个分词结果,每个分词结果作为一实体;从所述分词结果中确定五级行政区划的第一实体集,以及,其余实体组成的第二实体集;于所述预设行政区划知识图谱中...
【专利技术属性】
技术研发人员:王征,
申请(专利权)人:致诚阿福技术发展北京有限公司,普信恒业科技发展北京有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。