本发明专利技术实施例提供了一种地名匹配方法及装置,将第一地名及第二地名分别分解为专名和通名,并分别计算第一地名的专名与第二地名的专名的相似度及第一地名的通名与第二地名的通名的相似度,再由专名相似度及通名相似度确定第一地名与第二地名的相似度,因为分别考虑到了地名中包括专名和通名的构词方式及通名的语义特征,因此,相比于将地名作为一个字符串的匹配,具有较高的准确性。
【技术实现步骤摘要】
本专利技术测绘科学与
,尤其涉及一种地名匹配方法和装置。
技术介绍
随着网络技术的迅速发展及人们对基于位置信息的服务的需求的快速增长,地名已经成为普通民众获取信息的重要地理参考。如何从海量的地理信息资源中快速检索出所需的信息,成为地名研究中的重要课题。当前的地名匹配方法,将地名作为普通字符串,与地名库中的已有地名进行匹配,只将地名作为普通的字符串,而忽略了地名的符号和语义特征,因此不能提供较高的准确性。
技术实现思路
有鉴于此,本专利技术实施例提供了一种地名匹配方法及装置,目的在于解决现有的地名匹配方法存在的准确性不高的问题。一种地名匹配方法,应用于中文地名,包括:将第一地名及第二地名分别分解为专名和通名;计算所述第一地名的专名与所述第二地名的专名的专名相似度;计算所述第一地名的通名与所述第二地名的通名的通名相似度;依据所述专名相似度和所述通名相似度,确定所述第一地名与所述第二地名的相似度。 优选地,所述将第一地名及第二地名分别分解为专名和通名包括:去除第一地名中的非法字符后,将所述第一地名与预设的通名词库进行对比,确定所述第一地名中的通名;从所述第一地名去除所述第一地名中的通名,得到所述第一地名中的专名;去除第二地名中的非法字符后,将所述第二地名与所述预设的通名词库进行对t匕,确定所述第二地名中的通名;从所述第二地名去除所述第二地名中的通名,得到所述第二地名中的专名。优选地,所述计算所述第一地名的专名与所述第二地名的专名的专名相似度包括:确定所述第一地名的专名与所述第二地名的专名间的中文编辑距离;依据所述中文编辑距离及所述第一地名的专名的中文长度和所述第二地名的专名的中文长度中的较大者,计算所述第一地名的专名与所述第二地名的专名的相似度。优选地,所述计算所述第一地名的通名与所述第二地名的通名的通名相似度包括:确定所述第一地名的通名与所述第二地名的通名间的语义距离、概念深度、概念密度及关系类型;依据所述语义距离、概念深度、概念密度及关系类型计算所述通名的语义相似度。优选地,所述依据所述专名相似度和所述通名相似度,确定所述第一地名与所述第二地名的相似度包括:依据预设的权重计算规则,确定所述专名相似度的第一权重,及所述通名相似度的第二权重;依据所述第一权重、第二权重、所述第一地名的专名、所述第一地名的通名、所述第二地名的专名、所述第二地名的通名,计算所述第一地名与所述第二地名的相似度。一种地名匹配装置,应用于中文地名,包括:地名分解模块,用于将第一地名及第二地名分别分解为专名和通名;专名相似度计算模块,用于计算所述第一地名的专名与第二地名的专名的专名相似度;通名相似度计算模块,用于计算所述第一地名的通名与所述第二地名的通名的通名相似度;地名相似度确定模块,用于依据所述专名相似度和所述通名相似度,确定所述第一地名与所述第二地名的相似度。优选地,所述地名分解模块包括:过滤模块,用于在将第一地名及第二地名分别分解为专名和通名之前,去除所述第一地名及第二地名中的非法字符;通名确定单元,用于将所述第一地名及第二地名与预设的通名词库进行对比,确定所述第一地名及第二地名各自的通名;专名确定单元,用于从所述第一地名中去除所述第一地名中的通名,得到所述第一地名中的专名,及从所述第二地名中去除所述第二地名中的通名,得到所述第二地名中的专名。优选地,所述专名相似度计算模块包括:编辑距离确定单元,用于确定所述第一地名的专名与所述第二地名的专名间的中文编辑距离;专名的相似度计算单元,用于依据所述中文编辑距离及所述第一地名的专名的长度和所述第二地名的专名的长度中的较大者,计算所述第一地名的专名与所述第二地名的专名的相似度。优选地,所述通名相似度计算模块包括:参数确定单元,用于确定所述第一地名的通名与所述第二地名的通名间的语义距离、概念深度、概念密度及关系类型;通名语义相似度计算单元,用于依据所述语义距离、概念深度、概念密度及关系类型计算所述通名的语义相似度。优选地,所述地名相似度确定模块包括:权重确定单元,用于依据预设的权重计算规则,确定所述专名相似度的第一权重,及所述通名相似度的第二权重;地名相似度计算单元,用于依据所述第一权重、第二权重、所述专名相似度及所述通名相似度,计算所述第一地名与所述第二地名的相似度。本专利技术实施例公开的一种地名匹配方法及装置,将第一地名及第二地名分别分解为专名和通名,并分别计算第一地名的专名与第二地名的专名的相似度及第一地名的通名与第二地名的通名的相似度,再由专名相似度及通名相似度确定第一地名与第二地名的相似度,因为分别考虑到了地名中包括专名和通名的构词方式及通名的语义特征,因此,相比于将地名作为一个字符串的匹配,具有较高的准确性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例公开的一种地名匹配方法的流程图;图2为本专利技术实施例公开的又一种地名匹配方法的流程图;图3为本专利技术实施例公开的又一种地名匹配方法的流程图;图4为本专利技术实施例公开的建立的地名通名语义知识库片段示意图;图5为本专利技术实施例公开的又一种地名匹配方法的流程图;图6为本专利技术实施例公开的一种地名匹配装置的结构示意图。具体实施例方式本专利技术实施例公开了一种地名匹配方法及装置,其核心专利技术点在于,依据地名中包含专名和通名的构词特性,分别计算待匹配地名的专名间的相似度及通名间的相似度,再依据专名相似度和通名相似度,确定待匹配地名间的相似度,可见,所述方法及装置以地名的构词特性为依据及约束条件,因此,相对于其它地名匹配方法,能够更细致地反映不同地名间的区别及相似程度,因而具有更高的准确性。下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例公开了一种地名匹配方法,应用于中文地名,如图1所示,包括:SlOl:将第一地名及第二地名分别分解为专名和通名;通常,地名作为专有名称,其构词随语言的不同又各有特点,在几千年的演变过程中,中文地名逐渐形成了独特的构词方式,即“专名”加“通名”的形式。其中,专名表示某一个地理实体或现象,通名则表示地名所指地理实体或现象的类型。如“河南省”中“河南”是专名,表示河南这个地方;“省”是通名,表示“河南”是一级行政区域。S102:计算所述第一地名的专名与所述第二地名的专名的专名相似度;S103:计算所述第一地名的通名与所述第二地名的通名的通名相似度;S104:依据所述专名相似度和所述通名相似度,确定所述第一地名与所述第二地名的相似度。本实施例所述的地名匹配方法,依据中文地名的构词特性,分别计算待匹配地名的专名间的相似度和通名间的相似度,因此所述方法更适用于地名间的匹配,具有较高的匹配准确性。本专利技术实施例公开的又一种地名匹配方法,应用于中文地名,如图2所示,包括:S201:去除所本文档来自技高网...
【技术保护点】
一种地名匹配方法,应用于中文地名,其特征在于,包括:将第一地名及第二地名分别分解为专名和通名;计算所述第一地名的专名与所述第二地名的专名的专名相似度;计算所述第一地名的通名与所述第二地名的通名的通名相似度;依据所述专名相似度和所述通名相似度,确定所述第一地名与所述第二地名的相似度。
【技术特征摘要】
1.一种地名匹配方法,应用于中文地名,其特征在于,包括: 将第一地名及第二地名分别分解为专名和通名; 计算所述第一地名的专名与所述第二地名的专名的专名相似度; 计算所述第一地名的通名与所述第二地名的通名的通名相似度; 依据所述专名相似度和所述通名相似度,确定所述第一地名与所述第二地名的相似度。2.根据权利要求1所述的方法,其特征在于,所述将第一地名及第二地名分别分解为专名和通名包括: 去除第一地名中的非法字符后,将所述第一地名与预设的通名词库进行对比,确定所述第一地名中的通名; 从所述第一地名去除所述第一地名中的通名,得到所述第一地名中的专名; 去除第二地名中的非法字符后,将所述第二地名与所述预设的通名词库进行对比,确定所述第二地名中的通名; 从所述第二地名去除所述第二地名中的通名,得到所述第二地名中的专名。3.根据权利要求1所述的方法,其特征在于,所述计算所述第一地名的专名与所述第二地名的专名的专名相似度包括: 确定所述第一地名的专名与所述第二地名的专名间的中文编辑距离;` 依据所述中文编辑距离及所述第一地名的专名的中文长度和所述第二地名的专名的中文长度中的较大者,计算所述第一地名的专名与所述第二地名的专名的相似度。4.根据权利要求1所述的方法,其特征在于,所述计算所述第一地名的通名与所述第二地名的通名的通名相似度包括: 确定所述第一地名的通名与所述第二地名的通名间的语义距离、概念深度、概念密度及关系类型; 依据所述语义距离、概念深度、概念密度及关系类型计算所述通名的语义相似度。5.根据权利要求1所述的方法,其特征在于,所述依据所述专名相似度和所述通名相似度,确定所述第一地名与所述第二地名的相似度包括: 依据预设的权重计算规则,确定所述专名相似性的第一权重,及所述通名相似性的第二权重; 依据所述第一权重、第二权重、所述第一地名的专名、所述第一地名的通名、所述第二地名的专名、所述第二地名的通名,计算所述第一地名与所述第二地名的相似度。6.一种地名匹配装置,...
【专利技术属性】
技术研发人员:程钢,卢小平,于海洋,文运平,杨杰,
申请(专利权)人:河南理工大学,
类型:发明
国别省市:河南;41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。