地址纠错方法及装置制造方法及图纸

技术编号:33921156 阅读:15 留言:0更新日期:2022-06-25 21:03
本申请公开了一种地址纠错方法及装置。所述方法包括:获取待纠错的地址文本;确定与所述待纠错的地址文本对应的地址节点列表,所述地址节点列表包括至少一个节点分支,所述节点分支包括基于地址字典树得到的地址节点,一个地址节点对应于一个行政区域;基于所述至少一个节点分支中每一个节点分支的权重分值或所包含的地址节点的数目,确定目标节点分支;基于所述目标节点分支,确定与所述待纠错的地址文本对应的目标地址。文本对应的目标地址。文本对应的目标地址。

【技术实现步骤摘要】
地址纠错方法及装置


[0001]本申请涉及互联网
,尤其涉及一种地址纠错方法及装置。

技术介绍

[0002]随着地址文本的使用日趋广泛,地址文本中出现错误的概率也日益提高。由于地址文本中出现错误会影响地址的准确性,因而,如何对地址文本进行纠错是一个值得关注的问题。
[0003]在对地址文本进行纠错的过程中,相关技术会从与待纠错的地址文本匹配的多个地址文本中选择出相似度最高(例如读音相似度最高)的地址文本作为目标地址文本,并用此目标地址文本作为待纠错的地址文本的替换文本。
[0004]然而,相关技术中这种基于相似度进行地址纠错的方式会存在准确率不高的问题。

技术实现思路

[0005]本申请实施例提供一种地址纠错方法及装置,以解决相关技术中的地址纠错方式的准确率不高的问题。
[0006]第一方面,本申请提供了一种地址纠错方法,所述方法包括:
[0007]获取待纠错的地址文本;
[0008]确定与所述待纠错的地址文本对应的地址节点列表,所述地址节点列表包括至少一个节点分支,所述节点分支包括基于地址字典树得到的地址节点,一个地址节点对应于一个行政区域;
[0009]基于所述至少一个节点分支中每一个节点分支的权重分值或所包含的地址节点的数目,确定目标节点分支;
[0010]基于所述目标节点分支,确定与所述待纠错的地址文本对应的目标地址。
[0011]第二方面,本申请提供了一种地址纠错装置,所述装置包括:
[0012]获取模块,用于获取待纠错的地址文本;
[0013]确定模块,用于确定与所述待纠错的地址文本对应的地址节点列表,所述地址节点列表包括至少一个节点分支,所述节点分支包括基于地址字典树得到的地址节点,一个地址节点对应于一个行政区域;基于所述至少一个节点分支中每一个节点分支的权重分值或所包含的地址节点的数目,确定目标节点分支;基于所述目标节点分支,确定与所述待纠错的地址文本对应的目标地址。
[0014]第三方面,本申请提供了一种电子设备,包括:处理器和存储器,所述存储器存储在程序或指令,所述程序或指令被所述处理器执行时实现第一方面的方法的步骤。
[0015]第四方面,本申请提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现第一方面的方法的步骤。
[0016]本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:
[0017]在本申请实施例中,获取待纠错的地址文本;确定与所述待纠错的地址文本对应的地址节点列表,所述地址节点列表包括至少一个节点分支,所述节点分支包括基于地址字典树得到的地址节点,一个地址节点对应于一个行政区域;基于所述至少一个节点分支中每一个节点分支的权重分值或所包含的地址节点的数目,确定目标节点分支;基于所述目标节点分支,确定与所述待纠错的地址文本对应的目标地址。如此,由于行政区域与地址节点对应,且基于地址字典树得到的地址节点能够准确反映行政区域之间的关系,因而这种基于各个节点分支的权重分值或所包含的地址节点的数目,确定与所述待纠错的地址文本对应的目标地址的方式地址纠错的准确率较高。
附图说明
[0018]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0019]图1为本申请实施例提供的一种地址纠错方法的流程图;
[0020]图2为本申请实施例提供的一种地址纠错方法的流程图;
[0021]图3为本申请实施例提供的一种地址纠错方法的流程图;
[0022]图4为本申请实施例提供的一种地址纠错方法的流程图;
[0023]图5为本申请实施例提供的一种地址纠错方法的流程图;
[0024]图6为本申请实施例提供的一种地址纠错方法的流程图;
[0025]图7为本申请实施例提供的一种地址纠错方法的流程图;
[0026]图8为本申请实施例提供的一种地址纠错方法的示意图;
[0027]图9为本申请实施例提供的一种地址纠错装置的结构框图;
[0028]图10为本申请实施例提供的一种电子设备的结构框图。
具体实施方式
[0029]为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0030]本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
[0031]以下结合附图,详细说明本申请各实施例提供的技术方案。
[0032]图1是本申请实施例提供的一种地址纠错方法的流程图,参照图1,本申请实施例提供的地址纠错方法可以包括:
[0033]步骤110,获取待纠错的地址文本;
[0034]其中,所述待纠错的地址文本可以是包含多级行政区域(例如,四级行政区域)文
本的标准地址文本,也可以是错误的地址文本。在本申请实施例中,所述待纠错的地址文本可以是用户直接输入而获取的,也可以是电子设备从例如快递单或者文档中获取的。
[0035]步骤120,确定与所述待纠错的地址文本对应的地址节点列表,所述地址节点列表包括至少一个节点分支,所述节点分支包括基于地址字典树得到的地址节点,一个地址节点对应于一个行政区域;
[0036]在本申请实施例中,所述地址节点列表可以包括多个地址节点子列表,所述地址节点子列表中可以包括多个节点分支;或者,所述地址节点列表也可以直接包括多个节点分支。所述地址节点列表中包括的地址节点可以对应于多级行政区域,例如,四级行政区域;一个地址节点可以对应于一个行政区域。其中,所述四级行政区域可以为,第一级行政区域可以为省级:省、直辖市、特别行政区;第二级行政区域可以为地级:地级市、地区;第三级行政区域可以为县级:县、市辖区;第四级行政区域可以为乡级:街道办事处、乡、镇。
[0037]在本申请实施例中,所述节点分支可以包括基于地址字典树得到的至少两个地址节点进行融合之后得到的节点分支,其中,所述至少两个地址节点可以对应于相互匹配的行政区域;所述节点分支也可以包括一个基于地址字典树得到的所述地址节点,也就是说,可以将未进行融合的一个地址节点作为一个节点分支。举例而言,在所述地址节点列表可以为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种地址纠错方法,其特征在于,所述方法包括:获取待纠错的地址文本;确定与所述待纠错的地址文本对应的地址节点列表,所述地址节点列表包括至少一个节点分支,所述节点分支包括基于地址字典树得到的地址节点,一个地址节点对应于一个行政区域;基于所述至少一个节点分支中每一个节点分支的权重分值或所包含的地址节点的数目,确定目标节点分支;基于所述目标节点分支,确定与所述待纠错的地址文本对应的目标地址。2.根据权利要求1所述的方法,其特征在于,所述确定与所述待纠错的地址文本对应的地址节点列表包括:基于所述待纠错的地址文本,获取第一地址文本,所述第一地址文本包括至少一个行政区域文本,所述至少一个行政区域文本中的各个行政区域文本按照行政区域级别大小顺序排列;通过所述地址字典树将所述第一地址文本中的各个行政区域文本转换为地址节点,其中,一个行政区域文本对应于一个地址节点;基于转换得到的所述地址节点,确定所述地址节点列表。3.根据权利要求2所述的方法,其特征在于,所述基于转换得到的所述地址节点,确定所述地址节点列表包括:对于转换得到的所述地址节点中不存在子节点的第一地址节点,将所述第一地址节点作为节点分支加入至地址节点列表中;对于转换得到的所述地址节点中存在子节点的第二地址节点,将所述第二地址节点和所述第二地址节点的子节点共同作为节点分支,加入至所述地址节点列表中。4.根据权利要求2所述的方法,其特征在于,所述基于所述待纠错的地址文本,获取第一地址文本包括:基于已预先训练好的第一模型,确定所述待纠错的地址文本中的各个行政区域文本;通过文本匹配模型,确定所述待纠错的地址文本中各个行政区域文本对应的匹配文本;基于所述各个行政区域文本对应的匹配文本,获取所述第一地址文本。5.根据权利要求4所述的方法,其特征在于,所述第一模型是基于地址标注数据对预训练模型进行调整得到的,所述地址标注数据是对按照正确的行政区域级别大小顺序排列好的地址文本进行文字操作得到的,所述文字操作包括以下至少一种:文字增加操作、文字删除操作、文字替换操作以及文字顺序调整操作。6.根据权利要求1

5任一项所述的方法,其特征在于,所述基于所述至少一个节点分支中每一个节点分支所包含的地址节点的数目,确定目标节点分支包括:确定所述至少一个节点分支中每一个节点分支所包含的地址节点的数目;将包含的地址节点数目最多的节点分支,确定为所述目标节点分支。7.根据权利要求1

5任一项所述的方法,其特征在于,所述基于所述至少一个节点分支中每一个节点分支的权重分值,确定目标节点分支包括:确定所述至少一个节点分支中每一个节点分支的权重分值;
将所述至少一个节点分支中权重分值最高的节点分支,确定为所述目标节点分支。8.根据权利要求7所述的方法,其特征在于,所述确定所述至少一个节点分支中每一个节点分支...

【专利技术属性】
技术研发人员:罗奇帅王洪斌吴海英权佳成
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1