地址匹配方法及装置、电子设备、计算机可读存储介质制造方法及图纸

技术编号:38272325 阅读:15 留言:0更新日期:2023-07-27 10:26
本申请提供一种地址匹配方法及装置、电子设备、计算机可读存储介质,该方法包括:将查询地址文本和标准地址文本分别输入预先训练得到的层级预测模型,预测得到查询地址文本对应的第一地址层级信息以及标准地址文本对应的第二地址层级信息;将查询地址文本、第一地址层级信息、标准地址文本以及第二地址层级信息输入预先训练得到的地址匹配模型,预测得到所述查询地址文本与标准地址文本之间的匹配度;根据匹配度确定查询地址文本与标准地址文本是否匹配。本申请能够有效提高地址匹配的准确性。性。性。

【技术实现步骤摘要】
地址匹配方法及装置、电子设备、计算机可读存储介质


[0001]本申请涉及信息处理
,特别涉及一种地址匹配方法及装置、电子设备、计算机可读存储介质。

技术介绍

[0002]地址匹配是将要查询的非标准数据与数据库中的标准地址进行一致性匹配,进而获取非标准数据中的地址层级元素和地理信息。如非标准数据为“重都高新区房天下大厦5楼”,数据库中的标准地址为“四川省重都市高新区XX一路176号房天下大厦5层”匹配后是同一地址,进而补全非标准地址的省、市、区、街道等层级元素。
[0003]在相关技术中,通常基于字符的统计特征来判断两个地址的匹配情况,例如,采用编辑距离或n

gram模型,但这种方式准确率较差。因此,目前如何提高地址匹配的准确率成为研究的热点问题之一。

技术实现思路

[0004]本申请提供一种地址匹配方法及装置、电子设备、计算机可读存储介质,能够有效提高地址匹配的准确性。
[0005]第一方面,本申请提供了一种地址匹配方法,该方法包括:
[0006]将查询地址文本和标准地址文本分别输入预先训练得到的层级预测模型,预测得到所述查询地址文本对应的第一地址层级信息以及所述标准地址文本对应的第二地址层级信息;
[0007]将所述查询地址文本、所述第一地址层级信息、所述标准地址文本以及所述第二地址层级信息输入预先训练得到的地址匹配模型,预测得到所述查询地址文本与所述标准地址文本之间的匹配度;
[0008]根据所述匹配度确定所述查询地址文本与所述标准地址文本是否匹配。
[0009]第二方面,本申请实施例提供一种地址匹配装置,该装置包括:
[0010]预测单元,用于将查询地址文本和标准地址文本分别输入预先训练得到的层级预测模型,预测得到所述查询地址文本对应的第一地址层级信息以及所述标准地址文本对应的第二地址层级信息;
[0011]匹配单元,用于将所述查询地址文本、所述第一地址层级信息、所述标准地址文本以及所述第二地址层级信息输入预先训练得到的地址匹配模型,预测得到所述查询地址文本与所述标准地址文本之间的匹配度;
[0012]所述匹配单元,还用于根据所述匹配度确定所述查询地址文本与所述标准地址文本是否匹配。
[0013]第三方面,本申请提供了一种电子设备,该电子设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的一个或多个计算机程序,一个或多个所述计算机程序被所述至少一个处理器执
行,以使所述至少一个处理器能够执行第一方面所述的地址匹配方法。
[0014]第四方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序在被处理器执行时实现第一方面所述的地址匹配方法。
[0015]根据本申请提供的地址匹配方法及装置、电子设备、计算机可读存储介质的技术方案,利用预先训练得到的层级预测模型预测查询地址文本对应的第一地址层级信息以及标准地址文本对应的第二地址层级信息,并利用预先训练得到的地址匹配模型基于查询地址文本、标准地址文本及地址层级信息计算查询地址文本与标准地址文本之间的匹配度,从而确定查询地址文本与标准地址文本是否匹配。在地址匹配过程中,利用层级预测模型获取地址完整的地址层级信息,在地址匹配模型中有效结合了地址层级进行地址匹配,地址的地址层级信息能够准确反映地址的真实含义,即使不同地址间存在相同的行政区域或者行政区域间仅存在细节差异,也能够根据地址的地址层级关系准确判断不同地址是否匹配,有利于减少不同地址文本间行政区域的细节差异对地址匹配造成的误判,有效改善了不同地址文本间行政区域的细节差异对地址匹配效果造成的影响,从而有利于提高地址匹配的准确性。
[0016]应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0017]附图用来提供对本申请的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请,并不构成对本申请的限制。通过参考附图对详细示例实施例进行描述,以上和其他特征和优点对本领域技术人员将变得更加显而易见,在附图中:
[0018]图1为本申请实施例提供的一种地址匹配方法的流程示意图;
[0019]图2为本申请实施例中一种确定第一地址层级信息和第二地址层级信息的具体实现方式的流程示意图;
[0020]图3为本申请实施例中一种确定查询地址文本与标准地址文本之间的匹配度的具体实现方式的流程示意图;
[0021]图4为本申请实施例中一种确定第二输入编码序列的具体实现方式的流程示意图;
[0022]图5为本申请实施例中一种层级预测模型的模型架构示意图;
[0023]图6为本申请实施例提供的一种层级预测模型的训练方法的流程示意图;
[0024]图7为本申请实施例中一种地址匹配模型的模型架构示意图;
[0025]图8为本申请实施例提供的一种地址匹配模型的训练方法的流程示意图;
[0026]图9为本申请实施例提供的一种地址匹配装置的框图;
[0027]图10为本申请实施例提供的一种电子设备的框图。
具体实施方式
[0028]为使本领域的技术人员更好地理解本申请的技术方案,以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各
种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0029]在不冲突的情况下,本申请各实施例及实施例中的各特征可相互组合。
[0030]如本文所使用的,术语“和/或”包括一个或多个相关列举条目的任何和所有组合。
[0031]本文所使用的术语仅用于描述特定实施例,且不意欲限制本申请。如本文所使用的,单数形式“一个”和“该”也意欲包括复数形式,除非上下文另外清楚指出。还将理解的是,当本说明书中使用术语“包括”和/或“由
……
制成”时,指定存在所述特征、整体、步骤、操作、元件和/或组件,但不排除存在或添加一个或多个其它特征、整体、步骤、操作、元件、组件和/或其群组。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。
[0032]除非另外限定,否则本文所用的所有术语(包括技术和科学术语)的含义与本领域普通技术人员通常理解的含义相同。还将理解,诸如那些在常用字典中限定的那些术语应当被解释为具有与其在相关技术以及本申请的背景下的含义一致的含义,且将不解释为具有理想化或过度形式上的含义,除非本文明确如此限定。
[0033]在相关技术中,通常基于字符的统计特征来判断两个地址的匹配情况,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种地址匹配方法,其特征在于,包括:将查询地址文本和标准地址文本分别输入预先训练得到的层级预测模型,预测得到所述查询地址文本对应的第一地址层级信息以及所述标准地址文本对应的第二地址层级信息;将所述查询地址文本、所述第一地址层级信息、所述标准地址文本以及所述第二地址层级信息输入预先训练得到的地址匹配模型,预测得到所述查询地址文本与所述标准地址文本之间的匹配度;根据所述匹配度确定所述查询地址文本与所述标准地址文本是否匹配。2.根据权利要求1所述的地址匹配方法,其特征在于,所述根据所述匹配度确定所述查询地址文本与所述标准地址文本是否匹配,包括:在所述匹配度大于或等于匹配阈值的情况下,确定所述查询地址文本与所述标准地址文本匹配;在所述匹配度小于所述匹配阈值的情况下,确定所述查询地址文本与所述标准地址文本不匹配。3.根据权利要求1所述的地址匹配方法,其特征在于,所述层级预测模型包括第一编码网络和字分类网络;所述将查询地址文本和标准地址文本分别输入预先训练得到的层级预测模型,预测得到所述查询地址文本对应的第一地址层级信息以及所述标准地址文本对应的第二地址层级信息,包括:将所述查询地址文本和所述标准地址文本分别作为所述层级预测模型的输入文本;对所述输入文本进行分词编码处理,得到所述输入文本对应的第一输入编码序列;通过所述层级预测模型的第一编码网络对所述第一输入编码序列进行编码处理,获得所述输入文本对应的第一表示向量序列;将所述第一表示向量序列输入所述字分类网络,得到所述输入文本对应的字分类预测向量序列;根据所述字分类预测向量序列确定所述输入文本对应的地址层级信息,所述输入文本包括所述查询地址文本和所述标准地址文本,所述地址层级信息包括所述查询地址文本对应的第一地址层级信息和所述标准地址文本对应的第二地址层级信息,所述第一地址层级信息由所述查询地址文本中每个字对应的地址层级构成,所述第二地址层级信息由所述标准地址文本中每个字对应的地址层级构成。4.根据权利要求1所述的地址匹配方法,其特征在于,所述地址匹配模型包括第二编码网络和匹配网络;所述将所述查询地址文本、所述第一地址层级信息、所述标准地址文本以及所述第二地址层级信息输入预先训练得到的地址匹配模型,预测得到所述查询地址文本与所述标准地址文本之间的匹配度,包括:对所述查询地址文本、所述第一地址层级信息、所述标准地址文本和所述第二地址层级信息进行编码处理,得到第二输入编码序列;将所述第二输入编码序列输入所述第二编码网络,获得第二表示向量序列;将所述第二表示向量序列输入所述匹配网络,得到匹配向量,并根据所述匹配向量确
定所述查询地址文本与所述标准地址文本之间的匹配度。5.根据权利要求4所述的地址匹配方法,其特征在于,所述对所述查询地址文本、所述第一地址层级信息、所述标准地址文本和所述第二地址层级信息进行编码处理,得到第二输入编码序列,包括:将所述查询地址文本与所述标准地址文本拼接后进行分词编码处理,得到文本编码序列以及位置编码序列;基于所述文本编码序列,通过标识符标识所述查询地址的标识和标准地址的标识,并对标识进行编码得到标识编码序列;将所述第一地址层级信息和所述第二地址层级信息进行编码得到层级编码序列;将所述文本编码序列、所述位置编码序列、所述标识编码序列和所述层级编码序列组成所述第二输入编码序列。6.根据权利要求1所述的地址匹配方法,其特征在于,所述层级预测模型通过以下训练方式训练得到:获取第一训练集及第一验证集,并基于所述第一训练集开始对所述层级预测模型的迭代训练,所述第一训练集包括多个第一训练地址文本及每个训练地址文本对应的地址层级标签,所述第一验证集包括多个第一验证地址文本;在每一次训练过程中,对第一训练集中的任意第一训练地址文本进行分词编码处理,得到第一训练编码序列,以及对所述任意第一训练地址文本对应的地址层级标签进行编码处理,得到标签编码序列;将所述任意第一训练地址文本的第一训练编码序列输入所述层级预测模型得到字分类预测向量序列,所述字分类预测向量序列用于预测所述第一训练地址文本对应的地址层级;根据所述标签编码序列和所述字分类预测向量序列计算第一损失;基于所述第一损失对所述层级预测模型进行模型梯度计算和模型参数更新。7.根据权利要...

【专利技术属性】
技术研发人员:汪自立马超夏粉蒋宁肖冰吴海英
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1