【技术实现步骤摘要】
地址匹配方法及装置、电子设备、计算机可读存储介质
[0001]本申请涉及信息处理
,特别涉及一种地址匹配方法及装置、电子设备、计算机可读存储介质。
技术介绍
[0002]地址匹配是将要查询的非标准数据与数据库中的标准地址进行一致性匹配,进而获取非标准数据中的地址层级元素和地理信息。如非标准数据为“重都高新区房天下大厦5楼”,数据库中的标准地址为“四川省重都市高新区XX一路176号房天下大厦5层”匹配后是同一地址,进而补全非标准地址的省、市、区、街道等层级元素。
[0003]在相关技术中,通常基于字符的统计特征来判断两个地址的匹配情况,例如,采用编辑距离或n
‑
gram模型,但这种方式准确率较差。因此,目前如何提高地址匹配的准确率成为研究的热点问题之一。
技术实现思路
[0004]本申请提供一种地址匹配方法及装置、电子设备、计算机可读存储介质,能够有效提高地址匹配的准确性。
[0005]第一方面,本申请提供了一种地址匹配方法,该方法包括:
[0006]将查询地址文本和标准地址文本分别输入预先训练得到的层级预测模型,预测得到所述查询地址文本对应的第一地址层级信息以及所述标准地址文本对应的第二地址层级信息;
[0007]将所述查询地址文本、所述第一地址层级信息、所述标准地址文本以及所述第二地址层级信息输入预先训练得到的地址匹配模型,预测得到所述查询地址文本与所述标准地址文本之间的匹配度;
[0008]根据所述匹配度确定所述查询地址文本与所述标准 ...
【技术保护点】
【技术特征摘要】
1.一种地址匹配方法,其特征在于,包括:将查询地址文本和标准地址文本分别输入预先训练得到的层级预测模型,预测得到所述查询地址文本对应的第一地址层级信息以及所述标准地址文本对应的第二地址层级信息;将所述查询地址文本、所述第一地址层级信息、所述标准地址文本以及所述第二地址层级信息输入预先训练得到的地址匹配模型,预测得到所述查询地址文本与所述标准地址文本之间的匹配度;根据所述匹配度确定所述查询地址文本与所述标准地址文本是否匹配。2.根据权利要求1所述的地址匹配方法,其特征在于,所述根据所述匹配度确定所述查询地址文本与所述标准地址文本是否匹配,包括:在所述匹配度大于或等于匹配阈值的情况下,确定所述查询地址文本与所述标准地址文本匹配;在所述匹配度小于所述匹配阈值的情况下,确定所述查询地址文本与所述标准地址文本不匹配。3.根据权利要求1所述的地址匹配方法,其特征在于,所述层级预测模型包括第一编码网络和字分类网络;所述将查询地址文本和标准地址文本分别输入预先训练得到的层级预测模型,预测得到所述查询地址文本对应的第一地址层级信息以及所述标准地址文本对应的第二地址层级信息,包括:将所述查询地址文本和所述标准地址文本分别作为所述层级预测模型的输入文本;对所述输入文本进行分词编码处理,得到所述输入文本对应的第一输入编码序列;通过所述层级预测模型的第一编码网络对所述第一输入编码序列进行编码处理,获得所述输入文本对应的第一表示向量序列;将所述第一表示向量序列输入所述字分类网络,得到所述输入文本对应的字分类预测向量序列;根据所述字分类预测向量序列确定所述输入文本对应的地址层级信息,所述输入文本包括所述查询地址文本和所述标准地址文本,所述地址层级信息包括所述查询地址文本对应的第一地址层级信息和所述标准地址文本对应的第二地址层级信息,所述第一地址层级信息由所述查询地址文本中每个字对应的地址层级构成,所述第二地址层级信息由所述标准地址文本中每个字对应的地址层级构成。4.根据权利要求1所述的地址匹配方法,其特征在于,所述地址匹配模型包括第二编码网络和匹配网络;所述将所述查询地址文本、所述第一地址层级信息、所述标准地址文本以及所述第二地址层级信息输入预先训练得到的地址匹配模型,预测得到所述查询地址文本与所述标准地址文本之间的匹配度,包括:对所述查询地址文本、所述第一地址层级信息、所述标准地址文本和所述第二地址层级信息进行编码处理,得到第二输入编码序列;将所述第二输入编码序列输入所述第二编码网络,获得第二表示向量序列;将所述第二表示向量序列输入所述匹配网络,得到匹配向量,并根据所述匹配向量确
定所述查询地址文本与所述标准地址文本之间的匹配度。5.根据权利要求4所述的地址匹配方法,其特征在于,所述对所述查询地址文本、所述第一地址层级信息、所述标准地址文本和所述第二地址层级信息进行编码处理,得到第二输入编码序列,包括:将所述查询地址文本与所述标准地址文本拼接后进行分词编码处理,得到文本编码序列以及位置编码序列;基于所述文本编码序列,通过标识符标识所述查询地址的标识和标准地址的标识,并对标识进行编码得到标识编码序列;将所述第一地址层级信息和所述第二地址层级信息进行编码得到层级编码序列;将所述文本编码序列、所述位置编码序列、所述标识编码序列和所述层级编码序列组成所述第二输入编码序列。6.根据权利要求1所述的地址匹配方法,其特征在于,所述层级预测模型通过以下训练方式训练得到:获取第一训练集及第一验证集,并基于所述第一训练集开始对所述层级预测模型的迭代训练,所述第一训练集包括多个第一训练地址文本及每个训练地址文本对应的地址层级标签,所述第一验证集包括多个第一验证地址文本;在每一次训练过程中,对第一训练集中的任意第一训练地址文本进行分词编码处理,得到第一训练编码序列,以及对所述任意第一训练地址文本对应的地址层级标签进行编码处理,得到标签编码序列;将所述任意第一训练地址文本的第一训练编码序列输入所述层级预测模型得到字分类预测向量序列,所述字分类预测向量序列用于预测所述第一训练地址文本对应的地址层级;根据所述标签编码序列和所述字分类预测向量序列计算第一损失;基于所述第一损失对所述层级预测模型进行模型梯度计算和模型参数更新。7.根据权利要...
【专利技术属性】
技术研发人员:汪自立,马超,夏粉,蒋宁,肖冰,吴海英,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。