地址参数处理方法及相关设备技术

技术编号:27134338 阅读:12 留言:0更新日期:2021-01-25 20:32
本发明专利技术涉及人工智能技术领域,提供一种地址参数处理方法及相关设备,所述地址参数处理方法包括:接收输入的地址信息;将所述地址信息输入至基于Transformer的双向编码器表征BERT的地址解析模型中,获得输出概率;若所述输出概率大于预设阈值,获取所述地址解析模型输出的非规范地址参数;根据所述非规范地址参数,对所述地址信息进行清理,获得清理后的地址信息;根据地址知识模板库,对所述清理后的地址信息进行切分,获得规范地址参数;将所述非规范地址参数和所述规范地址参数进行合并,获得所述地址信息的地址解析结果。本发明专利技术还涉及区块链技术,可以将地址解析结果上传至区块链上。本发明专利技术能够对地址型参数进行有效解析。本发明专利技术能够对地址型参数进行有效解析。本发明专利技术能够对地址型参数进行有效解析。

【技术实现步骤摘要】
地址参数处理方法及相关设备


[0001]本专利技术涉及人工智能
,尤其涉及一种地址参数处理方法及相关设备。

技术介绍

[0002]地址型参数在自然语言处理中是非常常见而且重要的参数。地址型参数与一般的参数不一样,并不是简单的字符串,而是有省市区层级的对应,并且是真实有效的地址。
[0003]实际应用中,地址经常是介于规则和非规则信息中间,在实际对话中经常会有一些非规范的地址表述,比如:XX省XX市XX区XX路XX办公楼,XX办公楼就属于非规范的地址表述,然而,目前并没有有效的方法能够识别非规范的地址信息。
[0004]因此,如何对地址型参数进行有效解析是一个亟待解决的技术问题。

技术实现思路

[0005]鉴于以上内容,有必要提供一种地址参数处理方法及相关设备,能够对地址型参数进行有效解析。
[0006]本专利技术的第一方面提供一种地址参数处理方法,所述地址参数处理方法包括:
[0007]接收输入的地址信息;
[0008]将所述地址信息输入至基于Transformer的双向编码器表征BERT的地址解析模型中,获得输出概率,其中,所述基于BERT的地址解析模型包括BERT输入层、双向长短时记忆循环神经网络Bilstm层、全连接层FC以及条件随机场CRF层;
[0009]若所述输出概率大于预设阈值,获取所述地址解析模型输出的非规范地址参数;
[0010]根据所述非规范地址参数,对所述地址信息进行清理,获得清理后的地址信息;
[0011]根据地址知识模板库,对所述清理后的地址信息进行切分,获得规范地址参数;
[0012]将所述非规范地址参数和所述规范地址参数进行合并,获得所述地址信息的地址解析结果。
[0013]在一些可选的实施方式中,所述接收输入的地址信息之后,所述地址参数处理方法包括:
[0014]对所述地址信息进行语义识别,获得识别结果;
[0015]根据所述识别结果,判断所述地址信息中是否存在非规范信息;
[0016]若所述地址信息中存在非规范信息,执行所述的将所述地址信息输入至基于Transformer的双向编码器表征BERT的地址解析模型中,获得输出概率的步骤。
[0017]在一些可选的实施方式中,所述将所述地址信息输入至基于Transformer的双向编码器表征BERT的地址解析模型中,获得输出概率包括:
[0018]将所述地址信息输入至所述基于BERT的地址解析模型中的BERT输入层;
[0019]通过所述Bilstm层提取所述地址信息的非规范地址参数;
[0020]使用所述FC层对所述非规范地址参数进行分类识别,获得识别结果;
[0021]使用所述CRF层对所述识别结果进行预测,获得输出概率。
[0022]在一些可选的实施方式中,所述将所述地址信息输入至基于Transformer的双向编码器表征BERT的地址解析模型中,获得输出概率之后,以及所述若所述输出概率大于预设阈值,获取所述地址解析模型输出的非规范地址参数之前,所述地址参数处理方法还包括:
[0023]通过所述地址解析模型,输出非规范信息在所述地址信息中的位置及类型;
[0024]根据所述位置、所述类型以及所述非规范信息,生成所述非规范地址参数。
[0025]在一些可选的实施方式中,所述地址参数处理方法还包括:
[0026]获取基准地址参数;
[0027]计算所述地址解析结果与所述基准地址参数的相似度;
[0028]根据所述相似度,对所述地址信息的准确性进行校验。
[0029]在一些可选的实施方式中,所述计算所述地址解析结果与所述基准地址参数的相似度包括:
[0030]采用词频-逆文本频率指数TF-IDF算法计算所述地址解析结果的第一词频向量,以及采用所述TF-IDF算法计算所述基准地址参数的第二词频向量;
[0031]计算所述第一词频向量与所述第二词频向量的余弦值;
[0032]将所述余弦值确定为所述地址解析结果与所述基准地址参数的相似度。
[0033]在一些可选的实施方式中,所述地址参数处理方法还包括:
[0034]若校验的结果表明所述地址信息有误,从所述地址解析结果中提取出有误的目标地址参数;
[0035]获取所述目标地址参数所属的地址类型以及所述地址信息的应用场景;
[0036]根据所述地址类型,确定所述目标地址参数在所述应用场景下的风险级别;
[0037]若所述风险级别高于预设风险级别阈值,输出风险提示信息。
[0038]本专利技术的第二方面提供一种地址参数处理装置,所述地址参数处理装置包括:
[0039]接收模块,用于接收输入的地址信息;
[0040]输入模块,用于将所述地址信息输入至基于Transformer的双向编码器表征BERT的地址解析模型中,获得输出概率,其中,所述基于BERT的地址解析模型包括BERT输入层、双向长短时记忆循环神经网络Bilstm层、全连接层FC以及条件随机场CRF层;
[0041]获取模块,用于若所述输出概率大于预设阈值,获取所述地址解析模型输出的非规范地址参数;
[0042]清理模块,用于根据所述非规范地址参数,对所述地址信息进行清理,获得清理后的地址信息;
[0043]切分模块,用于根据地址知识模板库,对所述清理后的地址信息进行切分,获得规范地址参数;
[0044]合并模块,用于将所述非规范地址参数和所述规范地址参数进行合并,获得所述地址信息的地址解析结果。
[0045]本专利技术的第三方面提供一种电子设备,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现所述的地址参数处理方法。
[0046]本专利技术的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述的地址参数处理方法。
[0047]由以上技术方案可知,本专利技术中,在传统的基础上,先利用地址解析模型提取并识别非规范地址参数,然后利用地址知识模板库,对清理后的地址信息进行切分,获得规范地址参数,最后,结合两部分内容,得到地址解析结果,让传统的方法在清理后的地址信息上更好的发挥作用,同时对这些非规范地点信息进行定位和识别,从而有效地解决了现有技术中无法识别非规范地址的盲点,有效解析了地址型参数。
附图说明
[0048]图1是本专利技术公开的一种地址参数处理方法的较佳实施例的流程图。
[0049]图2是本专利技术公开的一种BIO标记的示意图。
[0050]图3是本专利技术公开的一种地址参数处理装置的较佳实施例的功能模块图。
[0051]图4是本专利技术实现地址参数处理方法的较佳实施例的电子设备的结构示意图。
具体实施方式
[0052]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种地址参数处理方法,其特征在于,所述地址参数处理方法包括:接收输入的地址信息;将所述地址信息输入至基于Transformer的双向编码器表征BERT的地址解析模型中,获得输出概率,其中,所述基于BERT的地址解析模型包括BERT输入层、双向长短时记忆循环神经网络Bilstm层、全连接层FC以及条件随机场CRF层;若所述输出概率大于预设阈值,获取所述地址解析模型输出的非规范地址参数;根据所述非规范地址参数,对所述地址信息进行清理,获得清理后的地址信息;根据地址知识模板库,对所述清理后的地址信息进行切分,获得规范地址参数;将所述非规范地址参数和所述规范地址参数进行合并,获得所述地址信息的地址解析结果。2.根据权利要求1所述的地址参数处理方法,其特征在于,所述接收输入的地址信息之后,所述地址参数处理方法包括:对所述地址信息进行语义识别,获得识别结果;根据所述识别结果,判断所述地址信息中是否存在非规范信息;若所述地址信息中存在非规范信息,执行所述的将所述地址信息输入至基于Transformer的双向编码器表征BERT的地址解析模型中,获得输出概率的步骤。3.根据权利要求1所述的地址参数处理方法,其特征在于,所述将所述地址信息输入至基于Transformer的双向编码器表征BERT的地址解析模型中,获得输出概率包括:将所述地址信息输入至所述基于BERT的地址解析模型中的BERT输入层;通过所述Bilstm层提取所述地址信息的非规范地址参数;使用所述FC层对所述非规范地址参数进行分类识别,获得识别结果;使用所述CRF层对所述识别结果进行预测,获得输出概率。4.根据权利要求1所述的地址参数处理方法,其特征在于,所述将所述地址信息输入至基于Transformer的双向编码器表征BERT的地址解析模型中,获得输出概率之后,以及所述若所述输出概率大于预设阈值,获取所述地址解析模型输出的非规范地址参数之前,所述地址参数处理方法还包括:通过所述地址解析模型,输出非规范信息在所述地址信息中的位置及类型;根据所述位置、所述类型以及所述非规范信息,生成所述非规范地址参数。5.根据权利要求1所述的地址参数处理方法,其特征在于,所述地址参数处理方法还包括:获...

【专利技术属性】
技术研发人员:邹倩霞
申请(专利权)人:深圳壹账通智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1