地址信息提取方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:34088176 阅读:20 留言:0更新日期:2022-07-11 20:31
本申请涉及一种地址信息提取方法、装置、计算机设备和存储介质。所述方法通过获取待识别快递运单;提取待识别快递运单的原始地址信息;对原始地址信息中的层级地址信息进行标注,获取标注地址信息;根据标注地址信息与预设关键地址集,获取原始地址信息对应的标准地址信息。本申请通过提取快递运单内的原始地址,而后基于层级地址信息标注以及标准地址识别,来确定原始地址信息对应的标准地址信息,可以有效提高快递派件过程中的地址信息识别效率,避免出现因客户写错别字等原因导致地址信息不清楚,而使派件过程无法正常进行,影响快递派件效率的情况。快递派件效率的情况。快递派件效率的情况。

【技术实现步骤摘要】
地址信息提取方法、装置、计算机设备和存储介质


[0001]本申请涉及计算机
,特别是涉及一种地址信息提取方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着计算机技术与物流技术的快速发展,快递逐渐成为人们生产生活中不可或缺的一部分。快递又称速递或快运,是指物流企业(含货运代理)通过自身的独立网络或以联营合作(即联网)的方式,将用户委托的文件或包裹,快捷而安全地从发件人送达收件人的门到门(手递手)的新型运输方式。在快递运输中,一般需要托运人填写运单来获取快递相应的寄件人、托运物品以及目的地址等信息。
[0003]然而,由于运单的地址信息一般是客户填写的原始文本,因为填写习惯和细化地址的差异,文本信息呈现了明显多样性和书写差异。当前运单标签上地址信息即为客户填写的内容,不规范的填写内容大大影响相关作业人员的操作效率,进而影响快递的派送时效。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够可以有效提高地址信息识别效率的地址信息提取方法、装置、计算机设备和存储介质。
[0005]一种地址信息提取方法,所述方法包括:
[0006]获取待识别快递运单;
[0007]提取所述待识别快递运单的原始地址信息;
[0008]对所述原始地址信息中的层级地址信息进行标注,获取标注地址信息;
[0009]根据所述标注地址信息与预设关键地址集,获取所述原始地址信息对应的标准地址信息。
[0010]在其中一个实施例中,所述根据所述标注地址与预设关键地址集,获取所述原始地址信息中的标准地址信息包括:
[0011]获取所述标注地址信息中的关键地址,与预设关键地址集中标准关键地址的相似度;
[0012]根据所述相似度,识别所述标注地址信息对应的标准关键地址;
[0013]根据所述标注地址信息与所述标准关键地址,获取所述原始地址信息对应的标准地址信息。
[0014]在其中一个实施例中,所述获取所述标注地址信息,与预设关键地址集中标准关键地址的相似度包括:
[0015]根据所述标注地址信息中的标注,识别所述标注地址信息中的兴趣面地址与标注关键地址;
[0016]查找所述兴趣面地址对应的预设关键地址集;
[0017]通过基于计算Word Embedding余弦距离的fasttext文本相似度算法,获取所述标注关键地址与所述预设关键地址集中标准关键地址的相似度。
[0018]在其中一个实施例中,所述获取所述标注地址信息,与预设关键地址集中标准关键地址的相似度之前,还包括:
[0019]获取带层级地址信息标注的历史快递运单数据;
[0020]根据所述层级地址信息标注,识别所述历史快递运单数据中的兴趣面地址,以及所述兴趣面地址对应的关键地址的地址组合;
[0021]对兴趣面地址相同的所述地址组合进行聚类,构建各兴趣面地址对应的预设关键地址集。
[0022]在其中一个实施例中,所述对兴趣面地址相同的所述地址组合进行聚类,构建各兴趣面地址对应的预设关键地址集之前,还包括:
[0023]确定各地址组合在所述历史快递运单数据中的出现频率以及各地址组合之间的相似度;
[0024]根据所述出现频率以及所述相似度对所述各地址组合进行清洗;
[0025]所述对兴趣面地址相同的所述地址组合进行聚类,构建各兴趣面地址对应的预设关键地址集包括:
[0026]对清洗后的兴趣面地址相同的所述地址组合进行聚类,构建各兴趣面地址对应的预设关键地址集。
[0027]在其中一个实施例中,所述根据所述标注地址信息与预设关键地址集,获取所述原始地址信息对应的标准地址信息之后,还包括:
[0028]对所述标准地址信息中的标准关键地址进行标注。
[0029]在其中一个实施例中,所述对所述原始地址信息中的层级地址信息进行标注,获取标注地址信息包括:
[0030]通过预设LSTM(Long Short

Term Memory,长短期记忆人工神经网络)信息标注模型,对所述原始地址信息中的层级地址信息进行标注,获取标注地址,所述预设LSTM信息标注模型通过带层级地址信息标注的历史快递运单数据训练获取。
[0031]一种地址信息提取装置,所述装置包括:
[0032]运单获取模块,用于获取待识别快递运单;
[0033]地址提取模块,用于提取所述待识别快递运单的原始地址信息;
[0034]地址信息标注模块,用于对所述原始地址信息中的层级地址信息进行标注,获取标注地址信息;
[0035]标准地址识别模块,用于根据所述标注地址信息与预设关键地址集,获取所述原始地址信息对应的标准地址信息。
[0036]一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0037]获取待识别快递运单;
[0038]提取所述待识别快递运单的原始地址信息;
[0039]对所述原始地址信息中的层级地址信息进行标注,获取标注地址信息;
[0040]根据所述标注地址信息与预设关键地址集,获取所述原始地址信息对应的标准地
址信息。
[0041]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0042]获取待识别快递运单;
[0043]提取所述待识别快递运单的原始地址信息;
[0044]对所述原始地址信息中的层级地址信息进行标注,获取标注地址信息;
[0045]根据所述标注地址信息与预设关键地址集,获取所述原始地址信息对应的标准地址信息。
[0046]上述地址信息提取方法、装置、计算机设备和存储介质,通过获取待识别快递运单;提取待识别快递运单的原始地址信息;对原始地址信息中的层级地址信息进行标注,获取标注地址信息;根据标注地址信息与预设关键地址集,获取原始地址信息对应的标准地址信息。本申请通过提取快递运单内的原始地址,而后基于层级地址信息标注以及标准地址识别,来确定原始地址信息对应的标准地址信息,可以有效提高快递派件过程中的地址信息识别效率,避免出现因客户写错别字等原因导致地址信息不清楚,而使派件过程无法正常进行,影响快递派件效率的情况。
附图说明
[0047]图1为一个实施例中地址信息提取方法的应用环境图;
[0048]图2为一个实施例中地址信息提取方法的流程示意图;
[0049]图3为一个实施例中图2中步骤207的子流程示意图;
[0050]图4为一个实施例中图3中步骤302的子流程示意图;
[0051]图5为一个实施例中构建各兴趣面地址对应的预设关键地址集步骤的流程示意图;
[0052]图6为一个实施例中地址信息提取装置的结构框图;
[0053]图7为一个实施例中计算机设备的内部结构图。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种地址信息提取方法,所述方法包括:获取待识别快递运单;提取所述待识别快递运单的原始地址信息;对所述原始地址信息中的层级地址信息进行标注,获取标注地址信息;根据所述标注地址信息与预设关键地址集,获取所述原始地址信息对应的标准地址信息。2.根据权利要求1所述的方法,其特征在于,所述根据所述标注地址与预设关键地址集,获取所述原始地址信息中的标准地址信息包括:获取所述标注地址信息中的关键地址,与预设关键地址集中标准关键地址的相似度;根据所述相似度,识别所述标注地址信息对应的标准关键地址;根据所述标注地址信息与所述标准关键地址,获取所述原始地址信息对应的标准地址信息。3.根据权利要求2所述的方法,其特征在于,所述获取所述标注地址信息,与预设关键地址集中标准关键地址的相似度包括:根据所述标注地址信息中的标注,识别所述标注地址信息中的兴趣面地址与标注关键地址;查找所述兴趣面地址对应的预设关键地址集;通过基于计算Word Embedding余弦距离的fasttext文本相似度算法,获取所述标注关键地址与所述预设关键地址集中标准关键地址的相似度。4.根据权利要求2所述的方法,其特征在于,所述获取所述标注地址信息,与预设关键地址集中标准关键地址的相似度之前,还包括:获取带层级地址信息标注的历史快递运单数据;根据所述层级地址信息标注,识别所述历史快递运单数据中的兴趣面地址,以及所述兴趣面地址对应的关键地址的地址组合;对兴趣面地址相同的所述地址组合进行聚类,构建各兴趣面地址对应的预设关键地址集。5.根据权利要求4所述的方法,其特征在于,所述对兴趣面地址相同的所述地址组合进行聚类,构建各兴趣面地址对应的预设关键地址集...

【专利技术属性】
技术研发人员:姚淳子王俊翔刘龙威李崇贵仝淑雅
申请(专利权)人:顺丰科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1