物流社区村组预测方法、装置、计算机设备及可读介质制造方法及图纸

技术编号:38199609 阅读:13 留言:0更新日期:2023-07-21 16:40
本发明专利技术公开了一种物流社区村组预测方法、装置、及计算机可读介质,该方法包括:获取待处理的地址文本;对所述地址文本中不同地址层级的词及所述词对应的词级进行向量化处理,得到由词向量和对应的词级向量组合而成的拼接向量;将所述拼接向量输入已训练好的社区村组预测模型中,得到地址文本对应的至少一个社区村组数据;本发明专利技术基于深度学习技术进行社区/村组的预测,可提高对社区/村组识别的泛化能力及准确性,从而节约整个物流的成本开支。从而节约整个物流的成本开支。从而节约整个物流的成本开支。

【技术实现步骤摘要】
物流社区村组预测方法、装置、计算机设备及可读介质


[0001]本专利技术属于物流
,更具体地,涉及一种物流社区村组预测方法、装置、计算机设备及可读介质。

技术介绍

[0002]在完整的物流配送体系中,社区/村组是快递员收派件到户的最后范围圈。从客户下单开始,整个物流配送周期中,把快件准确地分配到收件地址附近的社区/村组,即物流网点,是非常关键的一环。然而,有些客户在下单时能够提供清晰规范的地址,但还存在部分用户无法提供规范的地址,存在地址信息部分缺失、冲突、有误等情况,导致快递员无法直接从客户的下单地址中提取出有效的社区/村组信息,影响后续的派件业务。
[0003]目前常用的解决方案是根据已有地址建立并维护白名单地址库(词典),并预先确定地址文本匹配规则,获取客户提供的地址之后,基于匹配规则将该地址与白名单地址库中的已有地址进行匹配,以此来获取准确的地址。但是,这种规则匹配最大缺点就是需要维护词典和匹配规则,并且中文地址写法多样,不仅地址库维护成本大,且社区/村组的识别准确率低。

技术实现思路

[0004]针对现有技术的至少一个缺陷或改进需求,本专利技术提供了一种物流社区村组预测方法、装置、计算机设备及可读介质,能提高社区村组的识别准确率,降低维护成本。
[0005]为实现上述目的,按照本专利技术的第一个方面,提供了一种物流社区村组预测方法,该方法包括:
[0006]获取待处理的地址文本;
[0007]对所述地址文本中不同地址层级的词及所述词对应的词级进行向量化处理,得到由词向量和对应的词级向量组合而成的拼接向量,不同的所述词向量对应不同的所述拼接向量;
[0008]将所述拼接向量输入已训练好的社区村组预测模型中,得到地址文本对应的至少一个社区村组数据;其中,所述社区村组预测模型为利用具有社区村组数据标签的样本地址文本训练得到,每个所述样本地址文本具有一个社区村组数据标签。
[0009]优选的,上述物流社区村组预测方法,所述得到地址文本对应的至少一个社区村组数据后还包括:
[0010]当所述社区村组预测模型输出所述地址文本对应的一个社区村组数据时,将所述社区村组数据作为最终输出的一个社区村组数据;
[0011]当所述社区村组预测模型输出所述地址文本对应的多个社区村组数据时,
[0012]判断每个所述社区村组数据对应的置信度中数值最大的所述置信度是否大于预置的第一阈值;
[0013]若是,则将数值最大的所述置信度对应的所述社区村组数据作为最终输出的一个
社区村组数据;
[0014]否则,判断数值大小排序前N的所述置信度之和是否大于预置的第二阈值;若大于预置的第二阈值,则将数值大小排序前N的所述置信度对应的多个所述社区村组数据作为最终输出的多个社区村组数据;其中,N为大于1的正整数。
[0015]优选的,上述物流社区村组预测方法还包括:
[0016]若不大于预置的第二阈值,则将待处理的地址文本与预设词典地址进行相似度匹配,并从匹配成功的预设词典地址中提取社区村组数据。
[0017]优选的,上述物流社区村组预测方法,所述社区村组预测模型的训练过程包括:
[0018]获取第一样本地址文本集合,所述第一样本地址文本集合中的每个第一样本地址文本具有至少一个社区村组标签;
[0019]对所述第一样本地址文本中不同地址层级的词及所述词对应的词级进行向量化处理,得到由样本词向量和对应的样本词级向量组合而成的样本拼接向量;
[0020]根据所述第一样本地址文本对应的样本拼接向量与至少一个社区村组标签得到第一训练样本,并将各个所述第一训练样本汇总形成第一训练样本集;
[0021]根据所述第一训练样本集进行模型训练,得到训练好的社区村组预测模型。
[0022]优选的,上述物流社区村组预测方法,所述根据所述第一训练样本集进行模型训练得,到训练好的社区村组预测模型,包括:
[0023]通过待训练的社区村组预测模型,根据所述样本拼接向量生成对应的社区村组预测数据;
[0024]计算所述社区村组预测数据与相应的社区村组标签之间的误差,并根据所述误差反向调整所述待训练的社区村组预测模型的模型参数;
[0025]返回至通过待训练的社区村组预测模型,根据样本拼接向量生成对应的社区村组预测数据的步骤继续执行,直至满足迭代停止条件,停止迭代,得到已训练好的社区村组预测模型。
[0026]优选的,所述社区村组预测模型包括第一神经网络层和第二神经网络层,上述物流社区村组预测方法,所述通过待训练的社区村组预测模型,根据所述样本拼接向量生成对应的社区村组预测数据具体包括:
[0027]通过所述第一神经网络层,对所述样本拼接向量进行特征提取,得到相应的全局特征向量;
[0028]通过所述第二神经网络层对所述全局特征向量进行处理,得到相应的最大池化特征向量、平均池化特征向量与权重特征向量;
[0029]根据所述最大池化特征向量、平均池化特征向量与权重特征向量,生成至少一个候选社区村组,且每个所述候选社区村组具有对应的置信度;
[0030]选择数值最大的所述置信度对应的候选社区村组作为社区村组预测数据。
[0031]优选的,所述根据所述误差反向调整所述待训练的社区村组预测模型的模型参数,包括:
[0032]计算所述样本拼接向量中每个样本词向量及其对应的样本词级向量对社区村组预测模型输出的社区村组预测数据的影响因子;
[0033]对于所述影响因子大于预设值的所述样本词向量,增大其在社区村组预测模型中
的对应网络节点的输出权重。
[0034]按照本专利技术的第二个方面,还提供了一种物流社区村组预测装置,该装置包括:
[0035]获取模块,用于获取待处理的地址文本;
[0036]向量生成模块,用于对所述地址文本中不同地址层级的词及所述词对应的词级进行向量化处理,得到由词向量和对应的词级向量组合而成的拼接向量,不同的所述词向量对应不同的所述拼接向量;
[0037]预测模块,用于将所述拼接向量输入已训练好的社区村组预测模型中,得到地址文本对应的至少一个社区村组数据;其中,所述社区村组预测模型为利用具有社区村组数据标签的样本地址文本训练得到,每个所述样本地址文本具有一个社区村组数据标签。
[0038]按照本专利技术的第三个方面,还提供了一种计算机设备,其包括至少一个处理单元、以及至少一个存储单元,其中,所述存储单元存储有计算机程序,当所述计算机程序被所述处理单元执行时,使得所述处理单元执行上述任一项所述方法的步骤。
[0039]按照本专利技术的第四个方面,还提供了一种计算机可读介质,其存储有可由计算机设备执行的计算机程序,当所述计算机程序在计算机设备上运行时,使得所述计算机设备执行上述任一项所述方法的步骤。
[0040]总体而言,通过本专利技术所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种物流社区村组预测方法,其特征在于,包括:获取待处理的地址文本;对所述地址文本中不同地址层级的词及所述词对应的词级进行向量化处理,得到由词向量和对应的词级向量组合而成的拼接向量,不同的所述词向量对应不同的所述拼接向量;将所述拼接向量输入已训练好的社区村组预测模型中,得到所述地址文本对应的至少一个社区村组数据;其中,所述社区村组预测模型为利用具有社区村组数据标签的样本地址文本训练得到,每个所述样本地址文本具有一个社区村组数据标签。2.如权利要求1所述的物流社区村组预测方法,其特征在于,在得到所述地址文本对应的至少一个社区村组数据后,还包括:当所述社区村组预测模型输出所述地址文本对应的一个社区村组数据时,将所述社区村组数据作为最终输出的一个社区村组数据;当所述社区村组预测模型输出所述地址文本对应的多个社区村组数据时,判断每个所述社区村组数据对应的置信度中数值最大的所述置信度是否大于预置的第一阈值;若是,则将数值最大的所述置信度对应的所述社区村组数据作为最终输出的一个社区村组数据;否则,判断数值大小排序前N的所述置信度之和是否大于预置的第二阈值;若大于预置的第二阈值,则将数值大小排序前N的所述置信度对应的多个所述社区村组数据作为最终输出的多个社区村组数据;其中,N为大于1的正整数。3.如权利要求2所述的物流社区村组预测方法,其特征在于,还包括:若不大于预置的第二阈值,则将待处理的地址文本与预设词典地址进行相似度匹配,并从匹配成功的预设词典地址中提取社区村组数据。4.如权利要求1所述的物流社区村组预测方法,其特征在于,所述社区村组预测模型的训练过程包括:获取第一样本地址文本集合,所述第一样本地址文本集合中的每个第一样本地址文本具有至少一个社区村组标签;对所述第一样本地址文本中不同地址层级的词及所述词对应的词级进行向量化处理,得到由样本词向量和对应的样本词级向量组合而成的样本拼接向量,不同的所述样本词向量对应不同的所述样本拼接向量;根据所述第一样本地址文本对应的样本拼接向量与至少一个社区村组标签得到第一训练样本,并将各个所述第一训练样本汇总形成第一训练样本集;根据所述第一训练样本集进行模型训练,得到训练好的社区村组预测模型。5.如权利要求4所述的物流社区村组预测方法,其特征在于,所述根据所述第一训练样本集进行模型训练,得到训练好的社区村组预测模型,包括:通过待训练的社区村组预测模型,根据所述样本拼接向量生成对应的社区村组预测数据;计算所述...

【专利技术属性】
技术研发人员:张定棋周训飞王小龙
申请(专利权)人:丰图科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1