System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 寄件信息识别方法及装置制造方法及图纸_技高网

寄件信息识别方法及装置制造方法及图纸

技术编号:42385850 阅读:3 留言:0更新日期:2024-08-16 16:13
本说明书一个或多个实施例提供一种寄件信息识别方法及装置。该方法包括:获取用户输入的用于提取寄件信息的文本,所述寄件信息包括寄件地址;通过预设的序列标注模型对所述文本进行序列标注,得到与所述文本对应的标签序列,所述标签序列包括与所述文本中包含的各个词元对应的标签,所述标签包括用于指示被标记的词元与所述寄件地址相关的第一标签;基于所述标签序列中的第一标签,从所述文本中确定与所述寄件地址相关的第一文本片段;基于与所述寄件地址相关的词典从所述第一文本片段中识别出所述用户的寄件地址。

【技术实现步骤摘要】

本说明书一个或多个实施例涉及数据处理领域,尤其涉及一种寄件信息识别方法及装置


技术介绍

1、寄快递是现代人们非常常见的生活方式之一,无论是寄送重要文件还是寄送生活用品,通过手机上的应用(app)或小程序寄快递都是非常方便快捷。在寄快递之前,用户需要先准备好寄件信息,例如物流面单信息。所述寄件信息可以包括:发件人和寄件人的寄件信息,所述寄件信息可以包括以下三种内容实体:姓名、联系方式、寄件地址等。这些寄件信息是快递公司寄送货物所必须的基本信息。

2、在用户使用手机app等方式寄件时,传统的做法是需要用户手动填写发件人和寄件人的所有寄件信息,包括姓名、联系方式、寄件地址等。手动填写需要消耗大量的时间,尤其是寄件地址,有些地址冗长,有些是从别处拷贝或截图保存的陌生地址,容易出错,操作繁琐,用户体验非常差。相关技术支持用户通过粘贴长段文本或截取图片,由app自动帮助用户精准识别相关信息。但由于信息来源五花八门,如各类聊天记录,短信,电子面单或各种app的地址簿等等,使填写的信息不规范,增加了app的识别难度,无法准确从粘贴的文本或截取图片中准确区分相关信息,导致识别出错。


技术实现思路

1、有鉴于此,本说明书一个或多个实施例提供一种寄件信息识别方法及装置,以解决相关技术中存在的问题。

2、为实现上述目的,本说明书一个或多个实施例提供技术方案如下:

3、根据本说明书一个或多个实施例的第一方面,提出了一种寄件信息识别方法,包括:

4、获取用户输入的用于提取寄件信息的文本,所述寄件信息包括寄件地址;

5、通过预设的序列标注模型对所述文本进行序列标注,得到与所述文本对应的标签序列,所述标签序列包括与所述文本中包含的各个词元对应的标签,所述标签包括用于指示被标记的词元与所述寄件地址相关的第一标签;

6、基于所述标签序列中的第一标签,从所述文本中确定与所述寄件地址相关的第一文本片段;

7、基于与所述寄件地址相关的词典从所述第一文本片段中识别出所述用户的寄件地址。

8、根据本说明书一个或多个实施例的第二方面,提出了一种寄件信息识别装置,包括:

9、输入模块,用于获取用户输入的用于提取寄件信息的文本,所述寄件信息包括寄件地址;

10、标注模块,用于通过预设的序列标注模型对所述文本进行序列标注,得到与所述文本对应的标签序列,所述标签序列包括与所述文本中包含的各个词元对应的标签,所述标签包括用于指示被标记的词元与所述寄件地址相关的第一标签;

11、分段模块,用于基于所述标签序列中的第一标签,从所述文本中确定与所述寄件地址相关的第一文本片段;

12、识别模块,用于基于与所述寄件地址相关的词典从所述第一文本片段中识别出所述用户的寄件地址。

13、根据本说明书一个或多个实施例的第三方面,提出了一种电子设备,包括:

14、处理器;

15、用于存储处理器可执行指令的存储器;

16、其中,所述处理器通过运行所述可执行指令以实现如第一方面所述的方法。

17、根据本说明书一个或多个实施例的第四方面,提出了一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现如第一方面所述方法的步骤。

18、在以上技术方案中,通过crf模型对用户输入的文本进行序列标注,可以基于得到的与文本对应的标签序列中与寄件地址相关的标签,对文本进行准确的划分,确定与寄件地址对应的第一文本片段,进而再采用与寄件地址相关的词典对该文本片段进行识别以从第一文本片段中确定所述用户的寄件地址,而无需对整个文本进行识别来确定寄件地址,从而可以避免与寄件地址无关的文本片段对寄件地址的识别的干扰,使得到的寄件信息的识别结果更加准确。

本文档来自技高网...

【技术保护点】

1.一种寄件信息识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述第一标签包括:用于指示被标记的词元为所述第一文本片段在所述文本中的开始位置的第一起始标签和用于指示被标记的词元为所述第一文本片段在所述文本中的结束位置的第一结束标签;

3.根据权利要求1所述的方法,其特征在于,与所述寄件地址相关的词典包括与行政区划相关的词典;

4.根据权利要求3所述的方法,其特征在于,所述分词结果还包括为所述若干个词元中的各个词元标注的词性标签,所述词性标签包括用于指示被标注的词元对应的行政区划等级的第一词性标签。

5.根据权利要求4所述的方法,其特征在于,所述词性标签还包括用于指示被标注的词元对地址描述的准确程度的第二词性标签;所述节点的词元评分由所述节点对应词元的行政区划等级和所述对应词元对地址描述的准确程度确定。

6.根据权利要求3所述的方法,其特征在于,所述路径规划算法为Viterbi算法。

7.根据权利要求3所述的方法,其特征在于,所述基于所述评分最高的节点路径包含的节点对应的词元确定所述寄件地址包括的目标行政区划地址,包括:

8.根据权利要求1所述的方法,其特征在于,所述方法还包括:

9.根据权利要求1所述的方法,其特征在于,所述寄件信息还包括姓名;所述标签包括用于指示被标记的词元与所述姓名相关的第二标签;所述方法还包括:

10.根据权利要求1所述的方法,其特征在于,所述寄件信息还包括联系方式;所述标签包括用于指示被标记的词元与所述联系方式相关的第三标签;所述方法还包括:

11.根据权利要求1所述的方法,其特征在于,所述方法还包括:

12.一种寄件信息识别装置,其特征在于,包括:

13.一种电子设备,其特征在于,包括:

14.一种计算机可读存储介质,其特征在于,其上存储有计算机指令,该指令被处理器执行时实现如权利要求1-11中任一项所述方法的步骤。

...

【技术特征摘要】

1.一种寄件信息识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述第一标签包括:用于指示被标记的词元为所述第一文本片段在所述文本中的开始位置的第一起始标签和用于指示被标记的词元为所述第一文本片段在所述文本中的结束位置的第一结束标签;

3.根据权利要求1所述的方法,其特征在于,与所述寄件地址相关的词典包括与行政区划相关的词典;

4.根据权利要求3所述的方法,其特征在于,所述分词结果还包括为所述若干个词元中的各个词元标注的词性标签,所述词性标签包括用于指示被标注的词元对应的行政区划等级的第一词性标签。

5.根据权利要求4所述的方法,其特征在于,所述词性标签还包括用于指示被标注的词元对地址描述的准确程度的第二词性标签;所述节点的词元评分由所述节点对应词元的行政区划等级和所述对应词元对地址描述的准确程度确定。

6.根据权利要求3所述的方法,其特征在于,所述路径规划算法为viterbi算法...

【专利技术属性】
技术研发人员:白明智殷浩
申请(专利权)人:浙江菜鸟供应链管理有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1