System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种商品信息的查验方法、装置、查验台电子设备及介质制造方法及图纸_技高网

一种商品信息的查验方法、装置、查验台电子设备及介质制造方法及图纸

技术编号:41403693 阅读:6 留言:0更新日期:2024-05-20 19:29
本申请涉及字符模糊匹配技术领域,尤其涉及一种商品信息的查验方法、装置、查验台电子设备及介质,用于解决短字节匹配长字节出现跨字节误匹配问题,该方法为:基于对待查验商品的图像中的商品信息进行文本识别得到的第一文本信息,从多个候选商品对应的文本信息中,匹配到与第一文本信息的匹配率大于匹配阈值的第二文本信息;将第一文本信息和第二文本信息进行逐字符比对,确定第一文本信息和第二文本信息的目标公共子串;根据第二文本信息,对目标公共子串进行字符延伸,得到目标子序列,从而基于目标子序列与第一文本信息的匹配率,确定待查验商品的查验结果;提高了短字节与长字节匹配的匹配效率和匹配准确率,提高了得到的查验结果的准确性。

【技术实现步骤摘要】

本申请涉及字符模糊匹配,尤其涉及一种商品信息的查验方法、装置、查验台电子设备及介质


技术介绍

1、在某些场景如海关商品查验场景中,常常需要对旅客携带的物品进行查验,确定该物品的名称等商品信息,并根据商品信息检验是否存在骗税,逃商检等情况。

2、相关技术下,通常对获取到的上述物品的图像进行文本识别,然后,基于文本识别得到的第一文本信息,与数据库中各候选商品对应的文本信息进行匹配,如最长公共子序列匹配方法等,并将匹配率大于匹配阈值的候选商品的商品信息作为该物品的商品信息。

3、然而,由于第一文本信息多为短字节,而数据库中的候选商品的文本信息多为长字节,在采用最长公共子序列匹配方法,进行短字节匹配长字节时,极易出现跨字节匹配成功的误匹配错误,降低了匹配效率和匹配准确率,从而降低了根据匹配到的商品信息得到的查验结果的准确性。


技术实现思路

1、本申请实施例提供一种商品信息的查验方法、装置、查验台电子设备及介质,用以提高短字节与长字节进行字符模糊匹配的匹配效率和匹配准确率,从而提高根据匹配到的商品信息得到的查验结果的准确性。

2、本申请实施例提供的具体技术方案如下:

3、第一方面,本申请实施例提供一种商品信息的查验方法,包括:

4、对待查验商品的图像中的商品信息进行文本识别,得到第一文本信息;

5、基于所述第一文本信息,从多个候选商品对应的文本信息中,匹配到与所述第一文本信息的匹配率大于匹配阈值的第二文本信息;

6、将所述第一文本信息和所述第二文本信息进行逐字符比对,确定所述第一文本信息和所述第二文本信息的目标公共子串;

7、根据所述第二文本信息,对所述目标公共子串进行字符延伸,得到目标子序列,并基于所述目标子序列与所述第一文本信息的匹配率,确定所述待查验商品的查验结果。

8、本申请实施例的上述方法,通过查找第一文本信息和第二文本信息的目标公共子串,并根据第二文本信息获取到的目标公共子串附近的字符,得到目标子序列,从而根据目标子序列与第一文本信息的匹配情况,确定第二文本信息中目标公共子串附近的字符与第一文本信息中关键字符之间的匹配情况,即是否匹配成功,实现快速模糊匹配,提高了短字节与长字节匹配的匹配效率和匹配准确率;进而基于目标子序列与第一文本信息的匹配率确定待查验商品的查验结果,提高查验结果的准确性。

9、在一种可能的实现方式中,所述将所述第一文本信息和所述第二文本信息进行逐字符比对,确定所述第一文本信息和所述第二文本信息的目标公共子串,包括:

10、针对所述第一文本信息中的每个字符执行如下操作:基于所述第一文本信息中的任一字符与所述第二文本信息中的目标字符的比对结果,确定比对结果索引中的与所述目标字符对应的索引字符,其中,若所述比对结果为相同,则所述索引字符为预设字符,若所述比对结果为不同,则所述索引字符为由字符重复累积值转换得到的字符,所述目标字符是所述第二文本信息中与所述第一文本信息未进行比对的至少一个字符;

11、将所述预设字符作为分割符,用所述分割符对所述比对结果索引进行分割,得到各个子串;

12、从所述第二文本信息中,确定出所述各个子串中字符长度最长的子串对应的字符串,并将所述字符串作为所述第一文本信息和所述第二文本信息的目标公共子串。

13、上述方法,通过比对得到第一文本信息在第二文本信息中的字符重复位置情况,从而快速筛选出第一文本信息和第二文本信息的目标公共子串,进而为后续确定目标公共子串关联的目标子序列与第一文本信息的匹配率提供可能。

14、在一种可能的实现方式中,所述根据所述第二文本信息,对所述目标公共子串进行字符延伸,得到目标子序列,包括:

15、根据所述第二文本信息,在所述第二文本信息中所述目标公共子串的预设延伸方向上,获取预设的延伸字符数的字符;

16、将所述延伸字符数的字符和所述目标公共子串,按照所述第二文本信息中各字符的字符顺序进行拼接,得到所述目标子序列。

17、上述方法,通过向左和/或向右进行字符延伸,以便于确定延伸后得到的目标子序列与第一文本信息的匹配情况,从而实现快速高效的长短字节模糊匹配。

18、在一种可能的实现方式中,所述基于所述目标子序列与所述第一文本信息的匹配率,确定所述待查验商品的查验结果,包括:

19、根据所述目标子序列和所述第一文本信息,确定所述目标子序列和所述第一文本信息中同时出现且顺序相同的第一最长公共子序列;

20、将所述第一最长公共子序列和所述第一文本信息的字符长度之比,确定为所述目标子序列和所述第一文本信息的目标匹配率;

21、在确定所述目标匹配率大于所述匹配阈值时,根据所述第二文本信息确定所述查验结果。

22、上述方法,将大于匹配阈值的第二文本信息确定为该待查验商品的查验结果,提高了查验结果的准确性。

23、在一种可能的实现方式中,所述根据所述第二文本信息确定所述查验结果,包括:

24、若存在一个第二文本信息,则将所述第二文本信息对应的候选商品的商品信息,作为所述待查验商品的查验结果;

25、若存在多个第二文本信息,则将多个目标匹配率中最大匹配率的第二文本信息对应的候选商品的商品信息,作为所述待查验商品的查验结果。

26、在一种可能的实现方式中,所述基于所述第一文本信息,从多个候选商品对应的文本信息中,匹配到与所述第一文本信息的匹配率大于匹配率阈值的第二文本信息,包括:

27、针对所述多个候选商品中的每个候选商品执行如下操作:根据所述第一文本信息,以及所述多个候选商品中任一候选商品对应的文本信息中同时出现且顺序相同的第二最长公共子序列,确定所述第一文本信息和所述任一候选商品对应的文本信息的匹配率;

28、将多个匹配率中大于所述匹配阈值的候选商品对应的文本信息,确定为与所述第一文本信息相匹配的第二文本信息。

29、在一种可能的实现方式中,所述对待查验商品的图像中的商品信息进行文本识别之前,还包括:

30、获取包含所述待查验商品在内的原始图像;

31、对所述原始图像进行目标检测,得到所述待查验商品的图像;

32、所述对待查验商品的图像中的商品信息进行文本识别,得到第一文本信息,包括:

33、对所述图像进行文本检测,检测出所述图像中的文本区域;

34、对所述文本区域内的图像进行文本识别,得到所述第一文本信息。

35、第二方面,本申请实施例提供一种商品信息的查验装置,包括:

36、文本识别模块,用于对待查验商品的图像中的商品信息进行文本识别,得到第一文本信息;

37、初步匹配模块,用于基于所述第一文本信息,从多个候选商品对应的文本信息中,匹配到与所述第一文本信息的匹配率大于匹配阈值的第二文本信息;

3本文档来自技高网...

【技术保护点】

1.一种商品信息的查验方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述将所述第一文本信息和所述第二文本信息进行逐字符比对,确定所述第一文本信息和所述第二文本信息的目标公共子串,包括:

3.如权利要求1所述的方法,其特征在于,所述根据所述第二文本信息,对所述目标公共子串进行字符延伸,得到目标子序列,包括:

4.如权利要求1所述的方法,其特征在于,所述基于所述目标子序列与所述第一文本信息的匹配率,确定所述待查验商品的查验结果,包括:

5.如权利要求4所述的方法,其特征在于,所述根据所述第二文本信息确定所述查验结果,包括:

6.如权利要求1-5任一所述的方法,其特征在于,所述基于所述第一文本信息,从多个候选商品对应的文本信息中,匹配到与所述第一文本信息的匹配率大于匹配率阈值的第二文本信息,包括:

7.如权利要求1-5任一所述的方法,其特征在于,所述对待查验商品的图像中的商品信息进行文本识别之前,还包括:

8.一种商品信息的查验装置,其特征在于,包括:

9.一种查验台电子设备,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,当所述存储介质中的指令由处理器执行时,使得所述处理器能够执行如权利要求1-7任一所述的方法。

...

【技术特征摘要】

1.一种商品信息的查验方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述将所述第一文本信息和所述第二文本信息进行逐字符比对,确定所述第一文本信息和所述第二文本信息的目标公共子串,包括:

3.如权利要求1所述的方法,其特征在于,所述根据所述第二文本信息,对所述目标公共子串进行字符延伸,得到目标子序列,包括:

4.如权利要求1所述的方法,其特征在于,所述基于所述目标子序列与所述第一文本信息的匹配率,确定所述待查验商品的查验结果,包括:

5.如权利要求4所述的方法,其特征在于,所述根据所述第二文本信息确定所述查验结果...

【专利技术属性】
技术研发人员:赵欣刘微王昕李洁马琳杰徐强强刘彦彦薛奡刘利明
申请(专利权)人:海信集团控股股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1