System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 边界框确定方法及相关设备技术_技高网

边界框确定方法及相关设备技术

技术编号:44531800 阅读:3 留言:0更新日期:2025-03-07 13:21
本申请公开了一种边界框确定方法及相关设备。根据该方法,确定待扫描图像中的待扫描文档对应的至少两个候选边界框;基于候选边界框的四个角度、候选边界框的四条边、以及候选边界框对边的延长线的夹角,确定候选边界框对应的候选框置信度;将候选框置信度最高的候选边界框确定为目标边界框,目标边界框用于辅助扫描待扫描文档。实现自动识别待扫描文档对应的边界框,并且使得识别出的边界框更加准确。

【技术实现步骤摘要】

本申请涉及计算机领域,尤其涉及边界框确定方法及相关设备


技术介绍

1、随着手机技术的高速发展,用户不再需要通过扫描机等设备,将纸字版的文档转换为电子版。用户可以通过手机将需要的文档扫描成电子版。

2、在扫描文档时,需要基于文档的边界框进行扫描,以确保文档中的内容扫描完整,并且不会扫描到文档以外的内容。在实际应用时,环境中可能存在多个文档,或者背景的线条较多,导致手机无法确定出需要进行识别的文档的边界框。用户只能手动选择需要进行识别的文档的边界框,以使得手机可以对文档进行识别。


技术实现思路

1、本申请提供了一种边界框确定方法及相关设备,实现自动识别待扫描文档对应的边界框,并且使得识别出的边界框更加准确。

2、第一方面,本申请的一些实施例提供了一种边界框确定方法。该边界框确定方法可以包括:确定待扫描图像中的待扫描文档对应的至少两个候选边界框;基于候选边界框的四个角度、候选边界框的四条边、以及候选边界框对边的延长线的夹角,确定候选边界框对应的候选框置信度;将候选框置信度最高的候选边界框确定为目标边界框,目标边界框用于辅助扫描待扫描文档。

3、通过上述方法,由候选边界框的四个角度、候选边界框的四条边以及候选边界框对边的延长线的夹角共同确定候选框置信度,使得确定的候选框置信度更准确,从而通过该候选框置信度确定出的目标边界框,可以实现自动识别待扫描文档对应的边界框,并且使得识别出的边界框更加准确。

4、在一种可能实现中,基于候选边界框的四个角度、候选边界框的四条边、以及候选边界框对边的延长线的夹角,确定候选边界框对应的候选框置信度,包括:基于候选边界框的四个角度,确定候选边界框四个角的置信度;基于候选边界框的四条边,确定候选边界框占屏比的置信度、候选边界框对边比的置信度、候选边界框邻边比的置信度以及候选边界框中心位置的置信度;基于候选边界框对边的延长线的夹角,确定候选边界框对边角度的置信度;基于候选边界框四个角的置信度、候选边界框屏占比的置信度、候选边界框对边比的置信度、候选边界框邻边比的置信度、候选边界框中心位置的置信度以及候选边界框对边角度的置信度,确定候选边界框对应的候选框置信度。

5、通过上述方法,由候选边界框的四个角度、候选边界框的四条边以及候选边界框对边的延长线的夹角确定出六个与候选边界框相关的置信度,由该六个与候选边界框相关的置信度可以准确地确定出候选框置信度。

6、在一种可能的实现中,候选边界框对应的候选框置信度为候选边界框四个角的置信度、候选边界框占屏比的置信度、候选边界框对边比的置信度、候选边界框邻边比的置信度、候选边界框中心位置的置信度以及候选边界框对边角度的置信度之和。

7、通过上述方法,候选边界框对应的候选框置信度为六个置信度之和,可以更高效,快捷地通过六个置信度确定该候选框置信度。

8、在一种可能的实现中,确定待扫描图像中的待扫描文档对应的至少两个候选边界框,包括:从待扫描图像中确定出多条第一直线;以位于第一方位的任意一条第一直线为初始直线,按照预设的遍历顺序,依次遍历位于除第一方位以外的其余方位上的第一直线,以确定待扫描图像中的待扫描文档对应的至少两个候选边界框;其中,第一方位为上、下、左、右四个方位中的任意一个方向。

9、通过上述方法,可以确保不会遗漏第一直线,遍历所有的第一直线。更加可以准确地确定出所有待扫描图像中的待扫描文档对应的候选边界框。

10、在一种可能的实现中,第一直线所位于的方位为第一直线相对于待扫描图像的横向中轴线或纵向中轴线的方位。

11、通过上述方法,使得确定出的待扫描图像中的待扫描文档对应的候选边界框的尺寸更接近待扫描图像。确定出的待扫描图像中的待扫描文档对应的候选边界框更加准确。

12、在一种可能的实现中,候选边界框的任意一个角的位置坐标位于预设的坐标范围内,且候选边界框的任意一个角的角度位于预设的角度范围内。

13、通过上述方法,通过预设的位置坐标,确保确定出候选边界框位于屏幕内。并且通过预设的角度范围,确定该候选边界框更符合待扫描文档的形状。

14、在一种可能的实现中,从待扫描图像中确定出多条第一直线,包括:将待扫描图像输入边缘扫描模型,以得到多条第二直线;将待扫描图像输入直线检测模型,以得到多条第三直线;基于多条第二直线和多条第三直线,确定多条第一直线。

15、通过上述方法,将待扫描图像分别输入两种模型中,由两种模型得到的直线,一同确定第一直线,使得确定出的第一直线更准确,且更完整。

16、在一种可能的实现中,将待扫描图像输入边缘扫描模型,以得到多条第二直线,包括:将待扫描图像输入边缘检测模型,得到边缘检测模型输出的第四直线;将满足合并条件的第四直线进行合并,得到多条第二直线,合并条件为任意两条直线的夹角小于第一阈值,或者任意两条直线的中点距离小于第二阈值;将待扫描图像输入直线检测模型,以得到多条第三直线,包括:将待扫描图像输入直线检测模型,得到直线检测模型输出的第五直线;将满足合并条件的第五直线进行合并,得到多条第三直线。

17、通过上述方法,用两种模型得到的直线进行交叉筛选,过滤掉与候选边界框不相关的直线,从而准确地确定出第一直线。

18、在一种可能的实现中,将待扫描图像分别输入边缘检测模型和直线检测模型,以得到多条第二直线和多条第三直线,包括:将待扫描图像输入边缘检测模型,得到边缘检测模型输出的第四直线;将满足合并条件的第四直线进行合并,得到多条第二直线;将待扫描图像输入直线检测模型,得到直线检测模型输出的第五直线;将满足合并条件的第五直线进行合并,得到多条第三直线;合并条件为任意两条直线的夹角小于第一阈值,或者任意两条直线的中点距离小于第二阈值。

19、通过上述方法,将距离相近的直线进行合并,减少得到的第二直线和第三直线的数量,提高后续处理的效率。

20、第二方面,本申请提供了一种电子设备。该电子设备包括:一个或多个处理器,以及一个或多个存储器;该一个或多个存储器与该一个或多个处理器耦合,该存储器用于存储计算机程序代码,该计算机程序代码包括计算机指令,该一个或多个处理器调用该计算机指令以使得该电子设备执行如第一方面或第一方面的任意一种实现方式所描述的方法。

21、第三方面,本申请提供一种计算机存储介质。该计算机存储介质包括计算机指令,当该计算机指令在电子设备上运行时,使得该电子设备执行如第一方面或第一方面的任意一种实现方式所描述的方法。

22、第四方面,本申请实施例提供一种芯片。该芯片可以应用于电子设备,该芯片包括一个或多个处理器,该处理器用于调用计算机指令以使得该电子设备执行如第一方面或第一方面的任意一种实现方式所描述的方法。

23、第五方面,本申请提供一种计算机程序或计算机程序产品,包括代码或指令,当代码或指令在计算机上运行时,使得计算机执行如上述第一方面所述的方法。...

【技术保护点】

1.一种边界框确定方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述候选边界框的四个角度、所述候选边界框的四条边、以及所述候选边界框对边的延长线的夹角,确定所述候选边界框对应的候选框置信度,包括:

3.根据权利要求2所述的方法,其特征在于,所述候选边界框对应的候选框置信度为所述候选边界框四个角的置信度、所述候选边界框占屏比的置信度、所述候选边界框对边比的置信度、所述候选边界框邻边比的置信度、所述候选边界框中心位置的置信度以及所述候选边界框对边角度的置信度之和。

4.根据权利要求1-3中任意一项所述的方法,其特征在于,所述确定待扫描图像中的待扫描文档对应的至少两个候选边界框,包括:

5.根据权利要求4所述的方法,其特征在于,所述第一直线所位于的方位为所述第一直线相对于所述待扫描图像的横向中轴线或纵向中轴线的方位。

6.根据权利要求1-5中任意一项所述的方法,其特征在于,所述候选边界框的任意一个角的位置坐标位于预设的坐标范围内,且所述候选边界框的任意一个角的角度位于预设的角度范围内。p>

7.根据权利要求4-6中任意一项所述的方法,其特征在于,所述从所述待扫描图像中确定出多条第一直线,包括:

8.根据权利要求7所述的方法,其特征在于,所述基于所述多条第二直线和所述多条第三直线,确定多条第一直线,包括:

9.根据权利要求7或8所述的方法,其特征在于,所述将所述待扫描图像输入边缘扫描模型,以得到多条第二直线,包括:

10.一种电子设备,包括一个或多个存储器、一个或多个处理器,其特征在于,所述存储器用于存储计算机程序;所述处理器用于调用所述计算机程序,使得所述电子设备执行权利要求1-9中任一项所述的方法。

11.一种计算机可读存储介质,其特征在于,所述计算机存储介质中存储有计算机可读指令,当所述计算机可读指令在电子设备上运行时,使得所述电子设备执行权利要求1~9中任一项所述的方法。

...

【技术特征摘要】

1.一种边界框确定方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述候选边界框的四个角度、所述候选边界框的四条边、以及所述候选边界框对边的延长线的夹角,确定所述候选边界框对应的候选框置信度,包括:

3.根据权利要求2所述的方法,其特征在于,所述候选边界框对应的候选框置信度为所述候选边界框四个角的置信度、所述候选边界框占屏比的置信度、所述候选边界框对边比的置信度、所述候选边界框邻边比的置信度、所述候选边界框中心位置的置信度以及所述候选边界框对边角度的置信度之和。

4.根据权利要求1-3中任意一项所述的方法,其特征在于,所述确定待扫描图像中的待扫描文档对应的至少两个候选边界框,包括:

5.根据权利要求4所述的方法,其特征在于,所述第一直线所位于的方位为所述第一直线相对于所述待扫描图像的横向中轴线或纵向中轴线的方位。

6.根据权利要求1-5中任意一项所述的方法,其特征在于,...

【专利技术属性】
技术研发人员:张驰孙斌刘梦倩宓振鹏
申请(专利权)人:荣耀终端股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1