System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于终端设备的文本识别方法、设备以及存储介质技术_技高网

基于终端设备的文本识别方法、设备以及存储介质技术

技术编号:42686138 阅读:21 留言:0更新日期:2024-09-10 12:34
本申请实施例提供一种基于终端设备的文本识别方法、设备以及存储介质。该方法包括:显示第一界面;当预览流中的第一图像为文档对象,在第一界面上显示第二按钮;响应于第一界面中的第二按钮被触发,显示第二界面;当预览流的当前帧图像中包括目标文本时,第二界面上显示有第三按钮;当预览流的当前帧图像中不包括目标文本时,第二界面上未显示第三按钮;第三窗口显示有第一按钮和第四按钮;响应于第二界面中的第三按钮被触发,显示第三界面;当第四窗口中的目标文本中包括实体时,第五窗口显示有第五按钮和至少一个第六按钮;响应于第二界面中的第一按钮被触发,显示第四界面,提供文档扫描的功能和文字提取的功能。及时的识别到图像中的文本。

【技术实现步骤摘要】

本申请涉及终端,尤其涉及一种基于终端设备的文本识别方法、设备以及存储介质


技术介绍

1、终端设备已经成为人们生活中的重要工具。可以利用终端设备采集图像,终端设备可以提取图像中的文本信息;进而用户可以获取到文本信息。

2、从而,亟需一种可以及时、快速的获取到图像中的文本的方案,以免错过实时的图像中的文本。


技术实现思路

1、本申请实施例提供一种基于终端设备的文本识别方法、设备以及存储介质,应用于终端

2、第一方面,本申请实施例提出一种基于终端设备的文本识别方法,所述方法应用于终端设备,所述方法包括:

3、显示第一界面;其中,所述第一界面中包括第一窗口,所述第一窗口显示有所述终端设备采集的预览流;所述第一界面中包括第一按钮;

4、当所述预览流中的第一图像的对象类别为文档对象时,在所述第一界面上显示第二按钮;

5、响应于所述第一界面中的第二按钮被触发,显示第二界面;其中,所述第二界面中包括第二窗口和第三窗口;所述第二窗口显示有所述终端设备采集的预览流,所述预览流中的当前帧图像中的文档外框被高亮显示;当所述预览流的当前帧图像中包括目标文本时,所述第二界面上显示有第三按钮;当所述预览流的当前帧图像中不包括目标文本时,所述第二界面上未显示所述第三按钮;所述第三窗口显示有所述第一按钮和第四按钮;

6、响应于所述第二界面中的第三按钮被触发,显示第三界面;其中,所述第三界面中包括第四窗口和第五窗口;所述第三界面上显示有所述第三按钮;所述第四窗口显示有所述预览流中的第二图像,所述第二图像中包括被高亮显示的目标文本;当所述第四窗口中的目标文本中不包括实体时,所述第五窗口显示有第五按钮;当所述第四窗口中的目标文本中包括实体时,所述第五窗口显示有所述第五按钮和至少一个第六按钮,所述第六按钮与所述第四窗口中的目标文本中的实体之间一一对应;

7、响应于所述第二界面中的第一按钮被触发,显示第四界面;其中,所述第四界面显示有所述预览流中的第三图像,所述第四界面中的第三图像中的文档外框被高亮显示;所述第四界面中包括第七按钮、第八按钮以及第九按钮。

8、这样,提供了文档扫描的功能和图像处理的功能。提供了文字提取的功能。

9、在可能的一种实现方式中,在所述显示第三界面之后,还包括:

10、响应于所述第三界面中的第三按钮被触发,显示所述第二界面。

11、这样,点击“文本提取按钮”,返回预览流的界面。

12、在可能的一种实现方式中,在所述显示第四界面之后,还包括:

13、响应于所述第四界面中的第九按钮被触发,显示第五界面;其中,所述第五界面显示有所述预览流中的第三图像;所述第五界面中包括至少一个图像处理按钮。

14、这样,提供了文档扫描下的图像处理的功能。

15、在可能的一种实现方式中,所述方法,还包括:

16、当所述第一图像的对象类别为文本对象时,在所述第一界面上显示所述第三按钮;

17、响应于所述第一界面中的第三按钮被触发,显示第三界面;其中,所述第三界面中包括第四窗口和第五窗口;所述第三界面上显示有所述第三按钮;所述第四窗口显示有所述预览流中的第二图像,所述第二图像中包括被高亮显示的目标文本;当所述第四窗口中的目标文本中不包括实体时,所述第五窗口显示有第五按钮;当所述第四窗口中的目标文本中包括实体时,所述第五窗口显示有所述第五按钮和至少一个第六按钮,所述第六按钮与所述第四窗口中的目标文本中的实体之间一一对应;

18、响应于所述第三界面中的第三按钮被触发,显示所述第一界面。

19、这样,提供了文字提取功能。不再需要用户手动选择要识别文本,防止文本可能稍纵即逝,用户可能还没来得及选好目标文本,进而导致错过文本。例如,会议ppt演讲场景,演讲者翻页过快,手机取景框可能来不及选好目标文本。可以及时的识别到图像中的文本。并且,不需要用户手动的在屏幕上选择目标文本,避免与相机本身的交互产生冲突,影响文本识别或者影响拍摄图像;并且,减少用户的学习成本。

20、在可能的一种实现方式中,所述方法,还包括

21、响应于所述第一界面中的第三按钮被触发,显示第七界面;其中,所述第七界面中包括第七窗口;所述第七窗口显示有所述预览流,且所述第七窗口上显示有第二提示信息;所述第七界面上未显示所述第三按钮所述第七界面中包括所述第一按钮。

22、这样,在基于第三按钮去识别图像中的目标文本的时候,若终端设备抖动,无法获取到正常图像,从出现异常情况,可以提示用户。

23、在可能的一种实现方式中,在当所述第一图像的对象类别为文本对象时,在所述第一界面上显示所述第三按钮之前,还包括:当确定所述终端设备的摄像头与物理对象之间的距离,小于第一阈值时,开启超级微距模式,在所述第一界面上显示第一图标;

24、当所述第一图像的对象类别为文本对象时,在所述第一界面上显示所述第三按钮,包括:当所述第一图像的对象类别为文本对象时,在所述第一界面上显示所述第三按钮、不显示所述第一图标。

25、这样,在触发超级微距模式时,可以先显示第一图标,以提醒用户进入了超级微距模式;然后,若确定第一图像的对象类别为文本对象,不再显示第一图标、显示第三按钮,避免第一图标和第三按钮的位置冲突。

26、在可能的一种实现方式中,在当所述第一图像的对象类别为文本对象时,在所述第一界面上显示所述第三按钮之前,还包括:当确定所述终端设备的摄像头与物理对象之间的距离,小于第一阈值时,开启超级微距模式;

27、当所述第一图像的对象类别为文本对象时,在所述第一界面上显示所述第三按钮,包括:

28、当所述第一图像的对象类别为文本对象时,在第一时刻上,在所述第一界面上显示所述第三按钮;

29、在第二时刻上,在所述第一界面上显示第一图标、不显示所述第三按钮;其中,所述第二时刻晚于所述第一时刻;

30、在第三时刻上,在所述第一界面上显示所述第三按钮、不显示所述第一图标;其中,第三时刻晚于第二时刻。

31、这样,在触发超级微距模式时,若确定第一图像的对象类别为文本对象,先显示第三按钮;然后显示第一图标、显示第三按钮,避免第一图标和第三按钮的位置冲突,并且提醒用户进入了超级微距模式;然后再显示第三按钮、不显示第一图标,以提示用户检测到了文本对象。

32、在可能的一种实现方式中,所述第三界面中还包括第七按钮。

33、在可能的一种实现方式中,当所述第二图像中的实体的个数大于预设个数,则所述第六按钮中的个数为预设个数减去1,所述第五窗口还显示有第十按钮。

34、在可能的一种实现方式中,所述第五窗口中第六按钮的排布次序、所述第二图像中实体的排布排序,两者相对应;或者,所述第五窗口中第六按钮的排布次序,为基于用户画像或者用户意图所实时确定的。...

【技术保护点】

1.一种基于终端设备的文本识别方法,其特征在于,所述方法应用于终端设备,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在所述显示第三界面之后,还包括:

3.根据权利要求1或2所述的方法,其特征在于,在所述显示第四界面之后,还包括:

4.根据权利要求1-3中任一项所述的方法,其特征在于,所述方法,还包括:

5.根据权利要求4所述的方法,其特征在于,所述方法,还包括:

6.根据权利要求4或5所述的方法,其特征在于,在当所述第一图像的对象类别为文本对象时,在所述第一界面上显示所述第三按钮之前,还包括:当确定所述终端设备的摄像头与物理对象之间的距离,小于第一阈值时,开启超级微距模式,在所述第一界面上显示第一图标;

7.根据权利要求4或5所述的方法,其特征在于,在当所述第一图像的对象类别为文本对象时,在所述第一界面上显示所述第三按钮之前,还包括:当确定所述终端设备的摄像头与物理对象之间的距离,小于第一阈值时,开启超级微距模式;

8.根据权利要求1-7中任一项所述的方法,其特征在于,所述第三界面中还包括第七按钮。

9.根据权利要求1-8中任一项所述的方法,其特征在于,当所述第二图像中的实体的个数大于预设个数,则所述第六按钮中的个数为预设个数减去1,所述第五窗口还显示有第十按钮。

10.根据权利要求1-9中任一项所述的方法,其特征在于,所述第五窗口中第六按钮的排布次序、所述第二图像中实体的排布排序,两者相对应;或者,所述第五窗口中第六按钮的排布次序,为基于用户画像或者用户意图所实时确定的。

11.根据权利要求1-10中任一项所述的方法,其特征在于,所述第六按钮对应有至少一个功能,所述功能具有优先级,所述功能的优先级为基于用户画像或者用户意图所实时确定的;

12.根据权利要求1-11中任一项所述的方法,其特征在于,所述第三界面中所述第四窗口所显示的实体对应有至少一个第一选项,所述第一选项具有优先级,所述第一选项的优先级为基于用户画像或者用户意图所实时确定的;所述实体的第一选项的优先级、所述实体对应的第六按钮的功能的优先级,两者一一对应;

13.根据权利要求1-12中任一项所述的方法,其特征在于,所述方法,还包括:

14.根据权利要求1-13中任一项所述的方法,其特征在于,在当所述预览流中的第一图像的对象类别为文档对象时,在所述第一界面上显示第二按钮之前,所述方法,还包括:当所述终端设备的摄像头与物理对象之间的距离,小于第一阈值时,开启超级微距模式,在所述第一界面上显示第一图标;

15.根据权利要求1-13中任一项所述的方法,其特征在于,在当所述预览流中的第一图像的对象类别为文档对象时,在所述第一界面上显示第二按钮之前,还包括:当所述终端设备的摄像头与物理对象之间的距离,小于第一阈值时,开启超级微距模式,

16.根据权利要求1-15中任一项所述的方法,其特征在于,所述预览流中的第二图像包括第一区域和第二区域,所述第一区域为目标文本的各文本块所构成的区域,所述第二区域为第一区域的外围区域;

17.根据权利要求1-15中任一项所述的方法,其特征在于,所述预览流中的第二图像包括第一区域和第二区域,所述第一区域为目标文本的各文本块所构成的区域,所述第二区域为第一区域的外围区域;

18.根据权利要求1-15中任一项所述的方法,其特征在于,所述预览流中的第二图像包括至少一个第三区域、以及第四区域,所述第三区域为目标文本的文本块所构成的区域;至少一对相邻第三区域中的两个第三区域之间的距离大于预设距离;所述第四区域为所述至少一个第三区域所构成的区域的外围区域;

19.根据权利要求1-15中任一项所述的方法,其特征在于,所述预览流中的第二图像包括第五区域和第六区域,所述第五区域为目标文本的各文本块所构成的区域、且所述第五区域中具有背景图,所述第六区域为所述第五区域的外围区域;

20.根据权利要求1-15中任一项所述的方法,其特征在于,所述预览流中的第二图像包括第一区域和第二区域,所述第一区域为目标文本的各文本块所构成的区域,所述第二区域为第一区域的外围区域;所述预览流中的第二图像中目标文本的各文本块的方向,包括至少两种不同的方向;

21.根据权利要求1-15中任一项所述的方法,其特征在于,所述预览流中的第二图像包括至少一个第三区域、以及第四区域,所述第三区域为目标文本的文本块所构成的区域;至少一对相邻第三区域中的两个第三区域之间的距离大于预设距离;所述第四区域为所述至少一个第三区域所构成的区域的外围区域;所述...

【技术特征摘要】

1.一种基于终端设备的文本识别方法,其特征在于,所述方法应用于终端设备,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在所述显示第三界面之后,还包括:

3.根据权利要求1或2所述的方法,其特征在于,在所述显示第四界面之后,还包括:

4.根据权利要求1-3中任一项所述的方法,其特征在于,所述方法,还包括:

5.根据权利要求4所述的方法,其特征在于,所述方法,还包括:

6.根据权利要求4或5所述的方法,其特征在于,在当所述第一图像的对象类别为文本对象时,在所述第一界面上显示所述第三按钮之前,还包括:当确定所述终端设备的摄像头与物理对象之间的距离,小于第一阈值时,开启超级微距模式,在所述第一界面上显示第一图标;

7.根据权利要求4或5所述的方法,其特征在于,在当所述第一图像的对象类别为文本对象时,在所述第一界面上显示所述第三按钮之前,还包括:当确定所述终端设备的摄像头与物理对象之间的距离,小于第一阈值时,开启超级微距模式;

8.根据权利要求1-7中任一项所述的方法,其特征在于,所述第三界面中还包括第七按钮。

9.根据权利要求1-8中任一项所述的方法,其特征在于,当所述第二图像中的实体的个数大于预设个数,则所述第六按钮中的个数为预设个数减去1,所述第五窗口还显示有第十按钮。

10.根据权利要求1-9中任一项所述的方法,其特征在于,所述第五窗口中第六按钮的排布次序、所述第二图像中实体的排布排序,两者相对应;或者,所述第五窗口中第六按钮的排布次序,为基于用户画像或者用户意图所实时确定的。

11.根据权利要求1-10中任一项所述的方法,其特征在于,所述第六按钮对应有至少一个功能,所述功能具有优先级,所述功能的优先级为基于用户画像或者用户意图所实时确定的;

12.根据权利要求1-11中任一项所述的方法,其特征在于,所述第三界面中所述第四窗口所显示的实体对应有至少一个第一选项,所述第一选项具有优先级,所述第一选项的优先级为基于用户画像或者用户意图所实时确定的;所述实体的第一选项的优先级、所述实体对应的第六按钮的功能的优先级,两者一一对应;

13.根据权利要求1-12中任一项所述的方法,其特征在于,所述方法,还包括:

14.根据权利要求1-13中任一项所述的方法,其特征在于,在当所述预览流中的第一图像的对象类别为文档对象时,在所述第一界面上显示第二按钮之前,所述方法,还包括:当所述终端设备的摄像头与物理对象之间的距离,小于第一阈值时,开启超级微距模式,在所述第一界面上显示第一图标;

15.根据权利要求1-13中任一项所述的方法,其特征在于,在当所述预览流中的第一图像的对象类别为文档对象时,在所述第一界面上显示第二按钮之前,还包括:当所述终端设备的摄像头与物理对象之间的距离,小于第一阈值时,开启超级微距模式,

16.根据权利要求1-15中任一项所述的方法,其特征在于,所述预览流中的第二图像包括第一区域和第二区域,所述第一区域为目标文本的各文本块所构成的区域,所述第二区域为第一区域的外围区域;

17.根据权利要求1-15中任一项所述的方法,其特征在于,所述预览流中的第二图像包括第一区域和第二区域,所述第一区域为目标文本的各文本块所构成的区域,所述第二区域为第一区域的外围区域;

18...

【专利技术属性】
技术研发人员:徐超劲易婕邵林豪黄雨菲周元甲
申请(专利权)人:荣耀终端有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1