图像处理方法、装置、设备以及存储介质制造方法及图纸

技术编号:32483075 阅读:11 留言:0更新日期:2022-03-02 09:47
本公开提供了图像处理方法、装置、设备以及存储介质,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可用于OCR、文字识别等场景。具体实现方案为:获取依次采集得到的N帧图像,根据N帧图像,确定多个处理任务,多个处理任务包括:N帧图像各自对应的第一处理任务以及第二处理任务;第i帧图像对应的第二处理任务依赖第i帧图像对应的第一处理任务以及第i

【技术实现步骤摘要】
图像处理方法、装置、设备以及存储介质


[0001]本公开涉及人工智能
,具体为深度学习、计算机视觉
,可用于OCR、文字识别等场景,尤其涉及一种图像处理方法、装置、设备以及存储介质。

技术介绍

[0002]一些应用场景中,图像采集设备需要连续拍摄,得到多帧图像。进而,对采集到的多帧图像进行处理,例如,对多帧图像进行拼接处理或者其他处理。
[0003]实际应用中,对多帧图像进行处理的效率较低。

技术实现思路

[0004]本公开提供了一种图像处理方法、装置、设备以及存储介质。
[0005]根据本公开的第一方面,提供了一种图像处理方法,包括:
[0006]获取依次采集得到的N帧图像,所述N为大于2的整数;
[0007]根据所述N帧图像,确定多个处理任务,所述多个处理任务包括:所述N帧图像各自对应的第一处理任务,以及所述N帧图像各自对应的第二处理任务;其中,第i帧图像对应的第二处理任务依赖第i帧图像对应的第一处理任务以及第i

1帧图像对应的第二处理任务,所述i为整数,且,1<i≤N;
[0008]通过M个线程对所述多个处理任务进行并行处理,得到所述N帧图像对应的处理结果图像;其中,每个第二处理任务所依赖的处理任务先于该第二处理任务执行,且每个线程执行至少部分图像对应的第一处理任务以及至少部分图像对应的第二处理任务,所述M为大于1的整数。
[0009]根据本公开的第二方面,提供了一种图像处理装置,包括:
[0010]获取模块,用于获取依次采集得到的N帧图像,所述N为大于2的整数;
[0011]确定模块,用于根据所述N帧图像,确定多个处理任务,所述多个处理任务包括:所述N帧图像各自对应的第一处理任务,以及所述N帧图像各自对应的第二处理任务;其中,第i帧图像对应的第二处理任务依赖第i帧图像对应的第一处理任务以及第i

1帧图像对应的第二处理任务,所述i为整数,且,1<i≤N;
[0012]处理模块,用于通过M个线程对所述多个处理任务进行并行处理,得到所述N帧图像对应的处理结果图像;其中,每个第二处理任务所依赖的处理任务先于该第二处理任务执行,且每个线程执行至少部分图像对应的第一处理任务以及至少部分图像对应的第二处理任务,所述M为大于1的整数。
[0013]根据本公开的第三方面,提供了一种电子设备,包括:
[0014]至少一个处理器;以及
[0015]与所述至少一个处理器通信连接的存储器;其中,
[0016]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面中任一项所述的方法。
[0017]根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行第一方面中任一项所述的方法。
[0018]根据本公开的第五方面,提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面所述的方法。
[0019]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0020]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0021]图1A为本申请实施例提供的一种应用场景的示意图;
[0022]图1B为本申请实施例提供的另一种应用场景的示意图;
[0023]图2为采用单线程的图像处理过程示意图;
[0024]图3为采用双线程的图像处理过程示意图;
[0025]图4为本申请实施例提供的一种图像处理方法的流程示意图;
[0026]图5为本申请实施例提供的处理任务之间依赖关系的示意图;
[0027]图6为本申请实施例提供的另一种图像处理方法的流程示意图;
[0028]图7为本申请实施例提供的多线程多任务混调的图像处理过程的示意图;
[0029]图8为本申请实施例提供的一种图像处理装置的结构示意图;
[0030]图9为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
[0031]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0032]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0033]本公开提供一种图像处理方法、装置、设备以及存储介质,应用于人工智能
,具体为深度学习、计算机视觉
,可用于光学字符识别(Optical Character Recognition,OCR)、文字识别等场景,可以提高图像处理的效率。
[0034]一些应用场景中,图像采集设备连续拍摄得到多帧图像,该多帧图像中的相邻图像之间存在重叠区域。需要对多帧图像按序进行去重拼接处理,得到多帧图像对应的拼接结果图像。下面结合两个示例场景进行举例说明。
[0035]示例场景一,图1A为本申请实施例提供的一种应用场景的示意图。该应用场景可
以为翻译笔对文本进行扫描、翻译的场景。翻译笔扫描一行文本,在扫描过程中,翻译笔拍摄得到该行文本的多帧图像,该多帧图像如图1A中的图像1至图像5所示。该多帧图像中的相邻图像之间存在重叠区域。图像处理设备对该多帧图像进行去重拼接处理,得到拼接结果图像。进一步的,可以对拼接结果图像中的文本进行识别,并对识别出的文本进行翻译,得到翻译结果。该场景中,图像处理设备可以为翻译笔,或者,为与翻译笔连接的其他电子设备(比如服务器)。
[0036]示例场景二,图1B为本申请实施例提供的另一种应用场景的示意图。该应用场景可以为全景图拍摄场景。拍摄设备连续拍摄得到多帧图像,并在拍摄每帧图像后旋转一定角度,这样拍摄得到的多帧图像如图1B中的图像1至图像4所示,相邻图像之间具有一定的重叠区域。图像处理设备对该多帧图像进行去重拼接处理,得到拼接结果图像,该拼接结果图像即为全景图。该场景中,图像处理设备可以为拍摄设备(例如手机、相机等),或者,为与拍摄设备连接的其他电子设备。
[0037]需要说本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像处理方法,包括:获取依次采集得到的N帧图像,所述N为大于2的整数;根据所述N帧图像,确定多个处理任务,所述多个处理任务包括:所述N帧图像各自对应的第一处理任务,以及所述N帧图像各自对应的第二处理任务;其中,第i帧图像对应的第二处理任务依赖第i帧图像对应的第一处理任务以及第i

1帧图像对应的第二处理任务,所述i为整数,且,1<i≤N;通过M个线程对所述多个处理任务进行并行处理,得到所述N帧图像对应的处理结果图像;其中,每个第二处理任务所依赖的处理任务先于该第二处理任务执行,且每个线程执行至少部分图像对应的第一处理任务以及至少部分图像对应的第二处理任务,所述M为大于1的整数。2.根据权利要求1所述的方法,其中,通过M个线程对所述多个处理任务进行并行处理,得到所述N帧图像对应的处理结果图像,包括:针对所述M个线程中的每个第一线程,重复执行下述步骤,直至第N帧图像对应的第二处理任务执行完成时,得到所述N帧图像对应的处理结果图像:在所述第一线程的运行状态切换为空闲状态时,将所述N帧图像中首个未执行第一处理任务的图像确定为第一目标图像,以及将所述N帧图像中首个未执行第二处理任务的图像确定为第二目标图像;确定所述第二目标图像的前一帧图像对应的第二处理任务的执行状态,以及确定所述第二目标图像对应的第一处理任务的执行状态;根据所述第二目标图像的前一帧图像对应的第二处理任务的执行状态,以及所述第二目标图像对应的第一处理任务的执行状态,通过所述第一线程执行所述第一目标图像对应的第一处理任务,或者执行所述第二目标图像对应的第二处理任务。3.根据权利要求2所述的方法,其中,根据所述第二目标图像的前一帧图像对应的第二处理任务的执行状态,以及所述第二目标图像对应的第一处理任务的执行状态,通过所述第一线程执行所述第一目标图像对应的第一处理任务,或者执行所述第二目标图像对应的第二处理任务,包括:若所述第二目标图像的前一帧图像对应的第二处理任务的执行状态为未完成,则通过所述第一线程执行所述第一目标图像对应的第一处理任务;或者,若所述第二目标图像的前一帧图像对应的第二处理任务的执行状态为已完成,则根据所述第二目标图像对应的第一处理任务的执行状态,通过所述第一线程执行所述第一目标图像对应的第一处理任务,或者执行所述第二目标图像对应的第二处理任务。4.根据权利要求3所述的方法,其中,根据所述第二目标图像对应的第一处理任务的执行状态,通过所述第一线程执行所述第一目标图像对应的第一处理任务,或者执行所述第二目标图像对应的第二处理任务,包括:若所述第二目标图像对应的第一处理任务的执行状态为已完成,则通过所述第一线程执行所述第二目标图像对应的第二处理任务;或者,若所述第二目标图像对应的第一处理任务的执行状态为未完成,则通过所述第一线程
执行所述第一目标图像对应的第一处理任务。5.根据权利要求2至4任一项所述的方法,其中,所述N帧图像中的相邻图像存在重叠区域;第k帧图像对应的第一处理任务用于指示对所述第k帧图像进行特征提取,得到所述第k帧图像的特征;所述k为整数,1<k≤N;第1帧图像对应的第二处理任务为空,第j帧图像对应的第二处理任务用于指示根据所述第j帧图像的特征以及中间结果图像的特征,对第j帧图像与所述中间结果图像进行拼接处理,得到拼接图像以及所述拼接图像的特征,j为整数,且2≤j≤N,当j=2时,所述中间结果图像为第1帧图像,当j>2时,所述中间结果图像为第j

1帧图像对应的第二处理任务得到的拼接图像。6.根据权利要求2至5任一项所述的方法,其中,通过所述第一线程执行所述第一目标图像对应的第一处理任务,包括:通过所述第一线程对所述第一目标图像进行特征提取,得到所述第一目标图像的特征。7.根据权利要求2至5任一项所述的方法,其中,通过所述第一线程执行所述第二目标图像对应的第二处理任务,包括:根据所述第二目标图像对应的第一处理任务的任务结果,获取所述第二目标图像的特征;根据所述第二目标图像的前一帧图像对应的第二处理任务的任务结果,获取中间结果图像以及所述中间结果图像的特征;根据所述第二目标图像的特征和所述中间结果图像的特征,对所述第二目标图像和所述中间结果图像进行拼接处理,得到拼接图像以及所述拼接图像的特征。8.根据权利要求1至7任一项所述的方法,通过M个线程对所述多个处理任务进行并行处理,得到所述N帧图像对应的处理结果图像之后,还包括:对所述处理结果图像进行目标识别处理,得到目标识别结果;显示所述目标识别结果;或者,语音播放所述目标识别结果;或者,向预设设备发送所述目标识别结果。9.根据权利要求8所述的方法,其中,对所述处理结果图像进行目标识别处理,得到目标识别结果,包括:对所述处理结果图像中的文字进行识别处理,得到第一文本,所述第一文本采用第一语言;对所述第一文本进行翻译处理,得到第二文本,所述第二文本采用第二语言;将所述第二文本确定为所述目标识别结果。10.一种图像处理装置,包括...

【专利技术属性】
技术研发人员:张文明
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1