本公开涉及一种答案提取方法、装置、计算机可读介质及电子设备。方法包括:识别答案图像中是否包含预设分隔符;在所述答案图像中包含所述预设分隔符的情况下,提取被所述预设分隔符前后分隔开的文本区域的区域图像,其中,前后相邻的两个所述文本区域之间被所述预设分隔符分隔开;对所述区域图像进行文本识别,以得到所述区域图像对应的答案信息。这样,通过提取被该预设分隔符前后分隔开的文本区域即可获取到各作答点对应的答案的区域图像,可有效提升相邻作答点的答案分隔的精度和稳定性,进而保证后续基于各作答点对应的答案的区域图像提取出的答案信息的准确性。
【技术实现步骤摘要】
答案提取方法、装置、计算机可读介质及电子设备
本公开涉及图像处理
,具体地,涉及一种答案提取方法、装置、计算机可读介质及电子设备。
技术介绍
随着在线教育的不断发展,在线测试也变得越来越普及。通常情况下,用户根据线上展示的题目,给出答案(例如,在纸上手写),之后,用户使用图像采集装置(例如,智能终端、相机等)拍摄答案图像,并将其上传至用于答案提取的电子设备(例如,服务器或智能终端);电子设备对答案图像的中答案进行识别,并进行对错判定。当一道题目包含多个作答点时(例如:找规律写数字:101、102、103、?、105、106、?、108,其中,“?”代表一个作答点),需要先将每一作答点对应的答案提取出来,再将提取到的各作答点对应的答案分别与标准答案进行匹配,以进行对错判定。现阶段,大多使用基于连通组件和连通组件距离的方法进行答案提取。具体来说,首先对答案图像进行连通域提取,得到多个连通组件;然后将多个连通组件按照其在答案图像中的前后顺序排列,并计算每相邻两个连通组件之间的距离。若相邻两个连通组件之间的距离小于距离平均值(每相邻两个连通组件之间的距离之和的平均值),则将二者合并;最后,得到多个连通组件,其中,每一连通组件与一作答点对应,从而可将多个作答点的答案提取出来。但当答案图像中相邻字符之间的间距不明朗时,将无法精准地将各作答点对应的答案分隔开。
技术实现思路
提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。第一方面,本公开提供一种答案提取方法,包括:识别答案图像中是否包含预设分隔符;在所述答案图像中包含所述预设分隔符的情况下,提取被所述预设分隔符前后分隔开的文本区域的区域图像,其中,前后相邻的两个所述文本区域之间被所述预设分隔符分隔开;对所述区域图像进行文本识别,以得到所述区域图像对应的答案信息。第二方面,本公开提供一种答案提取装置,包括:第一识别模块,用于识别答案图像中是否包含预设分隔符;提取模块,用于在所述第一识别模块识别出所述答案图像中包含所述预设分隔符的情况下,提取被所述预设分隔符前后分隔开的文本区域的区域图像,其中,前后相邻的两个所述文本区域之间被所述预设分隔符分隔开;第二识别模块,用于对所述提取模块提取到的所述区域图像进行文本识别,以得到所述区域图像对应的答案信息。第三方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现本公开第一方面提供的所述方法的步骤。第四方面,本公开提供一种电子设备,包括:存储装置,其上存储有计算机程序;处理装置,用于执行所述存储装置中的所述计算机程序,以实现本公开第一方面提供的所述方法的步骤。在上述技术方案中,答案图像中前后相邻的两个文本区域(即作答点对应的答案所在的区域)之间通过预设分隔符分隔开,这样,通过提取被该预设分隔符前后分隔开的文本区域即可获取到各作答点对应的答案的区域图像,可有效提升相邻作答点的答案分隔的精度和稳定性,进而保证后续基于各作答点对应的答案的区域图像提取出的答案信息的准确性。本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。附图说明结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。在附图中:图1是现有技术中的一种答案图像的示意图。图2是根据一示例性实施例示出的一种答案提取方法的流程图。图3是根据一示例性实施例示出的一种答案图像的示意图。图4A-图4D是对图3中的答案图像进行处理得到的多个区域图像的示意图。图5是根据一示例性实施例示出的一种识别答案图像中是否包含预设分隔符的方法的流程图。图6是根据一示例性实施例示出的一种提取区域图像的方法的流程图。图7是根据一示例性实施例示出的一种对图3中的答案图像进行连通域提取后得到的多个连通组件的示意图。图8是根据一示例性实施例示出的一种对图7中、满足条件的连通组件进行拆分得到的连通组件的示意图。图9是根据一示例性实施例示出的一种当前得到的多个连通组件的示意图。图10是根据另一示例性实施例示出的一种提取区域图像的方法的流程图。图11是根据另一示例性实施例示出的一种对图7中、满足条件的连通组件进行拆分得到的连通组件的示意图。图12是根据另一示例性实施例示出的一种答案提取方法的流程图。图13是根据一示例性实施例示出的一种答案提取装置的框图。图14是根据一示例性实施例示出的一种电子设备的框图。具体实施方式下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。正如
技术介绍
所述的那样,当答案图像中相邻字符之间的间距不明朗时,将无法精准地将各作答点对应的答案分隔开。示例地,针对题目“101、102、103、?、105、106、?、108”,学生给出的答案如图1中所示。由图1可知,相邻字符之间的间距不明朗(例如,字符“4”和相邻字符“1”间距比较近,字符“7”和相邻字符“0”间距比较远),若基于连通组件和连通组件距离的方法对其进行答案提取,可能无法精准地将各作答点对应的答案分隔开。例如,提取到的答案信息为“10410”和“7”。为此,本公开提供一种答案提取方法、装置、计算机可本文档来自技高网...
【技术保护点】
1.一种答案提取方法,其特征在于,包括:/n识别答案图像中是否包含预设分隔符;/n在所述答案图像中包含所述预设分隔符的情况下,提取被所述预设分隔符前后分隔开的文本区域的区域图像,其中,前后相邻的两个所述文本区域之间被所述预设分隔符分隔开;/n对所述区域图像进行文本识别,以得到所述区域图像对应的答案信息。/n
【技术特征摘要】
1.一种答案提取方法,其特征在于,包括:
识别答案图像中是否包含预设分隔符;
在所述答案图像中包含所述预设分隔符的情况下,提取被所述预设分隔符前后分隔开的文本区域的区域图像,其中,前后相邻的两个所述文本区域之间被所述预设分隔符分隔开;
对所述区域图像进行文本识别,以得到所述区域图像对应的答案信息。
2.根据权利要求1所述的方法,其特征在于,所述识别答案图像中是否包含预设分隔符,包括:
对所述答案图像进行连通域提取,得到多个连通组件;
对每一所述连通组件分别进行识别,以确定所述连通组件中是否包含所述预设分隔符;
在存在包含所述预设分隔符的所述连通组件的情况下,确定所述答案图像中包含所述预设分隔符。
3.根据权利要求2所述的方法,其特征在于,所述提取被所述预设分隔符前后分隔开的文本区域的区域图像,包括:
将包含所述预设分隔符和除所述预设分隔符之外的其他文本的连通组件,以所述预设分隔符为分界点,拆分成多个连通组件,其中,所述预设分隔符被拆分为一个独立的连通组件,并且,拆分后得到的连通组件和未进行拆分的连通组件按照其在所述答案图像中的前后顺序排列;
按照所述连通组件的排列顺序遍历所述连通组件;
在当前遍历到的所述连通组件不包含所述预设分隔符,且当前遍历到的所述连通组件的前一连通组件也不包含所述预设分隔符的情况下,将当前遍历到的所述连通组件与所述前一连通组件合并成一个连通组件,之后继续遍历;
在当前遍历的所述连通组件包含所述预设分隔符的情况下,或者,在当前遍历到的所述连通组件不包含所述预设分隔符,而所述前一连通组件中包含所述预设分隔符的情况下,继续遍历;
在遍历完成后,将当前得到的不包含所述预设分隔符的连通组件确定为所述文本区域的区域图像。
4.根据权利要求2所述的方法,其特征在于,所述多个连通组件按照其在所述答案图像中的前后顺序排列;
所述提取被所述预设分隔符前后分隔开的文本区域的区域图像,包括:
按照所述连通组件的排列顺序遍历所述连通组件;
在当前遍历到的所述连通组件不包含所述预设分隔符,且当前遍历到的所述连通组件的前一连通组件也不包含所述预设分隔符的情况下,将当前遍历到的所述连通组件与所述前一连通组件合并成一个连通组件,之后继续遍历;
...
【专利技术属性】
技术研发人员:郝昱,黄灿,文林福,
申请(专利权)人:北京字节跳动网络技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。