文本内容的识别方法、装置及电子设备制造方法及图纸

技术编号:25272056 阅读:44 留言:0更新日期:2020-08-14 23:04
本申请公开了一种文本内容的识别方法、装置及电子设备,涉及计算机技术领域中的文本识别技术。具体实现方案为:获取表盘图片;检测所述表盘图片中的至少一根文本中心线以及与每一文本中心线对应的包围框;基于所述至少一根文本中心线以及与每一文本中心线对应的包围框,识别所述表盘图片中的每一行文本的文本内容。这样,电子设备可以准确且快速地识别表盘图片中的文本内容,从而提升仪表盘的计量内容的识别准确度以及效率。

【技术实现步骤摘要】
文本内容的识别方法、装置及电子设备
本申请涉及计算机
中的文本识别技术,尤其涉及一种文本内容的识别方法、装置及电子设备。
技术介绍
仪表盘作为一种计量装置,其被广泛应用于各个领域,包括机械制造、水务系统、电力系统、汽车以及医疗,等等。目前,随着仪表计量技术的发展,传统的指针式仪表盘逐渐被数字式仪表盘,数字式仪表盘通过设置的液晶显示面板等表盘显示计量内容,如计量指标项以及计量数值等。其中,为提升仪表盘的抄表效率,目前通常是通过设置在仪表盘的数据采集装置采集仪表盘的图片,再由服务器等电子设备识别仪表盘的图片中的计量内容。但是,目前仪表盘的计量内容的识别过程中,容易出现计量内容的识别出错,从而降低仪表盘的计量内容的识别准确性。可见,目前仪表盘的计量内容的识别过程中,存在识别准确性低的问题。
技术实现思路
提供了一种文本内容的识别方法、装置及电子设备,以解决目前仪表盘的计量内容的识别过程中存在识别准确性低的问题的问题。根据第一方面,提供了一种文本内容的识别方法,应用于电子设备,包括:获取表盘图片;检测所述表盘图片中的至少一根文本中心线以及与每一文本中心线对应的包围框;基于所述至少一根文本中心线以及与每一文本中心线对应的包围框,识别所述表盘图片中的每一行文本的文本内容。根据第二方面,还提供了一种文本内容的识别装置,应用于电子设备,包括:图片获取模块,用于获取表盘图片;检测模块,用于检测所述表盘图片中的至少一根文本中心线以及与每一文本中心线对应的包围框;识别模块,用于基于所述至少一根文本中心线以及与每一文本中心线对应的包围框,识别所述表盘图片中的每一行文本的文本内容。根据第三方面,还提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第一方面所述的方法。本申请第四方面提供一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行上述第一方面所述的方法。本申请中,通过获取表盘图片;检测所述表盘图片中的至少一根文本中心线以及与每一文本中心线对应的包围框;基于所述至少一根文本中心线以及与每一文本中心线对应的包围框,识别所述表盘图片中的每一行文本的文本内容。这样,电子设备可以准确且快速地识别表盘图片中的文本内容,从而提升仪表盘的计量内容的识别准确度以及效率。应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是根据本申请第一实施例的示意图之一;图2是根据本申请第一实施例的示意图之二;图3是根据本申请第二实施例的示意图之一;图4是根据本申请第二实施例的示意图之二;图5是根据本申请第二实施例的示意图之三;图6是根据本申请第二实施例的示意图之四;图7是根据本申请第二实施例的示意图之五;图8是根据本申请第二实施例的示意图之六;图9是用来实现本申请实施例的文本内容的识别方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。请参见图1,本申请实施例提供的一种文本内容的识别方法,该方法可以应用于电子设备,如图1所示,所述文本内容的识别方法包括如下步骤:步骤101、获取表盘图片。本申请中,在电子设备接收到仪表盘的拍摄图片的情况下,电子设备可以通过该仪表盘的拍摄图片获取到表盘图片。其中,上述表盘图片包括:拍摄图片中仪表盘的表盘所在区域的图像,且上述表盘是指仪表盘中显示屏所在的区域。例如,如图2中所示,电子设备接收到输入的仪表盘的拍摄图片21,电子设备通过拍摄图片21中的表盘所在的区域的图像211生成表盘图片22。需要说明的是,上述电子设备通过仪表盘的拍摄图片获取到表盘图片,可以是电子设备接收操作人员在拍摄图片中的标注操作,该标注操作用于标注拍摄图片中仪表盘的表盘所在区域的图像;电子设备响应于该标注操作,将该标注操作所标注的图像生成上述表盘图片。或者,在一些实施方式中,上述步骤101,可以包括:在接收到仪表盘的拍摄图片的情况下,对所述拍摄图片的图片特征进行多尺度特征处理,得到具有多尺度特征的拍摄图片;对具有多尺度特征的拍摄图片进行特征分类以及回归处理,确定所述拍摄图片中的表盘区域;将所述表盘区域的图片输出作为所述表盘图片。这里,电子设备可以通过对仪表盘的拍摄图片进行多尺度特征处理、中心线检测和包围框回归处理,从而能够准确识别到拍摄图像中仪表盘的表盘位置,进而提升仪表盘中文本内容的识别准确度。其中,上述对拍摄图片的图片特征进行多尺度特征处理,可以是通过预设的用于进行多尺度特征处理的算法实现。具体地,在如图2所示的质量控制过程中,对输入图片(即上述拍摄图片)先通过主体网络中的轻量级网络(如采用复合缩放方法对传统的卷积神经网络(CNN)进行优化的轻量级网络EfficientNetB0Small等)进行主体特征提取,结合深度学习分割网络(如UNet等)实现特征维度的多尺度适应,即对输入图片先下采样,再经过不同程度的卷积,学习得到输入图片的深层次的特征(在EfficientNetB0Small实现),最后对输入图片的深层次的特征经过上采样恢复为原图大小,从而得到具有多尺度特征的输入图片,其中,上采样通过反卷积实现。这里,采用轻量级网络对拍摄图片的图片特征进行多尺度特征处理,可以提升处理的准确率和效率。另外,在电子设备对仪表盘的拍摄图片进行多尺度特征处理之后,电子设备还可以对具有多尺度特征的拍摄图片进行特征分类以及回归处理,从而确定拍摄图片中的表盘区域。具体地,如图2中所示,在得到具有多尺度特征的输入图片之后,电子设备还可以在质量控制过程的East检测中对具有多尺度特征的输入图片进行分类和回归,例如,分类和回归网络可以均是采用2级3X3的网络和一个分类层提取前景和回归位置信息,且分类通过过dice_loss进行监督学习,回归通过smooth_l1_loss进行监督学习,从而确定表盘在拍摄图片中的位置,实现对拍摄图片中表盘区域的定位。当然,在上述对拍摄图片的图片特征进行多尺度特征处理之前,电子设备还可以对拍摄图片进行预处理,具体地,可以裁剪上述拍摄图片至预设尺寸,以及,对上述拍摄图片进行减均值处理,等等。...

【技术保护点】
1.一种文本内容的识别方法,应用于电子设备,其特征在于,包括:/n获取表盘图片;/n检测所述表盘图片中的至少一根文本中心线以及与每一文本中心线对应的包围框;/n基于所述至少一根文本中心线以及与每一文本中心线对应的包围框,识别所述表盘图片中的每一行文本的文本内容。/n

【技术特征摘要】
1.一种文本内容的识别方法,应用于电子设备,其特征在于,包括:
获取表盘图片;
检测所述表盘图片中的至少一根文本中心线以及与每一文本中心线对应的包围框;
基于所述至少一根文本中心线以及与每一文本中心线对应的包围框,识别所述表盘图片中的每一行文本的文本内容。


2.根据权利要求1所述的方法,所述基于所述少一根文本中心线以及与每一文本中心线对应的包围框,识别所述表盘图片中的每一行文本,包括:
基于目标文本中心线以及与所述第一文本中心线对应的包围框,获取与所述表盘图片中目标行文本对应的至少一个采样点的文本特征,其中,所述目标行文本位于与所述目标文本中心线对应的包围框内,且所述目标文本中心线为所述至少一根文本中心线中的任一根文本中心线;
对所述至少一个采样点的文本特征进行序列化处理,得到目标文本特征序列;
通过预设的损失函数对目标文本特征序列进行监督学习;
对监督学习后的所述目标文本特征序列进行解码,得到所述目标行文本的文本内容。


3.根据权利要求2所述的方法,其特征在于,所述对所述至少一个采样点的文本特征进行序列化处理之前,还包括:
对所述至少一个采样点的文本特征进行背景抑制处理;
所述对所述至少一个采样点的文本特征进行序列化处理,包括:
对背景抑制处理后的所述至少一个采样点的文本特征进行序列化处理。


4.根据权利要求1所述的方法,其特征在于,所述检测所述表盘图片中的至少一根文本中心线以及与每一文本中心线对应的包围框之前,还包括:
对所述表盘图片的图片特征进行多尺度特征处理,得到具有多尺度特征的表盘图片。


5.根据权利要求1所述的方法,其特征在于,所述获取表盘图片,包括:
在接收到仪表盘的拍摄图片的情况下,对所述拍摄图片的图片特征进行多尺度特征处理,得到具有多尺度特征的拍摄图片;
对具有多尺度特征的拍摄图片进行特征分类以及回归处理,确定所述拍摄图片中的表盘区域;
将所述表盘区域的图片输出作为所述表盘图片。


6.根据权利要求1所述的方法,其特征在于,所述检测所述表盘图片中的至少一根文本中心线以及与每一文本中心线对应的包围框之前,还包括:
对所述表盘图片进行预处理,其中,所述预处理包括:裁剪所述表盘图片至预设尺寸,以及,对所述表盘图片进行减均值处理。


7.一种文本内容的识别装置,应用于电子设备,其特征在于,包括:
图片获取模块,用于获取表盘图片;
检测模块,用于检测所述表盘图片中的至少一根文本中心线以及与每一文本中心线对...

【专利技术属性】
技术研发人员:刘珊珊章成全李轩恩孟一许海伦张晓强
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1