【技术实现步骤摘要】
一种基于目标编解码的表盘指针读数的识别方法
[0001]本专利技术涉及计算机视觉
,具体涉及一种基于目标编解码的表盘指针读数的识别方法。
技术介绍
[0002]人工智能技术现在已经广泛运用于教育行业,例如自动批阅中学的物理实验。物理实验的操作离不开各种仪表盘,其中包括且不限于电压表,电流表,天平刻度尺等,想要保证实验自动批阅的准确性和完备性,需要使用机器视觉技术自动识别上述表盘的指针读数。
[0003]现有表盘读数识别大多分为两类方法,分别是角度计算识别和读数直接识别,角度计算识别可以通过传统直线检测,轮廓检测,也可以通过深度学习的指针关键点检测,指针语义分割,最终计算出指针的刻度和所在位置,再利用指针和刻度位置之间的关系计算出指针的读数;读数直接识别是通过机器学习的方法,提取表盘的图像特征,然后通过分类或者回归的方法直接得到读数。
[0004]物理实验中,表盘的种类较多,格式各有不同,每个仪表盘的量程,刻度不同,指针的的关键点,外观也不同。传统方法需要针对不同的表盘设计不同的算法和参数,机器学习的方法也存在类似的问题,并且无法得到准确的指针和每一个刻度之间的关系,通过角度计算指针读数的方法无法还原真实的指针和刻度的关系,所以会存在误差。
[0005]中学物理实验场景存在着更多的挑战,会出现如下问题:光线明暗,场景复杂,表盘设备摆放角度不同,倾斜,颠倒会导致传统图像处理不具有兼容性;关键点检测,分割等方法需要标注大量的样本,标注量较大,并且模型较为复杂,不适合作为实验识别中的一个识别分支 ...
【技术保护点】
【技术特征摘要】
1.一种基于目标编解码的表盘指针读数的识别方法,其特征在于,具体包括以下步骤:S1:构建表盘目标检测模型和表盘读数识别模型;S2:输入实验待识别图像,使用表盘目标检测模型识别表盘和表盘角点,根据检测信息获取初步检测结果;S3:将初步检测结果中的图像中存在的多个表盘进行组装,生成一组表盘信息;S4:使用透视变换根据表盘的四个角点对表盘进行矫正;S5:通过表盘读数识别模型识别表盘读数,循环生成多个预测结果,并将循环生成的预测序列编码转成读数结果;S6:输出表盘读数。2.根据权利要求1所述的基于目标编解码的表盘指针读数的识别方法,其特征在于,所述步骤S1的具体步骤为:S11:标注并制作表盘目标检测的数据集,构建表盘目标检测模型;S12:制作表盘读数识别模型的数据集,构建基于图像特征序列编解码的神经网络的表盘读数识别模型。3.根据权利要求2所述的基于目标编解码的表盘指针读数的识别方法,其特征在于,在所述步骤S11中表盘标注包括表盘上角点标注和表盘下角点标注,所述表盘目标检测包括表盘检测、表盘上角点检测和表盘下角点检测;所述表盘上角点标注包括表盘左上角点标注和表盘右上角点标注,表盘下角点标注包括表盘左下角点标注和表盘右下角点标注;表盘目标检测模型采用Yolov5或Centernet或FasterRCNN;在所述步骤S12中制作表盘读数识别模型的数据集时使用onehot编码将读数编码成一个序列,将表盘读数根据刻度和指针的不同将读数转化成一组不定长的读数序列编码,其中刻度所在位置表示编码0,指针所在位置表示编码1。4.根据权利要求3所述的基于目标编解码的表盘指针读数的识别方法,其特征在于,在所述步骤S2中的初步检测结果包括表盘的位置和表盘的角点的中心坐标;在所述步骤S3中图像中存在多个表盘,则根据目标检测出的表盘B,表盘上角点U,表盘下角点L,还原出每个表盘的位置信息;具体为:循环所有检测到的表盘位置,找到表盘坐标范围表盘位置中的表盘上角点和表盘下角点,将表盘B
i
,表盘上角点U
i
,表盘下角点L
i
组装成一组表盘信息BUL
i
。5.根据权利要求4所述的基于目标编解码的表盘指针读数的识别方法,其特征在于,所述步骤S4的具体步骤为:S41:获取步骤S3中的一组表盘信息BUL
i
,根据上角点U
i
和下角点L
i
的位置关系确认表盘顺时针方向排序的四个角点[[x1,y1],[x2,y2],[x3,y3],[x4,y4]];S42:将这四个角点作为源图像中待测矩形的四点坐标,使用透视变换将源图像中的表盘通过透视变换矩阵求得变换后的目标表盘图像。6.根据权利要求5所述的基于目标编解码的表盘指针读数的识别方法,其特征在于,所述步骤S42中使用透视变换将源图像中的表盘通过透视变换矩阵求得变换后的目标表盘图像的具体步骤为:首先通过透视变换取得畸变图像的一组4个角点的坐标,和目标图像的一组4个角点的坐标,再通过该两组坐标点计算出透视变换的变换矩阵,从而通过变换矩阵对源图像进行变换,实现图像校正;矫正的矩阵变换公式为:
其中,x,y为源图像的像素点的坐标,参数z等于1,X,Y,Z是透视变换矩阵计算出的结果,最终得到结果图像坐标X
′
,Y
′
;其中,X
′
,Y
′
是变换矩阵的参数,具体为:且变换矩阵的参数中的未知数通过原始坐标和目标坐标求出。7.根据权利要求6所述的基于目标编解码的表盘指针读数的识别方法,其特征在于,所述步骤S5中使用基于图像特征序列编解码的神经网络的表盘读数识别模型对表盘读数进行识别的具体步骤为:S51特征提取:使用卷积神经网络对于图像...
【专利技术属性】
技术研发人员:江人杰,田博帆,
申请(专利权)人:南京红松信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。