一种试卷手写内容识别方法及系统技术方案

技术编号：41392287 阅读：25 留言：0更新日期：2024-05-20 19:15

本发明专利技术提供了一种试卷手写内容识别方法及系统，所述方法包括对初始试卷图像进行预处理；对处理试卷图像进行定位点识别，根据识别结果确定处理试卷图像的试卷类型，对处理试卷图像进行角度矫正处理；对矫正试卷图像进行答题区域确定，以得到手写区域图像；对手写区域图像进行字符分割处理，以得到手写图像数据；获取训练数据，对训练数据进行增强处理，以得到增强训练数据，将增强训练数据输入预设识别模型中进行训练，将手写图像数据输入训练后的预设识别模型中进行识别，以得到手写识别内容，本发明专利技术可将字符进行充分有效的分割，同时也能够提升模型识别的精度与速度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于图像识别的，具体地涉及一种试卷手写内容识别方法及系统。

技术介绍

1、网上阅卷相比传统人工阅卷，结果更准确、阅卷效率更高、阅卷过程更安全，有极大的优势，网上阅卷系统在上世纪 90 年代被提出，经过几十年的发展，已普遍使用在大型考试当中。

2、对于一些考试科目而言，其全文均为客观题，因此通过机器扫描试卷涂黑区域即可完成自动阅卷过程，但对另一些科目而言，例如思政，思政科目试卷的大部分的题目为主观题，其无法通过机器扫描实现自动阅卷，而是需要将试卷上主观题的手写内容扫描识别出来，但在实际扫描过程中试卷可能会出现倾斜的情况，如此不便于老师观看与打分阅卷，同时由于不同的撰写习惯以及中文的特点，部分试卷上的手写内容的相邻字符之间可能粘连在一起或者间隔较远，如此导致在对手写内容进行识别时，其识别内容与实际手写内容之间的误差较大，影响实际的阅卷过程

技术实现思路

1、为了解决上述技术问题，本专利技术提供了一种试卷手写内容识别方法及系统，用于解决现有技术中的技术问题。

2、一方面，本专利技术提供以下技术方案，一种试卷手写内容识别方法，包括：

3、获取初始试卷图像，对所述初始试卷图像进行预处理，以得到处理试卷图像；

4、对所述处理试卷图像进行定位点识别，以得到识别结果，根据所述识别结果确定所述处理试卷图像的试卷类型，并基于所述处理试卷图像的试卷类型对所述处理试卷图像进行角度矫正处理，以得到矫正试卷图像；

5、基于所述矫正试卷图像的

6、对所述手写区域图像进行字符分割处理，以得到手写图像数据；

7、获取训练数据，对所述训练数据进行增强处理，以得到增强训练数据，将所述增强训练数据输入预设识别模型中进行训练，将所述手写图像数据输入训练后的预设识别模型中进行识别，以得到手写识别内容。

8、相比现有技术，本专利技术的有益效果为：本专利技术首先获取初始试卷图像，对所述初始试卷图像进行预处理，以得到处理试卷图像；之后对所述处理试卷图像进行定位点识别，以得到识别结果，根据所述识别结果确定所述处理试卷图像的试卷类型，并基于所述处理试卷图像的试卷类型对所述处理试卷图像进行角度矫正处理，以得到矫正试卷图像；而后基于所述矫正试卷图像的试卷类型对所述矫正试卷图像进行答题区域确定，以得到手写区域图像；然后对所述手写区域图像进行字符分割处理，以得到手写图像数据；最后获取训练数据，对所述训练数据进行增强处理，以得到增强训练数据，将所述增强训练数据输入预设识别模型中进行训练，将所述手写图像数据输入训练后的预设识别模型中进行识别，以得到手写识别内容，本专利技术对不同的试卷类型采用不同的角度矫正方法，以此可满足不同试卷的识别需求同时相比传统矫正方法大幅度的提升了矫正效率与精度，同时本专利技术通过确定相应的答题区域与字符分割，可将粘连的字符进行充分分割以及将间隔较远的字符进行充分合并，能够有效将汉字字符进行分割，提升后续模型识别的精度与速度。

9、较佳的，所述根据所述识别结果确定所述处理试卷图像的试卷类型，并基于所述处理试卷图像的试卷类型对所述处理试卷图像进行角度矫正处理，以得到矫正试卷图像的步骤包括：

10、若所述处理试卷图像中含有定位点，则所述处理试卷图像为定位点试卷图像，并采用第一矫正方法对所述处理试卷图像进行角度矫正处理，以得到矫正试卷图像；

11、若所述处理试卷图像中不含有定位点，则所述处理试卷图像为普通试卷图像，并采用第二矫正方法对所述处理试卷图像进行角度矫正处理，以得到矫正试卷图像。

12、较佳的，所述采用第一矫正方法对所述处理试卷图像进行角度矫正处理，以得到矫正试卷图像的步骤包括：

13、在所述处理试卷图像的边缘分别截取若干第一边沿图像，计算每个所述第一边沿图像的黑色像素比例，将黑色像素比例最大的第一边沿图像作为第二边沿图像；

14、利用边缘检测算子对所述第二边沿图像进行边缘检测，以得到边缘图像；

15、对所述边缘图像进行光栅扫描，当像素点的像素值由第一预设值变为第二预设值时，将像素点的坐标（a，b）进行保存，将像素点（a，b）的其中一个相邻像素点作为起点开始以逆时针方向搜索像素点（a，b）八邻域内的像素点，将像素值首次出现为第二预设值的像素点记为像素点an并存入边缘点集中；

16、以像素点an的其中一个相邻像素点作为起点开始以逆时针方向搜索像素点an八邻域内的像素点，将像素值首次出现为第二预设值的像素点记为像素点an+1并存入边缘点集中，以像素点an+1作为起点进行八邻域搜索直至an+1=（a，b）；

17、将所述边缘点集中的像素点按顺序进行连接，以得到定位区域范围，根据所述定位区域范围的坐标与预设区域的坐标确定第一倾斜角度，基于所述第一倾斜角度对所述处理试卷图像进行角度矫正处理，以得到矫正试卷图像。

18、较佳的，所述采用第二矫正方法对所述处理试卷图像进行角度矫正处理，以得到矫正试卷图像的步骤包括：

19、获取所述处理试卷图像的纹理图，将所述纹理图分为个子纹理图，确定每个所述子纹理图的水平梯度与竖直梯度：

20、；

21、；

22、式中，分别为两个子纹理图中像素点之间的水平距离、竖直数据，为卷积操作，为高斯滤波器的第一平滑系数、第二平滑系数，为处理试卷图像；

23、基于所述子纹理图的水平梯度与竖直梯度确定每个所述子纹理图的倾斜角：

24、；

25、基于所有的所述子纹理图的倾斜角确定若干角度筛选范围，并确定每个所述角度筛选范围内落入的子纹理图数量，将落入的子纹理图数量最多的角度筛选范围作为最终角度筛选范围，计算所述最终角度筛选范围内所有倾斜角的平均值，以得到第二倾斜角度，基于所述第二倾斜角度对所述处理试卷图像进行角度矫正处理，以得到矫正试卷图像。

26、较佳的，所述基于所述矫正试卷图像的试卷类型对所述矫正试卷图像进行答题区域确定，以得到手写区域图像的步骤包括：

27、若所述矫正试卷图像中含有定位点，则采用第一区域确定方法对所述矫正试卷图像进行答题区域确定，以得到手写区域图像；

28、若所述矫正试卷图像中不含有定位点，则采用第二区域确定方法对所述矫正试卷图像进行答题区域确定，以得到手写区域图像。

29、较佳的，所述采用第一区域确定方法对所述矫正试卷图像进行答题区域确定，以得到手写区域图像的步骤包括：

30、从所述矫正试卷图像中提取所有定位点的坐标并按照纵坐标从大至小进行排序，以得到第一定位点序列，将所述第一定位点序列中的第一个定位点放入第二定位点序列中并遍历所述第一定位点序列中的其余定位点，计算其余定位点与第一个定位点之间的横向坐标差值；

31、将横向坐标差值小于预设差值的定位点放入第二定位点序列中，继续选取第一定位点序列中排列在第一位的定本文档来自技高网...

【技术保护点】

1.一种试卷手写内容识别方法，其特征在于，包括：

2.根据权利要求1所述的试卷手写内容识别方法，其特征在于，所述根据所述识别结果确定所述处理试卷图像的试卷类型，并基于所述处理试卷图像的试卷类型对所述处理试卷图像进行角度矫正处理，以得到矫正试卷图像的步骤包括：

3.根据权利要求1所述的试卷手写内容识别方法，其特征在于，所述采用第一矫正方法对所述处理试卷图像进行角度矫正处理，以得到矫正试卷图像的步骤包括：

4.根据权利要求3所述的试卷手写内容识别方法，其特征在于，所述采用第二矫正方法对所述处理试卷图像进行角度矫正处理，以得到矫正试卷图像的步骤包括：

5.根据权利要求1所述的试卷手写内容识别方法，其特征在于，所述基于所述矫正试卷图像的试卷类型对所述矫正试卷图像进行答题区域确定，以得到手写区域图像的步骤包括：

6.根据权利要求5所述的试卷手写内容识别方法，其特征在于，所述采用第一区域确定方法对所述矫正试卷图像进行答题区域确定，以得到手写区域图像的步骤包括：

7.根据权利要求6所述的试卷手写内容识别方法，其特征在于，所

8.根据权利要求1所述的试卷手写内容识别方法，其特征在于，所述对所述手写区域图像进行字符分割处理，以得到手写图像数据的步骤包括：

9.根据权利要求1所述的试卷手写内容识别方法，其特征在于，所述获取训练数据，对所述训练数据进行增强处理，以得到增强训练数据的步骤包括：

10.一种试卷手写内容识别系统，其特征在于，所述系统包括：

...

【技术特征摘要】

1.一种试卷手写内容识别方法，其特征在于，包括：

5.根据权利要求1所述的试卷手写内容识别方法，其特征在于，所述基于所述矫正试卷图像的试卷类型对所述矫正试卷图像进行答题区域...

【专利技术属性】
技术研发人员：郑燕玲，
申请(专利权)人：南昌理工学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人