一种博士与硕士学位论文授权页识别的方法技术

技术编号:33638521 阅读:14 留言:0更新日期:2022-06-02 01:55
本发明专利技术公开了一种博士与硕士学位论文授权页识别的方法,包括:按页抽取电子版学位论文形成待检图像集;按页扫描纸质版学位论文生成待检图像集;将待检图像集送入授权页识别分类器,判断是否存在授权页;若不存在,输出无授权页的结论,若存在,则执行下一步骤;在授权页内检测作者或导师的手写签名;输出授权页自动检测结果。本发明专利技术将自动检测有效授权页转化为图像分类和目标检测问题,采用基于深度卷积网络的图像分类和目标检测技术实现了授权页的自动检测和授权页是否有效的自动判别。自动检测和授权页是否有效的自动判别。自动检测和授权页是否有效的自动判别。

【技术实现步骤摘要】
一种博士与硕士学位论文授权页识别的方法


[0001]本专利技术涉及文档信息自动识别
,尤其涉及一种博硕士学位论文授权页识别的方法。

技术介绍

[0002]博士和硕士学位论文的数字化出版需要论文作者和所在学校的有效授权。在博硕士学位论文的数字化加工过程中,自动检测学位论文是否包含有效的授权页是一项重要的工作。授权页主要来自作者提交的电子版或纸质版学位论文,一个有效的授权页必须包含作者或导师的手写签名。如何从论文中自动检测出授权页以及如何判授权页是否有效,是本文研究的重点。质量欠佳的授权页存在白平衡、偏斜、阴影等问题,这给自动识别有效授权页带来困难。
[0003]近年来随着深度学习技术(Deep Learning)的兴起,深度卷积神经网络(Deep Convolution Neural Network)被广泛应用于图像分类中。深度卷积神经网络的优点在于,它能自动发现样本的特征规律,自动获取目标特征,克服了手动提取特征的效率低、性能低的不足。目标检测(Object Detection)是计算机视觉主要的研究方向,在人脸识别、行人检测、车辆检测、交通标识检测、视频目标检测和医学影像识别等领域有广泛的应用。随着深度学习技术的发展,目标检测取得了重大突破。
[0004]本专利技术针对自动检测有效授权页的难点,将自动检测有效授权页这项任务转化为图像分类和目标检测问题,并采用基于深度卷积网络的图像分类和目标检测技术成功实现了授权页的自动检测和授权页是否有效的自动判别。

技术实现思路

[0005]为解决上述技术问题,本专利技术的目的是提供一种博士与硕士学位论文授权页识别的方法。
[0006]本专利技术的目的通过以下的技术方案来实现:
[0007]一种博士与硕士学位论文授权页识别的方法,包括:
[0008]A、按页抽取电子版学位论文形成待检图像集;
[0009]B、按页扫描纸质版学位论文生成待检图像集;
[0010]C、将待检图像集送入授权页识别分类器,判断是否存在授权页;若不存在,输出无授权页的结论,若存在,则执行步骤D;
[0011]D、在授权页内检测作者或导师的手写签名;若授权页内检测出作者或导师的手写签名,则该授权页视为有效授权页,若授权页内未检测出作者或导师的手写签名,则该授权页视为无效授权页;
[0012]E、输出授权页自动检测结果。
[0013]上述技术方案中,所述待检图像集指的是一本博硕士学位论文的第2页至第10页以及论文的最后5页。
[0014]上述技术方案中,所述授权页识别分类器是一个由深度卷积模型构成的图像分类器;所述图像分类器将待检图像分为三类:授权页、目录页和其他页;所述其他页是指,待检图像中除去授权页和目录页的其他类型的图像页,如:中文摘要页、英文摘要页、论文正文页、参考文献页、致谢页等。
[0015]上述技术方案中,所述在授权页内检测作者或导师的手写签名指的是用一个基于FasterRCNN的目标检测器在授权页内检测作者或导师的手写签名区域;所述基于FasterRCNN的目标检测器的目标块类型包括两种:手写体签名块和印刷体签名块。
[0016]与现有技术相比,本专利技术的一个或多个实施例可以具有如下优点:
[0017]1)本专利技术将判断博硕士学位论文内是否存在授权页转化为一个图像分类问题,用深度学习的思想设计图像分类器,有效提高了授权页识别的准确率;
[0018]2)将判断授权页是否有效视为一个图像目标检测问题,采用基于深度学习的目标检测技术,成功实现了授权页是否有效的自动判别;
[0019]3)本专利技术提供的博硕士学位论文授权页识别的方法,已实际投产使用。在博硕士学位论文数字化加工过程中,该方法既有效降低了授权页检测环节的人工成本,也提高了授权页检测环节的处理速度。
附图说明
[0020]图1是博硕士学位论文授权页识别的流程图;
[0021]图2是授权页样例图;
[0022]图3是手写签名标注样例图。
具体实施方式
[0023]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合实施例及附图对本专利技术作进一步详细的描述。
[0024]如图1所示,为博士与硕士学位论文授权页识别的流程,包括:
[0025]A、按页抽取电子版学位论文形成待检图像集;
[0026]B、按页扫描纸质版学位论文生成待检图像集;
[0027]C、将待检图像集送入授权页识别分类器,判断是否存在授权页;若不存在,输出无授权页的结论,若存在,则执行步骤D;
[0028]D、在授权页内检测作者或导师的手写签名;若授权页内检测出作者或导师的手写签名,则该授权页视为有效授权页,若授权页内未检测出作者或导师的手写签名,则该授权页视为无效授权页;
[0029]E、输出授权页自动检测结果。
[0030]所述A和B中待检图像集指的是博硕士学位论文的第2页至第10页以及论文的最后5页。
[0031]对各类博硕士学位论文的授权页统计分析,授权页分布在前10页或后5页的情况占比99.91%。可见,授权页绝大部分集中在论文的前10页或后5页。学位论文的首页一般是论文题目、作者、导师、学校等信息,因此,将学位论文的第2页至第10页以及论文的最后5页作为待检图像。
[0032]授权页识别分类器是由深度卷积模型构成的图像分类器;图像分类器将待检图像分为三类:授权页、目录页和其他页;其他页是指待检图像中除去授权页和目录页的其他类型的图像页,如:中文摘要页、英文摘要页、论文正文页、参考文献页、致谢页等。
[0033]本实施例使用Pytorch深度学习框架来训练、验证和测试授权页识别分类器。从58237本博硕士学位论文按页抽取(抽取第2页至第10页以及最后5页)获得814984张图,其中,授权页55966张占比6.87%,目录页114352张占比14.03%,其他页644666张占比79.01%。将图像集的70%、10%和20%分别作为训练集、验证集和测试集。训练和测试的实验环境如下,处理器:Intel(R)Core(TM)i7

8700K CPU@3.70GHz,内存(RAM):16.0GB,操作系统:Windows10专业版,64位操作系统,显卡:NVIDIA GeForce GTX 1080Ti,显存:11G;Python:3.7.1,Pytorch:1.7.1,cudatoolkit:10.2.89,cudnn:7.6.5。
[0034]在训练授权页识别分类器时,作者尝试了ResNet50、ResNet34、ResNet18、MobileNetv3_large、MobileNetv3_small等模型。授权页识别分类器的模型选型综合考虑了各模型的识别准确率、召回率和运行速度,以及实际运行的软硬件环境,最终选择MobileNetv3_large。
[0035]在测试集中,授权页识别分类器对授权页的召回率达到99.32%本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种博士与硕士学位论文授权页识别的方法,其特征在于,包括:A、按页抽取电子版学位论文形成待检图像集;B、按页扫描纸质版学位论文生成待检图像集;C、将待检图像集送入授权页识别分类器,判断是否存在授权页;若不存在,输出无授权页的结论,若存在,则执行步骤D;D、在授权页内检测作者或导师的手写签名;若授权页内检测出作者或导师的手写签名,则该授权页视为有效授权页,若授权页内未检测出作者或导师的手写签名,则该授权页视为无效授权页;E、输出授权页自动检测结果。2.如权利要求1所述的博士与硕士学位论文授权页识别的方法,其特征在于,所述A和B中待检图像集指的是博硕士学位论文的第2页至第10页以及论文的最后5页。3.如权利要求1所述的博士与硕士学位论文授权页识别的方法,其特征在于,所述C中授权页识别分类器是由深度卷积模型构成的图像分类器;图像分类器将待检图像分为三类:授权页、目录页和其他页;其他页是指待检图像中除去授权页和目录页的其他类型的图像页。4.如权利要求1所述的博士与硕士学位论文授权页识别的方法,其特征在于,所述D中,授权页内检测作者或导师的手写签名指的是用一个基于FasterRCNN的目标检测器在授权页内检测作者或导师的手写签名区域;基于FasterRCNN的目标检测器的目标块类型包括两种:手写体签名块和印刷体签名块。5.如权利要求1所述的博士与硕士学位论文授权页识别的方法,其特征在于,将所述有效和无效授权页作为数据集,训练和测试基于FasterRCNN的手写签名目标检测器;具体包括:1)对图像进行预处理...

【专利技术属性】
技术研发人员:邹季英袁仁慧刘斌
申请(专利权)人:同方知网北京技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1