一种博士与硕士学位论文授权页识别的方法技术

技术编号：33638521 阅读：26 留言：0更新日期：2022-06-02 01:55

本发明专利技术公开了一种博士与硕士学位论文授权页识别的方法，包括：按页抽取电子版学位论文形成待检图像集；按页扫描纸质版学位论文生成待检图像集；将待检图像集送入授权页识别分类器，判断是否存在授权页；若不存在，输出无授权页的结论，若存在，则执行下一步骤；在授权页内检测作者或导师的手写签名；输出授权页自动检测结果。本发明专利技术将自动检测有效授权页转化为图像分类和目标检测问题，采用基于深度卷积网络的图像分类和目标检测技术实现了授权页的自动检测和授权页是否有效的自动判别。自动检测和授权页是否有效的自动判别。自动检测和授权页是否有效的自动判别。

全部详细技术资料下载

【技术实现步骤摘要】
一种博士与硕士学位论文授权页识别的方法

[0001]本专利技术涉及文档信息自动识别
，尤其涉及一种博硕士学位论文授权页识别的方法。

技术介绍

[0002]博士和硕士学位论文的数字化出版需要论文作者和所在学校的有效授权。在博硕士学位论文的数字化加工过程中，自动检测学位论文是否包含有效的授权页是一项重要的工作。授权页主要来自作者提交的电子版或纸质版学位论文，一个有效的授权页必须包含作者或导师的手写签名。如何从论文中自动检测出授权页以及如何判授权页是否有效，是本文研究的重点。质量欠佳的授权页存在白平衡、偏斜、阴影等问题，这给自动识别有效授权页带来困难。
[0003]近年来随着深度学习技术(Deep Learning)的兴起，深度卷积神经网络(Deep Convolution Neural Network)被广泛应用于图像分类中。深度卷积神经网络的优点在于，它能自动发现样本的特征规律，自动获取目标特征，克服了手动提取特征的效率低、性能低的不足。目标检测(Object Detection)是计算机视觉主要的研究方向，在人脸识别、行人检测、车辆检测、交通标识检测、视频目标检测和医学影像识别等领域有广泛的应用。随着深度学习技术的发展，目标检测取得了重大突破。
[0004]本专利技术针对自动检测有效授权页的难点，将自动检测有效授权页这项任务转化为图像分类和目标检测问题，并采用基于深度卷积网络的图像分类和目标检测技术成功实现了授权页的自动检测和授权页是否有效的自动判别。

技术实现思路

[0005]...

【技术保护点】

【技术特征摘要】
1.一种博士与硕士学位论文授权页识别的方法，其特征在于，包括：A、按页抽取电子版学位论文形成待检图像集；B、按页扫描纸质版学位论文生成待检图像集；C、将待检图像集送入授权页识别分类器，判断是否存在授权页；若不存在，输出无授权页的结论，若存在，则执行步骤D；D、在授权页内检测作者或导师的手写签名；若授权页内检测出作者或导师的手写签名，则该授权页视为有效授权页，若授权页内未检测出作者或导师的手写签名，则该授权页视为无效授权页；E、输出授权页自动检测结果。2.如权利要求1所述的博士与硕士学位论文授权页识别的方法，其特征在于，所述A和B中待检图像集指的是博硕士学位论文的第2页至第10页以及论文的最后5页。3.如权利要求1所述的博士与硕士学位论文授权页识别的方法，其特征在于，所述C中授权页识别分类器是由深度卷积模型构成的图像分类器；图像分类器将待检图像分为三类：授权页、目录页和其他页；其他页是指待检图像中除去授权页和目录页的其他类型的图像页。4.如权利要求1所述的博士与硕士学位论文授权页识别的方法，其特征在于，所述D中，授权页内检测作者或导师的手写签名指的是用一个基于FasterRCNN的目标检测器在授权页内检测作者或导师的手写签名区域；基于FasterRCNN的目标检测器的目标块类型包括两种：手写体签名块和印刷体签名块。5.如权利要求1所述的博士与硕士学位论文授权页识别的方法，其特征在于，将所述有效和无效授权页作为数据集，训练和测试基于FasterRCNN的手写签名目标检测器；具体包括：1)对图像进行预处理...

【专利技术属性】
技术研发人员：邹季英，袁仁慧，刘斌，
申请(专利权)人：同方知网北京技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人