一种文献版面区域检测分割的方法技术

技术编号:24093099 阅读:37 留言:0更新日期:2020-05-09 08:59
本发明专利技术提供的一种文献版面区域检测分割的方法,通过获取文献图片,并建立训练数据集;创建第一检测模型,并通过所述训练数据集对所述第一检测模型进行训练,得到训练好的第二检测模型;根据所述第二检测模型对待检测分割的文献图片进行检测分割,能够实现文献图片自动化检测分割,且准确度高。

A method of document layout area detection and segmentation

【技术实现步骤摘要】
一种文献版面区域检测分割的方法
本专利技术涉及图像检测
,特别涉及一种文献版面区域检测分割的方法。
技术介绍
目前OCR技术通常先识别整个图片中的所有文字,然后分析内容,提取有用信息。在对文献利用OCR技术进行数字化,制作成电子书时,不仅要利用OCR技术检测识别文字,还需要遵循原书的排版,为此需确定版面中的有效内容区域、边框(如黑框)内区域、页眉页脚等。由于不同文献版面的多样性,很难用规则化方式分割版面,目前还没有相应的技术实现版面自动分割。因此,需要一种文献版面区域检测分割的方法,能够实现文献图片自动化检测分割,且准确度高。
技术实现思路
(一)要解决的技术问题为了解决现有技术的上述问题,本专利技术提供一种文献版面区域检测分割的方法,能够实现文献图片自动化检测分割,且准确度高。(二)技术方案为了达到上述目的,本专利技术采用的主要技术方案包括:一种文献版面区域检测分割的方法,包括步骤:S1、获取文献图片,并建立训练数据集;S2、创建第一检测模型,并通过所述训练数据集对所述第一检测模型进行训练,得到训练好的第二检测模型;S3、根据所述第二检测模型对待检测分割的文献图片进行检测分割。(三)有益效果本专利技术的有益效果在于:通过获取文献图片,并建立训练数据集;创建第一检测模型,并通过所述训练数据集对所述第一检测模型进行训练,得到训练好的第二检测模型;根据所述第二检测模型对待检测分割的文献图片进行检测分割,能够实现文献图片自动化检测分割,且准确度高。附图说明图1为本专利技术实施例的文献版面区域检测分割的方法流程图。具体实施方式为了更好的解释本专利技术,以便于理解,下面结合附图,通过具体实施方式,对本专利技术作详细描述。一种文献版面区域检测分割的方法,其特征在于,包括步骤:S1、获取文献图片,并建立训练数据集;S2、创建第一检测模型,并通过所述训练数据集对所述第一检测模型进行训练,得到训练好的第二检测模型;S3、根据所述第二检测模型对待检测分割的文献图片进行检测分割。从上述描述可知,通过获取文献图片,并建立训练数据集;创建第一检测模型,并通过所述训练数据集对所述第一检测模型进行训练,得到训练好的第二检测模型;根据所述第二检测模型对待检测分割的文献图片进行检测分割,能够实现文献图片自动化检测分割,且准确度高。进一步地,步骤S1具体为:获取不同版式的文献图片,并建立第一检测数据集。进一步地,步骤S1还包括:对所述第一检测数据集中的图片进行标记,得到第二检测数据集。由上述描述可知,通过获取不同版式的文献图片,并对所述第一检测数据集中的图片进行标记,得到第二检测数据集,提高了后续检测分割的准确度。进一步地,步骤S2具体为:创建第一神经网络YOLOV3检测模型,并通过所述训练数据集对所述第一神经网络YOLOV3检测模型进行训练,得到训练好的第二神经网络YOLOV3检测模型。由上述描述可知,通过创建第一神经网络YOLOV3检测模型,并通过所述训练数据集对所述第一神经网络YOLOV3检测模型进行训练,得到训练好的第二神经网络YOLOV3检测模型,提高了检测分割的效率和准确度。进一步地,所述的通过所述训练数据集对所述第一神经网络YOLOV3检测模型进行训练具体为:通过所述第二检测数据集对所述第一神经网络YOLOV3检测模型进行训练。由上述描述可知,通过所述第二检测数据集对所述第一神经网络YOLOV3检测模型进行训练,保证了训练好的模型的检测分割的准确度。进一步地,步骤S3具体为:根据所述第二神经网络YOLOV3检测模型对待检测分割的文献图片进行检测分割。由上述描述可知,通过根据所述第二神经网络YOLOV3检测模型对待检测分割的文献图片进行检测分割,提高了文献图片检测分割的准确度和效率。进一步地,所述的根据所述第二检测模型对待检测分割的文献图片进行检测分割之前还包括:对待检测分割的文献图片进行标准化处理。由上述描述可知,通过对待检测分割的文献图片进行标准化处理,便于提高检测分割的准确度。实施例一请参照图1,一种文献版面区域检测分割的方法,其特征在于,包括步骤:S1、获取文献图片,并建立训练数据集;步骤S1具体为:获取不同版式的文献图片,并建立第一检测数据集。步骤S1还包括:对所述第一检测数据集中的图片进行标记,得到第二检测数据集。S2、创建第一检测模型,并通过所述训练数据集对所述第一检测模型进行训练,得到训练好的第二检测模型;步骤S2具体为:创建第一神经网络YOLOV3检测模型,并通过所述训练数据集对所述第一神经网络YOLOV3检测模型进行训练,得到训练好的第二神经网络YOLOV3检测模型。所述的通过所述训练数据集对所述第一神经网络YOLOV3检测模型进行训练具体为:通过所述第二检测数据集对所述第一神经网络YOLOV3检测模型进行训练。S3、根据所述第二检测模型对待检测分割的文献图片进行检测分割。步骤S3具体为:根据所述第二神经网络YOLOV3检测模型对待检测分割的文献图片进行检测分割。所述的根据所述第二检测模型对待检测分割的文献图片进行检测分割之前还包括:对待检测分割的文献图片进行标准化处理。实施例二本实施例和实施例一的区别在于本实施例将结合具体的应用场景进一步说明本专利技术上述文献版面区域检测分割的方法是如何实现的:一、收集数据获取文献图片,并建立训练数据集;获取不同版式的文献图片,并建立第一检测数据集。具体地,根据业务需求收集各种板式的文献图片,进行数据分析和整理。图片尽量多,版式尽量多,数据量在几万张这个数量级。二、标记数据对所述第一检测数据集中的图片进行标记,得到第二检测数据集。具体地,利用标注工具,对每一张图片都采用人工分割版面区域的方式进行标记,把图片版面各区域的坐标都记入TXT文件中,作为这张图片的区域标签,一张图片一个标签文件。具体标签文件内容格式如下:X1,Y1,X2,Y2表1标签文件内容说明表三、训练模型创建第一神经网络YOLOV3检测模型,并通过所述训练数据集对所述第一神经网络YOLOV3检测模型进行训练,得到训练好的第二神经网络YOLOV3检测模型。建立YOLOV3框架,采用105层的结构,其中主要超参数定义,采用darknet-53特征提取模块和yolo网络的特征交互层。darknet-53:从第0层一直到74层,一共有53个卷积层,其余为res层。卷积层用于提取图像特征,res层为了解决网络的梯度弥散或者梯度爆炸的现象。作为YOLOV3特征提取的主要网络结构。该结构使用一系列的3本文档来自技高网...

【技术保护点】
1.一种文献版面区域检测分割的方法,其特征在于,包括步骤:/nS1、获取文献图片,并建立训练数据集;/nS2、创建第一检测模型,并通过所述训练数据集对所述第一检测模型进行训练,得到训练好的第二检测模型;/nS3、根据所述第二检测模型对待检测分割的文献图片进行检测分割。/n

【技术特征摘要】
1.一种文献版面区域检测分割的方法,其特征在于,包括步骤:
S1、获取文献图片,并建立训练数据集;
S2、创建第一检测模型,并通过所述训练数据集对所述第一检测模型进行训练,得到训练好的第二检测模型;
S3、根据所述第二检测模型对待检测分割的文献图片进行检测分割。


2.根据权利要求1所述的文献版面区域检测分割的方法,其特征在于,步骤S1具体为:
获取不同版式的文献图片,并建立第一检测数据集。


3.根据权利要求2所述的文献版面区域检测分割的方法,其特征在于,步骤S1还包括:
对所述第一检测数据集中的图片进行标记,得到第二检测数据集。


4.根据权利要求1所述的文献版面区域检测分割的方法,其特征在于,步骤S2具体为:
创建第一神经网络YOLOV3检测模...

【专利技术属性】
技术研发人员:张雄
申请(专利权)人:福建两岸信息技术有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1