版面还原方法技术

技术编号:2822932 阅读:265 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开一种版面还原方法,包括有以下步骤:图像文件生成步骤,获得待处理文件的源稿,并将所述源稿生成源版面图像文件;背景文件设置步骤,将所述源版面图像文件作为背景文件导入待处理文件版面;还原处理步骤,移动待处理文件中的对象,使所述对象完全覆盖背景文件中对应的源对象。本发明专利技术实现了非常精确的版面还原,并且大大提高了排版速度和排版效率,节省了人力和时间成本。

【技术实现步骤摘要】

本专利技术涉及排版技术,尤其涉及一种。
技术介绍
近年来,各种平面媒体(如报纸、杂志、书籍等)均投入大量的人力 物力进行数字化的工作,以互联网为主的新媒体是各种平面媒体内容发布的主要途径,在互联网上,PDF文件已成为媒体发布的主要文件格式。为了把历史数据真实呈现到读者的眼前, 一般的平面媒体都需要将原 来的版面进行还原,即按照原来的报纸或书本的样子重现,使读者看到的 电子数据与报纸或书本一模一样。目前版面还原的方法主要有三种1)对照原报或书籍进行排版;2) 一是通过Adobe公司的Acrobat软件直接对PDF文件进行排版,可以随意 调整PDF版面中的任意对象;3)通过Acrobat或DjVu生成工具直接从图 像中对文字进行识别,然后输出为版面文件。目前版面还原的方法均有不同的缺点,,1)是利用通用排版软件,对 照原报纸、书籍等纸质媒体,或都将纸质媒体扫描到电脑中,根据图像进 行排版,将排版结果通过PDF虚拟机打印成PDF文件,或者输出到其它 文件格式,这种方法最大的缺点是文字的位置及字体不准确,不能做到与 原来的纸质媒体一致的效果;2)通过Acrobat软件排版,直接对文字对象 进行调整,这种方法的缺点也是文字的位置不准确,同时速度太慢,不适 合做大量数据的加工;3)通过Acrobat或DjVu生成工具直接从图像中对 文字进行识别,然后输出为版面文件的方法速度快,坐标准确,它的缺点 是无法进行人工调整,对于一些有底纹或彩色的图像识别率差,文字正确 率太低。
技术实现思路
本专利技术所要解决的技术问题是提供一种,该方法可实现 非常精确的版面还原,且大大提高排版速度和排版效率。为解决上述技术问题,本专利技术采用如下技术方案 一种,包括有以下步骤图像文件生成步骤,获得待处理文件的源稿,并将所述源稿生成源版面 图像文件;背景文件设置步骤,将所述源版面图像文件作为背景文件导入待处理文 件版面;还原处理步骤,移动待处理文件中的对象,使所述对象完全覆盖所述背 景文件中对应的源对象。 本专利技术的有益效果是本专利技术的实施例通过将源稿导入版面背景中提供准确的参考基准,从而 实现了非常精确的版面还原,并且大大提高了排版速度和排版效率,节省了 人力和时间成本。下面结合附图对本专利技术作进一步的详细描述。附图说明图1是本专利技术提供的一个实施例的方法流程图。图2是本专利技术提供的一个实施例中步骤S03的示意图。图3是本专利技术提供的一个实施例中源稿图像文件的示意图。图4是本专利技术提供的一个实施例中待处理文件的示意图。 图5是是本专利技术提供的一个实施例中步骤S03的效果示意图。图6和图7是本专利技术提供的一个实施例中步骤S04的示意图b具体实施方式下面参考图1详细描述本专利技术的一个实施例,如图1所示,本实施例的 一次版面还原处理过程包括有以下步骤在步骤SOl,即图像文件生成步骤中,获取待处理文件的源稿,并将所 述源稿生成源版面图像文件,具体实现时, 一般通过将纸质媒体扫描到电脑 中获取待处理文件的源稿。在步骤S02,即源对象信息获取步骤中,获得源版面图像文件中源对象, (包括文字或图片等)的坐标信息,具体实现时,可通过画框、切分、识别 等流程获得所述源对象及其坐标信息。参考图2,在步骤S03,即背景文件设置步骤中,将所述源版面图像文件 作为背景文件导入待处理文件版面,而图3和图4分别是源版面图像文件、 待处理文件版面的示意图;其导入后的效果则如图5所示。在步骤S04,即还原处理步骤中,移动待处理文件的对象(与所述源对 象对应地,包括文字或图片等),使所述对象完全覆盖背景文件中对应的源对 象,具体实现时,可采取以下两种方法对所述对象进行处理1) 将所述待处理文件的对象移动到其对应的源对象所在的坐标位置上, 通过坐标的重合达到对象和源对象重合的效果;2) 参考图6和图7,使用鼠标选中需要调整的对象,通过鼠标拖拉或键 盘移动对文字进行细微调整,使其完全覆盖作为背景的源对象。在步骤S05,即版面输出步骤中,利用虚拟打印机将调整后的待处理文 件和背景文件以PDF文件格式或其它文件格式输出,具体实现时,其输出文 件的格式与所述虚拟打印机能输出的文件格式对应。本专利技术可非常准确地将纸质媒转化为电子媒体,并大大提髙纸质媒体数 字化的效率,可节省大量人力、财力。以一家平均水平的国内中型报社为例,从建国以来,五十多年报纸总量 约为十万版左右,如果采用传统的方法,手工录入加上排版, 一个人一天l 2版,以2版计算,总共需要181人年,按照每人每年的工作日为276天计 算,即需要181个人处理1年才可以完成十万版报纸的数字化还原工作;而 采用本专利技术,平均1个人一天可以处理15版左右,完成十万版报纸仅需要 24人年。.以上所述是本专利技术的优选实施方式,应当指出,对于本
的普通 技术人员来说,在不脱离本专利技术原理的前提下,还可以做出若干改进和润饰, 这些改进和润饰也视为本专利技术的保护范围。权利要求1、一种,其特征在于,包括有以下步骤图像文件生成步骤,获得待处理文件的源稿,并将所述源稿生成源版面图像文件;背景文件设置步骤,将所述源版面图像文件作为背景文件导入待处理文件版面;还原处理步骤,移动待处理文件中的对象,使所述对象完全覆盖所述背景文件中对应的源对象。2、 如权利要求1所述的,其特征在于,所述背景文件设置 步骤之前还包括有源对象信息获取步骤,获取源版面图像文件中源对象的坐标信息; 在所述还原处理步骤中,通过将所述待处理文件的对象移动到其对应的 源对象所在的坐标位置上,使所述对象完全覆盖其对应的源对象。3、 如权利要求1或2所述的,其特征在于,所述待处理文 件为可读写文件。4、 如权利要求3所述的,-其特征在于,所述源稿图像文件 为只读文件。5、 如权利要求1所述的,其特征在于,在所述还原处理步 骤之后还包括有版面输出步骤,利用虚拟打印机将调整后的待处理文件和背景文件输出。全文摘要本专利技术公开一种,包括有以下步骤图像文件生成步骤,获得待处理文件的源稿,并将所述源稿生成源版面图像文件;背景文件设置步骤,将所述源版面图像文件作为背景文件导入待处理文件版面;还原处理步骤,移动待处理文件中的对象,使所述对象完全覆盖背景文件中对应的源对象。本专利技术实现了非常精确的版面还原,并且大大提高了排版速度和排版效率,节省了人力和时间成本。文档编号G06F17/25GK101308491SQ20081006813公开日2008年11月19日 申请日期2008年6月27日 优先权日2008年6月27日专利技术者张玉志 申请人:深圳市点通数据有限公司本文档来自技高网
...

【技术保护点】
一种版面还原方法,其特征在于,包括有以下步骤:    图像文件生成步骤,获得待处理文件的源稿,并将所述源稿生成源版面图像文件;    背景文件设置步骤,将所述源版面图像文件作为背景文件导入待处理文件版面;    还原处理步骤,移动待处理文件中的对象,使所述对象完全覆盖所述背景文件中对应的源对象。

【技术特征摘要】

【专利技术属性】
技术研发人员:张玉志
申请(专利权)人:深圳市点通数据有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1