一种扫描版文档重排版的方法技术

技术编号：8241678 阅读：215 留言：0更新日期：2013-01-24 22:37

本发明专利技术公开了一种扫描版文档重排版的方法，首先将扫描版文档生成图像，转化为二值图，对二值图进行游程平滑、求取连通域、水平合并和垂直合并，得出文字段落位置，根据获得的图片位置和文字段落位置，确定文档段落区域，计算每个文档段落区域的宽高之比和显示屏幕的宽高之比，判断文档段落区域的宽高之比是否满足预设条件，如果满足则不处理，如果不满足，则拆分成多个的满足预设条件的文档段落区域；确定所有文档段落区域的阅读顺序，并按照顺序提供逐屏阅读。采用了本发明专利技术的技术方案，能够对电子阅读中扫描版文档进行自动分栏，将扫描版文档根据自动划分的区域逐屏显示，减少选择放大区域的频率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及电子阅读
，尤其涉及。
技术介绍
在科学技术日新月异的今天，尤其是伴随着互联网技术的高速发展，人们的阅读习惯不再只局限于传统的纸质出版物阅读，电子阅读已经非常普及并且比重正在逐渐加大。由于电子阅读终端(电子书、手机等)的便携性，人们可以在生活中的碎片时间里进行电子阅读，比如乘坐公交车、地铁时，甚至在排队买票的几分钟时间里也可以进行电子阅读。电子阅读素材的来源多种多样，有些来自电子出版物，有些来自纸质出版物的扫描版本。但是由于电子阅读终端的便携性，必然造成阅读屏幕的尺寸受限。在当前各种电子阅读终端的阅读体验中，对于扫描版文档的阅读非常不方便，如果将书页大小尺寸的扫描图片全部显示在小尺寸屏幕中会觉得字太小；如果采用将扫描图片局部放大的方式阅读，需要频繁地选择放大区域，会影响用户的阅读体验。
技术实现思路
本专利技术的目的在于提出，能够对电子阅读中扫描版文档进行自动分栏，将扫描版文档根据自动划分的区域逐屏显示，减少选择放大区域的频率。为达此目的，本专利技术采用以下技术方案，包括以下步骤 A、将扫描版文档生成图像，转化为二值 B、对二值图进行游程平滑，并对游程平滑处理后的二值图求取连通域，把同值的且连通的一块区域的外接矩形的位置记录下来，作为初始块位置信息； C、将初始块进行水平合并，得出文字的行信息和图片位置，再将水平合并后的块进行垂直合并，得出文字段落位置； D、根据获得的图片位置和文字段落位置，确定文档段落区域； E、计算每个文档段落区域的宽高之比r，计算显示屏幕的宽高之比R； F、如果一个文档段落区域的宽高之比满足以下公...

【技术保护点】
一种扫描版文档重排版的方法，其特征在于，包括以下步骤：A、将扫描版文档生成图像，转化为二值图；B、对二值图进行游程平滑，并对游程平滑处理后的二值图求取连通域，把同值的且连通的一块区域的外接矩形的位置记录下来，作为初始块位置信息；C、将初始块进行水平合并，得出文字的行信息和图片位置，再将水平合并后的块进行垂直合并，得出文字段落位置；D、根据获得的图片位置和文字段落位置，确定文档段落区域；E、计算每个文档段落区域的宽高之比r，计算显示屏幕的宽高之比R；F、如果一个文档段落区域的宽高之比满足以下公式：r∈[R？d1，R+d2]，其中d1和d2为预设的正的常数，则不处理所述文档段落区域，如果不满足，则将所述文档段落区域拆分成不少于2个的满足所述公式的文档段落区域；G、确定所有文档段落区域的阅读顺序，并按照顺序将获得的文档段落区域放大或缩小至需要显示的尺寸，提供逐屏阅读。

【技术特征摘要】

【专利技术属性】
技术研发人员：王毅，
申请(专利权)人：北京多看科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人