本发明专利技术公开了一种基于原始文档的排版处理方法及装置,包括步骤B:判断第X个字符是否是换行符;第X个字符不是换行符,则运行步骤B1;第X个字符是换行符,则运行步骤C;步骤C:判断第X-1个字符是否是段落结束符:第X-1个字符不是段落结束符,则运行步骤C1;第X-1个字符是段落结束符,则进行步骤D;步骤B1、C1和步骤D:判断第X个字符是否是原始文档的最后一个字符,并根据情况进行相应处理。本发明专利技术的基于原始文档的排版处理方法及装置有益效果在于,将原始文档的多余的换行符予以删除,去掉了原始文档中多余的空行以及不必要的换行;为段落增加段落首格式;使文档段落清晰,并提高了文档的美观性和连贯性,使文档更加符合人们的阅读习惯。
【技术实现步骤摘要】
本专利技术涉及文档的排版处理领域,尤其涉及基于原始文档的排版处理方法及装置。
技术介绍
目前,很多原始文档为了适应不同的阅读、出版或流通方式(包括如电子阅读设备,阅读软件以及纸质出版物等),在编辑时附帯了很多换行符,给读者或使用者带来了不便;例如从网络上下载的电子书,为了适应个人电脑屏幕的大小,经常包含多余的换行符,当这样的电子书应用到手持设备上或者别的阅读器上阅读时,就会出现不符合阅读习惯的情况,具体表现为每屏幕显示的内容不对齐,由于太多的换行,导致每屏幕显示的内 容太少,段落首没有特效。
技术实现思路
本专利技术目的在于提供一种基于原始文档的排版处理方法及装置,用以解决由于换行符而导致的段落不清晰,不连贯的问题;并使经过排版处理的文档更加美观,符合人们的阅读习惯。为达到上述目的,本专利技术通过下述技术方案实现一种基于原始文档的排版处理方法,包括以下步骤步骤A :将识别到的原始文档的字符按照先后顺序进行编号,用第I个字符,第2个字符,...,第N个字符表示;其中N为自然数;步骤B :读取第X个字符,判断第X个字符是否是换行符;其中,X是字符在步骤A中的编号;如果第X个字符不是换行符,则运行步骤BI ;如果第X个字符是换行符,则运行步骤C ;步骤BI :判断第X个字符是否是原始文档的最后一个字符;如果第X个字符是最后ー个字符,则结束排版处理;如果第X个字符不是最后一个字符则X = X+1,返回步骤B ;步骤C :读取第X-I个字符,判断第X-I个字符是否是段落结束符;如果第X-I个字符不是段落结束符,则运行步骤Cl ;如果第X-I个字符是段落结束符,则进行步骤D ;步骤Cl :判断第X个字符是否是原始文档的最后一个字符;如果第X个字符是最后一个字符则删除换行符,结束排版处理;如果第X个字符不是最后一个字符则删除换行符,X = X+1,返回步骤B ;步骤D :判断第X个字符是否是原始文档的最后一个字符;如果第X个字符是最后ー个字符,则删除换行符,结束排版处理;如果第X个字符不是最后一个字符则删除换行符,为第X+1个字符増加段落首格式,X = X+1,返回步骤B。ー种对原始文档进行排版处理的装置,包括编号模块,用于将识别出的原始文档的字符按照先后顺序进行编号,用第I个字符,第2个字符,...,第N个字符表示;其中N为自然数;读取模块,用于读取编号后的字符;换行符判断模块,用于判断读取模块读取的第X个字符是否是换行符;其中,X是字符的编号;最后ー个字符判断模块,用于判断读取模块读取的第X个字符是否是原始文档的最后一个字符;段落结束符判断模块,用于判断读取模块读取的第X-I个字符是否是段落结束符; 中央处理模块,用于对编号模块,读取模块,换行符判断模块,最后一个字符判断模块和段落结束符判断模块进行控制。本专利技术的基于原始文档的排版处理方法及装置有益效果在于,将原始文档中的多余的换行符予以删除,去掉了原始文档中多余的空行以及不必要的换行;并为段落増加段落首格式;这样,使文档段落清晰,并提高了文档的美观性和连贯性,使文档更加符合人们的阅读习惯。附图说明图I是本专利技术的基于原始文档的排版处理方法的流程图;图2A是本专利技术的原始文档的示意图;图2B是本专利技术的基于原始文档的排版处理方法将图2A所示原始文档进行部分排版处通后的不意图;图2C是本专利技术的基于原始文档的排版处理方法将图2A所示原始文档进行全部排版处理后的示意图。具体实施例方式为使本专利技术基于原始文档的排版处理方法及装置的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术做进ー步详细说明;以下所描述的具体实施例仅用于说明本专利技术,但不用来限定本专利技术的范围。实施例一本专利技术的基于原始文档的排版处理方法,如图I所示,包括以下步骤步骤A :将识别到的原始文档的字符按照先后顺序进行编号,用第I个字符,第2个字符,...,第N个字符表示;其中N为自然数;步骤B :读取第X个字符,判断第X个字符是否是换行符;其中,X是字符在步骤A中的编号;如果第X个字符不是换行符,则运行步骤BI ;如果第X个字符是换行符,则运行步骤C ;步骤BI :判断第X个字符是否是原始文档的最后一个字符;如果第X个字符是最后ー个字符,则结束排版处理;如果第X个字符不是最后一个字符则X = X+1,返回步骤B ;步骤C :读取第X-I个字符,判断第X-I个字符是否是段落结束符;如果第X-I个字符不是段落结束符,则运行步骤Cl ;如果第X-I个字符是段落结束符,则进行步骤D ;步骤Cl :判断第X个字符是否是原始文档的最后一个字符;如果第X个字符是最后一个字符则删除换行符,结束排版处理;如果第X个字符不是最后一个字符则删除换行符,X = X+1,返回步骤B ;步骤D :判断第X个字符是否是原始文档的最后一个字符; 如果第X个字符是最后ー个字符,则删除换行符,结束排版处理;如果第X个字符不是最后一个字符则删除换行符,为第X+1个字符増加段落首格式,X =X+1,返回步骤B。优选的,在步骤B中,所述判断第X个字符是否是换行符,包括以下步骤步骤B2 :判断第X个字符是否是预先设置的换行符集合中的ー种换行符;步骤B21 :在换行符集合中查找第X个字符如果第X个字符存在于换行符集合内,则第X个字符是换行符;如果第X个字符不存在于换行符集合内,则第X个字符不是换行符。其中,换行符集合的设置方法是设置换行符集合,将所有的换行符増加到换行符集合内。优选的,在步骤BI,步骤Cl和步骤D中,判断第X个字符是否是原始文档的最后ー个字符,包括以下步骤步骤E :判断X是否等于N 如果X = N,则第X个字符是原始文档的最后ー个字符;如果XデN,则第X个字符不是原始文档的最后ー个字符。优选的,在步骤C中,所述判断第X-I个字符是否是段落结束符,包括以下步骤步骤C2 :判断第X-I个字符是否是预先设置的段落结束符集合中的ー种段落结束符;步骤C21 :在段落结束符集合中查找第X-I个字符如果第X-I个字符存在于段落结束符集合内,则第X-I个字符是段落结束符;如果第X-I个字符不存在于段落结束符集合内,则第X-I个字符不是段落结束符。其中,段落结束符集合的设置方法是设置段落结束符集合,将所有的段落结束符増加到段落结束符集合内。优选的,在步骤D中,所述段落首格式包括缩进,首字符大写。下面结合对图2A所示的原始文档进行排版处理的例子对基于原始文档的排版处理方法进行说明步骤A :将识别到的图2A所示的原始文档的字符按照先后顺序进行编号,其中,“第一章、大会天下”中“第”字为第I个字符,“一”字为第2个字符,,“下”字为第8个字符,...,以此类推;步骤B:读取第I个字符(第),判断第I个字符(第)是否是换行符;第I个字符(第)不是换行符,则运行步骤BI ;步骤BI :判断第I个字符(第)是否是原始文档的最后一个字符;第I个字符(第)不是最后一个字符则X = X+1 = 2,返回步骤B ;...步骤B :读取第9个字符(」回车符),判断第9个字符(」回车符)是否是换行符;第9个字符(」回车符)不是换行符,则运行步骤BI ;步骤BI :判断第9个字符(」回车符)是否是原始文档的最后一个字符;第9个字 符(」回车符)不是最后一个字符则X = x+1本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于原始文档的排版处理方法,其特征在于,包括以下步骤 步骤A :将识别到的原始文档的字符按照先后顺序进行编号,用第I个字符,第2个字符,...,第N个字符表示;其中N为自然数; 步骤B :读取第X个字符,判断第X个字符是否是换行符;其中,X是字符在步骤A中的编号; 如果第X个字符不是换行符,则运行步骤BI ; 如果第X个字符是换行符,则运行步骤C ; 步骤BI :判断第X个字符是否是原始文档的最后一个字符; 如果第X个字符是最后ー个字符,则结束排版处理; 如果第X个字符不是最后一个字符则X = X+1,返回步骤B ; 步骤C :读取第X-I个字符,判断第X-I个字符是否是段落结束符; 如果第X-I个字符不是段落结束符,则运行步骤Cl ; 如果第X-I个字符是段落结束符,则进行步骤D ; 步骤Cl :判断第X个字符是否是原始文档的最后一个字符; 如果第X个字符是最后一个字符则删除换行符,结束排版处理; 如果第X个字符不是最后一个字符则删除换行符,X = X+1,返回步骤B ; 步骤D :判断第X个字符是否是原始文档的最后一个字符; 如果第X个字符是最后ー个字符,则删除换行符,结束排版处理; 如果第X个字符不是最后一个字符则删除换行符,为第X+1个字符増加段落首格式,X = X+1,返回步骤B。2.根据权利要求I所述的基于原始文档的排版处理方法,其特征在于 在步骤B中,所述判断第X个字符是否是换行符,包括以下步骤 步骤B2 :判断第X个字符是否是预先设置的换行符集合中的ー种换行符; 步骤B21 :在换行符集合中查找第X个字符 如果第X个字符存在于换行符集合内,则第X个字符是换行符; 如果第X个字符不存在于换行符集合内,则第X个字符不是换行符。3.根据权利要求I所述的基于原始文档的排版处理方法,其特征在于 在步骤BI,步骤Cl和步骤D中,判断第X个字符是否是原始文档的最后ー个字符,包括以下步骤 步骤E :判断X是否等于N: 如果X = N,则第X个字符是原始文档的最后一个字符; 如果XデN,则第X个字符不是原始文档的最后ー个字符。4.根据权利要求I所述的基于原始文档的排版处理方法,其特征在于 在步骤C中,所述判断第X-I个字符是否是段落结束符,包括以下步骤 步骤C2 :判断第X-I个字符是否是预先设置的段落结束符集合中的ー种段落结束符; 步骤C21 :在段落结束符集合中查找第X-I个字符 如果第X-I个字符存在于段落结束符集合内,则第X-I个字符是段落结束符; 如果第X-I个字符不存在于段落结束符集合内,则第X-I个字符不是段落结束符。5.根据权利要求I所述的基于原始文档的排版处理方法,其特征在于在步骤D中,所述段落首格式包括缩进,首字符大写。6.ー种对原始文档进行排版处理的装置,其特征在于 包括编号模块,用于将识别出的原始文档的字符按照先后顺序进行编号,用第I个字符,第2个字符,...,第N个字符表示;其中N为自然数; 读取模块,用于读取编号后的字符; 换行符判断模块,用于判...
【专利技术属性】
技术研发人员:张恭继,
申请(专利权)人:珠海全志科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。