文章排版方法、设备、可编程设备及文章发布平台技术

技术编号:15391525 阅读:71 留言:0更新日期:2017-05-19 04:48
本发明专利技术公开了一种文章排版方法、设备、可编程设备以及文章发布平台。该文章排版方法包括:响应于目标文章的排版请求,清除目标文章中包含的特定格式符,得到预处理文本;清除预处理文本中包含的冗余的换行符,得到中间文本;对中间文本设置排版格式符,得到符合预定排版格式的排版文本。根据本发明专利技术,可以不必分别针对待排版的文章可能会出现的各种排版错误进行检测并做相应的处理,而是通过统一的排版技术方案获取符合需求的排版文本,实现复杂度低并且响应速度快。

Article typesetting method, apparatus, programmable device and article publishing platform

The invention discloses an article typesetting method, an apparatus, a programmable device and an article publishing platform. Including the article publishing methods: in response to the goal of the article typesetting requests, clear the specific format containing the target in the match, text preprocessing; redundant contains preprocessing in the text by a newline, intermediate text format of intermediate text; set match, can meet the predetermined format of the text layout. According to the invention, various typographical errors can be respectively typesetting articles may according to the detection and make corresponding treatment, but by typesetting the unified plan to get to meet the needs of the text layout, to achieve low complexity and fast response speed.

【技术实现步骤摘要】
文章排版方法、设备、可编程设备及文章发布平台
本专利技术涉及电子阅读
,更具体地,涉及一种文章排版方法、设备及可编程设备。
技术介绍
随著计算机技术以及互联网技术的迅速发展,电子阅读的迅速崛起,人们更喜欢在手机里阅读新闻、小说、文章等等,网络文学也随之蓬勃发展,大量网络作者通过各大网络文章发布平台(例如文学网站、小说网站等)发布自己创作的网络文章,供网站访问者阅读,极大地丰富了用户的电子阅读体验。但是,由于网络作者群体鱼龙混杂,文化水平高低不一,良莠不齐,很多作者直接写出的文章内容由于格式混乱、乱用标点、出现敏感内容、错别字泛滥、段落层次不清等原因,是没法直接发布在网络上的。各个网络文章发布平台,都会设立编辑部门通过编辑人员对要发布到网络上的文章进行审核、排版、纠错、去除敏感内容等工作,这类工作繁琐、冗余、重复、枯燥,消耗大量公司人力和资金成本并且审核过程中也很容易出错,效率低下。目前的一些网络文章发布平台上,对网络作者需要发布文章,提供自动排版的功能(例如一键排版功能),但通常需要网络文章发布平台的开发者们,针对成百上千的文本错误格式针对性的逐一进行编程和修复,每一种错误情况都要编写一种对应的策略代码,因此实现的算法非常的复杂和庞大,算法执行效率低下,随着错误的情况变多,也会使得代码到后期很难维护,并且由于错误情况很难考虑周全,会存在遗漏某些少见的极端格式错误的情况,从而造成对哪些极端的格式错误没法进行修复。此外,对于动辄几十万字的网络文章,通过目前的自动排版方案进行排版,由于算法复杂且庞大,响应速度非常慢,影响用户体验,相应地,需要消耗较多的处理资源,也增加了实施自动排版方案的中央后端服务器的压力。因此,专利技术人认为,有必要针对上述现有技术中存在的问题进行改进。
技术实现思路
本专利技术的一个目的是提供一种用于文章排版的新技术方案。根据本专利技术的第一方面,提供了一种文章排版方法,包括:响应于目标文章的排版请求,清除所述目标文章中包含的特定格式符,得到预处理文本,所述特定格式符中至少包括空格符、缩进符以及回车符;清除所述预处理文本中包含的冗余的换行符,得到中间文本;对所述中间文本设置排版格式符,得到符合预定排版格式的排版文本,其中,所述排版格式符至少包括预定的占位符。可选地,所述预定排版格式为每段首行缩进两个字符位且段落间隔为一行,所述排版格式符包括所述占位符、所述换行符以及所述缩进符,所述对所述中间文本设置排版格式符,得到符合预定排版格式的排版文本的步骤包括:对所述中间文本中包含的单个换行符,执行字符替换步骤以替换为两个连续的换行符以及两个连续的占位符;对所述占位符,执行字符替换步骤以替换为所述缩进符,得到所述排版文本。可选地,所述清除目标文章中包含的特定格式符,得到预处理文本的为:对所述目标文章中包含的所述特定格式符,执行字符替换步骤以替换为空字符,得到预处理文本。可选地,所述清除所述预处理文本中包含的冗余的换行符,得到中间文本的步骤为:对所述预处理文本中包含的换行符,重复执行预定次数的字符替换步骤,以实现将多个连续的换行符替换为单个换行符,得到所述中间文本。可选地,所述特定格式符中还包括所述占位符。可选地,所述字符替换步骤,通过JavaScript的str.replace()函数执行。根据本专利技术的第二方面,提供一种文章排版设备,包括:预处理单元,用于响应于目标文章的排版请求,清除目标文章的文本中包含的特定格式符,得到预处理文本,所述特定格式符中至少包括空格符、缩进符以及回车符;中间处理单元,用于清除所述预处理文本中包含的冗余的换行符,得到中间文本;排版设置单元,用于对所述中间文本设置排版格式符,得到符合预定排版格式的排版文本,其中,所述排版格式符至少包括预定的占位符。可选地,所述预定排版格式为每段首行缩进两个字符位且段落间隔为一行,所述排版格式符包括所述占位符、所述换行符以及所述缩进符,所述排版设置单元包括:用于对所述中间文本中包含的单个换行符,执行字符替换步骤以替换为两个连续的换行符以及两个连续的占位符的装置;以及用于对所述占位符,执行字符替换步骤以替换为所述缩进符,得到所述排版文本的装置。可选地,所述预处理单元,用于对所述目标文章中包含的所述特定格式符,执行字符替换步骤以替换为空字符,得到预处理文本。可选地,所述中间处理单元,用于对所述预处理文本中包含的换行符,重复执行预定次数的字符替换步骤,以实现将所述多个连续的换行符替换为单个换行符,得到所述中间文本。根据本专利技术的第三方面,提供一种可编程设备,其特征在于,包括存储器和处理器,其中,所述存储器用于存储指令,所述指令用于控制所述处理器进行操作以执行本专利技术的第一方面的任意一项的文章排版方法。根据本专利技术的第三方面,提供一种文章发布平台,包括根据本专利技术第二方面的任意一项文章排版设备。本专利技术的专利技术人发现,在现有技术中,尚未存在一种文章排版方法、设备、可编程设备以及文章发布平台,可以不必分别针对待排版的文章可能会出现的各种排版错误进行检测并做相应的处理,而是通过统一的排版技术方案获取符合需求的排版文本,实现复杂度低并且响应速度快。因此,本专利技术所要实现的技术任务或者所要解决的技术问题是本领域技术人员从未想到的或者没有预期到的,故本专利技术是一种新的技术方案。通过以下参照附图对本专利技术的示例性实施例的详细描述,本专利技术的其它特征及其优点将会变得清楚。附图说明被结合在说明书中并构成说明书的一部分的附图示出了本专利技术的实施例,并且连同其说明一起用于解释本专利技术的原理。图1是显示可用于实现本专利技术的实施例的计算系统的硬件配置的例子的框图。图2示出了本专利技术实施例中文章排版方法的流程图。图3是本专利技术实施例中文章排版方法的例子的目标文章的示意图。图4示出了本专利技术实施例中文章排版方法的例子的流程图。图5是本专利技术实施例中文章排版方法的例子的预处理文本的示意图。图6是本专利技术实施例中文章排版方法的例子的中间文本的示意图。图7是本专利技术实施例中文章排版方法的例子的排版处理的示意图。图8是本专利技术实施例中文章排版方法的例子的排版文本的示意图。图9示出了本专利技术实施例中文章排版设备的示意性框图。具体实施方式现在将参照附图来详细描述本专利技术的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本专利技术的范围。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本专利技术及其应用或使用的任何限制。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。<硬件配置>图1是示出可以实现本专利技术的实施例的计算机系统1000的硬件配置的框图。如图1所示,计算机系统1000包括计算机1110。计算机1110包括经由系统总线1121连接的处理器1120、存储器1130、固定非易失性存储器接口1140、移动非易失性存本文档来自技高网
...
文章排版方法、设备、可编程设备及文章发布平台

【技术保护点】
一种文章排版方法,其特征在于,包括:响应于目标文章的排版请求,清除所述目标文章中包含的特定格式符,得到预处理文本,所述特定格式符中至少包括空格符、缩进符以及回车符;清除所述预处理文本中包含的冗余的换行符,得到中间文本;对所述中间文本设置排版格式符,得到符合预定排版格式的排版文本,其中,所述排版格式符至少包括预定的占位符。

【技术特征摘要】
1.一种文章排版方法,其特征在于,包括:响应于目标文章的排版请求,清除所述目标文章中包含的特定格式符,得到预处理文本,所述特定格式符中至少包括空格符、缩进符以及回车符;清除所述预处理文本中包含的冗余的换行符,得到中间文本;对所述中间文本设置排版格式符,得到符合预定排版格式的排版文本,其中,所述排版格式符至少包括预定的占位符。2.根据权利要求1所述的方法,其特征在于,所述预定排版格式为每段首行缩进两个字符位且段落间隔为一行,所述排版格式符包括所述占位符、所述换行符以及所述缩进符,所述对所述中间文本设置排版格式符,得到符合预定排版格式的排版文本的步骤包括:对所述中间文本中包含的单个换行符,执行字符替换步骤以替换为两个连续的换行符以及两个连续的占位符;对所述占位符,执行字符替换步骤以替换为所述缩进符,得到所述排版文本。3.根据权利要求1所述的方法,其特征在于,所述清除目标文章中包含的特定格式符,得到预处理文本的步骤为:对所述目标文章中包含的所述特定格式符,执行字符替换步骤以替换为空字符,得到预处理文本。4.根据权利要求1所述的方法,其特征在于,所述清除所述预处理文本中包含的冗余的换行符,得到中间文本的步骤为:对所述预处理文本中包含的换行符,重复执行预定次数的字符替换步骤,以实现将多个连续的换行符替换为单个换行符,得到所述中间文本。5.根据权利要求1-4中任意一项所述的方法,其特征在于,所述特定格式符中还包括所述占位符。6.根据权利要求2-4中任意一项所述的方法,其特征在于,所述字符替换步骤,通过JavaScript的str.replace...

【专利技术属性】
技术研发人员:艾瑞坤
申请(专利权)人:广州阿里巴巴文学信息技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1