The invention discloses an article typesetting method, an apparatus, a programmable device and an article publishing platform. Including the article publishing methods: in response to the goal of the article typesetting requests, clear the specific format containing the target in the match, text preprocessing; redundant contains preprocessing in the text by a newline, intermediate text format of intermediate text; set match, can meet the predetermined format of the text layout. According to the invention, various typographical errors can be respectively typesetting articles may according to the detection and make corresponding treatment, but by typesetting the unified plan to get to meet the needs of the text layout, to achieve low complexity and fast response speed.
【技术实现步骤摘要】
文章排版方法、设备、可编程设备及文章发布平台
本专利技术涉及电子阅读
,更具体地,涉及一种文章排版方法、设备及可编程设备。
技术介绍
随著计算机技术以及互联网技术的迅速发展,电子阅读的迅速崛起,人们更喜欢在手机里阅读新闻、小说、文章等等,网络文学也随之蓬勃发展,大量网络作者通过各大网络文章发布平台(例如文学网站、小说网站等)发布自己创作的网络文章,供网站访问者阅读,极大地丰富了用户的电子阅读体验。但是,由于网络作者群体鱼龙混杂,文化水平高低不一,良莠不齐,很多作者直接写出的文章内容由于格式混乱、乱用标点、出现敏感内容、错别字泛滥、段落层次不清等原因,是没法直接发布在网络上的。各个网络文章发布平台,都会设立编辑部门通过编辑人员对要发布到网络上的文章进行审核、排版、纠错、去除敏感内容等工作,这类工作繁琐、冗余、重复、枯燥,消耗大量公司人力和资金成本并且审核过程中也很容易出错,效率低下。目前的一些网络文章发布平台上,对网络作者需要发布文章,提供自动排版的功能(例如一键排版功能),但通常需要网络文章发布平台的开发者们,针对成百上千的文本错误格式针对性的逐一进行编程和修复,每一种错误情况都要编写一种对应的策略代码,因此实现的算法非常的复杂和庞大,算法执行效率低下,随着错误的情况变多,也会使得代码到后期很难维护,并且由于错误情况很难考虑周全,会存在遗漏某些少见的极端格式错误的情况,从而造成对哪些极端的格式错误没法进行修复。此外,对于动辄几十万字的网络文章,通过目前的自动排版方案进行排版,由于算法复杂且庞大,响应速度非常慢,影响用户体验,相应地,需要消耗较多的处理 ...
【技术保护点】
一种文章排版方法,其特征在于,包括:响应于目标文章的排版请求,清除所述目标文章中包含的特定格式符,得到预处理文本,所述特定格式符中至少包括空格符、缩进符以及回车符;清除所述预处理文本中包含的冗余的换行符,得到中间文本;对所述中间文本设置排版格式符,得到符合预定排版格式的排版文本,其中,所述排版格式符至少包括预定的占位符。
【技术特征摘要】
1.一种文章排版方法,其特征在于,包括:响应于目标文章的排版请求,清除所述目标文章中包含的特定格式符,得到预处理文本,所述特定格式符中至少包括空格符、缩进符以及回车符;清除所述预处理文本中包含的冗余的换行符,得到中间文本;对所述中间文本设置排版格式符,得到符合预定排版格式的排版文本,其中,所述排版格式符至少包括预定的占位符。2.根据权利要求1所述的方法,其特征在于,所述预定排版格式为每段首行缩进两个字符位且段落间隔为一行,所述排版格式符包括所述占位符、所述换行符以及所述缩进符,所述对所述中间文本设置排版格式符,得到符合预定排版格式的排版文本的步骤包括:对所述中间文本中包含的单个换行符,执行字符替换步骤以替换为两个连续的换行符以及两个连续的占位符;对所述占位符,执行字符替换步骤以替换为所述缩进符,得到所述排版文本。3.根据权利要求1所述的方法,其特征在于,所述清除目标文章中包含的特定格式符,得到预处理文本的步骤为:对所述目标文章中包含的所述特定格式符,执行字符替换步骤以替换为空字符,得到预处理文本。4.根据权利要求1所述的方法,其特征在于,所述清除所述预处理文本中包含的冗余的换行符,得到中间文本的步骤为:对所述预处理文本中包含的换行符,重复执行预定次数的字符替换步骤,以实现将多个连续的换行符替换为单个换行符,得到所述中间文本。5.根据权利要求1-4中任意一项所述的方法,其特征在于,所述特定格式符中还包括所述占位符。6.根据权利要求2-4中任意一项所述的方法,其特征在于,所述字符替换步骤,通过JavaScript的str.replace...
【专利技术属性】
技术研发人员:艾瑞坤,
申请(专利权)人:广州阿里巴巴文学信息技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。