本发明专利技术提供了一种文档处理系统,包括:图元生成单元,用于在当前界面中,将处于指定区域内的一种或多种类型的背景元素生成为一个复合图元;设置单元,用于根据接收到的用户设置指令,设置与所述复合图元对应的排版区域,以及与所述排版区域对应的正文内容;文档生成单元,用于利用所有的所述复合图元、所述排版区域、所述正文内容及其之间的关联关系,生成对应的流式文档。本发明专利技术还提出了一种文档处理方法。通过本发明专利技术的技术方案,可以使流式文档中包含原本版式文档中才有的复杂背景元素,从而在流式显示时,展示出各种精美的版式效果。
【技术实现步骤摘要】
本专利技术涉及文档处理
,具体而言,涉及一种文档处理系统和一种文档处理方法。
技术介绍
在阅读电子图书、电子报刊时,通常有两种阅读方式,即版式阅读方式和流式阅读方式。 版式阅读的效果跟印刷的效果一致,所以版面能够做得很复杂,在数字出版中支持版式阅读的文件格式有FOFCPortabIe Document Format,便携式文件格式)、CEB(ChineseE-paper Basic,北大方正电子公司拥有自主知识产权的一种版式文件格式)、CEBX (Commone-Document of Blending XML,基于混合XML的公共电子文档)等。 流式阅读是根据显示器的大小进行重新排版,比较适合小屏幕的移动终端阅读,在数字出版中支持流式阅读的典型格式有ePub(Electronic Publicat1n,电子出版)、AZW(一种支持流式阅读的格式)、XEB (—种支持流式阅读的格式)、CEBX等。但目前阅读软件在处理流式显示时,虽然可以设置背景,但背景单一,只能设置一种颜色或一个图像,不能表示设置复杂版式的背景。 例如,HTML (Hypertext Markup Language,超文本标记语言)可以有背景,主要通过CSS (Cascading Style Sheet,级联样式表)描述,但只能是简单的背景,背景只能是指定颜色或者图像,不能指定复杂的版面描述(例如由文字、图形、图像等组合而成的复合对象)。如果指定了图像作为背景,则在不同大小的显示器上显示时,需要对图像进行放大或缩小,显示质量下降,同一背景图像在不同大小的显示屏下显示效果不一致。由于ePub采用了 HTML相同的方法,也只能设置简单的背景。CEBX格式同时支持版式显示和流式显示,其最新版本CEBX1.2的流式状态下,背景与CSS类似,只能设为一种颜色或者一个图像。此夕卜,CEBX还支持模板页,使多个页面共用相同的背景,但模板页用于版式显示时,针对不同大小的显示屏,不能进行非模板部分内容的重新排版,而且也无排版区域的属性。 PDF主要支持版式的显示,能表示复杂的背景,但是PDF不能区分背景元素和正文元素。虽然有些PDF的阅读软件能把PDF转化为流式进行显示,但是由于PDF不能区分背景元素和正文元素,所以流式显示时,背景被忽略(不显示)或者作为正文元素进行流式排版,从而产生了错误的阅读效果。此外,PDF的阅读软件把PDF转化为流式进行显示时,软件只能设置简单的背景或者无法设置背景。 有些平板电脑(Pad)上的互动阅读应用,在版式阅读的页面上开一个小窗口(或区域),使文字内容在小窗口中显示,并通过滚动条进行滚动显示文字内容,而版式部分保持不变。由于这种方式仍然以版式文件的处理方式,只能以版式的页为处理单元,无法实现整本电子书(或电子报刊)跨页内容的流式阅读,没有翻书的效果。 综上所述,目前的流式文档只能设置简单的背景,远不如版式文档的显示效果,有碍于用户获得更好的阅读体验。 因此,本专利技术提出了一种文档处理方案,可以使流式文档中包含原本版式文档中才有的复杂背景元素,从而在流式显示时,展示出各种精美的版式效果。
技术实现思路
本专利技术正是基于上述问题,提出了一种文档处理方案,可以使流式文档中包含原本版式文档中才有的复杂背景元素,从而在流式显示时,展示出各种精美的版式效果。 有鉴于此,本专利技术提出了一种文档处理系统,包括:图元生成单元,用于在当前界面中,将处于指定区域内的一种或多种类型的背景元素生成为一个复合图元;设置单元,用于根据接收到的用户设置指令,设置与所述复合图元对应的排版区域,以及与所述排版区域对应的正文内容;文档生成单元,用于利用所有的所述复合图元、所述排版区域、所述正文内容及其之间的关联关系,生成对应的流式文档。 在该技术方案中,通过将多种类型的背景元素生成一个整体的复合图元,避免了现有技术中仅能够显示单一背景元素的问题,可以使得背景元素更加丰富;同时,通过生成复合图元,使得各个背景元素及其显示属性在流式显示时保持不变或动态缩放,从而实现精美的版面效果。此外,通过将复合图元与排版区域之间建立关联关系,便于在背景与正文内容之间紧密联系起来,从而在得到更好的背景效果的同时,保证了对正文内容的正确显 /Jn ο 在上述技术方案中,优选地,所述背景元素的类型包括以下至少一种或其组合:字符、图形、图像。 在该技术方案中,尤其是当背景元素中包含图形时,可以使用图形来替换原本的图像,比如对于一个粉色的矩形图像,可以利用矩形的外框以及在其中填充粉色进行替换,由于图形是由线条和颜色属性构成,有利于降低文档的数据量,并且由于图形的矢量特性,从而有利于避免图像在缩放过程中出现锯齿等问题。 在上述技术方案中,优选地,还包括:版面分析与理解单元,用于对选定的版式文档进行版面分析与理解,并从所述版式文档中识别出所述背景元素和所述正文内容,以用于生成所述流式文档。 在该技术方案中,本申请提出的基于复合图元的流式文档,可以是从头开始建立的。而通过对现有的版式文档进行版面分析与理解的方法,可以将识别出来的背景元素生成复合图元,从而重新生成为相应的流式文档,实现了版式文档与流式文档之前的转换,且得到的流式文档能够具有与版式文档类似的显示效果。而在进行版面中正文内容和背景元素的识别和分离时,除了采用版面分析与理解的方法进行自动识别,还可以利用工具软件,对正文内容和背景进行手工标注,方便用户对流式显示属性的设置。 在上述技术方案中,优选地,还包括:图元确定单元,用于在终端上显示所述流式文档的指定页面时,确定所述指定页面上的复合图元;图元适配单元,用于根据所述终端的屏幕分辨率,将所述复合图元适配显示在所述终端的屏幕界面上,以作为所述指定页面的显示背景;区域适配单元,用于根据所述复合图元的适配比例,以及所述排版区域与所述复合图元之间的相对位置关系,计算所述排版区域在所述屏幕界面上对应的实际排版区域;内容排版单元,用于将对应于所述排版区域的正文内容排入所述实际排版区域。 在该技术方案中,对流式文档进行显示时,首先显示复合图元,可以根据复合图元与终端屏幕的宽高比例来选择复合图元的适配显示方式,然后根据其适配比例和复合图元与排版区域之间的关联关系,确定实际显示时的实际排版区域,以填充相应的正文内容。 在上述技术方案中,优选地,还包括:页面添加单元,用于在所述正文内容无法全部排入当前页面中的所述实际排版区域中的情况下,生成至少一个新页面,所述至少一个新页面包含与所述当前页面相同的复合图元和排版区域;其中,所述内容排版单元将剩余的正文内容排入所述至少一个新页面中。 在该技术方案中,由于流式显示过程中,需要针对显示终端的分辨率进行界面调整,因而当终端的实际分辨率较低时,可能导致无法将全部的正文内容都填充至实际排版区域内,因而按照实际排版区域能够排入的数据量,将原本显示在一页的正文内容拆分开来,显示在自动重新生成的其他新的页面,且新的页面具有与原来页面相同的背景元素,增强文档的一致性。更为具体地,如果最后一个页面内的正文内容较少,不能排满整个排版区域,则未排版的部分作为空白。 本专利技术还提出了一种文档处理方本文档来自技高网...
【技术保护点】
文档处理系统,其特征在于,包括:图元生成单元,用于在当前界面中,将处于指定区域内的一种或多种类型的背景元素生成为一个复合图元;设置单元,用于根据接收到的用户设置指令,设置与所述复合图元对应的排版区域,以及与所述排版区域对应的正文内容;文档生成单元,用于利用所有的所述复合图元、所述排版区域、所述正文内容及其之间的关联关系,生成对应的流式文档。
【技术特征摘要】
1.文档处理系统,其特征在于,包括: 图元生成单元,用于在当前界面中,将处于指定区域内的一种或多种类型的背景元素生成为一个复合图元; 设置单元,用于根据接收到的用户设置指令,设置与所述复合图元对应的排版区域,以及与所述排版区域对应的正文内容; 文档生成单元,用于利用所有的所述复合图元、所述排版区域、所述正文内容及其之间的关联关系,生成对应的流式文档。2.根据权利要求1所述的文档处理系统,其特征在于,所述背景元素的类型包括以下至少一种或其组合:字符、图形、图像。3.根据权利要求1所述的文档处理系统,其特征在于,还包括: 版面分析与理解单元,用于对选定的版式文档进行版面分析与理解,并从所述版式文档中识别出所述背景元素和所述正文内容,以用于生成所述流式文档。4.根据权利要求1至3中任一项所述的文档处理系统,其特征在于,还包括: 图元确定单元,用于在终端上显示所述流式文档的指定页面时,确定所述指定页面上的复合图元; 图元适配单元,用于根据所述终端的屏幕分辨率,将所述复合图元适配显示在所述终端的屏幕界面上,以作为所述指定页面的显示背景; 区域适配单元,用于根据所述复合图元的适配比例,以及所述排版区域与所述复合图元之间的相对位置关系,计算所述排版区域在所述屏幕界面上对应的实际排版区域;内容排版单元,用于将对应于所述排版区域的正文内容排入所述实际排版区域。5.根据权利要求4所述的文档处理系统,其特征在于,还包括: 页面添加单元,用于在所述正文内容无法全部排入当前页面中的所述实际排版区域中的情况下,生成至少一个新页面,所述至少一个新页面包含与所述当前页面相...
【专利技术属性】
技术研发人员:汤帜,丁力,
申请(专利权)人:北京大学,北大方正集团有限公司,北京方正阿帕比技术有限公司,方正信息产业控股有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。