System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请实施例涉及文档处理,具体而言,涉及一种书签目录的生成方法、装置、电子设备。
技术介绍
1、pdf(portable document format,便携式文件格式)是一种常用的电子文档格式,具有跨平台、易于传播和保护内容等优点。pdf文件可将文字、字型、格式、颜色及独立于设备和分辨率的图形图像等封装在一个文件中,该格式文件还可以包含超文本链接、声音和动态影像等电子信息,且该格式支持特长文件,其集成度和安全可靠性都较高。
2、对于较长的pdf文档,如果缺少书签目录导航,用户在查找特定内容时往往需要耗费较多时间。pdf书签是一种用于标记和导航pdf文档内容的功能。它可以帮助用户快速定位到文档中的特定章节、标题或其他重要内容。通过书签,用户可以方便地浏览和查找pdf文档的内容,提高阅读和使用的效率。pdf文档目录同理。在主流pdf软件产品中,对pdf文档添加目录通常需要用户手动添加,操作繁琐,费时费力。
技术实现思路
1、针对上述现有技术中存在的问题,本申请实施例提供了一种书签目录的生成方法、装置、电子设备,能够自动生成比较准确的书签目录,以提高用户在浏览和查找pdf文档内容时的效率。
2、第一方面,本申请实施例提供了一种书签目录的生成方法,包括:
3、解析pdf文档的结构信息,识别所述pdf文档的标题;
4、根据所识别的所述pdf文档的标题,自动生成所述pdf文档的书签目录;和
5、将生成的所述书签目录添加到所述pdf文
6、进一步地,所述解析pdf文档的结构信息,识别所述pdf文档的标题,包括:
7、全文分析所述pdf文档的标题样式层级,识别所述pdf文档的标题。
8、进一步地,所述根据所识别的所述pdf文档的标题,自动生成所述pdf文档的书签目录,包括:
9、遍历获取所述pdf文档的段落;
10、判断所述段落是否为所述标题;和
11、根据判断结果,自动生成所述pdf文档的书签目录。
12、进一步地,所述根据判断结果,自动生成所述pdf文档的书签目录之前,还包括:
13、根据判断结果,自动生成所述pdf文档的大纲。
14、进一步地,在所述根据判断结果,自动生成所述pdf文档的大纲之后,还包括:
15、对所述pdf文档的大纲进行筛选,对所述大纲精简化。
16、进一步地,所述pdf文档的大纲包括书签树和/或目录页。
17、进一步地,在判断所述段落是否为所述标题之后,还包括:
18、进行二次判断,排除误判元素。
19、第二方面,本申请实施例还提供了一种书签目录生成装置,包括:
20、结构解析模块,用于解析pdf文档的结构信息,识别所述pdf文档的标题;
21、目录生成模块,用于根据所识别的所述pdf文档的标题,自动生成所述pdf文档的书签目录;和
22、目录添加模块,用于将生成的所述书签目录添加到所述pdf文档内。
23、第三方面,本申请实施例还提供了一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器用于执行所述程序时实现根据上述的第一方面所述的书签目录的生成方法。
24、第四方面,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序用于实现根据上述的第一方面所述的书签目录的生成方法。
25、第五方面,本申请实施例还提供了一种计算机程序产品,其上存储有计算机程序,所述计算机程序用于实现根据上述的第一方面所述的书签目录的生成方法。
26、本申请实施例带来了以下有益效果:
27、本申请实施例提供的书签目录的生成方法,通过解析pdf文档的结构信息,识别所述pdf文档的标题,并根据所识别的所述pdf文档的标题,自动生成所述pdf文档的书签目录,最后将生成的所述书签目录添加到所述pdf文档内,能够解决手动添加pdf文档书签目录的繁琐和容易出错的问题,从而以自动的方式生成比较准确的书签目录,以提高用户在浏览和查找pdf文档内容时的效率。
本文档来自技高网...【技术保护点】
1.一种书签目录的生成方法,其特征在于,包括:
2.根据权利要求1所述的书签目录的生成方法,其特征在于,所述解析PDF文档的结构信息,识别所述PDF文档的标题,包括:
3.根据权利要求2所述的书签目录的生成方法,其特征在于,所述根据所识别的所述PDF文档的标题,自动生成所述PDF文档的书签目录,包括:
4.根据权利要求3所述的书签目录的生成方法,其特征在于,所述根据判断结果,自动生成所述PDF文档的书签目录之前,还包括:
5.根据权利要求4所述的书签目录的生成方法,其特征在于,在所述根据判断结果,自动生成所述PDF文档的大纲之后,还包括:
6.根据权利要求5所述的书签目录的生成方法,其特征在于,所述PDF文档的大纲包括书签树和/或目录页。
7.根据权利要求3所述的书签目录的生成方法,其特征在于,在判断所述段落是否为所述标题之后,还包括:
8.一种书签目录生成装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序用于实现根据权利要求1-7任一项所述的书签目录的生成方法。
...【技术特征摘要】
1.一种书签目录的生成方法,其特征在于,包括:
2.根据权利要求1所述的书签目录的生成方法,其特征在于,所述解析pdf文档的结构信息,识别所述pdf文档的标题,包括:
3.根据权利要求2所述的书签目录的生成方法,其特征在于,所述根据所识别的所述pdf文档的标题,自动生成所述pdf文档的书签目录,包括:
4.根据权利要求3所述的书签目录的生成方法,其特征在于,所述根据判断结果,自动生成所述pdf文档的书签目录之前,还包括:
5.根据权利要求4所述的书签目录的生成方法,其特征在于,在所述根据判断结果,自动生成所述pdf文档的大纲之后,还包括:
6.根据权利要...
【专利技术属性】
技术研发人员:邓国康,
申请(专利权)人:万兴科技湖南有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。