System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及互联网,尤其涉及一种文档处理方法、装置、电子设备及存储介质。
技术介绍
1、目前,涉及公用或者特定数据库时,用户可以对公用或者特定数据库中的文档进行在线阅读,在线阅读的过程中,用户也可以对正在阅读的文档做阅读标记。但在用户对在线阅读的文档做阅读标记后,从公用或者特定数据库文档下载的文档中并没有用户做过的阅读标记,这给用户后期线下阅读该文档带来了极大的不便。
技术实现思路
1、本专利技术实施例提供一种文档处理方法,旨在解决用户在公用数据库中下载文档,下载的文档中并没有用户做过的阅读标记的问题。将从公用数据库中获取第一目标文档与网页文档的标记文档进行合并处理,得到具有标记信息的第二目标文档,由于标记文档包括用户在网页文档上标记的标记信息,合并后的第二目标文档中会带有用户在线阅读时所做的标记,将第二目标文档存储在本地,可以为用户提供带有标记信息的本地文档,便于用户在后期线下阅读,提高了用户的阅读体验。
2、第一方面,本专利技术实施例提供一种文档处理方法,所述方法包括:
3、从公用数据库中获取第一目标文档;
4、获取网页文档的标记文档,所述网页文档为所述第一目标文档在网页上加载后进行显示的文档,所述标记文档包括用户在所述网页文档上标记的标记信息;
5、将所述标记文档与所述第一目标文档进行合并处理,得到第二目标文档,并将所述第二目标文档存储在本地,所述第二目标文档包括用户在所述网页文档上标记的标记信息。
6、可选的,在
7、对网页文档中的用户标记进行识别,得到用户对所述网页文档标记的标记信息,所述网页文档的标记信息包括至少一个所述用户标记的标记信息;
8、对每个所述用户标记的标记信息进行汇编处理,得到所述网页文档的标记文档。
9、可选的,所述对每个所述用户标记的标记信息进行汇编处理,得到所述网页文档的标记文档的步骤包括:
10、根据每个所述用户标记的标记信息,确定每个所述用户标记的标记类型和起始字符位置,以及标记字符长度或终止字符位置;
11、基于每个所述用户标记的标记类型和标记起始字符位置,以及标记字符长度或标记终止字符位置,确定每个所述用户标记的第一汇编字段,每个所述第一汇编字段对应一个所述用户标记;
12、将所有的所述第一汇编字段按对应所述用户标记在所述网页文档中的位置顺序进行排列,得到所述网页文档的标记文档。
13、可选的,所述对每个所述用户标记的标记信息进行汇编处理,得到所述网页文档的标记文档的步骤还包括:
14、根据每个所述用户标记的标记信息,确定每个所述用户标记的起始字符位置以及标记字段;
15、基于每个所述用户标记的起始字符位置以及标记字段,确定每个所述用户标记的第二汇编字段,每个所述第二汇编字段对应一个所述用户标记;
16、将所有的所述第二汇编字段按对应所述用户标记在所述网页文档中的位置顺序进行排列,得到所述网页文档的标记文档。
17、可选的,所述对每个所述用户标记的标记信息进行汇编处理,得到所述网页文档的标记文档的步骤包括:
18、若存在一个所述用户标记的标记信息中包括多个标记类型,则在一个所述用户标记的标记信息中确定出多个所述标记类型对应的子标记信息;
19、对一个所述用户标记的标记信息进行第一汇编处理,得到父级汇编字段;
20、对多个所述标记类型对应的子标记信息进行第二汇编处理,得到多个子级汇编字段;
21、基于所述父级汇编字段以及所述多个子级汇编字段,得到一个所述用户标记的第三汇编字段,每个所述第三汇编字段对应一个所述用户标记;
22、基于所述第三汇编字段,得到所述网页文档的标记文档。
23、可选的,所述将所述标记文档与所述第一目标文档进行合并处理,得到第二目标文档的步骤包括:
24、根据所述标记信息的起始字符位置,确定出所述标记信息在所述第一目标文档中的标记位置;
25、根据所述标记位置,将所述标记信息在所述第一目标文档中进行标记,得到第二目标文档。
26、可选的,所述根据所述标记位置,将所述标记信息在所述第一目标文档中进行标记,得到第二目标文档的步骤包括:
27、根据所述标记位置,将所述标记信息以可编辑形式在所述第一目标文档中进行标记,得到初步标记文档,所述初步标记文档中包括可编辑标记;
28、在所述初步标记文档中的可编辑标记之间添加跳转链接,得到第二目标文档。
29、第二方面,本专利技术实施例还提供了一种文档处理装置,所述文档处理装置包括:
30、第一获取模块,用于从公用数据库中获取第一目标文档;
31、第二获取模块,用于获取网页文档的标记文档,所述网页文档为所述第一目标文档在网页上加载后进行显示的文档,所述标记文档包括用户在所述网页文档上标记的标记信息;
32、处理模块,用于将所述标记文档与所述第一目标文档进行合并处理,得到第二目标文档,并将所述第二目标文档存储在本地,第二目标文档包括用户在网页文档上标记的标记信息。
33、第三方面,本专利技术实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本专利技术实施例提供的文档处理方法中的步骤。
34、第四方面,本专利技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现专利技术实施例提供的文档处理方法中的步骤。
35、本专利技术实施例中,从公用数据库中获取第一目标文档;获取网页文档的标记文档,网页文档为第一目标文档在网页上加载后进行显示的文档,标记文档包括用户在网页文档上标记的标记信息;将标记文档与第一目标文档进行合并处理,得到第二目标文档,并将第二目标文档存储在本地,第二目标文档包括用户在网页文档上标记的标记信息。本专利技术将从公用数据库中获取第一目标文档与网页文档的标记文档进行合并处理,得到具有标记信息的第二目标文档,由于标记文档包括用户在网页文档上标记的标记信息,合并后的第二目标文档中会带有用户在线阅读时所做的标记,将第二目标文档存储在本地,可以为用户提供带有标记信息的本地文档,便于用户在后期线下阅读,提高了用户的阅读体验。
本文档来自技高网...【技术保护点】
1.一种文档处理方法,其特征在于,所述方法包括以下步骤:
2.如权利要求1所述的文档处理方法,其特征在于,在所述获取网页文档的标记文档的步骤之前,所述方法还包括:
3.如权利要求2所述的文档处理方法,其特征在于,所述对每个所述用户标记的标记信息进行汇编处理,得到所述网页文档的标记文档的步骤包括:
4.如权利要求2所述的文档处理方法,其特征在于,所述对每个所述用户标记的标记信息进行汇编处理,得到所述网页文档的标记文档的步骤还包括:
5.如权利要求2所述的文档处理方法,其特征在于,所述对每个所述用户标记的标记信息进行汇编处理,得到所述网页文档的标记文档的步骤包括:
6.如权利要求1至5中任一所述的文档处理方法,其特征在于,所述将所述标记文档与所述第一目标文档进行合并处理,得到第二目标文档的步骤包括:
7.如权利要求6所述的文档处理方法,其特征在于,所述根据所述标记位置,将所述标记信息在所述第一目标文档中进行标记,得到第二目标文档的步骤包括:
8.一种文档处理装置,其特征在于,所述文档处理装置包括:
...【技术特征摘要】
1.一种文档处理方法,其特征在于,所述方法包括以下步骤:
2.如权利要求1所述的文档处理方法,其特征在于,在所述获取网页文档的标记文档的步骤之前,所述方法还包括:
3.如权利要求2所述的文档处理方法,其特征在于,所述对每个所述用户标记的标记信息进行汇编处理,得到所述网页文档的标记文档的步骤包括:
4.如权利要求2所述的文档处理方法,其特征在于,所述对每个所述用户标记的标记信息进行汇编处理,得到所述网页文档的标记文档的步骤还包括:
5.如权利要求2所述的文档处理方法,其特征在于,所述对每个所述用户标记的标记信息进行汇编处理,得到所述网页文档的标记文档的步骤包括:
6.如权利要求1至5中任一所述的文档处理方法,其特征在于,所述...
【专利技术属性】
技术研发人员:林海澄,张国滔,戴志涛,
申请(专利权)人:深圳市沃特沃德信息有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。