一种文档处理方法及装置制造方法及图纸

技术编号:23890729 阅读:45 留言:0更新日期:2020-04-22 06:21
本申请公开了一种文档处理方法及装置,用于提升文档内容的检索速度,降低系统资源的消耗。该文档处理方法包括:确定与待处理文档的章节名称相关的信息;根据与待处理文档的章节名称相关的信息获取与所述章节名称对应的内容;将与所述章节名称对应的内容存储到章节内容表中;将所述待处理文档的章节名称存储到章节名称表中,其中,所述章节名称表中的章节名称与所述章节内容表中对应的内容索引相同。采用本申请所公开的方法,提升了文档内容的检索速度,降低了系统资源的消耗。

A document processing method and device

【技术实现步骤摘要】
一种文档处理方法及装置
本申请涉及计算机领域,特别涉及一种文档处理方法及装置。
技术介绍
随着科技的发展,无纸化办公已经由概念逐渐应用到多个行业领域中。文档是无纸化办公过程中不可缺少的一部分,文档通常是指电子文档,其作为信息的载体,在社会生活中占有着十分重要的地位。有时候,出于研究目的,会将大量同类文档进行收集整合,然后将文档内容整合到同一张数据表中,但是,这样的存储方式,数据表中的数据量会变得非常庞大。既包含了文档内的章节,也包含了各个章节的内容,如果要对某些内容进行检索,则需要在该数据表进行全文遍历,由于数据量庞大,因此,检索速度缓慢,且需要消耗大量的系统资源,因此,如何提升检索速度,降低系统资源的消耗,是一亟待解决的技术问题。
技术实现思路
本申请实施例的目的在于提供一种文档处理方法及装置,用于提升文档内容的检索速度,降低系统资源的消耗。为了解决上述技术问题,本申请的实施例采用了如下技术方案:一种文档处理方法,包括:确定与待处理文档的章节名称相关的信息;根据与待处理文档的章节名称相关的信息获取与所述章节名称对应的内容;将与所述章节名称对应的内容存储到章节内容表中;将所述待处理文档的章节名称存储到章节名称表中,其中,所述章节名称表中的章节名称与所述章节内容表中对应的内容索引相同。本专利技术的有益效果在于:将章节名称对应的内容和章节名称分别存储到章节内容表和章节名称表,从而,在检索章节名称对应的内容时,可以先通过章节名称表得到章节名称对应的内容的索引,再通过该索引检索章节内容表,因此,在整个检索过程中,只需要遍历章节名称表,以及遍历章节内容表中的索引就可以检索到章节名称对应的内容,而无需遍历数据量最大的章节名称对应的内容这部分数据,减少了遍历所需的时间,提升了文档内容的检索速度,降低了系统资源的消耗。在一个实施例中,在确定所述待处理文档的章节名称之前,所述方法还包括:判断所述待处理的文档是否为预设格式;当所述待处理的文档不是预设格式时,将所述待处理的文档转换为预设格式。本实施例的有益效果在于:当所述待处理的文档不是预设格式时,将所述待处理的文档转换为预设格式,从而使文档结构统一化,便于后续识别处理。在一个实施例中,所述确定与待处理文档的章节名称相关的信息,包括:获取预存储的章节名称字典;根据所述预存储的章节名称字典与所述待处理文档中的章节名称进行匹配;根据匹配结果确定所述待处理文档的章节名称。在一个实施例中,所述方法还包括:将所述章节内容表与所述章节名称表对应存储;其中,所述章节内容表中包含章节内容和对应的索引,所述章节名称表中包含所述章节的名称和对应的索引,所述章节内容表和所述章节名称表都为动态可扩展架构。在一个实施例中,在将所述章节内容表与所述章节名称表对应存储之后,所述方法还包括:当接收到基于预设章节名称的查询请求时,通过所述章节名称表确定所述预设章节名称对应的索引;通过所述预设章节名称对应的索引从所述章节内容表中查询所述预设章节名称对应的内容。在一个实施例中,在所述判断所述待处理的文档是否为预设格式之前,所述方法还包括:判断所述待处理文档是否为加密文档;当所述待处理文档为加密文档时,根据预设解密策略对所述加密文档进行解密。本申请还提供一种文档处理装置,包括:确定模块,用于确定与待处理文档的章节名称相关的信息;抽取模块,用于根据与待处理文档的章节名称相关的信息获取与所述章节名称对应的内容;第一存储模块,用于将与所述章节名称对应的内容存储到章节内容表中;第二存储模块,用于将所述待处理文档的章节名称存储到章节名称表中,其中,所述章节名称表中的章节名称与所述章节内容表中对应的内容索引相同。在一个实施例中,所述装置还包括:判断模块,用于在确定所述待处理文档的章节名称之前,判断所述待处理的文档是否为预设格式;转换模块,用于当所述待处理的文档不是预设格式时,将所述待处理的文档转换为预设格式。在一个实施例中,所述确定模块,包括:获取子模块,用于获取预存储的章节名称字典;匹配子模块,用于根据所述预存储的章节名称字典与所述待处理文档中的章节名称进行匹配;确定子模块,用于根据匹配结果确定所述待处理文档的章节名称。在一个实施例中,所述装置还包括:第三存储模块,用于将所述章节内容表与所述章节名称表对应存储;其中,所述章节内容表中包含章节内容和对应的索引,所述章节名称表中包含所述章节的名称和对应的索引,所述章节内容表和所述章节名称表都为动态可扩展架构。在一个实施例中,所述装置还包括:索引确定模块,用于当接收到基于预设章节名称的查询请求时,通过所述章节名称表确定所述预设章节名称对应的索引;查询模块,用于通过所述预设章节名称对应的索引从所述章节内容表中查询所述预设章节名称对应的内容。在一个实施例中,所述装置还包括:加密判断模块,用于判断所述待处理文档是否为加密文档;解密模块,用于当所述待处理文档为加密文档时,根据预设解密策略对所述加密文档进行解密。本申请还提供一种文档处理装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:确定与待处理文档的章节名称相关的信息;根据与待处理文档的章节名称相关的信息获取与所述章节名称对应的内容;将与所述章节名称对应的内容存储到章节内容表中;将所述待处理文档的章节名称存储到章节名称表中,其中,所述章节名称表中的章节名称与所述章节内容表中对应的内容索引相同。所述处理器还被配置为:在确定所述待处理文档的章节名称之前,判断所述待处理的文档是否为预设格式;当所述待处理的文档不是预设格式时,将所述待处理的文档转换为预设格式。所述处理器还被配置为:所述确定与待处理文档的章节名称相关的信息,包括:获取预存储的章节名称字典;根据所述预存储的章节名称字典与所述待处理文档中的章节名称进行匹配;根据匹配结果确定所述待处理文档的章节名称。所述处理器还被配置为:将所述章节内容表与所述章节名称表对应存储;其中,所述章节内容表中包含章节内容和对应的索引,所述章节名称表中包含所述章节的名称和对应的索引,所述章节内容表和所述章节名称表都为动态可扩展架构。所述处理器还被配置为:当接收到基于预设章节名称的查询请求时,通过所述章节名称表确定所述预设章节名称对应的索引;通过所述预设章节名称对应的索引从所述章节内容表中查询所述预设章节名称对应的内容。所述处理器还被配置为:判断所述待处理文档是否为加密文档;当所述待处理文档为加密文档时,根据预设解密策略对所述加密文档进行解密。本申请还提供一种非临时性可读存储介质本文档来自技高网...

【技术保护点】
1.一种文档处理方法,其特征在于,包括:/n确定与待处理文档的章节名称相关的信息;/n根据与待处理文档的章节名称相关的信息获取与所述章节名称对应的内容;/n将与所述章节名称对应的内容存储到章节内容表中;/n将所述待处理文档的文档名称和章节名称存储到章节名称表中,其中,所述章节名称表中的章节名称与所述章节内容表中对应的内容索引相同。/n

【技术特征摘要】
1.一种文档处理方法,其特征在于,包括:
确定与待处理文档的章节名称相关的信息;
根据与待处理文档的章节名称相关的信息获取与所述章节名称对应的内容;
将与所述章节名称对应的内容存储到章节内容表中;
将所述待处理文档的文档名称和章节名称存储到章节名称表中,其中,所述章节名称表中的章节名称与所述章节内容表中对应的内容索引相同。


2.如权利要求1所述的方法,其特征在于,在所述确定与待处理文档的章节名称相关的信息之前,所述方法还包括:
判断所述待处理的文档是否为预设格式;
当所述待处理的文档不是预设格式时,将所述待处理的文档转换为预设格式。


3.如权利要求1所述的方法,其特征在于,所述确定与待处理文档的章节名称相关的信息,包括:
获取预存储的章节名称字典;
根据所述预存储的章节名称字典与所述待处理文档中的章节名称进行匹配;
根据匹配结果确定所述待处理文档的章节名称。


4.如权利要求1所述的方法,其特征在于,所述方法还包括:
将所述章节内容表与所述章节名称表对应存储;其中,所述章节内容表中包含章节内容和对应的索引,所述章节名称表中包含所述章节的名称和对应的索引,所述章节内容表和所述章节名称表都为动态可扩展架构。


5.如权利要求4所述的方法,其特征在于,在将所述章节内容表与所述章节名称表对应存储之后,所述方法还包括:
当接收到基于预设章节名称的查询请求时,通过所述章节名称表确定所述预设章节名称对应的索引;
通过所述预设章节名称对应的索引从所述章节内容表中查询所述预设章节名称对应的内容。


6.如权利要求2所述的方法,其特征在于,在所述判断所述待处理的文档是否为预设格式之前,所述方法还包括:
判断所述待处理文档是否为加密文档;
当所述待处理文档为...

【专利技术属性】
技术研发人员:郑永升石磊其他发明人请求不公开姓名
申请(专利权)人:杭州依图医疗技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1