文档目录的生成方法、装置、终端设备及存储介质制造方法及图纸

技术编号:32885397 阅读:15 留言:0更新日期:2022-04-02 12:20
本发明专利技术公开了一种文档目录的生成方法、装置、终端设备及存储介质。该方法包括:从页面读取文本文档;将所述文本文档转化为语法树;对所述语法树的节点进行解构,得到文档目录。本发明专利技术解决了文档目录更新滞后的问题,实时更新文档目录。文档目录。文档目录。

【技术实现步骤摘要】
文档目录的生成方法、装置、终端设备及存储介质


[0001]本专利技术涉及数据处理
,尤其涉及一种文档目录的生成方法、装置、终端设备及存储介质。

技术介绍

[0002]为了快速查阅文档的内容,文档需要具有详细的目录。然而,当用户在编写文档的时候,更愿意把精力放在文档实质内容上,而不是花时间为文档编排一个详细的目录。
[0003]现有的应用系统选择将文档目录存储在文档数据库中,每次读取文档的同时将目录结构一并读取出来,然后整体显示在网页内容中。但是这种文档目录显示方法在一些实时编辑场景的效果不好,每次用户编辑输入时,都需要额外的接口请求开销,导致文档目录的更新滞后。

技术实现思路

[0004]本专利技术实施例的主要目的在于提供一种传统文档目录的生成方法、装置、终端设备及存储介质,旨在解决文档目录更新滞后的问题,实时更新文档目录。
[0005]为实现上述目的,本专利技术实施例提供一种传统文档目录的生成方法,所述文档目录的生成方法应用于页面,所述传统文档目录的生成方法包括:
[0006]从所述页面读取文本文档;
[0007]将所述文本文档转化为语法树;
[0008]对所述语法树的节点进行解构,得到文档目录。
[0009]可选地,所述将所述文本文档转化为语法树的步骤包括:
[0010]将所述文本文档转化为超文本标记语言HTML文档;
[0011]将所述HTML文档转化为所述语法树,并对所述语法树赋予标签。
[0012]可选地,所述对所述语法树的节点进行解构,得到文档目录的步骤之前包括:
[0013]对所述语法树的节点进行遍历,得到目录对象;
[0014]对所述目录对象进行遍历解构,得到所述文档目录。
[0015]可选地,所述对所述语法树的节点进行遍历,得到目录对象的步骤包括:
[0016]对所述语法树赋予标签;
[0017]读取所述语法树的节点并判断所述节点是否为叶子节点;
[0018]若所述节点是叶子节点,则判断所述节点的标签是否为预设字母开头;
[0019]若所述节点的标签不是预设字母开头,则读取所述节点的兄弟节点;
[0020]若所述节点的标签是预设字母开头,则将该节点作为所述目录对象。
[0021]可选地,所述读取所述语法树的节点并判断所述节点是否为叶子节点的步骤之后包括:
[0022]若所述节点不是叶子节点,则确定所述节点为子树;
[0023]读取所述子树的节点,作为子树节点,并判断所述子树节点是否为叶子节点;
[0024]若所述子树节点是叶子节点,则判断所述子树节点的标签是否为预设字母开头;
[0025]若所述子树节点的标签不是预设字母开头,则读取所述子树节点的兄弟节点;
[0026]若所述子树节点的标签是预设字母开头,则将该子树节点作为所述目录对象。
[0027]可选地,所述若所述节点的标签不是预设字母开头,则读取所述节点的兄弟节点的步骤之后包括:
[0028]若所述兄弟节点是树节点,则返回执行步骤:读取所述语法树的节点并判断所述节点是否为叶子节点;
[0029]若所述兄弟节点不是树节点,则丢弃所述兄弟节点。
[0030]可选地,所述对所述语法树的节点进行遍历,得到目录对象的步骤之前包括:
[0031]创建目录树寄存器;
[0032]所述若所述节点的标签是预设字母开头,则将该节点作为所述目录对象的步骤包括:
[0033]若所述节点的标签是预设字母开头,则将该节点作为所述节点对象,并存储于所述目录树寄存器。
[0034]可选地,所述对所述目录对象进行遍历解构,得到所述文档目录的步骤包括:
[0035]对所述目录树寄存器的目录对象进行组装,得到目录树;
[0036]对所述目录树进行遍历解构,得到所述文档目录。
[0037]此外,为实现上述目的,本专利技术还提供一种文档目录的生成装置,所述系统包括:
[0038]文档读取模块,用于从所述页面读取文本文档;
[0039]文档转化模块,用于将所述文本文档转化为语法树;
[0040]遍历解构模块,用于对所述语法树的节点进行解构,得到文档目录。
[0041]此外,为实现上述目的,本专利技术还提供一种终端设备,所述终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的文档目录的生成方法,所述文档目录的生成的程序被所述处理器执行时实现如上所述的文档目录的生成方法的步骤。
[0042]此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有文档目录的生成的程序,所述文档目录的生成的程序被处理器执行时实现如上所述的文档目录的生成方法的步骤。
[0043]本专利技术实施例提出的文档目录的生成方法、装置、终端设备及存储介质,该方法包括:从页面读取文本文档;将所述文本文档转化为语法树;对所述语法树的节点进行解构,得到文档目录。本专利技术解决了文档目录更新滞后的问题,自动读取文档,实时更新文档目录。
附图说明
[0044]图1为本专利技术文档目录的生成装置所属终端设备的功能模块示意图;
[0045]图2为本专利技术文档目录的生成方法第一实施例的流程示意图;
[0046]图3为本专利技术文档目录的生成方法第二实施例的流程示意图;
[0047]图4为本专利技术文档目录的生成方法第三实施例的流程示意图;
[0048]图5为本专利技术文档目录的生成系统的功能模块示意图。
[0049]本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0050]应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0051]本专利技术实施例的主要解决方案是:从页面读取文本文档;将所述文本文档转化为语法树;对所述语法树的节点进行解构,得到文档目录。本专利技术解决了文档目录更新滞后的问题,自动实时读取文档,实时更新文档目录。
[0052]本专利技术实施例涉及的技术术语:
[0053]Hast:超文本抽像语法树,Hast将HTML表示为抽象语法树的规范。
[0054]WYSIWYG:所见即所得,WYSIWYG指的是一种用户界面,可以让用户直接编辑和操作文档、页面或文件的外观和内容。
[0055]HTML:HTML的全称为超文本标记语言,是一种标记语言。它包括一系列标签。通过这些标签可以将网络上的文档格式统一,使分散的Internet资源连接为一个逻辑整体。HTML文本是由HTML命令组成的描述性文本,HTML命令可以说明文字,图形、动画、声音、表格、链接等。
[0056]目录树:在任何一个名字空间中,目录树是指由容器和对象构成的层次结构。树的叶子、节点往往是对象,树的非叶子节点是容器。目录树表达了对象的连接方式,也显示了从一个对象到另一个对象的路径。在活动目本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文档目录的生成方法,其特征在于,所述文档目录的生成方法应用于页面,所述方法包括如下步骤:从所述页面读取文本文档;将所述文本文档转化为语法树;对所述语法树的节点进行解构,得到文档目录。2.根据权利要求1所述的文档目录的生成方法,其特征在于,所述将所述文本文档转化为语法树的步骤包括:将所述文本文档转化为超文本标记语言HTML文档;将所述HTML文档转化为所述语法树。3.根据权利要求1所述的文档目录的生成方法,其特征在于,所述对所述语法树的节点进行解构,得到文档目录的步骤之前包括:对所述语法树的节点进行遍历,得到目录对象;所述对所述语法树的节点进行解构,得到文档目录的步骤包括:对所述目录对象进行遍历解构,得到所述文档目录。4.根据权利要求3所述的文档目录的生成方法,其特征在于,所述对所述语法树的节点进行遍历,得到目录对象的步骤包括:对所述语法树赋予标签;读取所述语法树的节点并判断所述节点是否为叶子节点;若所述节点是叶子节点,则判断所述节点的标签是否为预设字母开头;若所述节点的标签不是预设字母开头,则读取所述节点的兄弟节点;若所述节点的标签是预设字母开头,则将该节点作为所述目录对象。5.根据权利要求4所述的文档目录的生成方法,其特征在于,所述读取所述语法树的节点并判断所述节点是否为叶子节点的步骤之后包括:若所述节点不是叶子节点,则确定所述节点为子树;读取所述子树的节点,作为子树节点,并判断所述子树节点是否为叶子节点;所述若所述节点是叶子节点,则判断所述节点的标签是否为预设字母开头的步骤包括:若所述子树节点是叶子节点,则判断所述子树节点的标签是否为预设字母开头;所述若所述节点的标签不是预设字母开头,则读取所述节点的兄弟节点的步骤包括:若所述子树节点的标签不是预设字母开头,则读取所述子树节点的兄弟节点;所述若所述节点的标签是预设字母开头,则将该节点作为所述目录对象...

【专利技术属性】
技术研发人员:杨帆陈婷吴三平王宗泽
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1