文件处理方法、装置、电子设备和计算机可读介质制造方法及图纸

技术编号:36168218 阅读:20 留言:0更新日期:2022-12-31 20:18
本公开的实施例公开了文件处理方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:响应于检测到在文件处理界面所输入的文件处理信息,对文件处理信息进行语义提取,得到语义信息;从语义信息提取多个关键词;确定多个关键词中的每个关键词对应的关键词性类型;获取文件处理所需关键词性类型,得到所需关键词性类型集;响应于确定多个关键词对应的关键词性类型集包括所需关键词性类型集,确定与所需关键词性类型集中的每个所需关键词性类型对应的关键词,得到关键词集;确定关键词集对应的第一关键词编码集;在目标数据库中对待处理文件进行文件处理。该实施方式可以快捷、高效地对待处理文件进行文件处理。高效地对待处理文件进行文件处理。高效地对待处理文件进行文件处理。

【技术实现步骤摘要】
文件处理方法、装置、电子设备和计算机可读介质


[0001]本公开的实施例涉及计算机
,具体涉及文件处理方法、装置、电子设备和计算机可读介质。

技术介绍

[0002]目前,数据库已经广泛的应用于人们的日常生活中。对于数据库中文件的处理,通常采用的方式为:通常相关技术人员人为对数据库中的待处理文件进行文件处理。
[0003]然而,专利技术人发现,当采用上述方式来对数据库中的文件进行处理,经常会存在如下技术问题:第一,操作过于复杂,且数据库中的文件过于繁多,导致文件处理效率过于复杂,文件搜索的时间较长,文件搜索所占用的搜索资源较多,导致效率较低。
[0004]第二,所生成针对文件内容的文本思想信息不够精准,导致后续待处理文件处理不够精准。
[0005]该
技术介绍
部分中所公开的以上信息仅用于增强对本专利技术构思的背景的理解,并因此,其可包含并不形成本国的本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0006]本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0007]本公开的一些实施例提出了文件处理方法、装置、电子设备和计算机可读介质,来解决以上
技术介绍
部分提到的技术问题中的一项或多项。
[0008]第一方面,本公开的一些实施例提供了一种文件处理方法,包括:响应于检测到目标用户在文件处理界面所输入的文件处理信息,对上述文件处理信息进行语义提取,得到语义信息;从上述语义信息提取多个关键词;确定上述多个关键词中的每个关键词对应的关键词性类型;获取文件处理所需关键词性类型,得到所需关键词性类型集;响应于确定上述多个关键词对应的关键词性类型集包括上述所需关键词性类型集,确定与上述所需关键词性类型集中的每个所需关键词性类型对应的关键词,得到关键词集;确定上述关键词集对应的第一关键词编码集;根据上述第一关键词编码集,利用文件层次树模型,在目标数据库中对待处理文件进行文件处理,其中,上述文件层次树模型是基于目标数据库中的文件目录所建立的,文件层次树模型的树节点包括:文件信息和文件信息对应的至少一个第二关键词编码,其中,第二关键词编码与关键词存在一一对应关系。
[0009]第二方面,本公开的一些实施例提供了一种文件处理装置,包括:语义提取单元,被配置成响应于检测到目标用户在文件处理界面所输入的文件处理信息,对上述文件处理信息进行语义提取,得到语义信息;提取单元,被配置成从上述语义信息提取多个关键词;第一确定单元,被配置成确定上述多个关键词中的每个关键词对应的关键词性类型;获取
单元,被配置成获取文件处理所需关键词性类型,得到所需关键词性类型集;第二确定单元,被配置成响应于确定上述多个关键词对应的关键词性类型集包括上述所需关键词性类型集,确定与上述所需关键词性类型集中的每个所需关键词性类型对应的关键词,得到关键词集;第三确定单元,被配置成确定上述关键词集对应的第一关键词编码集;文件处理单元,被配置成根据上述第一关键词编码集,利用文件层次树模型,在目标数据库中对待处理文件进行文件处理,其中,上述文件层次树模型是基于目标数据库中的文件目录所建立的,文件层次树模型的树节点包括:文件信息和文件信息对应的至少一个第二关键词编码,其中,第二关键词编码与关键词存在一一对应关系。
[0010]第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。
[0011]第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
[0012]本公开的上述各个实施例具有如下有益效果:通过本公开的一些实施例的文件处理方法可以快捷、高效地对待处理文件进行文件处理。具体来说,造成相关的待处理文件处理不够快捷、高效地原因在于:操作过于复杂,且数据库中的文件过于繁多,导致文件处理效率过于复杂,文件搜索的时间较长,文件搜索所占用的搜索资源较多,导致效率较低。基于此,本公开的一些实施例的文件处理方法,首先,响应于检测到目标用户在文件处理界面所输入的文件处理信息,对上述文件处理信息进行语义提取,得到语义信息。在这里,通过文件处理界面输入文件处理信息,可以针对数据库中的文件处理提供了巨大的便利。目标用户不需要了解数据库的操作方法,仅需要输入文件处理信息,后续可以自动从目标数据库中针对文件处理信息对待处理文件进行文件处理。除此之外,通过对文件处理信息进行语义提取,以便于后续获取与文件处理信息戚戚相关的多个关键词。以此后续便于通过多个关键词来快速查询出待处理文件。然后,从上述语义信息提取多个关键词,以便于后续待处理文件的查询和确定待处理文件的处理方式。接着,确定上述多个关键词中的每个关键词对应的关键词性类型,以便于后续确定目标用户所输入的文件处理信息是否缺失关键文件处理内容。再接着,获取文件处理所需关键词性类型,得到所需关键词性类型集,以用于后续确定目标用户所输入的文件处理信息是否缺失关键文件处理内容。进一步,响应于确定上述多个关键词对应的关键词性类型集包括上述所需关键词性类型集,确定与上述所需关键词性类型集中的每个所需关键词性类型对应的关键词,得到关键词集,以用于后续待处理文件的查询和确定待处理文件的处理方式。进而,确定上述关键词集对应的第一关键词编码集以用于后续待处理文件的查询和确定待处理文件的处理方式。最后,根据上述第一关键词编码集,利用文件层次树模型,在目标数据库中可以高效、精准地对待处理文件进行文件处理。其中,上述文件层次树模型是基于目标数据库中的文件目录所建立的。文件层次树模型的树节点包括:文件信息和文件信息对应的至少一个第二关键词编码,其中,第二关键词编码与关键词存在一一对应关系。综上上述,通过文件处理界面中文件处理信息的输入,以及文件处理信息的一系列处理,利用文件层次树模型,在目标数据库中可以快捷、高效地对待处理文件进行文件处理。
附图说明
[0013]结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
[0014]图1是根据本公开的文件处理方法的一些实施例的流程图;图2是根据本公开的文件处理装置的一些实施例的结构示意图;图3是适于用来实现本公开的一些实施例的电子设备的结构示意图。
具体实施方式
[0015]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文件处理方法,包括:响应于检测到目标用户在文件处理界面所输入的文件处理信息,对所述文件处理信息进行语义提取,得到语义信息;从所述语义信息提取多个关键词;确定所述多个关键词中的每个关键词对应的关键词性类型;获取文件处理所需关键词性类型,得到所需关键词性类型集;响应于确定所述多个关键词对应的关键词性类型集包括所述所需关键词性类型集,确定与所述所需关键词性类型集中的每个所需关键词性类型对应的关键词,得到关键词集;确定所述关键词集对应的第一关键词编码集;根据所述第一关键词编码集,利用文件层次树模型,在目标数据库中对待处理文件进行文件处理,其中,所述文件层次树模型是基于目标数据库中的文件目录所建立的,文件层次树模型的树节点包括:文件信息和文件信息对应的至少一个第二关键词编码,其中,第二关键词编码与关键词存在一一对应关系。2.根据权利要求1所述的方法,其中,所述方法还包括:响应于确定所述待处理文件处理结束,确定所述待处理文件对应的文件信息和对应至少一个关键词;根据所述待处理文件对应的文件信息和对应至少一个关键词,对所述文件层次树模型进行模型更新。3.根据权利要求1所述的方法,其中,在所述响应于确定所述多个关键词对应的关键词性类型集包括所述所需关键词性类型集,确定与所述所需关键词性类型集中的每个所需关键词性类型对应的关键词,得到关键词集之后,所述方法还包括:响应于确定所述多个关键词对应的关键词性类型集不包括所述所需关键词性类型集,确定差别关键词性类型集,其中,所述差别关键词性类型集为所需关键词性类型集中的子集,所述差别关键词性类型集与所述关键词性类型集不存在相同的关键词性类型;生成针对所述差别关键词性类型集中的各个差别关键词性类型对应的信息询问文本;在所述文件处理界面弹出信息填写弹窗,以供所述目标用户针对所述信息询问文本填写对应关键词集;根据所填写的关键词集和所述多个关键词,确定针对所述所需关键词性类型集对应的关键词集。4.根据权利要求1所述的方法,其中,文件信息对应的至少一个第二关键词编码通过以下步骤生成:响应于确定文件信息对应文件不为空文件,确定所述文件对应的子文件集;确定所述子文件集中每个子文件的文件格式类型;响应于确定所述子文件集中的各个子文件的文件格式类型为第一文件格式类型,将各个子文件的文件名称确定为初始文本,得到初始文本集;对所述初始文本集中的各个初始文本进行文本分词,以生成至少一个第一词;将所述至少一个第一词确定为至少一个第一关键词;对所述至少一个第一关键词进行编码,得到至少一个第二关键词编码。5.根据权利要求4所述的方法,其中,在所述对所述至少一个第一关键词进行编码,得
到至少一个第二关键词编码之后,所述方法还包括:响应于确定所述子文件集中的各个子文件的文件格式类型为第一文件格式类型和第二文件格式类型,将所述第二文件格式类型的至少一个子文件的文件名称进行分词,得到词集;对于所述至少一个子文件中的每个子文件,执行文本关键词提取步骤:获取所述子文件对应的文件内容;将文件内容输入至文本思想信息提取模型,以输出文本思想信息;提取所述文件内容中词频满足预设条件的词,作为关键词,得到内容关键词集;对所述文本思想信息进行文本分词,以生成思想关键词,得到思想关键词集;将所述内容关键词集和所述思想关键词集进行词...

【专利技术属性】
技术研发人员:秦志宾闫松伟王瑞饶新宏
申请(专利权)人:北京德风新征程科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1