【技术实现步骤摘要】
文件处理方法、装置、电子设备和计算机可读介质
[0001]本公开的实施例涉及计算机
,具体涉及文件处理方法、装置、电子设备和计算机可读介质。
技术介绍
[0002]目前,数据库已经广泛的应用于人们的日常生活中。对于数据库中文件的处理,通常采用的方式为:通常相关技术人员人为对数据库中的待处理文件进行文件处理。
[0003]然而,专利技术人发现,当采用上述方式来对数据库中的文件进行处理,经常会存在如下技术问题:第一,操作过于复杂,且数据库中的文件过于繁多,导致文件处理效率过于复杂,文件搜索的时间较长,文件搜索所占用的搜索资源较多,导致效率较低。
[0004]第二,所生成针对文件内容的文本思想信息不够精准,导致后续待处理文件处理不够精准。
[0005]该
技术介绍
部分中所公开的以上信息仅用于增强对本专利技术构思的背景的理解,并因此,其可包含并不形成本国的本领域普通技术人员已知的现有技术的信息。
技术实现思路
[0006]本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0007]本公开的一些实施例提出了文件处理方法、装置、电子设备和计算机可读介质,来解决以上
技术介绍
部分提到的技术问题中的一项或多项。
[0008]第一方面,本公开的一些实施例提供了一种文件处理方法,包括:响应于检测到目标用户在文件处理界面所输入的 ...
【技术保护点】
【技术特征摘要】
1.一种文件处理方法,包括:响应于检测到目标用户在文件处理界面所输入的文件处理信息,对所述文件处理信息进行语义提取,得到语义信息;从所述语义信息提取多个关键词;确定所述多个关键词中的每个关键词对应的关键词性类型;获取文件处理所需关键词性类型,得到所需关键词性类型集;响应于确定所述多个关键词对应的关键词性类型集包括所述所需关键词性类型集,确定与所述所需关键词性类型集中的每个所需关键词性类型对应的关键词,得到关键词集;确定所述关键词集对应的第一关键词编码集;根据所述第一关键词编码集,利用文件层次树模型,在目标数据库中对待处理文件进行文件处理,其中,所述文件层次树模型是基于目标数据库中的文件目录所建立的,文件层次树模型的树节点包括:文件信息和文件信息对应的至少一个第二关键词编码,其中,第二关键词编码与关键词存在一一对应关系。2.根据权利要求1所述的方法,其中,所述方法还包括:响应于确定所述待处理文件处理结束,确定所述待处理文件对应的文件信息和对应至少一个关键词;根据所述待处理文件对应的文件信息和对应至少一个关键词,对所述文件层次树模型进行模型更新。3.根据权利要求1所述的方法,其中,在所述响应于确定所述多个关键词对应的关键词性类型集包括所述所需关键词性类型集,确定与所述所需关键词性类型集中的每个所需关键词性类型对应的关键词,得到关键词集之后,所述方法还包括:响应于确定所述多个关键词对应的关键词性类型集不包括所述所需关键词性类型集,确定差别关键词性类型集,其中,所述差别关键词性类型集为所需关键词性类型集中的子集,所述差别关键词性类型集与所述关键词性类型集不存在相同的关键词性类型;生成针对所述差别关键词性类型集中的各个差别关键词性类型对应的信息询问文本;在所述文件处理界面弹出信息填写弹窗,以供所述目标用户针对所述信息询问文本填写对应关键词集;根据所填写的关键词集和所述多个关键词,确定针对所述所需关键词性类型集对应的关键词集。4.根据权利要求1所述的方法,其中,文件信息对应的至少一个第二关键词编码通过以下步骤生成:响应于确定文件信息对应文件不为空文件,确定所述文件对应的子文件集;确定所述子文件集中每个子文件的文件格式类型;响应于确定所述子文件集中的各个子文件的文件格式类型为第一文件格式类型,将各个子文件的文件名称确定为初始文本,得到初始文本集;对所述初始文本集中的各个初始文本进行文本分词,以生成至少一个第一词;将所述至少一个第一词确定为至少一个第一关键词;对所述至少一个第一关键词进行编码,得到至少一个第二关键词编码。5.根据权利要求4所述的方法,其中,在所述对所述至少一个第一关键词进行编码,得
到至少一个第二关键词编码之后,所述方法还包括:响应于确定所述子文件集中的各个子文件的文件格式类型为第一文件格式类型和第二文件格式类型,将所述第二文件格式类型的至少一个子文件的文件名称进行分词,得到词集;对于所述至少一个子文件中的每个子文件,执行文本关键词提取步骤:获取所述子文件对应的文件内容;将文件内容输入至文本思想信息提取模型,以输出文本思想信息;提取所述文件内容中词频满足预设条件的词,作为关键词,得到内容关键词集;对所述文本思想信息进行文本分词,以生成思想关键词,得到思想关键词集;将所述内容关键词集和所述思想关键词集进行词...
【专利技术属性】
技术研发人员:秦志宾,闫松伟,王瑞,饶新宏,
申请(专利权)人:北京德风新征程科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。