文件处理方法、装置、服务器及可读存储介质制造方法及图纸

技术编号:35028602 阅读:27 留言:0更新日期:2022-09-24 23:01
本申请公开了一种文件处理方法、装置、服务器及可读存储介质,属于文件处理技术领域。该文件处理方法包括:获取待审核文件,并确定所述待审核文件的文件类型;获取与所述文件类型相对应的文件规范,以及所述文件规范的多个第一段落类型;将所述待审核文件的段落进行分类,得到所述待审核文件的多个第二段落类型;根据所述多个第一段落类型和所述多个第二段落类型确定所述待审核文件的审核结果。采用本申请实施例可提高文件审核的效率。申请实施例可提高文件审核的效率。申请实施例可提高文件审核的效率。

【技术实现步骤摘要】
文件处理方法、装置、服务器及可读存储介质


[0001]本申请属于文件处理
,具体涉及一种文件处理方法、装置、服务器及可读存储介质。

技术介绍

[0002]随着智能设备(如智能手机、笔记本电脑、台式计算机等)不断发展,不同业务所需要签署的文件(如合同等)可以在智能设备上完成,不同业务的业务量快速增长。为保证文件的合规性,需要对文件进行审核,目前,对于文件的审核通常是由工作人员逐一查看文件内容,以完成对文件进行审核,审核效率低下。

技术实现思路

[0003]本申请实施例提供一种文件处理方法、装置、服务器及可读存储介质,用于提高文件审核的效率。
[0004]第一方面,提供了一种文件处理方法,包括:
[0005]获取待审核文件,并确定所述待审核文件的文件类型;
[0006]获取与所述文件类型相对应的文件规范,以及所述文件规范的多个第一段落类型;
[0007]将所述待审核文件的段落进行分类,得到所述待审核文件的多个第二段落类型;
[0008]根据所述多个第一段落类型和所述多个第二段落类型确定所述待审核文件的审核结果。
[0009]第二方面,提供了一种文件处理装置,所述装置包括:
[0010]确定模块,用于获取待审核文件,并确定所述待审核文件的文件类型;
[0011]获取模块,用于获取与所述文件类型相对应的文件规范,以及所述文件规范的多个第一段落类型;
[0012]分类模块,用于将所述待审核文件的段落进行分类,得到所述待审核文件的多个第二段落类型;
[0013]审核模块,用于根据所述多个第一段落类型和所述多个第二段落类型确定所述待审核文件的审核结果。
[0014]第三方面,提供了一种服务器,该服务器包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
[0015]第四方面,提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
[0016]第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法的步骤。
[0017]在本申请实施例中,首先获取待审核文件,由于文件的类型包括很多种,每种文件类型对应的文件规范也不相同,因此需要确定待审核文件的文件类型,然后获取与待审核文件的文件类型相对应的文件规范,以及文件规范的多个第一段落类型,将待审核文件的段落进行分类,得到待审核文件的多个第二段落类型,最后根据多个第一段落类型和多个第二段落类型确定待审核文件的审核结果。通过对待审核文件的段落进行分类,以及对待审核文件对应的文件规范的段落进行分类,可以确定出待审核文件中每个段落的第一段落类型和文件规范的每个段落的第二段落类型,通过将待审核文件和文件规范的每个段落都确定出一个段落类型,可以在文件审核时仅通过确定待审核文件中的每个段落的段落类型是否都匹配到文件规范中的每个段落类型即可,无需逐字进行匹配,进而提高文件审核效率。
附图说明
[0018]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0019]图1是本申请的一个实施例提供的一种文件处理方法的流程图;
[0020]图2是本申请的一个实施例提供的一种文件处理装置的示意图;
[0021]图3是本申请的一个实施例提供的服务器的结构示意图。
具体实施方式
[0022]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
[0023]本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
[0024]为保证文件的质量,需要对文件进行审核,但由于文件的页数从十几页到几十页到几百页的都有,而且文件的数量也很多,现有通过人工进行文件审核费时费力,效率低,且可能存在遗漏。为了解决上述问题,本方案提出了一种文件处理方法,通过计算机来审核文件,实现审核的自动化,提高文件审核效率。
[0025]下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的文件处理方法、装置、服务器及可读存储介质进行详细地说明。
[0026]如图1所示,本申请实施例提供了一种文件处理方法,该文件处理方法可以包括S101至S104所示的内容。
[0027]在S101中,获取待审核文件,并确定待审核文件的文件类型。
[0028]其中,待审核文件可以是合同,文件类型例如有买卖合同,供用电、水、气、热力合同,赠与合同,借款合同,租赁合同,建筑工程合同,运输合同,技术合同,保管合同,仓储合
同,委托合同等等。每种合同均有与其对应的合同规范,合同规范是指合同审核的标准,对应不同类型的合同,为了审核,会写一些规范,例如:“合同中必须写明各方已交付了妥为签署的交易合同正本并加盖公章”、“合同中必须写明投资于XX产品的比例不高于10%”等等。
[0029]其中,确定待审核文件的文件类型的方式可以有多种,例如,可以通过文件本身自带的文件类型信息进行分类,还可以通过文件标题判断出文件类型,也可以通过获取文件中的一些关键词和段落信息,利用文件分类模型进行分类,利用文件分类模型进行分类的方式在后续实施例中进行了详细描述,本实施例中不做具体描述。其中,段落信息包括首段落、中间段落和结尾段落。
[0030]在S102中,获取与文件类型相对应的文件规范,以及文件规范的多个第一段落类型。
[0031]在上述确定出待审核文件的文件类型后,获取该文件类型相对应的文件规范,该文件规范包括多个段落,每个段落具有相应的段落类型,段落的段落类型可以相同,也可以不相同,根据段落的具体内容确定。
[0032]值得说明的是,文件规范的多个第一段落类型可以是预先分类好的,存储在数据库中,在使用时可以直接调用,也可以是在本申请中进行分类,确定出文件规范的多个第一段落类型,然后存储到数据库中,后续可以直接使用,具体地本申请中不做限定。
[0033]在S103中,待审核文件的段落进行分类,得到待审核文件的多个第二段落类型。
[0034]本申请实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文件处理方法,其特征在于,包括:获取待审核文件,并确定所述待审核文件的文件类型;获取与所述文件类型相对应的文件规范,以及所述文件规范的多个第一段落类型;将所述待审核文件的段落进行分类,得到所述待审核文件的多个第二段落类型;根据所述多个第一段落类型和所述多个第二段落类型确定所述待审核文件的审核结果。2.根据权利要求1所述的方法,其特征在于,所述确定所述待审核文件的文件类型,包括:提取所述待审核文件中的文件文本数据;根据所述文件文本数据中的特征字段信息,确定所述待审核文件的文件类型。3.根据权利要求2所述的方法,其特征在于,所述根据所述文件文本数据中的特征字段信息,确定所述待审核文件的文件类型,包括:获取所述文件文本数据中的关键词和结构特征信息,所述结构特征信息包括文件的标题、首段落、中间段落和结尾段落;将所述关键词和所述结构特征信息输入至文件分类模型中,进行分类处理,得到所述待审核文件的文件类型。4.根据权利要求1所述的方法,其特征在于,获取所述文件规范的多个第一段落类型,包括:根据预设方法对所述文件规范的段落进行分类,得到所述文件规范的多个第一段落类型;所述预设方法包括:将文件分为多个段落,并获取每个段落中的关键字;根据所述关键字,确定每个段落的标签类型和规范类型,所述标签类型用于表征段落的属性,所述规范类型包括量化规范类型和描述性规范类型;根据每个段落的标签类型和规范类型,得到所述文件的多个段落类型。5.根据权利要求4所述的方法,其特征在于,所述根据所述多个第一段落类型和所述多个第二段落类型确定所述待审核文件的审核结果,包括:若所述多个第二段落类型中存在至少一个与所述多个第一段落类型不匹配,则确定所述审核结果为所述待审核文件审核未通过。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:若所述多个第二段落类型均与所述多个第一段落类型相匹配,则判断所述待审核文件的每个段落的规范类型;若所述待审核文件的至少一个段落的规范类型为量...

【专利技术属性】
技术研发人员:李宽蒋宁王洪斌吴海英
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1