案件分类方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:34263088 阅读:59 留言:0更新日期:2022-07-24 14:16
本发明专利技术涉及人工智能和司法领域,公开了一种案件分类方法、装置、计算机设备及存储介质,所述方法包括:获取待预测案件数据;将所述待预测案件数据输入ERNIE

Case classification method, device, computer equipment and storage medium

【技术实现步骤摘要】
案件分类方法、装置、计算机设备及存储介质


[0001]本专利技术涉及人工智能和司法领域,尤其涉及一种案件分类方法、装置、计算机设备及存储介质。

技术介绍

[0002]目前,在法院对案件审理和判决的过程中,既需要法律相关人员的专业法律知识与技能,也有许多繁重和重复性的工作,如对案件文书的理解、相关法条与类似案件的检索工作等,这些工作会消耗大量的时间和判案人员的精力,即便让专业人员来同样如此。
[0003]由于大部分案件具有涉及领域广,违法行为多样等特点,导致对案件进行分类时容易出现漏掉类别的情况,准确率低以及审案效率低。
[0004]现在针对上述问题,主要采用的是法院立案智能辅助系统。针对案件的识别,主要通过立案法庭审理人员人工筛选后,填入案件特征栏中,在进行案件审理,造成了案件立案审理时处理的效率低。
[0005]因此,针对涉及领域广的案件,存在处理效率低的问题。

技术实现思路

[0006]本专利技术实施例提供一种案件分类方法、装置、计算机设备和存储介质,以提高对案件分类的处理效率。
[0007]为了解决上述技术问题,本申请实施例提供一种案件分类方法,包括:
[0008]获取待预测案件数据;
[0009]将所述待预测案件数据输入ERNIE

CNN分类模型,其中,所述ERNIE

CNN分类模型是指基于ERNIE算法对案件进行分类的模型,所述ERNIE

CNN分类模型包括CNN层;
[0010]基于所述ERNIE

CNN分类模型,对所述待预测案件数据进行文本向量化,得到词向量矩阵;
[0011]基于所述CNN层,对所述词向量矩阵进行局部特征提取,得到局部特征矩阵;
[0012]基于所述ERNIE

CNN分类模型的全连接层,对所述局部特征矩阵进行全连接和分类处理,得到所述待预测案件数据对应的分类结果。
[0013]为了解决上述技术问题,本申请实施例还提供一种案件分类装置,包括:
[0014]数据获取模块,用于获取待预测案件数据;
[0015]输入模块,用于将所述待预测案件数据输入ERNIE

CNN分类模型,其中,所述ERNIE

CNN分类模型是指基于ERNIE算法对案件进行分类的模型,所述ERNIE

CNN分类模型包括CNN层;
[0016]文本向量化模块,用于基于所述ERNIE

CNN分类模型,对所述待预测案件数据进行文本向量化,得到词向量矩阵;
[0017]特征提取模块,用于基于所述CNN层,对所述词向量矩阵进行局部特征提取,得到局部特征矩阵;
[0018]分类结果获取模块,用于基于所述ERNIE

CNN分类模型的全连接层,对所述局部特征矩阵进行全连接和分类处理,得到所述待预测案件数据对应的分类结果。
[0019]为了解决上述技术问题,本申请实施例还提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述案件分类方法的步骤。
[0020]为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述案件分类方法的步骤。
[0021]本专利技术实施例提供的案件分类方法、装置、计算机设备及存储介质,通过获取待预测案件数据。将待预测案件数据输入ERNIE

CNN分类模型,其中,ERNIE

CNN分类模型是指基于ERNIE算法对案件进行分类的模型,ERNIE

CNN分类模型包括CNN层。基于ERNIE

CNN分类模型,对待预测案件数据进行文本向量化,得到词向量矩阵。基于CNN层,对词向量矩阵进行局部特征提取,得到局部特征矩阵。基于ERNIE

CNN分类模型的全连接层,对局部特征矩阵进行全连接和分类处理,得到待预测案件数据对应的分类结果。通过采用ERNIE

CNN分类模型提取待预测案件数据的深层次信息,同时,基于CNN层提取待预测案件数据局部信息,使得待预测案件数据的深层次信息与局部信息相结合,提高了模型分类效果,在提高对案件分类的准确率同时提高对案件分类的处理效率。
附图说明
[0022]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0023]图1是本申请可以应用于其中的示例性系统架构图;
[0024]图2是本申请的案件分类方法的一个实施例的流程图;
[0025]图3是根据本申请ERNIE

CNN分类模型的一示例图;
[0026]图4是根据本申请的案件分类装置的一个实施例的结构示意图;
[0027]图5是根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
[0028]除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的
的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
[0029]在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和
隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0030]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0031]请参阅图1,如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0032]用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。...

【技术保护点】

【技术特征摘要】
1.一种案件分类方法,其特征在于,所述案件分类方法包括:获取待预测案件数据;将所述待预测案件数据输入ERNIE

CNN分类模型,其中,所述ERNIE

CNN分类模型是指基于ERNIE算法对案件进行分类的模型,所述ERNIE

CNN分类模型包括CNN层;基于所述ERNIE

CNN分类模型,对所述待预测案件数据进行文本向量化,得到词向量矩阵;基于所述CNN层,对所述词向量矩阵进行局部特征提取,得到局部特征矩阵;基于所述ERNIE

CNN分类模型的全连接层,对所述局部特征矩阵进行全连接和分类处理,得到所述待预测案件数据对应的分类结果。2.如权利要求1所述的案件分类方法,其特征在于,所述获取待预测案件数据的步骤包括:获取案件文档和所述案件文档对应的文本模板;基于预设的要素抽取方式,对所述文本模板进行要素抽取,得到抽取规则;基于所述抽取规则,对所述案件文档进行字段提取,得到关键字段;对所述关键字段进行预处理,得到待预测案件数据。3.如权利要求1所述的案件分类方法,其特征在于,所述基于所述ERNIE

CNN分类模型的全连接层,对所述局部特征矩阵进行全连接和分类处理,得到所述待预测案件数据对应的分类结果的步骤包括:将所述局部特征矩阵依次输入所述ERNIE

CNN分类模型的dropout层和全连接层;基于所述ERNIE

CNN分类模型的dropout层和全连接层,对所述局部特征矩阵进行全连接和分类处理,得到所述待预测案件数据对应的分类结果。4.如权利要求1至3任一项所述的案件分类方法,其特征在于,在所述将所述待预测案件数据输入ERNIE

CNN分类模型之前,所述方法还包括:基于DiceLoss损失函数,训练ERNIE

CNN分类模型;按照以下公式计算所述DiceLoss损失函数:其中,|A|表示样本预测值中元素的个数,|B|表示样本真实值中元素的个数,|A∩B|表示样本预测值和样本真实值之间的共同元素。5.一种案件分类装置,其特征在于,所述案件分类装置包括:数据获取模块,用于获取待预测案件数据;输入模块,用于将所述待预测案件数据输入ERNIE

CNN分...

【专利技术属性】
技术研发人员:陈晓红胡东滨付震坤梁伟曹文治
申请(专利权)人:湖南工商大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1