基于键值记忆网络的案件案由分类方法及介质技术

技术编号：25599037 阅读：96 留言：0更新日期：2020-09-11 23:56

本发明专利技术提供了一种基于键值记忆网络的案件案由分类方法及介质，包括：1)数据预处理：从司法文书中提取案情描述文本信息和文书引用的法律条文信息；2)模型构建：建立基于键值记忆网络的案件案由分类模型，包括对引用法条的建模、案件案情描述文本的建模和对键值记忆增强神经网络的建模；3)模型训练：通过训练数据对建立的案由分类模型进行优化，得到最优参数；4)模型预测：输入测试数据集的案件案情描述文本，模型预测案件对应的案由类别。本发明专利技术使用键值记忆增强神经网络进行案由分类，能够借助法律条文的引用信息有效提取案情关键信息，提高样本数量较少的案由的分类准确率，进而提升案由分类的总体准确度。

全部详细技术资料下载

【技术实现步骤摘要】
基于键值记忆网络的案件案由分类方法及介质
本专利技术涉及数据处理
，具体地，涉及基于键值记忆网络的案件案由分类方法及介质。尤其地，涉及一种基于键值记忆增强神经网络的案件案由分类方法。
技术介绍
案由分类对构建智能法律文书案件评查系统具有重要意义，给专业人员(例如法官和律师)提供方便的参考，提高他们的工作效率。案由分类同时也是立案、审判实务中不可回避的问题，案由确定的准确与否有利于对受理案件进行分类管理，有利于人民法院在审判务实中准确确定案件诉讼争点和正确使用法律，提高案件司法统计的准确性、科学性。专利文献CN110502634A(申请号：201910742625.8)公开了一种案由的判定和抓取方法及其系统，判定方法包括以下步骤：获取待判定的案件描述文本数据；对文本数据进行分词处理和去噪处理；从经过分词处理和去噪处理的文本数据中进行关键字提取，所述关键字用以表征主要事实说明；将提取到的关键字数据带入案由分类器，生成对案情的判定结果，所述案由分类器通过训练案例网络库学习语料获得；所述抓取方法包括以下步骤：利用网络爬虫在案例网络库网站进行搜索爬取，抓取其中的案例信息数据；对获取到的案例信息数据通过正则表达式进行结构化数据清洗。但该方法案由的判定和抓取准确度偏低。
技术实现思路
针对现有技术中的缺陷，本专利技术的目的是提供一种基于键值记忆网络的案件案由分类方法及介质。根据本专利技术提供的一种基于键值记忆网络的案件案由分类方法，包括如下步骤：数据预处理步骤：从司法文书中提取案情...

【技术保护点】
1.一种基于键值记忆网络的案件案由分类方法，其特征在于，包括如下步骤：/n数据预处理步骤：从司法文书中提取案情描述文本信息和文书引用的法律条文信息；/n模型构建步骤：建立基于键值记忆网络的案件案由分类模型，包括对引用法条的建模、案件案情描述文本的建模和对键值记忆增强神经网络的建模；/n模型训练步骤：通过训练数据对建立的案由分类模型进行优化，得到最优参数。/n模型预测步骤：输入测试数据集的案件案情描述文本，模型预测案件对应的案由类别。/n

【技术特征摘要】
1.一种基于键值记忆网络的案件案由分类方法，其特征在于，包括如下步骤：
数据预处理步骤：从司法文书中提取案情描述文本信息和文书引用的法律条文信息；
模型构建步骤：建立基于键值记忆网络的案件案由分类模型，包括对引用法条的建模、案件案情描述文本的建模和对键值记忆增强神经网络的建模；
模型训练步骤：通过训练数据对建立的案由分类模型进行优化，得到最优参数。
模型预测步骤：输入测试数据集的案件案情描述文本，模型预测案件对应的案由类别。

2.如权利要求1所述的基于键值记忆网络的案件案由分类方法，其特征在于，所述从司法文书中提取案情描述文本信息和文书引用的法律条文信息包括：
司法文书中包含对案件案情的描述和法院机构判定案件引用的法条；
所述法条与案由具有数据相关性，相同案由的案件引用相同或相关的法条，法条是判定案件性质的依据，也是案由分类的依据。将文书中引用的法条使用正则表达式从文书中提取出来得到引用的所有法条的编号，以及从文书文本中按照规则提取案情描述文本段落得到案情描述文本信息，对文本进行分词，用词向量表示。

3.如权利要求1所述的基于键值记忆网络的案件案由分类方法，其特征在于，所述模型构建步骤具体包括：
对引用法条表示向量的建模；
对案情描述文本表示向量的建模；
对键值记忆增强神经网络的建模。

4.如权利要求3所述的基于键值记忆网络的案件案由分类方法，其特征在于，对引用法条表示向量的建模,具体包括：
将文书引用的所有法条编号使用独热编码进行编码，法条编码乘以随机初始化的参数矩阵，得到引用法条表示向量。

5.如权利要求3所述的基于键值记忆网络的案件案由分类方法，其特征在于，所述对案情描述文本表示向量建模，具体包括：
使用特定神经网络模型作为编码器获得案情描述文本表示向量,作为键值记忆增强神经网络输入；
键记忆模块随机初始化，训练得出不同案由的案件案情对应的法条表达，即法条在案由层面上的表示向量，法条相关的案情描述的键；
对应不同法条的案件案情描述文本表示向量通过写操作写入案情描述记忆模块。

6.如权利要求3所述的基于键值记忆网络的案件案由分类方法，其特征在于，所述对键值记忆增强神经网络的建模，具体包括：
每个案件的引用法条表示向量用来控制对案情描述记忆模块的读写操作，训练数据集中每个案件的引用法条表示向量与键记忆模块计算相似度，得到这个案件的引用法条表示向量与每个案由相关的法条表示向量的相关性权重，法条上越相关，案件的案情描述就越相关，这个相关性权重去指导该案件案情描述文本的写入和读出，所述相关性权重既是读权重也是写权重；
键值记忆增强神经网络同...

【专利技术属性】
技术研发人员：黄璇璇，程威宇，沈艳艳，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人