基于深度神经网络的罪名预测方法技术

技术编号:35148027 阅读:21 留言:0更新日期:2022-10-05 10:25
本申请涉及法院的罪名和刑期判定领域,特别是涉及一种基于深度神经网络的罪名预测方法,其包括步骤:在神经网络W的输入层输入案件的个罪要素特征和共有要素特征,并使所述个罪要素特征和共有要素特征进行全连接后激活得到数据A;将所述数据A输入DesNet网络输出数据B;将所述数据A和数据B输入所述神经网络W的输出层进行预测,得到预测值A1,其目的在于提高预测性能和可解释性。预测性能和可解释性。预测性能和可解释性。

【技术实现步骤摘要】
基于深度神经网络的罪名预测方法


[0001]本申请涉及法院的罪名和刑期判定领域,特别是涉及一种基于深度神经网络的罪名预测方法。

技术介绍

[0002]罪名预测和刑期预测是法律判决预测任务中的子任务,根据裁判文书的案情事实等内容,罪名预测任务主要是预判被告人可能的罪名,刑期预测任务主要是预测被告人的服刑时间。
[0003]目前的罪名和刑期预测技术可分为三类:
[0004]1、基于规则的方法具有较强的可解释性,但缺乏案件的具体内容等重要信息,模型的预测效果不好;
[0005]2、基于机器学习的方法受限于特定的案件类别,泛化能力不足;
[0006]3、基于深度神经网络的方法具有较好的预测性能,但无法解释预测结果。
[0007]除了上述方法存在的共性问题外,大多数方法只考虑了单一类型的法律案件,缺少跨各类案件数据的模型;上述方法大都只考虑了一种算法,没有考虑使用各种算法在不同方面的优势来弥补单一算法的不足。

技术实现思路

[0008]有鉴于此,本申请的目的在于提供一种有良好的预测性能和可解释性的基于深度神经网络的罪名预测方法,以及刑期预测方法,还有与它们相关的网络和模型。
[0009]对于仅有罪名预测需求的场景,公开了基于深度神经网络的罪名预测方法,包括步骤:
[0010]在神经网络W的输入层输入案件的个罪要素特征和共有要素特征,并使所述个罪要素特征和共有要素特征进行全连接后激活得到数据A;
[0011]将所述数据A输入DesNet网络输出数据B
[0012]将所述数据A和数据B输入所述神经网络W的输出层进行预测,得到预测值A1。
[0013]除了常规的层和块以外,单独构建了神经网络W,并针对地处理案情事实等内容中的个罪要素特征和共有要素特征,同时基于个罪要素特征和共有要素特征的特性,把其两者进行全连接,再进行激活,得到的数据A再通过DesNet网络处理,处理结果再和数据A结合输入到输出层,即使用了神经网络达到较好的预测性能,同时单独拆分出案情事实等内容中的个罪要素特征和共有要素特征进行组合处理为输入数据,也提高了可解释性。
[0014]其次还公布了以下细节,所述DesNet网络包含多层Dense块,该多层Dense块中至少1层包含BatchNorm归一化过程。
[0015]其次还公布了以下细节,所述多层Dense块中至少1层包含dropout正则化过程。
[0016]其次还公布了以下细节,所述多层Dense块中至少1层包含Dense全连接和激活过程。
[0017]其次还公布了以下细节,还包括步骤:
[0018]在基础模型梯度提升机模型(GBM)、极端梯度提升模型(X(GBoost)、随机森林模型(RF)和极端随机树模型(ExtraTree)中分别输入所述个罪要素特征和共有要素特征,且均分别输出对应的预测值B、预测值C、预测值D、预测值E;
[0019]将所述预测值A1、预测值B、预测值C、预测值D、预测值E、个罪要素特征和共有要素特征连接得到特征数据F;
[0020]将所述特征数据F输入所述基础模型梯度提升机模型(GBM)、极端梯度提升模型(XGBoost)、随机森林模型(RF)、极端随机树模型(ExtraTree)和神经网络W中,重复前述对应的过程进行训练,得到对应的新预测值;
[0021]对所述新预测值进行加权,得到预测结果。
[0022]基础模型梯度提升机模型(GBM)、极端梯度提升模型(XGBoost)、随机森林模型(RF)和极端随机树模型(ExtraTree)是已知的现有模型,在这几个模型中去输入案情事实等内容中的个罪要素特征和共有要素特征,输出相应的预测值,再把这些预测值和单独构建的神经网络W的预测值结合,再次进行下一层的训练,即使用了神经网络达到较好的预测性能,同时单独拆分出案情事实等内容中的个罪要素特征和共有要素特征进行组合处理为输入数据,也提高了可解释性。
[0023]而对于同时有罪名和刑期预测需求的场景,公布了基于深度神经网络的罪名和刑期预测方法,包括步骤:
[0024]在神经网络Z的输入层输入案件的个罪要素特征和共有要素特征,并使所述个罪要素特征和共有要素特征进行全连接后激活得到数据A;
[0025]在神经网络Z输入层输入案件的罪名分类特征,所述罪名分类特征包含对罪名的语义处理以及标签化处理;
[0026]所述数据A和罪名分类特征连接得到向量A;
[0027]所述向量A输入Dense层后输出数据C;
[0028]所述向量A输入DesNet网络输出数据D;
[0029]将所述数据C和数据D输入所述神经网络Z的输出层进行预测,得到预测值A2。
[0030]除了常规的层和块以外,单独构建了神经网络Z,并针对地处理案情事实等内容中的个罪要素特征、共有要素特征和罪名分类特征,同时基于个罪要素特征、共有要素特征和罪名分类特征的特性,把其三者进行处理,再通过DesNet网络处理,以及Dense层处理,再把处理结果一并输入到输出层,即使用了神经网络达到较好的预测性能,同时单独拆分出案情事实等内容中的个罪要素特征、共有要素特征和罪名分类特征进行组合处理为输入数据,也提高了可解释性。
[0031]其次还公布了以下细节,所述数据C和数据D在输入所述神经网络的输出层前进行全连接。
[0032]其次还公布了以下细节,所述DesNet网络包含多层Dense块,该多层Dense块中至少1层包含BatchNorm归一化过程。
[0033]其次还公布了以下细节,所述多层Dense块中至少1层包含dropout正则化过程。
[0034]其次还公布了以下细节,所述多层Dense块中至少1层包含Dense全连接和激活过程。
[0035]其次还公布了以下细节,所述标签化处理为:对不同的罪名类型进行嵌入,增加特征表示对应的分类属性。
[0036]其次还公布了以下细节,还包括步骤:
[0037]在基础模型梯度提升机模型(GBM)、极端梯度提升模型(XGBoost)、随机森林模型(RF)和极端随机树模型(ExtraTree)中分别输入所述个罪要素特征、共有要素特征和罪名分类特征,且均分别输出对应的预测值B、预测值C、预测值D、预测值E;
[0038]将所述预测值A2、预测值B、预测值C、预测值D、预测值E、个罪要素特征、共有要素特征和罪名分类特征连接得到特征数据G;
[0039]将所述特征数据G输入所述基础模型梯度提升机模型(GBM)、极端梯度提升模型(XGBoost)、随机森林模型(RF)、极端随机树模型(ExtraTree)和神经网络Z中,重复前述对应的过程进行训练,得到对应的新预测值;
[0040]对所述新预测值进行加权,得到预测结果。
[0041]基础模型梯度提升机模型(GBM)、极端梯度提升模型(XGBoost)、随机森林模型(RF)和极端随机树模型(E本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于深度神经网络的罪名预测方法,其特征在于,包括步骤:在神经网络W的输入层输入案件的个罪要素特征和共有要素特征,并使所述个罪要素特征和共有要素特征进行全连接后激活得到数据A;将所述数据A输入DesNet网络输出数据B;将所述数据A和数据B输入所述神经网络W的输出层进行预测,得到预测值A1。2.根据权利要求1所述的罪名预测方法,其特征在于,所述DesNet网络包含多层Dense块,该多层Dense块中至少1层包含BatchNorm归一化过程。3.根据权利要求2所述的罪名预测方法,其特征在于,所述多层Dense块中至少1层包含dropout正则化过程。4.根据权利要求2所述的罪名预测方法,其特征在于,所述多层Dense块中至少1层包含Dense全连接和激活过程。5.根据权利要求1所述的罪名预测方法,其特征在于,还包括步骤:在基础模型梯度提升机模型(GBM)、极端梯度提升模型(XGBoost)、随机森林模型(RF)和极端随机树模型(ExtraTree)中分别输入所述个罪要素特征和共有要素特征,且均分别输出对应的预测值B、预测值C、预测值D、预测值E;将所述预测值A1、预测值B、预测值C、预测值D、预测值E、个罪要素特征和共有要素特征连接得到特征数据F;将所述特征数据F输入所述基础模型梯度提升机模型(GBM)、极端梯度提升模型(XGBoost)、随机森林模型(RF)、极端随机树模型(ExtraTree)和神经网络W中,重复前述对应的过程进行训练,得到对应的新预测值;对所述新预测值进行加权,得到预测结果。6.基于深度神经网络的罪名和刑期预测方法,其特征在于,包括步骤:在神经网络Z的输入层输入案件的个罪要素特征和共有要素特征,并使所述个罪要素特征和共有要素特征进行全连接后激活得到数据A;在神经网络Z输入层输入案件的罪名分类特征,所述罪名分类特征包含对罪名的语义处理以及标签化处理;所述数据A和罪名分类特征连接得到向量A;所述向量A输入Dense层后输出数据C;所述向量A输入DesNet网络输出数据D;将所述数据C和数据D输入所述神经网络Z的输出层进行预测,得到预测值A2。7.根据权利要求6所述的罪名和刑期预测方法,其特征在于,所述数据C和数据D在输入所述神经网络的输出层前进行全连接。8.根据权利要求6所述的罪名和刑期预测方法,其特征在于,所述DesNet网络包含多层Dense块,该多层Dense块中至少1层包含BatchNorm归一化过程。9.根据权利要求8所述的罪名和刑期预测方法,其特征在于,所述多层Dense块中至少1层包含dropout正则化过程。
10.根据权利要求8所述的罪名和刑期预测方法,其特征在于,所述多层Dense块中至少1层包含Dense全连接和激活过程。11.根据权利要求6所述的罪名和刑期预测方法,其特征在于,所述标签化处理为:对不同的罪名类型进行嵌入,增加特征表示对应的分类属性。12.根据权利要求6所述的罪名和刑期预测方法,其特征在于,还包括步骤:在基础模型梯度提升机模型(GBM)、极端梯度提升模型(XGBoost)、随机森林模型(RF)和极端随机树模型(ExtraTree)中分别输入所述个罪要素特征、共有要素特征和罪名分类特征,且均分别输出对应的预测值B、预测值C、预测值D、预测值E;将所述预测值A2、预测值B、预测值C、预测值D、预测值E、个罪要素特征、共有要素特征和罪名分类特征连接得到特征数据G;将所述特征数据G输入所述基础模型梯度提升机模型(GBM)、极端梯度提升模型(XGBoost)、随机森林模型(RF)、极端随机树模型(ExtraTree)和神经网络Z中,重复前述对应的过程进行训练,得到对应的新预测值;对所述新预测值进行加权,得到预测结果。13.用于罪名预测的深度神经网络模型,其特征在于,包括神经网络W,所述深度神经网络W包括:输入层,用于输入案件的个罪要素特征和共有要素特征;隐藏层,包含用于使所述个罪要素特征和共有要素特征进行全连接后激活得到数据A的第一全连接激活块,同时包含处理数据A为数据B的DesNet网络;输出层,用于将所述数据A和数据B输入,得到预测值A1。14.根据权利要求13所述的深度神经网络,其特征在于,所述DesNet网络包含多层Dense块,该多层Dense块中至少1层包含BatchNorm归一化块。15.根据权利要求14所述的深度神经网络,...

【专利技术属性】
技术研发人员:ꢀ五一IntClG零六Q一零零四
申请(专利权)人:成都数之联科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1