本申请公开了一种类案推荐方法、装置、设备及存储介质,可应用于金融领域或大数据领域。通过获取目标案件;提取所述目标案件的特征信息;将所述特征信息输入已构建的决策森林模型,得到所述目标案件的推荐结果。在类案推荐服务进程启动过程中,当用户使用诉讼案件时,系统根据用户录入或者选择的案件,通过训练好的模型对特定的案件进行类案推荐,找到与目标案件相似的案件,并自动推送出具有相似性大于一定阈值的案件,同时对于相同的案件类型产生不同判决结果的案件即同案不同判案件进行及时推送,输出类案推荐列表,为使用者提供相似案件前期参考。使该方案具备实时性、预测精度高、人工干预较少、适宜于海量数据、定量性等优良应用特质。等优良应用特质。等优良应用特质。
【技术实现步骤摘要】
一种类案推荐方法、装置、计算机设备及存储介质
[0001]本申请涉及计算机
,特别是涉及一种类案推荐方法、装置、计算机设备及存储介质。
技术介绍
[0002]近些年,随着诉讼案件不断增多,通过提取相似案件对于案件处理具有更加重要的意义。类案推荐指主要通过使用已存在案例库案件对目标案件进行匹配,以展现给用户案例库与目标案件相似的案件列表。对于同行业的单位或机构如商业银行常常遇到大量的相似案件,如果能够有效利用前期已发生的相似案件的信息,能够为其他案件提供参考,同时用于相似案件在不同诉讼进程进行实时推荐,能够更好地跟踪案件进展,及时为案件提供参考。
[0003]目前的类案推荐系统主要有两种形态:第一种是自动推送,自动推送常依托技术人员根据裁判文书建立案件数据库,同时对相关案件“贴标签”,将每个具体案例结构化为法律标签。再将起诉书接入系统,与系统中的标签对比,推送标签最相似的案例;第二种是主动搜索,主动搜索是指案件使用人自主选取系统中具体的标签,在此基础上输入关键词,主动在数据库中检索符合条件的类案。但这两种推荐系统普遍存在推送类案不准确、案情细节不匹配等问题。
技术实现思路
[0004]基于上述问题,本申请提供了一种类案推荐方法、装置、设备及存储介质,能够提高类案推荐结果的准确性。
[0005]为解决上述问题,本申请实施例提供的技术方案如下:
[0006]本申请第一方面提供了一种类案推荐方法,包括:
[0007]获取目标案件;
[0008]提取所述目标案件的特征信息;
[0009]将所述特征信息输入已构建的决策森林模型,得到所述目标案件的推荐结果,所述决策森林模型为基于决策树快速分类模型和权重树对历史数据进行训练得到的。
[0010]在一个可能的实现方式中,所述获取目标案件之前,还包括:
[0011]获取训练集和测试集;
[0012]采用随机森林算法对所述训练集进行特征抽取,得到目标特征,根据所述训练集构造至少一个目标决策树;
[0013]对建立所述目标决策树所使用目标特征的数量和目标决策树数量进行优化,得到目标参数;
[0014]根据所述目标参数构建决策森林模型。
[0015]在一个可能的实现方式中,述获取训练集和测试集之前,还包括:
[0016]获取由历史数据样本组成的历史样本集,
[0017]分别对历史样本集中每个样本进行标准化处理,得到由历史样本特征数据组成的历史样本特征集;
[0018]按预设比例将所述历史样本特征集划分为训练集和测试集,所述训练集用于构造所述决策森林模型,所述测试集用于验证所述决策森林模型。
[0019]在一个可能的实现方式中,所述根据所述目标参数构建决策森林模型之后,还包括:
[0020]利用决策森林对本次案件的相似案件进行投票;
[0021]根据投票得到的分类结果得到目标案件对应的类案推荐列表。
[0022]在一个可能的实现方式中,所述利用决策森林对本次案件的相似案件进行投票包括:
[0023]获取投票权重,所述投票权重是根据特征集的统计特性或决策树的性能确定的;
[0024]将所述投票权重分配给相应的决策树;
[0025]结合所述投票权重和每棵决策树的分类决策获取分类结果,所述类别决定由所有决策树之间得票最多的类别决定。
[0026]在一个可能的实现方式中,所述根据所述目标参数构建决策森林模型之后,还包括:
[0027]利用所述测试集对决策森林模型进行一次测试,计算本次模型测试的案件相似率,响应于所述案件相似率不小于预设阈值,终止模型训练。
[0028]在一个可能的实现方式中,所述终止模型训练之后,还包括:
[0029]获取训练进程的所述目标参数、所述投票权重和本次训练得到的模型上传至数据库存储。
[0030]本申请第二方面提供了一种类案推荐装置,包括:
[0031]目标案件获取模块,用于获取目标案件;
[0032]特征信息提取模块,用于提取所述目标案件的特征信息;
[0033]推荐结果确定模块,用于将所述特征信息输入已构建的决策森林模型,得到所述目标案件的推荐结果,所述决策森林模型为基于决策树快速分类模型和权重树对历史数据进行训练得到的。
[0034]本申请第三方面提供一种计算机设备,包括:处理器、存储器、系统总线;
[0035]所述处理器以及所述存储器通过所述系统总线相连;
[0036]所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行本申请实施例第一方面提供的类案推荐方法。
[0037]本申请第四方面提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行本申请实施例第一方面提供的类案推荐方法。
[0038]相较于现有技术,本申请具有以下有益效果:
[0039]本申请提供的类案推荐方法,通过获取目标案件;提取所述目标案件的特征信息;将所述特征信息输入已构建的决策森林模型,得到所述目标案件的推荐结果。所述决策森林模型为基于决策树快速分类模型和权重树对历史数据进行训练得到的。在类案推荐服务进程启动过程中,当用户使用诉讼案件时,系统根据用户录入或者选择的案件,通过训练好
的模型对特定的案件进行类案推荐,找到与目标案件相似的案件,并自动推送出具有相似性大于一定阈值的案件,同时对于相同的案件类型产生不同判决结果的案件即同案不同判案件进行及时推送,输出类案推荐列表,为使用者提供相似案件前期参考。
附图说明
[0040]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0041]图1为本申请实施例提供的一种类案推荐方法流程图;
[0042]图2为本申请实施例提供的决策森林模型的构建训练过程;
[0043]图3为本申请实施例提供的一种类案推荐方法流程图;
[0044]图4为本申请实施例提供的基于权重树随机森林模型训练流程;
[0045]图5为本实施提供的模型在实际应用场景中的训练示意图;
[0046]图6为本申请实施例提供的一种类案推荐装置结构示意图。
具体实施方式
[0047]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0048]随机森林是一个包含多个本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种类案推荐方法,其特征在于,包括:获取目标案件;提取所述目标案件的特征信息;将所述特征信息输入已构建的决策森林模型,得到所述目标案件的推荐结果,所述决策森林模型为基于决策树快速分类模型和权重树对历史数据进行训练得到的。2.根据权利要求1所述的方法,其特征在于,所述获取目标案件之前,还包括:获取训练集和测试集;采用随机森林算法对所述训练集进行特征抽取,得到目标特征,根据所述训练集构造至少一个目标决策树;对建立所述目标决策树所使用目标特征的数量和目标决策树数量进行优化,得到目标参数;根据所述目标参数构建决策森林模型。3.根据权利要求2所述的方法,其特征在于,所述获取训练集和测试集之前,还包括:获取由历史数据样本组成的历史样本集,分别对历史样本集中每个样本进行标准化处理,得到由历史样本特征数据组成的历史样本特征集;按预设比例将所述历史样本特征集划分为训练集和测试集,所述训练集用于构造所述决策森林模型,所述测试集用于验证所述决策森林模型。4.根据权利要求2所述的方法,其特征在于,所述根据所述目标参数构建决策森林模型之后,还包括:利用决策森林对本次案件的相似案件进行投票;根据投票得到的分类结果得到目标案件对应的类案推荐列表。5.根据权利要求4所述的方法,其特征在于,所述利用决策森林对本次案件的相似案件进行投票包括:获取投票权重,所述投票权重是根据特征集的统计特性或决策树的性能确定的;将所述投票权重分配给相应的决策树;结...
【专利技术属性】
技术研发人员:谢波,周成阳,蒋洪伟,严欢,
申请(专利权)人:中国农业银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。