自动判案方法及系统技术方案

技术编号:18166543 阅读:31 留言:0更新日期:2018-06-09 12:06
本发明专利技术公开了一种自动判案方法及系统,该方法包括:获取待判案件相关资料;对所述待判案件相关资料进行分词及向量化处理,得到待判案件的文本向量;对预先构建的先验知识库中的信息进行向量化处理,得到先验知识向量;将所述先验知识向量及所述待判案件的文本向量输入预先构建的判案模型,根据所述判案模型的输出得到判案结果。利用本发明专利技术,可以提高判案效率,避免司法人员知识背景等主观因素的影响,提高判案的公正性和权威性。

【技术实现步骤摘要】
自动判案方法及系统
本专利技术涉及深度学习领域,具体涉及一种自动判案方法及系统。
技术介绍
现有的司法判案大多还是由司法相关人员主导的判案,如基于专家规则的判案方法,大致流程:对每种案件(如盗窃、抢劫等),人工定义影响判案的各个要素,在实际判案过程中,需填写每一个要素信息,最后根据要素信息得到对应的判案结果。
技术实现思路
本专利技术实施例提供一种自动判案方法及系统,以解决现有判案方法存在的人力耗费大,公正性、权威性易受办案人员主观影响的问题。为此,本专利技术提供如下技术方案:一种自动判案方法,包括:获取待判案件相关资料;对所述待判案件的描述信息进行分词及向量化处理,得到待判案件的文本向量;对预先构建的先验知识库中的信息进行向量化处理,得到先验知识向量;将所述先验知识向量及所述待判案件的文本向量输入预先构建的判案模型,根据所述判案模型的输出得到判案结果。优选地,按以下方式构建先验知识库:收集大量针对不同判案任务的相关语料;抽取所述语料中的关键词构建先验知识库。优选地,构建判案模型的过程包括:确定判案模型的拓扑结构,所述判案模型的拓扑结构包括:输入层、表示层、全连接层和输出层,所述输入层包括文本输入层和知识输入层,所述表示层包括文本表示层和知识表示层;收集训练数据,所述训练数据包括历史案件描述信息及对应的案件判案结果;对所述历史案件描述信息进行分词及向量化处理,得到历史案件的文本向量;对所述先验知识库中的信息进行向量化处理,得到先验知识向量;根据所述历史案件的文本向量、所述先验知识向量、以及所述案件判案结果,训练得到模型参数。优选地,所述对所述历史案件描述信息进行分词及向量化处理还包括:人名处理:对所述历史案件描述信息中的被告人和被害人的姓名进行识别,并将识别到的姓名用通用描述主体替代;和/或数字处理:对所述历史案件描述信息中的数值信息进行归一化处理,然后将归一化处理后的数字转化为词向量。优选地,所述将归一化处理后的数字转化为词向量包括:将归一化处理后的数字和设置的偏置量组成二维向量;利用多层感知器将所述二维向量转换为词向量。优选地,所述构建判案模型的过程还包括:在对所述历史案件描述信息进行分词及向量化处理之前,提取所述历史案件描述信息中的案情要素,并将所述案情要素依次拼接作为所述历史案件描述信息。优选地,所述方法还包括:在对所述待判案件的描述信息进行分词及向量化处理之前,提取所述待判案件相关资料中的案情要素,并将所述案情要素依次拼接作为所述待判案件的描述信息。优选地,所述对所述待判案件的描述信息进行分词及向量化处理还包括:人名处理:对所述待判案件的描述信息中的被告人和被害人的姓名进行识别,并将识别到的姓名用通用描述主体替代;和/或数字处理:对所述待判案件的描述信息中的数值信息进行归一化处理,然后将归一化处理后的数字转化为词向量。一种自动判案系统,包括:资料获取模块,用于获取待判案件相关资料;预处理模块,用于对所述待判案件相关资料进行分词及向量化处理,得到待判案件的文本向量;先验知识处理模块,用于对所述先验知识库中的信息进行向量化处理,得到先验知识向量;判案模块,用于将所述先验知识向量及所述待判案件的文本向量输入所述判案模型,根据所述判案模型的输出得到判案结果。优选地,所述系统还包括:先验知识库构建模块,用于收集大量针对不同判案任务的相关语料,抽取所述语料中的关键词构建先验知识库。优选地,所述系统还包括:判案模型构建模块,用于构建判案模型;所述判案模型构建模块包括:结构设计单元,用于确定判案模型的拓扑结构,所述判案模型的拓扑结构包括:输入层、表示层、全连接层和输出层,所述输入层包括文本输入层和知识输入层,所述表示层包括文本表示层和知识表示层;数据收集单元,用于收集训练数据,所述训练数据包括历史案件描述信息及对应的案件判案结果;预处理单元,用于对所述历史案件描述信息进行分词及向量化处理,得到历史案件的文本向量;先验知识处理单元,用于对所述先验知识库中的信息进行向量化处理,得到先验知识向量;训练单元,用于根据所述历史案件的文本向量、所述先验知识向量、以及所述案件判案结果,训练得到模型参数。优选地,所述预处理单元包括:人名处理子单元,用于对所述历史案件描述信息中的被告人和被害人的姓名进行识别,并将识别到的姓名用通用描述主体替代;和/或数字处理子单元,用于对所述历史案件描述信息中的数值信息进行归一化处理,然后将归一化处理后的数字转化为词向量。优选地,所述数字处理子单元将归一化处理后的数字和设置的偏置量组成二维向量,利用多层感知器将所述二维向量转换为词向量。优选地,所述判案模型构建模块还包括:信息处理单元,用于提取所述历史案件描述信息中的案情要素,并将所述案情要素依次拼接作为所述历史案件描述信息。优选地,所述系统还包括:信息处理模块,用于提取所述待判案件相关资料中的案情要素,并将所述案情要素依次拼接作为所述待判案件的描述信息。优选地,所述预处理模块包括:人名处理子模块,用于对所述待判案件的描述信息中的被告人和被害人的姓名进行识别,并将识别到的姓名用通用描述主体替代;和/或数字处理子模块,用于对所述待判案件的描述信息中的数值信息进行归一化处理,然后将归一化处理后的数字转化为词向量。本专利技术实施例提供的自动判案方法及系统,预先构建先验知识库和判案模型,在进行判案时,根据所述先验知识库及待判案件相关资料,基于所述判案模型得到判案结果。本专利技术方案不仅提高了判案效率,减轻了司法相关工作人员的工作量,而且避免了司法人员知识背景等主观因素的影响,提高了判案的公正性和权威性。此外,利用先验知识辅助判案,解决了端到端建模存在的因训练数据量不足导致效果不佳的问题。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1是本专利技术实施例中构建先验知识库的流程图;图2是本专利技术实施例中构建判案模型的流程图;图3是本专利技术实施例中判案模型的拓扑结构示意图;图4是本专利技术实施例中数字向量化模型结构示意图;图5是本专利技术实施例自动判案方法的流程图;图6是本专利技术实施例自动判案系统的一种结构示意图;图7是本专利技术实施例中判案模型构建模块的一种具体结构示意图;图8是本专利技术实施例自动判案系统的另一种结构示意图。具体实施方式为了使本
的人员更好地理解本专利技术实施例的方案,下面结合附图和实施方式对本专利技术实施例作进一步的详细说明。针对现有技术中人工主导的办案方式存在的诸多问题,本专利技术实施例提供一种自动判案方法及系统,预先构建先验知识库和判案模型,对于待判案件,基于所述先验知识库中的信息和判案模型,自动得到判断结果。如图1所示,是本专利技术实施例中构建先验知识库的流程图,包括以下步骤:步骤101,收集大量针对不同判案任务的相关语料。步骤102,抽取所述语料中的关键词构建先验知识库。如针对刑期预测任务,收集《刑法》、各地区《量刑指导意见》等语料,抽取语料中的关键词构建先验知识库。需要说明的是,关键词的抽取可以采用自动方式或者人工的方式,对此本专利技术实施例不做限定。为了便于描述及后续对先验知识库中信息的使用本文档来自技高网
...
自动判案方法及系统

【技术保护点】
一种自动判案方法,其特征在于,包括:获取待判案件相关资料;对所述待判案件的描述信息进行分词及向量化处理,得到待判案件的文本向量;对预先构建的先验知识库中的信息进行向量化处理,得到先验知识向量;将所述先验知识向量及所述待判案件的文本向量输入预先构建的判案模型,根据所述判案模型的输出得到判案结果。

【技术特征摘要】
1.一种自动判案方法,其特征在于,包括:获取待判案件相关资料;对所述待判案件的描述信息进行分词及向量化处理,得到待判案件的文本向量;对预先构建的先验知识库中的信息进行向量化处理,得到先验知识向量;将所述先验知识向量及所述待判案件的文本向量输入预先构建的判案模型,根据所述判案模型的输出得到判案结果。2.根据权利要求1所述的方法,其特征在于,按以下方式构建先验知识库:收集大量针对不同判案任务的相关语料;抽取所述语料中的关键词构建先验知识库。3.根据权利要求1所述的方法,其特征在于,构建判案模型的过程包括:确定判案模型的拓扑结构,所述判案模型的拓扑结构包括:输入层、表示层、全连接层和输出层,所述输入层包括文本输入层和知识输入层,所述表示层包括文本表示层和知识表示层;收集训练数据,所述训练数据包括历史案件描述信息及对应的案件判案结果;对所述历史案件描述信息进行分词及向量化处理,得到历史案件的文本向量;对所述先验知识库中的信息进行向量化处理,得到先验知识向量;根据所述历史案件的文本向量、所述先验知识向量、以及所述案件判案结果,训练得到模型参数。4.根据权利要求3所述的方法,其特征在于,所述对所述历史案件描述信息进行分词及向量化处理还包括:人名处理:对所述历史案件描述信息中的被告人和被害人的姓名进行识别,并将识别到的姓名用通用描述主体替代;和/或数字处理:对所述历史案件描述信息中的数值信息进行归一化处理,然后将归一化处理后的数字转化为词向量。5.根据权利要求4所述的方法,其特征在于,所述将归一化处理后的数字转化为词向量包括:将归一化处理后的数字和设置的偏置量组成二维向量;利用多层感知器将所述二维向量转换为词向量。6.根据权利要求3所述的方法,其特征在于,所述构建判案模型的过程还包括:在对所述历史案件描述信息进行分词及向量化处理之前,提取所述历史案件描述信息中的案情要素,并将所述案情要素依次拼接作为所述历史案件描述信息;所述方法还包括:在对所述待判案件的描述信息进行分词及向量化处理之前,提取所述待判案件相关资料中的案情要素,并将所述案情要素依次拼接作为所述待判案件的描述信息。7.根据权利要求1所述的方法,其特征在于,所述对所述待判案件的描述信息进行分词及向量化处理还包括:人名处理:对所述待判案件的描述信息中的被告人和被害人的姓名进行识别,并将识别到的姓名用通用描述主体替代;和/或数字处理:对所述待判案件的描述信息中的数值信息进行归一化处理,然后将归一化处理后的数字转化为词向量。8.一种自动判案系统,其特征在于,包括:资料获取模块...

【专利技术属性】
技术研发人员:王宝鑫李剑锋王士进
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1