自动判案方法及系统技术方案

技术编号：18166543 阅读：31 留言：0更新日期：2018-06-09 12:06

本发明专利技术公开了一种自动判案方法及系统，该方法包括：获取待判案件相关资料；对所述待判案件相关资料进行分词及向量化处理，得到待判案件的文本向量；对预先构建的先验知识库中的信息进行向量化处理，得到先验知识向量；将所述先验知识向量及所述待判案件的文本向量输入预先构建的判案模型，根据所述判案模型的输出得到判案结果。利用本发明专利技术，可以提高判案效率，避免司法人员知识背景等主观因素的影响，提高判案的公正性和权威性。

全部详细技术资料下载

【技术实现步骤摘要】
自动判案方法及系统
本专利技术涉及深度学习领域，具体涉及一种自动判案方法及系统。
技术介绍
现有的司法判案大多还是由司法相关人员主导的判案，如基于专家规则的判案方法，大致流程：对每种案件(如盗窃、抢劫等)，人工定义影响判案的各个要素，在实际判案过程中，需填写每一个要素信息，最后根据要素信息得到对应的判案结果。
技术实现思路
本专利技术实施例提供一种自动判案方法及系统，以解决现有判案方法存在的人力耗费大，公正性、权威性易受办案人员主观影响的问题。为此，本专利技术提供如下技术方案：一种自动判案方法，包括：获取待判案件相关资料；对所述待判案件的描述信息进行分词及向量化处理，得到待判案件的文本向量；对预先构建的先验知识库中的信息进行向量化处理，得到先验知识向量；将所述先验知识向量及所述待判案件的文本向量输入预先构建的判案模型，根据所述判案模型的输出得到判案结果。优选地，按以下方式构建先验知识库：收集大量针对不同判案任务的相关语料；抽取所述语料中的关键词构建先验知识库。优选地，构建判案模型的过程包括：确定判案模型的拓扑结构，所述判案模型的拓扑结构包括：输入层、表示层、全连接层和输出层，所述输入层包括文本输入层和知识输入层，所述表示层包括文本表示层和知识表示层；收集训练数据，所述训练数据包括历史案件描述信息及对应的案件判案结果；对所述历史案件描述信息进行分词及向量化处理，得到历史案件的文本向量；对所述先验知识库中的信息进行向量化处理，得到先验知识向量；根据所述历史案件的文本向量、所述先验知识向量、以及所述案件判案结果，训练得到模型参数。优选地，所述对所述历史案件描述信息进...
自动判案方法及系统

【技术保护点】
一种自动判案方法，其特征在于，包括：获取待判案件相关资料；对所述待判案件的描述信息进行分词及向量化处理，得到待判案件的文本向量；对预先构建的先验知识库中的信息进行向量化处理，得到先验知识向量；将所述先验知识向量及所述待判案件的文本向量输入预先构建的判案模型，根据所述判案模型的输出得到判案结果。

【技术特征摘要】
1.一种自动判案方法，其特征在于，包括：获取待判案件相关资料；对所述待判案件的描述信息进行分词及向量化处理，得到待判案件的文本向量；对预先构建的先验知识库中的信息进行向量化处理，得到先验知识向量；将所述先验知识向量及所述待判案件的文本向量输入预先构建的判案模型，根据所述判案模型的输出得到判案结果。2.根据权利要求1所述的方法，其特征在于，按以下方式构建先验知识库：收集大量针对不同判案任务的相关语料；抽取所述语料中的关键词构建先验知识库。3.根据权利要求1所述的方法，其特征在于，构建判案模型的过程包括：确定判案模型的拓扑结构，所述判案模型的拓扑结构包括：输入层、表示层、全连接层和输出层，所述输入层包括文本输入层和知识输入层，所述表示层包括文本表示层和知识表示层；收集训练数据，所述训练数据包括历史案件描述信息及对应的案件判案结果；对所述历史案件描述信息进行分词及向量化处理，得到历史案件的文本向量；对所述先验知识库中的信息进行向量化处理，得到先验知识向量；根据所述历史案件的文本向量、所述先验知识向量、以及所述案件判案结果，训练得到模型参数。4.根据权利要求3所述的方法，其特征在于，所述对所述历史案件描述信息进行分词及向量化处理还包括：人名处理：对所述历史案件描述信息中的被告人和被害人的姓名进行识别，并将识别到的姓名用通用描述主体替代；和/或数字处理：对所述历史案件描述信息中的数值信息进行归一化处理，然后将归一化处理后的数字转化为词向量。5.根据权利要求4所述的方法，其特征在于，所述将归一化处理后的数字转化为词向量包括：将归一化处理后的数字和设置的偏置量组成二维向量；利用多层感知器将所述二维向量转换为词向量。6.根据权利要求3所述的方法，其特征在于，所述构建判案模型的过程还包括：在对所述历史案件描述信息进行分词及向量化处理之前，提取所述历史案件描述信息中的案情要素，并将所述案情要素依次拼接作为所述历史案件描述信息；所述方法还包括：在对所述待判案件的描述信息进行分词及向量化处理之前，提取所述待判案件相关资料中的案情要素，并将所述案情要素依次拼接作为所述待判案件的描述信息。7.根据权利要求1所述的方法，其特征在于，所述对所述待判案件的描述信息进行分词及向量化处理还包括：人名处理：对所述待判案件的描述信息中的被告人和被害人的姓名进行识别，并将识别到的姓名用通用描述主体替代；和/或数字处理：对所述待判案件的描述信息中的数值信息进行归一化处理，然后将归一化处理后的数字转化为词向量。8.一种自动判案系统，其特征在于，包括：资料获取模块...

【专利技术属性】
技术研发人员：王宝鑫，李剑锋，王士进，
申请(专利权)人：科大讯飞股份有限公司，
类型：发明
国别省市：安徽,34

全部详细技术资料下载我是这个专利的主人