一种司法类案检索方法及系统技术方案

技术编号:16379740 阅读:49 留言:0更新日期:2017-10-15 13:45
本发明专利技术公开了一种司法类案检索方法及系统,该方法包括:接收用户输入的查询信息,并根据查询信息提取关键词;根据所述关键词,通过预先配置的语义词典,确定与所述关键词相同或相近的语义;对所述语义进行数据处理,确定所述语义所对应的查询特征信息;根据所述查询特征信息,在预先配置的司法文书数据库中,查找与所述查询特征信息相匹配的司法文书;根据预先设置的排序规则,对查找出的所述司法文书进行排序,并将排序后的司法文书进行输出呈现。本发明专利技术有效的提高了司法类案件检索时的个性化、智能化和专业化,增强了用户的体验性,提高了检索时的准确性。

A judicial case retrieval method and system

The invention discloses a judicial case retrieval method and system, the method comprises: receiving user input query information, and extract keywords according to query information; according to the key words, the semantic dictionary pre configured, the semantic and the key words in the same or similar; the semantic data processing, determine corresponding to the semantic feature information; according to the query feature information in the database of judicial documents pre configured, search and the feature information matching the judicial documents; according to the sorting rules set in advance, ordering the judicial documents to find out, and will sort the judicial documents the output shows. The invention effectively improves the individuation, intelligence and specialization of the judicial case retrieval, enhances the user's experience, and improves the accuracy of the retrieval.

【技术实现步骤摘要】
一种司法类案检索方法及系统
本专利技术涉及数据检索
,具体来说,涉及一种司法类案件检索方法及系统。
技术介绍
随着社会信息的公开化和透明化,案件的审判结果也越来越受到社会的关注。由于不同用户的偏好不同,关心的文书案件差异也相对较大,现有的司法类案件检索应用,缺少与用户的互动,不能针对不同的用户搜索习惯作出相应的搜索调整,已经不能满足当前用户个性化和智能化的检索需求。总的来说,主要有如下几个方面:1、用户无法准确的表达自己的需求。正常情况下用户很难用一个词或者一组词来准确的表达自己的需要,而现有的搜索引擎中使用的关键词匹配方式的搜索只是将关键词跟索引的词语进行机械的匹配。2、缺少用户个性化服务。现有的搜索引擎没有对用户的搜索习惯、浏览偏好进行总结,用户经常搜索的内容不能按照用户兴趣对搜索结果进行排序,所有用户进行相同搜索时得到的结果都是相同的,不能针对用户兴趣将用户感兴趣的内容优先显示。3.一篇文书仅仅使用内容信息来描述是不全面的,因为对于一篇文书,对于用户A是十分感兴趣的内容,但是对于用户B来说不一定,从而导致推荐结果的准确率和专业性大大的降低。针对相关技术中的问题,目前尚未提出有效的解决方案。
技术实现思路
针对相关技术中的问题,本专利技术提出一种司法类案检索方法及系统,以克服现有相关技术所存在的上述技术问题。本专利技术的技术方案是这样实现的:根据本专利技术一方面,提供了一种司法类案检索方法。该司法类案件检索方法,包括:接收用户输入的查询信息,并根据查询信息提取关键词;根据所述关键词,通过预先配置的语义词典,确定与所述关键词相同或相近的语义;对所述语义进行数据处理,确定所述语义所对应的查询特征信息;根据所述查询特征信息,在预先配置的司法文书数据库中,查找与所述查询特征信息相匹配的司法文书;根据预先设置的排序规则,对查找出的所述司法文书进行排序,并将排序后的司法文书进行呈现。其中,所述查询信息为文字信息。其中,在对所述语义进行数据处理,确定所述语义所对应的查询特征信息时,可对语义的内容进行分析,确定所述语义中包含的法律法规、法律事实、法律争议要点;并将将确定出的所述法律法规、所述法律事实和/或所述法律争议要点作为所述查询特征信息。其中,在根据所述查询特征信息,在预先配置的司法文书数据库中,查找与所述查询特征信息相匹配的司法文书时:可预先配置司法文书数据库,并对所述司法文书数据库中的司法文书进行数据处理,确定每个司法文书所述对应的特征信息,其中,所述特征信息包括法律法规、法律事实和/或法律争议要点;并将所述查询特征信息与所述特征信息进行对比,并在对比结果为查询特征信息与所述特征信息相符的情况下,确定所述特征信息所对应的司法文书为所述查询特征信息所对应的欲查询司法文书。其中,在根据预先设置的排序规则,对查找出的所述司法文书进行排序,并将排序后的司法文书进行呈现时,可计算所述查询特征信息的特征向量以及所述查询特征信息所对应的司法文书的特征向量;并根据上述特征向量,基于向量空间模型确定所述查询信息的特征向量与所述司法文书的特征向量的相似度;再根据预先配置的权重,确定所述相似度所对应的权重总和,并根据权重总和的大小进行司法文书排序并呈现。此外,上述司法类案件检索方法还包括:在对司法文书进行呈现后,根据用户浏览文书页面时的行为,确定用户对每个司法文书的兴趣度;将所述兴趣度与对应的司法文书的所对应的查询特征信息和/或用户的ID进行绑定,建立绑定关系;在再次接收用户输入的查询信息并确定对应的查询特征信息后,通过所述绑定关系判断所述查询特征信息是否具备对应的兴趣度;在判断结果为具备对应的兴趣度的情况下,在排序的基础上,再根据预定兴趣度排序规则,对司法文书进行排序,并将排序后的司法文书进行呈现。其中,所述行为包括用户在文书页面停留时间、鼠标点击次数、用户对文书页面进行收藏、点赞。其中,在根据所述行为,确定用户对每个司法文书的兴趣度时,可在所述文书页面停留时间大于或等于预先设定阈值的情况下,确定用户对对应的司法文书感兴趣,并计算兴趣度;在所述鼠标点击次数大于或等于预先设定阈值的情况下,确定用户对对应的司法文书感兴趣,并计算兴趣度;在用户对文书页面进行了收藏的情况下,确定用户对对应的司法文书感兴趣,并计算兴趣度;在用户对文书页面进行了点赞的情况下,确定用户对对应的司法文书感兴趣,并计算兴趣度。此外,在根据所述行为,确定用户对每个司法文书的兴趣度时,还可根据所述文书页面停留时间和对该文书内容长度大小,确定停留时间和文书内容长度大小的比值;在所述比值大于或等于预先设定阈值的情况下,确定用户对对应的司法文书感兴趣。其中,在根据预定兴趣度排序规则,对司法文书进行排序,并将排序后的司法文书进行呈现时,可根据司法文书文档的更新时间,确定司法文书的新鲜度,并根据用户对对应的司法文书的兴趣度和该司法文书的新鲜度,通过预先配置的权重,计算兴趣度和新鲜度的权重总和,并将该权重总和作为排序评分;根据排序评分的高低进行排序,排序评分高的司法文书优先于排序评分低的司法文书。此外,在根据预定兴趣度排序规则,对司法文书进行排序,并将排序后的司法文书进行呈现时,还可确定用户查询和司法文书的相似度,并在排序评分的基础上,根据所述相似度进行排序,相似度高者优先于相似度低者。根据本专利技术另一方面,提供了一种司法类案检索系统。该司法类案件检索系统包括:接收模块,用于接收用户输入的查询信息,并根据查询信息提取关键词;扩展模块,用于根据所述关键词,通过预先配置的语义词典,确定与所述关键词相同或相近的语义处理模块,用于对所述语义进行数据处理,确定所述语义所对应的查询特征信息;匹配模块,用于根据所述查询特征信息,在预先配置的司法文书数据库中,查找与所述查询特征信息相匹配的司法文书;呈现模块,用于根据预先设置的排序规则,对查找出的所述司法文书进行排序,并将排序后的司法文书进行呈现。其中,所述查询信息为文字信息。其中,所述处理模块包括特征分析子模块和特征确定子模块,其中,所述特征分析子模块,用于对所述语义的内容进行分析,确定所述语义中包含的法律法规、法律事实、法律争议要点;所述特征确定子模块,用于将确定出的所述法律法规、所述法律事实和/或所述法律争议要点作为所述查询特征信息。其中,所述匹配模块包括配置子模块和对比子模块,其中,所述配置子模块,用于预先配置司法文书数据库,并对所述司法文书数据库中的司法文书进行数据处理,确定每个司法文书所述对应的特征信息,其中,所述特征信息包括法律法规、法律事实和/或法律争议要点;所述对比子模块,用于将所述查询特征信息与所述特征信息进行对比,并在对比结果为查询特征信息与所述特征信息相符的情况下,确定所述特征信息所对应的司法文书为所述查询特征信息所对应的欲查询司法文书。其中,所述呈现模块包括计算子模块、确定子模块、排序子模块,其中,所述计算子模块,用于计算所述查询特征信息的特征向量以及所述查询特征信息所对应的司法文书的特征向量;所述确定子模块,用于根据上述特征向量,基于向量空间模型确定所述查询信息的特征向量与所述司法文书的特征向量的相似度;所述排序子模块,用于根据预先配置的权重,确定所述相似度所对应的权重总和,并根据权重总和的大小进行司法文书排序并呈本文档来自技高网...
一种司法类案检索方法及系统

【技术保护点】
一种司法类案检索方法,其特征在于,包括:接收用户输入的查询信息,并根据查询信息提取关键词;根据所述关键词,通过预先配置的语义词典,确定与所述关键词相同或相近的语义;对所述语义进行数据处理,确定所述语义所对应的查询特征信息;根据所述查询特征信息,在预先配置的司法文书数据库中,查找与所述查询特征信息相匹配的司法文书;根据预先设置的排序规则,对查找出的所述司法文书进行排序,并将排序后的司法文书进行呈现。

【技术特征摘要】
1.一种司法类案检索方法,其特征在于,包括:接收用户输入的查询信息,并根据查询信息提取关键词;根据所述关键词,通过预先配置的语义词典,确定与所述关键词相同或相近的语义;对所述语义进行数据处理,确定所述语义所对应的查询特征信息;根据所述查询特征信息,在预先配置的司法文书数据库中,查找与所述查询特征信息相匹配的司法文书;根据预先设置的排序规则,对查找出的所述司法文书进行排序,并将排序后的司法文书进行呈现。2.根据权利要求1所述的司法类案件检索方法,其特征在于,还包括:在对司法文书进行呈现后,根据用户浏览文书页面时的行为,确定用户对每个司法文书的兴趣度;将所述兴趣度与对应的司法文书的所对应的查询特征信息和/或用户的ID进行绑定,建立绑定关系;在再次接收用户输入的查询信息并确定对应的查询特征信息后,通过所述绑定关系判断所述查询特征信息是否具备对应的兴趣度;在判断结果为具备对应的兴趣度的情况下,在排序的基础上,再根据预定兴趣度排序规则,对司法文书进行排序,并将排序后的司法文书进行呈现。3.根据权利要求2所述的司法类案件检索方法,其特征在于,所述行为包括用户在文书页面停留时间、鼠标点击次数、用户对文书页面进行收藏、点赞。4.根据权利要求3所述的司法类案件检索方法,其特征在于,根据所述行为,确定用户对每个司法文书的兴趣度包括:在所述文书页面停留时间大于或等于预先设定阈值的情况下,确定用户对对应的司法文书感兴趣,并计算兴趣度;在所述鼠标点击次数大于或等于预先设定阈值的情况下,确定用户对对应的司法文书感兴趣,并计算兴趣度;在用户对文书页面进行了收藏的情况下,确定用户对对应的司法文书感兴趣,并计算兴趣度;在用户对文书页面进行了点赞的情况下,确定用户对对应的司法文书感兴趣,并计算兴趣度。5.根据权利要求4所述的司法类案件检索方法,其特征在于,根据所述行为,确定用户对每个司法文书的兴趣度还包括:根据所述文书页面停留时间和对该文书内容长度大小,确定停留时间和文书内容长度大小的比值;在所述比值大于或等于预先设定阈值的情况下,确定用户对对应的司法文书感兴趣。6.根据权利要求5所述的司法类案件检索方法,其特征在于,根据预定兴趣度排序规则,对司法文书进行排序,并将排序后的司法文书进行呈现包括:根据司法文书文档的更新时间,确定司法文书的新鲜度,并根据用户对对应的司法文书的兴趣度和该司法文书的新鲜度,通过预先配置的权重,计算兴趣度和新鲜度的权重总和,并将该权重总和作为排序评分;根据排序评分的高低进行排序,排序评分高的司法文书优先于排序评分低的司法文书。7.根据权利要求6所述的司法类案件检索方法,其特征在于,根据预定兴趣度排序规则,对司法文书进行排序,并将排序后的司法文书进行呈现包括:确定用户查询和司法文书的相似度,并在排序评分的基础上,根据所述相似度进行排序,相似度高者优先于相似度低者。8.一种司法类案件检索系统,其特征在于,包括:接收模块,用于接收用户输入的查询信息,并根据查询信息提取关键词;扩展模块,用于根...

【专利技术属性】
技术研发人员:耿伟贾真周宇司华建
申请(专利权)人:安徽富驰信息技术有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1