System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机,特别涉及一种案件分析方法、系统、设备及存储介质。
技术介绍
1、随着科技的迅猛发展,ai(人工智能)在各行业中的应用日益广泛,并显著提升了生产效率。新一代aigc(生成式人工智能)技术,基于深度学习理论和预训练基础模型,通过利用大数据技术实现智能化。根据新一代ai发展规划,政府积极推广ai技术在司法领域的应用,以推动治理现代化,解决行政管理、司法管理、城市管理和环境保护等热点和难点问题。
2、例如,2022年中国信通院和京东探索研究院联合发布的白皮书强调,ai生成内容正在引发深刻变革,重塑甚至颠覆数字内容的生产方式。此外,政府也积极参与到数字化变革中,并为基层信访咨询提供数字化赋能。智能咨询系统通过自然语言算法为用户提供个性化的咨询服务,但也存在局限性,如过度依赖数据库资料。近年来,预训练语言模型的发展使得aigc能够为不同用户提供个性化、精细化的咨询服务,为社会治理现代化提供有力支持。
3、在近年来的自然语言处理(nlp)领域,预训练语言基座模型已经成为了一个核心技术。这种模型基于深度学习技术,通过在大规模的文本数据上进行无监督学习,从而实现了与传统网络不同的语言处理能力。它不仅具备了文本语义分类、文本翻译等基础的自然语言处理任务的能力,还成功地拓展到了文本对话、上下文语义记忆与对答以及逻辑推理等高阶任务。
4、2017年标志着自然语言处理领域的一个重要里程碑。在这一年,google(谷歌)引入了一种创新性的模型结构,名为transformer(一种模型结构)。此模型基
5、在2018年,openai(人工智能工具包)和google分别推出了gpt(生成式预训练transfomer模型)和bert(一种端到端的模型)两大模型。这两大模型均以transformer结构为基础构建,但是在训练方法上有所不同。具体来说,bert采用了双向transformer结构,而gpt则采用了单向结构。这两种模型在各种自然语言处理任务中均表现出卓越的性能,为整个领域带来了重大的突破。
6、而当前语言模型解决法律咨询问题时存在可靠性低,幻觉现象,人类指令遵循能力不佳等问题,尤其在面对复杂案情中,大语言模型仍然无法形成人类法官思考时的事实链条,因此模型输出的判决结果可靠性低。
技术实现思路
1、本专利技术要解决的技术问题是为了克服现有技术中处理法律案件的方式存在可靠性低,无法形成事实链条的缺陷,提供一种案件分析方法、系统、设备及存储介质。
2、本专利技术是通过下述技术方案来解决上述技术问题:
3、本专利技术第一方面提供了一种案件分析方法,所述案件分析方法包括:
4、构建法律事实链的监督数据集;
5、利用所述监督数据集对法律基座模型进行微调,得到微调后的法律基座模型;
6、将咨询文本输入所述微调后的法律基座模型进行提取并分析所述咨询文本中的法律事实链,以实现目标案件的咨询。
7、优选地,所述构建法律事实链的监督数据集的步骤包括:
8、获取非结构化的历史法律数据,所述非结构化的历史法律数据包括历史咨询文本以及与所述历史咨询文本对应的历史判决书;
9、利用微调前的法律基座模型从所述历史咨询文本以及所述历史判决书中提取法律实体;
10、按照法律思维链框架对所述法律实体进行分析和标注,以得到法律思维链数据;
11、基于所述法律思维链数据构建所述法律事实链的监督数据集。
12、优选地,所述案件分析方法还包括:
13、识别所述咨询文本的咨询类型;
14、搜寻与所述咨询类型匹配的法条数据标签;
15、根据所述法条数据标签确定法条数据范围;
16、在所述法条数据范围内获取与所述咨询文本相关的法条数据的相似度;
17、对所述法条数据的相似度进行排序,并将排序名次大于预设排序名次的法条数据反馈至所述微调后的法律基座模型。
18、优选地,所述案件分析方法还包括:
19、对所述咨询文本中的法律事实链进行校验,得到校验结果。
20、本专利技术第二方面提供了一种案件分析系统,所述案件分析系统包括:
21、构建模块,用于构建法律事实链的监督数据集;
22、微调模块,用于利用所述监督数据集对法律基座模型进行微调,得到微调后的法律基座模型;
23、分析模块,用于将待分析案件的目标咨询文本输入所述微调后的法律基座模型进行分析,以得到目标事实链。
24、优选地,所述构建模块包括:
25、获取单元,用于获取非结构化的历史法律数据,所述非结构化的历史法律数据包括历史咨询文本以及与所述历史咨询文本对应的历史判决书;
26、提取单元,用于利用微调前的法律基座模型从所述历史咨询文本以及所述历史判决书中提取法律实体;
27、处理单元,用于按照法律思维链框架对所述法律实体进行分析和标注,以得到法律思维链数据;
28、构建单元,用于基于所述法律思维链数据构建所述法律事实链的监督数据集。
29、优选地,所述案件分析系统还包括:
30、识别模块,用于识别所述咨询文本的咨询类型;
31、搜寻模块,用于搜寻与所述咨询类型匹配的法条数据标签;
32、确定模块,用于根据所述法条数据标签确定法条数据范围;
33、获取模块,用于在所述法条数据范围内获取与所述咨询文本相关的法条数据的相似度;
34、排序模块,用于对所述法条数据的相似度进行排序,并将排序名次大于预设排序名次的法条数据反馈至所述微调后的法律基座模型。
35、优选地,所述案件分析系统还包括:
36、校验模块,用于对所述咨询文本中的法律事实链进行校验,得到校验结果。
37、本专利技术第三方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并用于在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的案件分析方法。
38、本专利技术第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的案件分析方法。
39、在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本专利技术各较佳实例。
40、本专利技术的积极进步效果在于:
41、本专利技术利用构建的法律事实链的监督数据集对法律基座模型进行微调,得到微调后的法律基座模型;将咨询文本输入微调后的法律基座模型进行提取并分析所述咨询文本中的法律事实链,以实现目标案件的咨询,实现了基于法律事实链的案件分析,利用微调后的法律基座模型能够对用户的咨询本文档来自技高网...
【技术保护点】
1.一种案件分析方法,其特征在于,所述案件分析方法包括:
2.如权利要求1所述的案件分析方法,其特征在于,所述构建法律事实链的监督数据集的步骤包括:
3.如权利要求1所述的案件分析方法,其特征在于,所述案件分析方法还包括:
4.如权利要求1所述的案件分析方法,其特征在于,所述案件分析方法还包括:
5.一种案件分析系统,其特征在于,所述案件分析系统包括:
6.如权利要求5所述的案件分析系统,其特征在于,所述构建模块包括:
7.如权利要求5所述的案件分析系统,其特征在于,所述案件分析系统还包括:
8.如权利要求5所述的案件分析系统,其特征在于,所述案件分析系统还包括:
9.一种电子设备,包括存储器、处理器及存储在存储器上并用于在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-4中任一项所述的案件分析方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-4中任一项所述的案件分析方
...【技术特征摘要】
1.一种案件分析方法,其特征在于,所述案件分析方法包括:
2.如权利要求1所述的案件分析方法,其特征在于,所述构建法律事实链的监督数据集的步骤包括:
3.如权利要求1所述的案件分析方法,其特征在于,所述案件分析方法还包括:
4.如权利要求1所述的案件分析方法,其特征在于,所述案件分析方法还包括:
5.一种案件分析系统,其特征在于,所述案件分析系统包括:
6.如权利要求5所述的案件分析系统,其特征在于,所述构建模块包括:
7....
【专利技术属性】
技术研发人员:林凯文,姚昱材,胡贤良,于祥雨,
申请(专利权)人:华院计算技术上海股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。