System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及智能问答方法,具体涉及一种基于大语言模型的案件问答方法、介质及设备。
技术介绍
1、随着人工智能(legalai)的兴起,各个行业领域正在经历重大的转变。通过自动化任务、问题解答使各类群体受益。它通过减轻纸质工作的繁重负担,提高了人们的工作效率,简化了普通人群对日常生活服务、咨询服务和远程案件咨询的获取过程。
2、然而,这些技术的应用也面临着诸如回答产生幻觉和模型的推理能力不够等挑战,所以解决智能研判产生幻觉和提高模型的推理能力也成了目前研究的热点。
3、结合现行问答技术和指定应用领域大模型技术的调研与整理,可知现有案件的标注好的语料较少,并且由于案件问答任务的特殊性导致智能问答的部分方法无法直接迁移到这一领域上。由于大语言模型在各种任务上都取得了优异的效果,使用大语言模型解决案件问答问题是目前研究热点,但是仍存在以下问题:
4、1)虽然大语言模型在不少nlp任务中表现出优异的效果,常用的微调方法在案件智能问答任务上效果仍不理想。
5、2)虽然大语言模型在通用领域的智能问答效果较好,但是由于案件问答任务的特殊性,智能问答的逻辑性以及准确度仍然不够。
技术实现思路
1、本专利技术目的在于提供一种能够提高问答技术在生成准确和可靠答案方面的性能、减少错误信息或幻觉的产生的基于大语言模型的案件问答方法、介质及设备,具体技术方案如下:
2、本专利技术提供一种基于大语言模型的案件问答方法,包括如下步骤:
3、
4、将获取的案件的图文信息和案件的相关问题输入智能问答模型得到最优答案,该智能问答模型通过以下步骤获得:
5、s1:构建包含案件相关知识的多模态语料库,并基于迁移学习通过多模态语料库训练预训练模型,得到适用于案件的基模型,其中:多模态语料库的数据格式包括文本和图片;
6、s2:基于lora和p-tuning对基模型的参数信息进行微调,得到微调后大语言模型;
7、s3:在微调后大语言模型的基础上引入clip模块对输入案件的图文信息进行多模态特征融合,得到能够理解和融合图文信息的初步问答模型;
8、s4:在初步问答模型中引入多维逻辑关联的思维链,得到生成模型;生成模型根据输入案件的相关问题输出多个具有推理链的候选答案;
9、s5:基于对比学习方法以及生成模型所生成的候选答案训练现有打分模型,得到能够输出多个候选答案中最优答案的评价模型。
10、可选地,所述s1包括:
11、s1.1、收集案件相关领域的多源数据,并对收集到的案件相关领域的多源数据进行预处理,得到包含案件相关知识的多模态语料库,其中:案件相关知识的文本数据包括案件相关规定和案件判决信息;预处理包括对案件相关领域的多源数据进行数据清洗,并对案件相关领域的多源数据中未标注的数据进行标注;
12、s1.2、选择基于在大规模通用语料上预训练的语言模型作为预训练模型,并对预训练模型进行初始化;
13、s1.3、从多模态语料库中提取得到案件相关领域的标注数据集,通过案件相关领域的标注数据集对预训练模型进行继续训练得到微调后的模型,具体公式如下:
14、;
15、其中,是目标任务上的损失函数;为预训练模型;是案件相关领域的标注数据集,是微调后的模型;
16、s1.4、将微调后的模型适配到具体的案件问答任务,得到适配后的模型,其中:案件问答任务包括问题理解、答案生成和信息抽取;
17、s1.5、对适配后的模型进行优化,得到适用于案件的基模型。
18、可选地,所述s1.5包括:
19、对适配后的模型进行多任务学习,得到能够同时进行多任务的优化模型;
20、在优化模型中引入正则化项和学习率调度策略,得到正则化后的模型;
21、在正则化后的模型引入知识图谱或多模态语料库,得到适用于案件的基模型。
22、可选地,所述s2包括:
23、基于lora微调方法通过引入低秩矩阵来优化基模型中特定层的权重矩阵,得到第一次微调后基模型;
24、基于p-tuning微调方法优化第一次微调后基模型的输入端中针对案件问答任务的提示符,得到微调后大语言模型。
25、可选地,所述s3包括:
26、利用clip模型分别对输入案件的图文信息进行编码,生成图像的嵌入向量和文本的嵌入向量;
27、将图像和文本嵌入到一个共享的语义空间进行对比学习和融合,得到能够理解和融合图文信息的初步问答模型。
28、可选地,所述s4包括:
29、s4.1、基于三段论和类比推理构建多维逻辑关联的思维链;具体是:
30、将相关规定作为主前提、案件的图文信息作为次前提输入初步问答模型;
31、判断输入的案件的图文信息是否符合主前提下的相关规定,若符合,初步问答模型输出初步结论,若不符合则通过搜索与当前案件相似的历史案件和判决,类比推导出类似的结论,其中:主前提、次前提和基于主前提和次前提得推理结论为三段论的三个要素;
32、结合三段论和类比推理的推理结论,生成一个完整的推理链以及案件咨询的答案;
33、s4.2、将多维逻辑关联的思维链引入初步问答模型中,得到生成模型。
34、可选地,所述s5包括:
35、s5.1、构建对比学习损失函数和排序损失函数;
36、s5.2、基于对比学习损失函数和排序损失函数训练现有打分模型学习区分多个候选答案中的高质量答案和低质量答案并进行排序,得到能够输出多个候选答案中最优答案的评价模型,其中:高质量答案为正样本,低质量或不相关的答案为负样本;
37、具体是:
38、s5.2.1、输入案件的相关问题与候选答案:将相关问题和多个候选答案输入到现有打分模型中;
39、s5.2.2、计算句子嵌入:使用预训练语言模型生成问题和候选答案的句子嵌入;
40、s5.2.3、构建总损失函数:构建由对比学习损失函数和排序损失函数组成的总损失函数;
41、s5.2.4、计算损失:通过计算总损失函数评估各候选答案的质量,并按候选答案与问题的相关性进行排序;
42、s5.2.5、梯度更新:通过反向传播算法使用梯度下降优化总损失函数更新现有打分模型的权重;
43、s5.2.6、迭代训练:重复s5.2.4至s5.2.5直到现有打分模型的总损失函数收敛,得到能够输出多个候选答案中最优答案的评价模型。
44、可选地,对比学习损失函数为分类目标函数或三元组目标函数,分类目标函数具体公式如下:
45、;
46、其中:为训练现有打分模型的时间步;为可训练权重矩阵,;是句子嵌入的维度,是分类目标函数中标签类别的数量;、为两个不本文档来自技高网...
【技术保护点】
1.一种基于大语言模型的案件问答方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于大语言模型的案件问答方法,其特征在于,所述S1包括:
3.根据权利要求2所述的基于大语言模型的案件问答方法,其特征在于,所述S1.5包括:
4.根据权利要求3所述的基于大语言模型的案件问答方法,其特征在于,所述S2包括:
5.根据权利要求4所述的基于大语言模型的案件问答方法,其特征在于,所述S3包括:
6.根据权利要求5所述的基于大语言模型的案件问答方法,其特征在于,所述S4包括:
7.根据权利要求6所述的基于大语言模型的案件问答方法,其特征在于,所述S5包括:
8.根据权利要求7所述的基于大语言模型的案件问答方法,其特征在于,对比学习损失函数为分类目标函数或三元组目标函数,分类目标函数具体公式如下:
9.一种可读存储介质,其特征在于,其上存储有计算机程序指令,当所述计算机程序指令被处理器执行时实现如权利要求1至8中任一项所述的基于大语言模型的案件问答方法。
10.一种电子设备,其
...【技术特征摘要】
1.一种基于大语言模型的案件问答方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于大语言模型的案件问答方法,其特征在于,所述s1包括:
3.根据权利要求2所述的基于大语言模型的案件问答方法,其特征在于,所述s1.5包括:
4.根据权利要求3所述的基于大语言模型的案件问答方法,其特征在于,所述s2包括:
5.根据权利要求4所述的基于大语言模型的案件问答方法,其特征在于,所述s3包括:
6.根据权利要求5所述的基于大语言模型的案件问答方法,其特征在于,所述s4包括:
7.根据权利要求6所述的基于大语言模...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。