System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 案例检索方法、装置、计算机设备及存储介质制造方法及图纸_技高网

案例检索方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:42327596 阅读:6 留言:0更新日期:2024-08-14 16:05
本发明专利技术实施例涉及文本处理技术领域,公开了一种案例检索方法、装置、计算机设备及计算机可读存储介质,该方法包括:获取用户输入的当前检索语句及历史记录;将当前检索语句及历史记录输入检索模型中得到当前检索条件;根据当前检索条件在法律文本数据库系统中检索,得到初始法律文本案例数据;将各个初始法律文本案例数据输入摘要模型得到各个目标摘要文本;将各个目标摘要文本输入多个相关性判断模型中,得到中间结果;若初始相关性判断结果一致,则输出目标案例;目标案例为相关的法律文本案例;将历史记录及目标案例输入总结模型中,得到目标法律文本检索报告。本发明专利技术实施例通过在检索过程中系统主动请求用户反馈,实现了准确检索的技术效果。

【技术实现步骤摘要】

本专利技术实施例涉及文本处理,具体涉及一种案例检索方法、装置、计算机设备及计算机可读存储介质。


技术介绍

1、目前,案例检索是律师处理一个法律业务前重要的工作,律师需要根据案情,在法律文本库中检索出相关案例并进行包括筛选、摘要、总结和撰写检索报告等操作,需要耗费大量精力。

2、现有的法律检索系统一般会提供案例检索功能、案例摘要功能,需要律师不断地判断检索结果的相关性并优化检索关键词,最终得到需要的案例,并对所有案例进行归纳总结并撰写检索报告,这些方法不仅耗时耗力,而且效率低下,难以满足日益增长的法律服务需求。

3、大模型技术是处理文本任务有效工具,得益于巨大的参数量,大模型可以输入自然语言语句,理解语句中的需求,并根据需求较为准确地生成需要的内容,帮助使用者完成相应的任务,例如:文本翻译、文本总结等。

4、现有的技术方案虽然有agent之间的博弈机制设计,但是缺少人类的反馈,由于大模型存在“幻觉”问题,即产生错误信息,则会导致最终的整个结果错误。


技术实现思路

1、鉴于上述问题,本专利技术实施例提供了一种案例检索方法、装置、计算机设备及计算机可读存储介质,用于解决现有技术中存在的大模型“幻觉”的问题。

2、根据本专利技术实施例的一个方面,提供了一种案例检索方法,所述方法包括:

3、获取用户输入的当前检索语句及历史记录;所述当前检索语句为法律相关的自然语言语句;所述历史记录为本次检索之前的检索过程中生成的历史检索条件、历史检索结果内容总结、历史相关性判断信息及历史用户反馈信息;

4、将所述当前检索语句及所述历史记录输入检索模型中,得到当前检索条件;所述检索模型为预先根据检索条件样本进行训练得到;

5、根据所述当前检索条件在法律文本数据库系统中检索,得到初始法律文本案例数据;

6、将各个所述初始法律文本案例数据输入摘要模型,得到各个目标摘要文本;所述目标摘要文本包括所述初始法律文本案例数据的案情、双方陈述观点、法院观点、判决结果;所述摘要模型为预先根据法律文本案例样本进行训练得到;

7、将各个所述目标摘要文本输入多个相关性判断模型中,得到中间结果;所述中间结果包括各个相关性判断模型输出的初始相关性判断结果及初始判断理由;所述相关性判断结果及判断理由为所述目标摘要文本与所述当前检索语句之间是否存在相关性的判断结果及判断理由;各个相关性判断模型分别为不同架构的模型采用相关性训练样本训练得到;

8、若所述初始相关性判断结果一致,则输出目标案例;所述目标案例为相关的法律文本案例;

9、将所述历史记录及目标案例输入总结模型中,得到目标法律文本检索报告。

10、在一种可选的方式中,所述将所述目标摘要文本输入多个相关性判断模型中,得到中间结果之后,所述方法还包括:

11、若所述初始相关性判断结果不一致,则将所述检索条件、初始法律文本案例数据、目标摘要文本、初始相关性判断结果及初始判断理由存储至历史记录中;

12、根据所述初始相关性判断结果及初始判断理由发送反馈问题给用户,以使用户输出对应的反馈信息;

13、将所述当前检索语句、所述反馈信息及所述历史记录输入检索模型中,得到当前检索条件,直至得到判断结果一致的目标相关性判断结果。

14、在一种可选的方式中,多个所述相关性判断模型分别基于四个不同架构不同的大语言模型训练得到;所述将各个所述目标摘要文本输入多个相关性判断模型中,得到中间结果之前,所述方法还包括:

15、将相关性判断样本输入不同四个不同的大语言模型中训练,得到四个相关性判断模型;相关性判断样本包括检索语句样本及对应了标记了相关性的摘要文本样本。

16、在一种可选的方式中,将各个所述目标摘要文本输入多个相关性判断模型中,得到中间结果,包括:

17、基于判断投票机制,确定四个初始相关性判断结果是否一致。

18、在一种可选的方式中,所述历史记录为json结构体;所述json结构体记录了用户输入信息、模型输出信息、用户的反馈信息。

19、在一种可选的方式中,所述将所述历史记录及目标案例输入总结模型中,得到目标法律文本检索报告之后,所述方法还包括:

20、将所述检索报告反馈给用户;

21、若得到用户输入的满意信息,则检索结束;

22、若得到用户的反馈信息,则继续将所述检索报告存储至历史记录中,并继续将所述当前检索语句、所述反馈信息及所述历史记录输入检索模型中,得到当前检索条件,直至得到判断结果一致的目标相关性判断结果,得到新的目标案例。

23、根据本专利技术实施例的另一方面,提供了一种案例检索装置,包括:

24、获取模块,用于获取用户输入的当前检索语句及历史记录;所述当前检索语句为法律相关的自然语言语句;所述历史记录为本次检索之前的检索过程中生成的历史检索条件、历史检索结果内容总结、历史相关性判断信息及历史用户反馈信息;

25、检索条件生成模块,用于将所述当前检索语句及所述历史记录输入检索模型中,得到当前检索条件;所述检索模型为预先根据检索条件样本进行训练得到;

26、检索模块,用于根据所述当前检索条件在法律文本数据库系统中检索,得到初始法律文本案例数据;

27、摘要模块,用于将各个所述初始法律文本案例数据输入摘要模型,得到各个目标摘要文本;所述目标摘要文本包括所述初始法律文本案例数据的案情、双方陈述观点、法院观点、判决结果;所述摘要模型为预先根据法律文本案例样本进行训练得到;

28、相关性判断模块,用于将各个所述目标摘要文本输入多个相关性判断模型中,得到中间结果;所述中间结果包括各个相关性判断模型输出的初始相关性判断结果及初始判断理由;所述相关性判断结果及判断理由为所述目标摘要文本与所述当前检索语句之间是否存在相关性的判断结果及判断理由;各个相关性判断模型分别为不同架构的模型采用相关性训练样本训练得到;

29、案例确定模块,用于若所述初始相关性判断结果一致,则输出目标案例;所述目标案例为相关的法律文本案例;

30、总结模块,用于将所述历史记录及目标案例输入总结模型中,得到目标法律文本检索报告。

31、在一种可选的方式中,所述装置还包括反馈模块,用于:

32、若所述初始相关性判断结果不一致,则将所述检索条件、初始法律文本案例数据、目标摘要文本、初始相关性判断结果及初始判断理由存储至历史记录中;

33、根据所述初始相关性判断结果及初始判断理由发送反馈问题给用户,以使用户输出对应的反馈信息;

34、将所述当前检索语句、所述反馈信息及所述历史记录输入检索模型中,得到当前检索条件,直至得到判断结果一致的目标相关性判断结果。

35、根据本专利技术实施例的另一方面,提供了一种计算机设备,包括:处理器、存储器、通信接口和通信总本文档来自技高网...

【技术保护点】

1.一种案例检索方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,将各个所述目标摘要文本输入多个相关性判断模型中,得到中间结果之后,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,多个所述相关性判断模型分别基于四个不同架构不同的大语言模型训练得到;所述将各个所述目标摘要文本输入多个相关性判断模型中,得到中间结果之前,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,将各个所述目标摘要文本输入多个相关性判断模型中,得到中间结果,包括:

5.根据权利要求1-3任一项所述的方法,其特征在于,所述历史记录为JSON结构体;所述JSON结构体记录了用户输入信息、模型输出信息、用户的反馈信息;

6.根据权利要求3所述的方法,其特征在于,所述将所述历史记录及目标案例输入总结模型中,得到目标法律文本检索报告之后,所述方法还包括:

7.一种案例检索装置,其特征在于,所述装置包括:

8.根据权利要求7所述的装置,其特征在于,所述装置还包括反馈模块,用于:

9.一种计算机设备,其特征在于,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;

10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一可执行指令,所述可执行指令在计算机设备上运行时,使得计算机设备执行如权利要求1-6任意一项所述的案例检索方法的操作。

...

【技术特征摘要】

1.一种案例检索方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,将各个所述目标摘要文本输入多个相关性判断模型中,得到中间结果之后,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,多个所述相关性判断模型分别基于四个不同架构不同的大语言模型训练得到;所述将各个所述目标摘要文本输入多个相关性判断模型中,得到中间结果之前,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,将各个所述目标摘要文本输入多个相关性判断模型中,得到中间结果,包括:

5.根据权利要求1-3任一项所述的方法,其特征在于,所述历史记录为json结构体;所述json结构体记录了用户输入信息、模型输出信息、...

【专利技术属性】
技术研发人员:雷宇
申请(专利权)人:深圳得理科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1