一种法律问题应答模型生成方法及装置制造方法及图纸

技术编号:38525904 阅读:10 留言:0更新日期:2023-08-19 17:02
本发明专利技术公开了一种法律问题应答模型生成方法及装置,该方法包括:获取语料集;语料集包括至少4个法律语料数据集;利用语料集对问题应答模型中的多个依次连接的初始应答模型分别进行训练,得到目标应答模型;对目标应答模型进行优化处理,得到法律问题应答模型;法律问题应答模型用于对用户的法律问题进行语义解析和答案匹配。可见,本发明专利技术有利于实现法律问题应答模型的高效生成和提高模型准确率,进而提高法律问题应答模型的应答实时性和准确性,提高用于体验感。提高用于体验感。提高用于体验感。

【技术实现步骤摘要】
一种法律问题应答模型生成方法及装置


[0001]本专利技术涉及信息
,尤其涉及一种法律问题应答模型生成方法及装置。

技术介绍

[0002]目前,现阶段法律问题的解答的常规渠道是由律师进行解决,通用化的法律顾问水平不足问题比较凸显。现有法律问题应答系统的问题和答案的结构化性较差,很难找到两个句子的结构化的最佳匹配。因此,提供一种法律问题应答模型生成方法及装置,以实现法律问题应答模型的高效生成和提高模型准确率,进而提高法律问题应答模型的应答实时性和准确性,提高用于体验感。

技术实现思路

[0003]本专利技术所要解决的技术问题在于,提供一种法律问题应答模型生成方法及装置有利于实现法律问题应答模型的高效生成和提高模型准确率,进而提高法律问题应答模型的应答实时性和准确性,提高用于体验感。
[0004]为了解决上述技术问题,本专利技术实施例第一方面公开了一种法律问题应答模型生成方法,所述方法包括:
[0005]获取语料集;所述语料集包括至少4个法律语料数据集;
[0006]利用所述语料集对问题应答模型中的多个依次连接的初始应答模型分别进行训练,得到目标应答模型;
[0007]对所述目标应答模型进行优化处理,得到法律问题应答模型;所述法律问题应答模型用于对用户的法律问题进行语义解析和答案匹配。
[0008]作为一种可选的实施方式,在本专利技术实施例第一方面中,所述法律语料数据集包括第一法律语料数据集,和/或,第二法律语料数据集,和/或,第三法律语料数据集;所述初始应答模型包括依次连接的初始问题分类模型、初始问题应答模型和初始答语选择模型;所述目标应答模型包括依次连接的目标问题分类模型、目标问题应答模型和目标答语选择模型;
[0009]所述利用所述语料集对问题应答模型中的多个依次连接的初始应答模型分别进行训练,得到目标应答模型,包括:
[0010]利用所述第一法律语料数据集对所述初始问题分类模型进行训练,得到所述目标问题分类模型;
[0011]利用所述第二法律语料数据集对所述初始问题应答模型进行训练,得到所述目标问题应答模型;
[0012]利用所述第三法律语料数据集对所述初始答语选择模型进行训练,得到所述目标答语选择模型。
[0013]作为一种可选的实施方式,在本专利技术实施例第一方面中,所述利用所述第一法律语料数据集对所述初始问题分类模型进行训练,得到所述目标问题分类模型,包括:
[0014]从所述第一法律语料数据集中所有的第一法律语料样本中随机确定出第一目标法律语料样本集;所述第一目标法律语料样本集包括若干个第一目标法律语料样本;
[0015]将所述第一目标法律语料样本集输入到所述初始问题分类模型进行训练,得到备用问题分类模型和分类结果信息;
[0016]利用第一损失函数模型对所述分类结果信息进行计算,得到第一损失函数值;
[0017]其中,所述第一损失函数模型为:
[0018][0019]式中,L1为所述第一损失函数值;N为所述第一目标法律语料样本的数量;x
i
为所述分类结果信息中第i个分类结果对应的真实意图的概率;为所述第i个分类结果对应的意图真实值;D为所述分类结果对应的意图总数量;
[0020]判断所述第一损失函数值和历史第一损失函数值是否收敛,得到第一收敛判断结果;
[0021]当所述第一收敛判断结果为否时,确定所述备用问题分类模型为新的初始问题分类模型,并触发执行所述从所述第一法律语料数据集中所有的第一法律语料样本中随机确定出第一目标法律语料样本集;
[0022]当所述第一收敛判断结果为是时,确定所述备用问题分类模型为所述目标问题分类模型。
[0023]作为一种可选的实施方式,在本专利技术实施例第一方面中,所述法律语料数据集还包括第四法律语料数据集;所述第四法律语料数据集包括若干个子法律语料数据集;
[0024]所述对所述目标应答模型进行优化处理,得到法律问题应答模型,包括:
[0025]将所述第四法律语料数据集输入到所述目标应答模型,得到应答结果集;所述应答结果集包括若干个应答结果信息;所述应答结果信息包括应答答案信息和响应时间信息;每个所述应答结果信息对应于一个所述子法律语料数据集;
[0026]利用所述应答结果集对所述目标应答模型进行优化处理,得到法律问题应答模型。
[0027]作为一种可选的实施方式,在本专利技术实施例第一方面中,所述利用所述应答结果集对所述目标应答模型进行优化处理,得到法律问题应答模型,包括:
[0028]利用评估模型对所述应答结果集进行计算处理,得到模型评估值信息;所述模型评估值信息包括准确率值信息和响应时间均值信息;所述准确率值信息包括若干个准确率值;所述响应时间均值信息包括若干个响应时间均值;
[0029]判断所述模型评估值信息是否满足模型优化条件,得到优化判断结果;
[0030]当所述优化判断结果为否时,利用所述目标应答模型对所述问题应答模型进行替换更新,并触发执行所述利用所述语料集对问题应答模型中的多个依次连接的初始应答模型分别进行训练,得到目标应答模型;
[0031]当所述优化判断结果为是时,确定所述目标应答模型为法律问题应答模型。
[0032]作为一种可选的实施方式,在本专利技术实施例第一方面中,所述利用评估模型对所述应答结果集进行计算处理,得到模型评估值信息,包括:
[0033]对于任一所述应答结果信息,利用响应时间模型对该应答结果信息对应的响应时
间信息进行均值计算,得到该应答结果信息对应的响应时间均值;
[0034]其中,所述响应时间模型为:
[0035][0036]式中,T为所述响应时间均值;M为所述响应时间信息中响应时间的数量;t
j
为第j个所述响应时间;
[0037]对该应答结果信息对应的应答答案信息进行处理,得到该应答结果信息对应的准确率值。
[0038]作为一种可选的实施方式,在本专利技术实施例第一方面中,所述对该应答结果信息对应的应答答案信息进行处理,得到该应答结果信息对应的准确率值,包括:
[0039]从所述子法律语料数据集中确定出该应答结果信息对应的法律问题答案信息;
[0040]对所述法律问题答案信息和应答答案信息进行重复度计算,得到答案重复度信息;所述答案重复度信息包括若干个答案重复度;
[0041]判断该应答结果信息对应的子法律语料数据集的问题标签是否为复杂问题,得到问题类型判断结果;
[0042]当所述问题类型判断结果为否时,确定第一重复度阈值为目标重复度阈值;
[0043]当所述问题类型判断结果为是时,确定第二重复度阈值为目标重复度阈值;所述第二重复度阈值是所述第一重复度阈值的1.5倍;
[0044]对于该应答结果信息中的任一应答结果,判断该应答结果对应的答案重复度是否大于等于所述目标重复度阈值,得到重复度判断结果;
[0045]当本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种法律问题应答模型生成方法,其特征在于,所述方法包括:获取语料集;所述语料集包括至少4个法律语料数据集;利用所述语料集对问题应答模型中的多个依次连接的初始应答模型分别进行训练,得到目标应答模型;对所述目标应答模型进行优化处理,得到法律问题应答模型;所述法律问题应答模型用于对用户的法律问题进行语义解析和答案匹配。2.根据权利要求1所述的法律问题应答模型生成方法,其特征在于,所述法律语料数据集包括第一法律语料数据集,和/或,第二法律语料数据集,和/或,第三法律语料数据集;所述初始应答模型包括依次连接的初始问题分类模型、初始问题应答模型和初始答语选择模型;所述目标应答模型包括依次连接的目标问题分类模型、目标问题应答模型和目标答语选择模型;所述利用所述语料集对问题应答模型中的多个依次连接的初始应答模型分别进行训练,得到目标应答模型,包括:利用所述第一法律语料数据集对所述初始问题分类模型进行训练,得到所述目标问题分类模型;利用所述第二法律语料数据集对所述初始问题应答模型进行训练,得到所述目标问题应答模型;利用所述第三法律语料数据集对所述初始答语选择模型进行训练,得到所述目标答语选择模型。3.根据权利要求2所述的法律问题应答模型生成方法,其特征在于,所述利用所述第一法律语料数据集对所述初始问题分类模型进行训练,得到所述目标问题分类模型,包括:从所述第一法律语料数据集中所有的第一法律语料样本中随机确定出第一目标法律语料样本集;所述第一目标法律语料样本集包括若干个第一目标法律语料样本;将所述第一目标法律语料样本集输入到所述初始问题分类模型进行训练,得到备用问题分类模型和分类结果信息;利用第一损失函数模型对所述分类结果信息进行计算,得到第一损失函数值;其中,所述第一损失函数模型为:式中,L1为所述第一损失函数值;N为所述第一目标法律语料样本的数量;x
i
为所述分类结果信息中第i个分类结果对应的真实意图的概率;为所述第i个分类结果对应的意图真实值;D为所述分类结果对应的意图总数量;判断所述第一损失函数值和历史第一损失函数值是否收敛,得到第一收敛判断结果;当所述第一收敛判断结果为否时,确定所述备用问题分类模型为新的初始问题分类模型,并触发执行所述从所述第一法律语料数据集中所有的第一法律语料样本中随机确定出第一目标法律语料样本集;当所述第一收敛判断结果为是时,确定所述备用问题分类模型为所述目标问题分类模型。4.根据权利要求1所述的法律问题应答模型生成方法,其特征在于,所述法律语料数据
集还包括第四法律语料数据集;所述第四法律语料数据集包括若干个子法律语料数据集;所述对所述目标应答模型进行优化处理,得到法律问题应答模型,包括:将所述第四法律语料数据集输入到所述目标应答模型,得到应答结果集;所述应答结果集包括若干个应答结果信息;所述应答结果信息包括应答答案信息和响应时间信息;每个所述应答结果信息对应于一个所述子法律语料数据集;利用所述应答结果集对所述目标应答模型进行优化处理,得到法律问题应答模型。5.根据权利要求4所述的法律问题应答模型生成方法,其特征在于,所述利用所述应答结果集对所述目标应答模型进行优化处理,得到法律问题应答模型,包括:利用评估模型对所述应答结...

【专利技术属性】
技术研发人员:洪治纲
申请(专利权)人:上海富问信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1