一种要素内容获取方法、装置、设备及存储介质制造方法及图纸

技术编号:29401064 阅读:28 留言:0更新日期:2021-07-23 22:38
本申请提供了一种要素内容获取方法、装置、设备及存储介质,其中,方法包括:获取目标案情文本;基于目标案情文本确定目标要素,并基于目标案情文本和目标要素确定目标要素对应的要素表示向量,其中,目标要素对应的要素表示向量用于表征目标要素在目标案情文本中的语义;基于目标案情文本和目标要素对应的要素表示向量,获取目标要素对应的要素内容。本申请提供的要素内容获取方法可根据目标案情文本自动确定出目标要素,并可根据目标案情文本和目标要素对应的要素表示向量自动确定出目标要素对应的要素内容。

【技术实现步骤摘要】
一种要素内容获取方法、装置、设备及存储介质
本申请涉及自然语言处理
,尤其涉及一种要素内容获取方法、装置、设备及存储介质。
技术介绍
在司法领域,对于法官、检察官等公检法一线工作人员来说,办案的任何一个环节都离不开大量法律文书,为了便于法官、检察官等工作人员快速了解案情,往往需要根据法律文书获取要素对应的要素内容。目前的要素内容获取方式大多为人工获取方式,即由人工通过阅读法律文书获取要素对应的要素内容。然而,人工获取方式费时费力,即人工获取方式的人工成本和时间成本较高,并且,人工获取方式易受主观因素影响,会导致获取的要素内容可能不准确。
技术实现思路
有鉴于此,本申请提供了一种要素内容获取方法、装置、设备及计算机可读存储介质,用以解决现有的要素内容获取方式的人工成本和时间成本较高,且要素内容获取易受主观因素影响的问题,其技术方案如下:一种要素内容获取方法,包括:获取目标案情文本;基于所述目标案情文本确定目标要素,并基于所述目标案情文本和所述目标要素确定所述目标要素对应的要素表示向量,其中,所述目标要素对应的要素表示向量用于表征所述目标要素在所述目标案情文本中的语义;基于所述目标案情文本和所述目标要素对应的要素表示向量,获取所述目标要素对应的要素内容。可选的,所述目标要素对应的要素表示向量还用于表征所述目标要素的语义和所述目标要素与所述目标案情文本的关系。可选的,所述基于所述目标案情文本确定目标要素,并基于所述目标案情文本和所述目标要素确定所述目标要素对应的要素表示向量,包括:基于所述目标案情文本以及预先训练的要素编码模型,确定目标要素;基于所述目标要素、所述目标案情文本和所述要素编码模型,确定所述目标要素对应的要素表示向量;其中,所述要素编码模型采用包含案情文本、要素和要素内容的第一样本训练得到,所述第一样本中的要素对应有真实问题,所述问题的答案为所述第一样本中的要素内容,所述要素编码模型的训练目标为,使根据要素编码模块输出的要素表示向量预测的问题,趋于所述第一样本中的要素所对应的真实问题。可选的,所述目标要素对应的要素内容为以下内容中的一种或多种:所述目标案情文本中描述所述目标要素的文本片段、所述目标要素未被所述目标案情文本所提及的指示信息、所述目标案情文本中的所述目标要素所描述的情形属实的指示信息、所述目标案情文本中的所述目标要素所描述的情形不属实的指示信息。可选的,所述基于所述目标案情文本和所述目标要素对应的要素表示向量,获取所述目标要素对应的要素内容,包括:基于所述目标案情文本、所述目标要素对应的要素表示向量以及预先训练的要素内容抽取模型,获取所述目标要素对应的要素内容;其中,所述要素内容抽取模型采用包含案情文本和要素表示向量的第二样本,以及所述第二样本中的要素表示向量表示的要素所对应的真实要素内容训练得到,所述第二样本中的要素表示向量基于所述第二样本中的案情文本和所述要素编码模型获得。可选的,所述要素内容抽取模型的参数根据预先训练的阅读理解模型进行初始化;其中,所述阅读理解模型采用包含案情文本和问题的第三样本以及第三样本中问题的答案训练得到,所述第三样本中的问题根据与所述第三样本中的案情文本相关的要素转换而来。可选的,所述基于所述目标案情文本、所述目标要素对应的要素表示向量以及预先训练的要素内容抽取模型,获取所述目标要素对应的要素内容,包括:由所述目标案情文本,以及所述目标要素对应的要素表示向量、第一答案标识符、第二答案标识符、第三答案标识符、要素类型标识符组成目标数据,其中,所述目标要素对应的第一答案标识符、第二答案标识符、第三答案标识符、要素类型标识符依次用于指示:所述目标要素未被所述目标案情文本所提及、所述目标要素在所述目标案情文本中所描述的情形属实、所述目标要素在所述目标案情文本中描述的情形不属实、所述目标要素对应的要素类型;基于所述目标数据和所述要素内容抽取模型,从所述目标数据中抽取所述目标要素对应的要素内容。可选的,所述基于所述目标数据和所述要素内容抽取模型,从所述目标数据中抽取所述目标要素对应的要素内容,包括:基于所述目标数据和所述要素内容抽取模型,确定所述目标要素对应的位置指示信息,其中,所述位置指示信息用于指示所述目标要素对应的要素内容在所述目标数据中所处的位置;基于所述目标要素对应的位置指示信息,从所述目标数据中抽取所述目标要素对应的要素内容。可选的,所述基于所述目标数据和所述要素内容抽取模型,确定所述目标要素对应的位置指示信息,包括:将所述目标数据输入所述要素内容抽取模型,以由所述要素内容抽取模型结合所述目标数据中的要素表示向量对所述目标案情文本进行编码,并根据通过编码得到的融合有要素信息的案情表示向量,确定所述目标要素对应的位置指示信息。可选的,所述目标要素为一个或多个;若所述目标要素为多个,则所述目标数据中包括目标案情文本,以及每个目标要素对应的要素表示向量、第一答案标识符、第二答案标识符、第三答案标识符和要素类型标识符;所述要素内容抽取模型输出多个目标要素分别对应的位置指示信息,所述位置指示信息包括:对应的目标要素、对应的目标要素对应的要素内容中起始字符的位置指示信息和结束字符的位置指示信息。可选的,所述要素编码模型的训练过程包括:将所述第一样本输入要素编码模型,得到要素编码模型输出的所述第一样本中的要素所对应的要素表示向量;基于问题解码器、所述第一样本中的要素所对应的要素表示向量以及所述第一样本中的要素所对应的问题,确定所述第一样本中的要素所对应的问题的预测概率;根据所述第一样本中的要素所对应的问题的预测概率,更新所述要素编码模型的参数。可选的,所述将所述第一样本输入要素编码模型,得到要素编码模型输出的所述第一样本中的要素所对应的要素表示向量,包括:将所述第一样本中的要素输入要素编码模型的要素编码模块进行编码,得到要素编码结果;将所述第一样本中的案情文本输入要素编码模型的案情编码模块进行编码,得到案情编码结果;将所述第一样本中的要素内容输入要素编码模型的要素内容编码模块进行编码,得到要素内容编码结果;将所述案情编码结果和所述要素内容编码结果输入要素编码模型的数据融合模块进行融合,得到融合结果;将所述案情编码结果和所述融合结果输入要素编码模型的数据拼接模块进行拼接,得到拼接结果;将所述拼接结果输入要素编码模型的要素表示向量确定模块,得到所述第一样本中的要素所对应的要素表示向量。可选的,所述要素内容抽取模型的训练过程,包括:将所述第二样本输入要素内容抽取模型,以得到针对所述第二样本中的要素表示向量所表示的要素预测的要素内容;根据预测的要素内容和所述第二样本中要素对应的真实要素内容,确定要素内容抽取模型的预测损失;根据确定的预测损失,更新要素内容抽取模型的参数本文档来自技高网...

【技术保护点】
1.一种要素内容获取方法,其特征在于,包括:/n获取目标案情文本;/n基于所述目标案情文本确定目标要素,并基于所述目标案情文本和所述目标要素确定所述目标要素对应的要素表示向量,其中,所述目标要素对应的要素表示向量用于表征所述目标要素在所述目标案情文本中的语义;/n基于所述目标案情文本和所述目标要素对应的要素表示向量,获取所述目标要素对应的要素内容。/n

【技术特征摘要】
1.一种要素内容获取方法,其特征在于,包括:
获取目标案情文本;
基于所述目标案情文本确定目标要素,并基于所述目标案情文本和所述目标要素确定所述目标要素对应的要素表示向量,其中,所述目标要素对应的要素表示向量用于表征所述目标要素在所述目标案情文本中的语义;
基于所述目标案情文本和所述目标要素对应的要素表示向量,获取所述目标要素对应的要素内容。


2.根据权利要求1所述的要素内容获取方法,其特征在于,所述目标要素对应的要素表示向量还用于表征所述目标要素的语义和所述目标要素与所述目标案情文本的关系。


3.根据权利要求2所述的要素内容获取方法,其特征在于,所述基于所述目标案情文本确定目标要素,并基于所述目标案情文本和所述目标要素确定所述目标要素对应的要素表示向量,包括:
基于所述目标案情文本以及预先训练的要素编码模型,确定目标要素;
基于所述目标要素、所述目标案情文本和所述要素编码模型,确定所述目标要素对应的要素表示向量;
其中,所述要素编码模型采用包含案情文本、要素和要素内容的第一样本训练得到,所述第一样本中的要素对应有真实问题,所述问题的答案为所述第一样本中的要素内容,所述要素编码模型的训练目标为,使根据要素编码模块输出的要素表示向量预测的问题,趋于所述第一样本中的要素所对应的真实问题。


4.根据权利要求1所述的要素内容获取方法,其特征在于,所述目标要素对应的要素内容为以下内容中的一种或多种:
所述目标案情文本中描述所述目标要素的文本片段、所述目标要素未被所述目标案情文本所提及的指示信息、所述目标案情文本中的所述目标要素所描述的情形属实的指示信息、所述目标案情文本中的所述目标要素所描述的情形不属实的指示信息。


5.根据权利要求3所述的要素内容获取方法,其特征在于,所述基于所述目标案情文本和所述目标要素对应的要素表示向量,获取所述目标要素对应的要素内容,包括:
基于所述目标案情文本、所述目标要素对应的要素表示向量以及预先训练的要素内容抽取模型,获取所述目标要素对应的要素内容;
其中,所述要素内容抽取模型采用包含案情文本和要素表示向量的第二样本,以及所述第二样本中的要素表示向量表示的要素所对应的真实要素内容训练得到,所述第二样本中的要素表示向量基于所述第二样本中的案情文本和所述要素编码模型获得。


6.根据权利要求5所述的要素内容获取方法,其特征在于,所述要素内容抽取模型的参数根据预先训练的阅读理解模型进行初始化;
其中,所述阅读理解模型采用包含案情文本和问题的第三样本以及第三样本中问题的答案训练得到,所述第三样本中的问题根据与所述第三样本中的案情文本相关的要素转换而来。


7.根据权利要求5所述的要素内容获取方法,其特征在于,所述基于所述目标案情文本、所述目标要素对应的要素表示向量以及预先训练的要素内容抽取模型,获取所述目标要素对应的要素内容,包括:
由所述目标案情文本,以及所述目标要素对应的要素表示向量、第一答案标识符、第二答案标识符、第三答案标识符、要素类型标识符组成目标数据,其中,所述目标要素对应的第一答案标识符、第二答案标识符、第三答案标识符、要素类型标识符依次用于指示:所述目标要素未被所述目标案情文本所提及、所述目标要素在所述目标案情文本中所描述的情形属实、所述目标要素在所述目标案情文本中描述的情形不属实、所述目标要素对应的要素类型;
基于所述目标数据和所述要素内容抽取模型,从所述目标数据中抽取所述目标要素对应的要素内容。


8.根据权利要求7所述的要素内容获取方法,其特征在于,所述基于所述目标数据和所述要素内容抽取模型,从所述目标数据中抽取所述目标要素对应的要素内容,包括:
基于所述目标数据和所述要素内容抽取模型,确定所述目标要素对应的位置指示信息,其中,所述位置指示信息用于指示所述目标要素对应的要素内容在所述目标数据中所处的位置;
基于所述目标要素对应的位置指示信息,从所述目标数据中抽取所述目标要素对应的要素内容。


9.根据权利要求8所述的要素内容获取方法,其特征在于,所述基于所述目...

【专利技术属性】
技术研发人员:王梓玥王宝鑫伍大勇王士进胡国平
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1