【技术实现步骤摘要】
一种要素内容获取方法、装置、设备及存储介质
本申请涉及自然语言处理
,尤其涉及一种要素内容获取方法、装置、设备及存储介质。
技术介绍
在司法领域,对于法官、检察官等公检法一线工作人员来说,办案的任何一个环节都离不开大量法律文书,为了便于法官、检察官等工作人员快速了解案情,往往需要根据法律文书获取要素对应的要素内容。目前的要素内容获取方式大多为人工获取方式,即由人工通过阅读法律文书获取要素对应的要素内容。然而,人工获取方式费时费力,即人工获取方式的人工成本和时间成本较高,并且,人工获取方式易受主观因素影响,会导致获取的要素内容可能不准确。
技术实现思路
有鉴于此,本申请提供了一种要素内容获取方法、装置、设备及计算机可读存储介质,用以解决现有的要素内容获取方式的人工成本和时间成本较高,且要素内容获取易受主观因素影响的问题,其技术方案如下:一种要素内容获取方法,包括:获取目标案情文本;基于所述目标案情文本确定目标要素,并基于所述目标案情文本和所述目标要素确定所述目标要素对应的要素表示向量,其中,所述目标要素对应的要素表示向量用于表征所述目标要素在所述目标案情文本中的语义;基于所述目标案情文本和所述目标要素对应的要素表示向量,获取所述目标要素对应的要素内容。可选的,所述目标要素对应的要素表示向量还用于表征所述目标要素的语义和所述目标要素与所述目标案情文本的关系。可选的,所述基于所述目标案情文本确定目标要素,并基于所述目标案情文本和所述目标要素确 ...
【技术保护点】
1.一种要素内容获取方法,其特征在于,包括:/n获取目标案情文本;/n基于所述目标案情文本确定目标要素,并基于所述目标案情文本和所述目标要素确定所述目标要素对应的要素表示向量,其中,所述目标要素对应的要素表示向量用于表征所述目标要素在所述目标案情文本中的语义;/n基于所述目标案情文本和所述目标要素对应的要素表示向量,获取所述目标要素对应的要素内容。/n
【技术特征摘要】
1.一种要素内容获取方法,其特征在于,包括:
获取目标案情文本;
基于所述目标案情文本确定目标要素,并基于所述目标案情文本和所述目标要素确定所述目标要素对应的要素表示向量,其中,所述目标要素对应的要素表示向量用于表征所述目标要素在所述目标案情文本中的语义;
基于所述目标案情文本和所述目标要素对应的要素表示向量,获取所述目标要素对应的要素内容。
2.根据权利要求1所述的要素内容获取方法,其特征在于,所述目标要素对应的要素表示向量还用于表征所述目标要素的语义和所述目标要素与所述目标案情文本的关系。
3.根据权利要求2所述的要素内容获取方法,其特征在于,所述基于所述目标案情文本确定目标要素,并基于所述目标案情文本和所述目标要素确定所述目标要素对应的要素表示向量,包括:
基于所述目标案情文本以及预先训练的要素编码模型,确定目标要素;
基于所述目标要素、所述目标案情文本和所述要素编码模型,确定所述目标要素对应的要素表示向量;
其中,所述要素编码模型采用包含案情文本、要素和要素内容的第一样本训练得到,所述第一样本中的要素对应有真实问题,所述问题的答案为所述第一样本中的要素内容,所述要素编码模型的训练目标为,使根据要素编码模块输出的要素表示向量预测的问题,趋于所述第一样本中的要素所对应的真实问题。
4.根据权利要求1所述的要素内容获取方法,其特征在于,所述目标要素对应的要素内容为以下内容中的一种或多种:
所述目标案情文本中描述所述目标要素的文本片段、所述目标要素未被所述目标案情文本所提及的指示信息、所述目标案情文本中的所述目标要素所描述的情形属实的指示信息、所述目标案情文本中的所述目标要素所描述的情形不属实的指示信息。
5.根据权利要求3所述的要素内容获取方法,其特征在于,所述基于所述目标案情文本和所述目标要素对应的要素表示向量,获取所述目标要素对应的要素内容,包括:
基于所述目标案情文本、所述目标要素对应的要素表示向量以及预先训练的要素内容抽取模型,获取所述目标要素对应的要素内容;
其中,所述要素内容抽取模型采用包含案情文本和要素表示向量的第二样本,以及所述第二样本中的要素表示向量表示的要素所对应的真实要素内容训练得到,所述第二样本中的要素表示向量基于所述第二样本中的案情文本和所述要素编码模型获得。
6.根据权利要求5所述的要素内容获取方法,其特征在于,所述要素内容抽取模型的参数根据预先训练的阅读理解模型进行初始化;
其中,所述阅读理解模型采用包含案情文本和问题的第三样本以及第三样本中问题的答案训练得到,所述第三样本中的问题根据与所述第三样本中的案情文本相关的要素转换而来。
7.根据权利要求5所述的要素内容获取方法,其特征在于,所述基于所述目标案情文本、所述目标要素对应的要素表示向量以及预先训练的要素内容抽取模型,获取所述目标要素对应的要素内容,包括:
由所述目标案情文本,以及所述目标要素对应的要素表示向量、第一答案标识符、第二答案标识符、第三答案标识符、要素类型标识符组成目标数据,其中,所述目标要素对应的第一答案标识符、第二答案标识符、第三答案标识符、要素类型标识符依次用于指示:所述目标要素未被所述目标案情文本所提及、所述目标要素在所述目标案情文本中所描述的情形属实、所述目标要素在所述目标案情文本中描述的情形不属实、所述目标要素对应的要素类型;
基于所述目标数据和所述要素内容抽取模型,从所述目标数据中抽取所述目标要素对应的要素内容。
8.根据权利要求7所述的要素内容获取方法,其特征在于,所述基于所述目标数据和所述要素内容抽取模型,从所述目标数据中抽取所述目标要素对应的要素内容,包括:
基于所述目标数据和所述要素内容抽取模型,确定所述目标要素对应的位置指示信息,其中,所述位置指示信息用于指示所述目标要素对应的要素内容在所述目标数据中所处的位置;
基于所述目标要素对应的位置指示信息,从所述目标数据中抽取所述目标要素对应的要素内容。
9.根据权利要求8所述的要素内容获取方法,其特征在于,所述基于所述目...
【专利技术属性】
技术研发人员:王梓玥,王宝鑫,伍大勇,王士进,胡国平,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。