The embodiment of this application discloses an information determination method, device, equipment and readable storage medium. The application obtains more than two project data corresponding to the activity item. For each project data, the value information of the verification item is obtained from it, and the verification item corresponds to the activity item, and further according to each item. The value information of the verification items corresponding to the data shall be determined and the correct value information of the verification items shall be determined. The method provided in the embodiment of this application can automatically determine the correct value information of verification items without manual access to project information, thus avoiding human interference in the results and reducing labor costs.
【技术实现步骤摘要】
一种信息确定方法、装置、设备及可读存储介质
本申请涉及自然语言处理
,更具体地说,涉及一种信息确定方法、装置、设备及可读存储介质。
技术介绍
随着时代的发展,当前已经进入了数据时代,各行各业都积累了大量的数据,基于大量的数据可以实现多样化的功能。以司法案件审判场景为例,一个案件内可能会有多个查证事项,例如被害人死亡时间、死亡原因等。对于同一查证事项,其取值信息可能存在于多个证据材料中,如尸体检验报告、目击者的询问笔录等都可能提供被害人的死亡时间。并且,同一查证事项在不同证据材料中的取值信息可能不完全相同。现有技术中,一般由法官查阅大量的卷宗资料,人为给出每一查证事项的正确取值信息。而由于人与人之间判断差异度不同,因此给出的结论很容易受到人为干扰,并且查阅大量卷宗资料也会占用很大的人力成本。
技术实现思路
有鉴于此,本申请提供了一种信息确定方法、装置、设备及可读存储介质,用于解决现有通过人工查阅卷宗资料来确定查证事项的正确取值信息的方式,容易受到人为干扰,且占用人力成本的问题。为了实现上述目的,现提出的方案如下:一种信息确定方法,包括:获取活动项目对应的两条以上的项目资料;针对每一条所述项目资料,从中获取查证事项的取值信息,所述查证事项与所述活动项目相对应;根据各条所述项目资料对应的所述查证事项的取值信息,确定所述查证事项的正确取值信息。优选地,所述针对每一条所述项目资料,从中获取查证事项的取值信息,包括:将每一条所述项目资料输入预置的序列标注模型,得到序列标注模型输出的所述项目资料包含的词所属的查证事项的类型;所述序列标注模型为,预先以项目训练数据包含的 ...
【技术保护点】
1.一种信息确定方法,其特征在于,包括:获取活动项目对应的两条以上的项目资料;针对每一条所述项目资料,从中获取查证事项的取值信息,所述查证事项与所述活动项目相对应;根据各条所述项目资料对应的所述查证事项的取值信息,确定所述查证事项的正确取值信息。
【技术特征摘要】
1.一种信息确定方法,其特征在于,包括:获取活动项目对应的两条以上的项目资料;针对每一条所述项目资料,从中获取查证事项的取值信息,所述查证事项与所述活动项目相对应;根据各条所述项目资料对应的所述查证事项的取值信息,确定所述查证事项的正确取值信息。2.根据权利要求1所述的方法,其特征在于,所述针对每一条所述项目资料,从中获取查证事项的取值信息,包括:将每一条所述项目资料输入预置的序列标注模型,得到序列标注模型输出的所述项目资料包含的词所属的查证事项的类型;所述序列标注模型为,预先以项目训练数据包含的词作为训练样本,以标注的所述词所属的查证事项的类型为样本标签训练得到;将属于同一类型查证事项的词,作为所述同一类型查证事项的取值信息。3.根据权利要求1所述的方法,其特征在于,在所述根据各条所述项目资料对应的所述查证事项的取值信息,确定所述查证事项的正确取值信息之前,该方法还包括:在预置的知识点库中,查找与获取的所述查证事项相同类型查证事项的规整取值信息集合,所述知识点库中存储了每一类型查证事项的规整取值信息集合,规整取值信息集合中包含至少一个规整取值信息;确定获取的所述查证事项的取值信息,与所述规整取值信息集合中每一个规整取值信息的相似度;将相似度最高的规整取值信息作为获取的所述查证事项的规整后取值信息。4.根据权利要求3所述的方法,其特征在于,所述确定获取的所述查证事项的取值信息,与所述规整取值信息集合中每一个规整取值信息的相似度,包括:将所述规整取值信息集合中每一规整取值信息分别与所述查证事项的取值信息输入预置的相似度确定模型,得到相似度确定模型输出的所述查证事项的取值信息与每一规整取值信息的相似度;所述相似度确定模型为,预先以所述查证事项的取值训练数据及所述查证事项的规整取值信息集合为训练样本,以所述规整取值信息集合中每一规整取值信息与所述取值训练数据的相似度标注结果为样本标签训练得到。5.根据权利要求1-4任一项所述的方法,其特征在于,还包括:对每条所述项目资料进行分类,得到每条所述项目资料所属的类别。6.根据权利要求5所述的方法,其特征在于,所述根据各条所述项目资料对应的所述查证事项的取值信息,确定所述查证事...
【专利技术属性】
技术研发人员:柳彬,宗升亚,王震,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。