一种信息确定方法、装置、设备及可读存储介质制造方法及图纸

技术编号:19544299 阅读:64 留言:0更新日期:2018-11-24 20:42
本申请实施例公开了一种信息确定方法、装置、设备及可读存储介质,本申请获取活动项目对应的两条以上的项目资料,针对每一条项目资料,从中获取查证事项的取值信息,查证事项与活动项目相对应,进一步根据各条项目资料对应的查证事项的取值信息,确定查证事项的正确取值信息。本申请实施例提供的方法,能够实现自动化的确定查证事项的正确取值信息,无需人工查阅项目资料,从而避免了结果受人为的干扰,且降低了人工成本。

An Information Determining Method, Device, Equipment and Readable Storage Media

The embodiment of this application discloses an information determination method, device, equipment and readable storage medium. The application obtains more than two project data corresponding to the activity item. For each project data, the value information of the verification item is obtained from it, and the verification item corresponds to the activity item, and further according to each item. The value information of the verification items corresponding to the data shall be determined and the correct value information of the verification items shall be determined. The method provided in the embodiment of this application can automatically determine the correct value information of verification items without manual access to project information, thus avoiding human interference in the results and reducing labor costs.

【技术实现步骤摘要】
一种信息确定方法、装置、设备及可读存储介质
本申请涉及自然语言处理
,更具体地说,涉及一种信息确定方法、装置、设备及可读存储介质。
技术介绍
随着时代的发展,当前已经进入了数据时代,各行各业都积累了大量的数据,基于大量的数据可以实现多样化的功能。以司法案件审判场景为例,一个案件内可能会有多个查证事项,例如被害人死亡时间、死亡原因等。对于同一查证事项,其取值信息可能存在于多个证据材料中,如尸体检验报告、目击者的询问笔录等都可能提供被害人的死亡时间。并且,同一查证事项在不同证据材料中的取值信息可能不完全相同。现有技术中,一般由法官查阅大量的卷宗资料,人为给出每一查证事项的正确取值信息。而由于人与人之间判断差异度不同,因此给出的结论很容易受到人为干扰,并且查阅大量卷宗资料也会占用很大的人力成本。
技术实现思路
有鉴于此,本申请提供了一种信息确定方法、装置、设备及可读存储介质,用于解决现有通过人工查阅卷宗资料来确定查证事项的正确取值信息的方式,容易受到人为干扰,且占用人力成本的问题。为了实现上述目的,现提出的方案如下:一种信息确定方法,包括:获取活动项目对应的两条以上的项目资料;针对每一条所述项目资料,从中获取查证事项的取值信息,所述查证事项与所述活动项目相对应;根据各条所述项目资料对应的所述查证事项的取值信息,确定所述查证事项的正确取值信息。优选地,所述针对每一条所述项目资料,从中获取查证事项的取值信息,包括:将每一条所述项目资料输入预置的序列标注模型,得到序列标注模型输出的所述项目资料包含的词所属的查证事项的类型;所述序列标注模型为,预先以项目训练数据包含的词作为训练样本,以标注的所述词所属的查证事项的类型为样本标签训练得到;将属于同一类型查证事项的词,作为所述同一类型查证事项的取值信息。优选地,在所述根据各条所述项目资料对应的所述查证事项的取值信息,确定所述查证事项的正确取值信息之前,该方法还包括:在预置的知识点库中,查找与获取的所述查证事项相同类型查证事项的规整取值信息集合,所述知识点库中存储了每一类型查证事项的规整取值信息集合,规整取值信息集合中包含至少一个规整取值信息;确定获取的所述查证事项的取值信息,与所述规整取值信息集合中每一个规整取值信息的相似度;将相似度最高的规整取值信息作为获取的所述查证事项的规整后取值信息。优选地,所述确定获取的所述查证事项的取值信息,与所述规整取值信息集合中每一个规整取值信息的相似度,包括:将所述规整取值信息集合中每一规整取值信息分别与所述查证事项的取值信息输入预置的相似度确定模型,得到相似度确定模型输出的所述查证事项的取值信息与每一规整取值信息的相似度;所述相似度确定模型为,预先以所述查证事项的取值训练数据及所述查证事项的规整取值信息集合为训练样本,以所述规整取值信息集合中每一规整取值信息与所述取值训练数据的相似度标注结果为样本标签训练得到。优选地,还包括:对每条所述项目资料进行分类,得到每条所述项目资料所属的类别。优选地,所述根据各条所述项目资料对应的所述查证事项的取值信息,确定所述查证事项的正确取值信息,包括:根据各条所述项目资料对应的所述查证事项的取值信息,统计每一类型的查证事项的不同取值信息的集合;针对每一类型的查证事项下每一取值信息,在每一类别的项目资料中,统计包含所述取值信息的项目资料的条数,作为所述查证事项下每一取值信息的统计特征;针对每一类型的查证事项,根据所述查证事项下每一取值信息的统计特征,在各取值信息中确定所述查证事项的正确取值信息。优选地,还包括:将预置的各类别项目资料的权威度排序,确定为所述查证事项下每一取值信息的统计特征。优选地,所述根据所述查证事项下每一取值信息的统计特征,在各取值信息中确定所述查证事项的正确取值信息,包括:将所述查证事项下每一取值信息的统计特征输入预置的正确取值预测模型,并获取正确取值预测模型输出的所述查证事项的正确取值信息;所述正确取值预测模型为,预先以项目资料训练数据中,每一类型的查证事项下每一取值信息的统计特征作为训练样本,以每一取值信息标注的是否为正确取值信息的结果为样本标签训练得到。优选地,所述根据所述查证事项下每一取值信息的统计特征,在各取值信息中确定所述查证事项的正确取值信息,包括:针对所述查证事项下每一取值信息,验证其统计特征是否满足预置的验证规则;将满足预置验证规则的取值信息作为所述查证事项的正确取值信息。优选地,所述对每条所述项目资料进行分类,包括:将每条所述项目资料输入预置的分类模型,得到分类模型输出的每条所述项目资料所属的类别;所述分类模型为,预先利用标注有分类类别的项目资料训练数据训练得到。一种信息确定装置,包括:项目资料获取单元,用于获取活动项目对应的两条以上的项目资料;取值信息获取单元,用于针对每一条所述项目资料,从中获取查证事项的取值信息,所述查证事项与所述活动项目相对应;正确取值信息确定单元,用于根据各条所述项目资料对应的所述查证事项的取值信息,确定所述查证事项的正确取值信息。一种信息确定设备,包括存储器和处理器;所述存储器,用于存储程序;所述处理器,用于执行所述程序,实现上述的信息确定方法的各个步骤。一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现上述的信息确定方法的各个步骤。从上述的技术方案可以看出,本申请实施例提供的信息确定方法,获取活动项目对应的两条以上的项目资料,针对每一条项目资料,从中获取查证事项的取值信息,查证事项与活动项目相对应,进一步根据各条项目资料对应的查证事项的取值信息,确定查证事项的正确取值信息。本申请实施例提供的方法,能够实现自动化的确定查证事项的正确取值信息,无需人工查阅项目资料,从而避免了结果受人为的干扰,且降低了人工成本。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本申请实施例公开的一种信息确定方法流程图;图2示例了一种相似度确定模型的架构;图3示例了一种查证事项取值信息的统计特征示意结构;图4示例了一种样本标签示意结构;图5示例了一种正确取值预测模型训练过程示意图;图6为本申请实施例公开的一种信息确定装置结构示意图;图7为本申请实施例公开的一种信息确定设备的硬件结构框图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。以活动项目为司法案件审核为例,当前的审判过程中,基本由法官自由裁量主观性很强。并且,由于卷宗资料庞大,人工查阅极其耗时。对于查证事项,其与活动项目相对应,不同活动项目对应的查证事项也不完全相同。查证事项为针对活动项目而言,需要查验确认正确取值信息的事项。以活动项目为司法案件审核为例,对应的查证事项可以包括:死亡时间、死亡原因、作案手段等等。本申请方案借助处理本文档来自技高网...

【技术保护点】
1.一种信息确定方法,其特征在于,包括:获取活动项目对应的两条以上的项目资料;针对每一条所述项目资料,从中获取查证事项的取值信息,所述查证事项与所述活动项目相对应;根据各条所述项目资料对应的所述查证事项的取值信息,确定所述查证事项的正确取值信息。

【技术特征摘要】
1.一种信息确定方法,其特征在于,包括:获取活动项目对应的两条以上的项目资料;针对每一条所述项目资料,从中获取查证事项的取值信息,所述查证事项与所述活动项目相对应;根据各条所述项目资料对应的所述查证事项的取值信息,确定所述查证事项的正确取值信息。2.根据权利要求1所述的方法,其特征在于,所述针对每一条所述项目资料,从中获取查证事项的取值信息,包括:将每一条所述项目资料输入预置的序列标注模型,得到序列标注模型输出的所述项目资料包含的词所属的查证事项的类型;所述序列标注模型为,预先以项目训练数据包含的词作为训练样本,以标注的所述词所属的查证事项的类型为样本标签训练得到;将属于同一类型查证事项的词,作为所述同一类型查证事项的取值信息。3.根据权利要求1所述的方法,其特征在于,在所述根据各条所述项目资料对应的所述查证事项的取值信息,确定所述查证事项的正确取值信息之前,该方法还包括:在预置的知识点库中,查找与获取的所述查证事项相同类型查证事项的规整取值信息集合,所述知识点库中存储了每一类型查证事项的规整取值信息集合,规整取值信息集合中包含至少一个规整取值信息;确定获取的所述查证事项的取值信息,与所述规整取值信息集合中每一个规整取值信息的相似度;将相似度最高的规整取值信息作为获取的所述查证事项的规整后取值信息。4.根据权利要求3所述的方法,其特征在于,所述确定获取的所述查证事项的取值信息,与所述规整取值信息集合中每一个规整取值信息的相似度,包括:将所述规整取值信息集合中每一规整取值信息分别与所述查证事项的取值信息输入预置的相似度确定模型,得到相似度确定模型输出的所述查证事项的取值信息与每一规整取值信息的相似度;所述相似度确定模型为,预先以所述查证事项的取值训练数据及所述查证事项的规整取值信息集合为训练样本,以所述规整取值信息集合中每一规整取值信息与所述取值训练数据的相似度标注结果为样本标签训练得到。5.根据权利要求1-4任一项所述的方法,其特征在于,还包括:对每条所述项目资料进行分类,得到每条所述项目资料所属的类别。6.根据权利要求5所述的方法,其特征在于,所述根据各条所述项目资料对应的所述查证事项的取值信息,确定所述查证事...

【专利技术属性】
技术研发人员:柳彬宗升亚王震
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1