当前位置: 首页 > 专利查询>华侨大学专利>正文

一种文档衔接连贯性的评测方法、装置、设备及存储介质制造方法及图纸

技术编号:38466836 阅读:81 留言:0更新日期:2023-08-11 14:44
本发明专利技术提供了一种文档衔接连贯性的评测方法、装置、设备及存储介质,通过先调用预训练语言模型并以掩码预测的方式将事件论元逐个进行填充,将事件实例还原为事件描述语句,接着,将两个事件描述语句之间的事件关系映射为关联词集合,选取置信度最高的关联词作为事件关系预测结果,事件关系预测结果包括事件论元连贯性与事件关系衔接性,最后,根据事件论元连贯性与事件关系衔接性的度量和融合,生成文档衔接连贯性的评测结果,通过文档衔接连贯性评测,拓宽自动作文评测的适用题型与应用场景。景。景。

【技术实现步骤摘要】
一种文档衔接连贯性的评测方法、装置、设备及存储介质


[0001]本专利技术涉及自然语言处理
,特别涉及一种文档衔接连贯性的评测方法、装置、设备及存储介质。

技术介绍

[0002]事件关系客观存在于事件之间,并且作用于原本孤立的事件集合中。事件关系能将离散于文本中的事件相连接,形成事件关系网络和事件发展的拓扑脉络,然而在现有技术中,无法基于文档衔接连贯性评测来进一步拓宽自动作文评测的适用题型与应用场景。
[0003]有鉴于此,提出本申请。

技术实现思路

[0004]本专利技术公开了一种文档衔接连贯性的评测方法、装置、设备及存储介质,旨在基于文档衔接连贯性评测,来拓宽自动作文评测的适用题型与应用场景。
[0005]本专利技术第一实施例提供了一种文档衔接连贯性的评测方法,包括:
[0006]调用预训练语言模型并以掩码预测的方式将事件论元逐个进行填充,将事件实例还原为事件描述语句;
[0007]将两个事件描述语句之间的事件关系映射为关联词集合,选取置信度最高的关联词作为事件关系预测结果,其中,所述事件关系预测结果包括事件论元连贯性与事件关系衔接性;
[0008]根据所述事件论元连贯性与所述事件关系衔接性的度量和融合,生成文档衔接连贯性的评测结果,其中,所述事件论元连贯性为两个文档事件集合中出现事件论元连贯的事件数量占所有事数量的比例;所述事件关系衔接性为两个文档事件集合中具有事件关系的事件对数量占所有事件对的比例。
[0009]优选地,所述调用预训练语言模型并以掩码预测的方式将事件论元逐个进行填充,将事件实例还原为事件描述语句,具体为:
[0010]S201,以事件实例中的事件触发词为事件描述重构语句的初始状态,将事件实例中的事件论元按其自身长度分组后,按升序每轮选取一个事件论元组作为候选论元集合;
[0011]S202,调用预训练语言模型对所述候选论元集中每一论元在当前事件描述重构语句中所有待填充位置进行预测,并选取在本轮预测中获得最高置信度的论元填充至事件描述重构语句的对应位置;
[0012]S203,更新事件重构语句并将该论元从候选论元集合中移除;
[0013]S204,进行下一次预测,重复上述过程,直至所有论元填充完毕。
[0014]优选地,所述将两个事件描述语句之间的事件关系映射为关联词集合,选取置信度最高的关联词作为事件关系预测结果,具体为:
[0015]采用Prompt学习的方式将两个事件实例对应的事件描述语句使用遮盖标记进行拼接,
[0016]通过预训练语言模型对所述遮盖标记进行预测,选取拥有最高置信度的连接词并将其映射得到两个事件间的事件关系。
[0017]优选地,所述文档衔接连贯性为所述事件论元连贯性与所述事件关系衔接性的乘积。
[0018]本专利技术第二实施例提供了一种文档衔接连贯性的评测装置,包括:
[0019]事件描述语句还原单元,用于调用预训练语言模型并以掩码预测的方式将事件论元逐个进行填充,将事件实例还原为事件描述语句;
[0020]事件关系预测结果选取单元,用于将两个事件描述语句之间的事件关系映射为关联词集合,选取置信度最高的关联词作为事件关系预测结果,其中,所述事件关系预测结果包括事件论元连贯性与事件关系衔接性;
[0021]文档衔接连贯性的评测结果生成单元,用于根据事件论元连贯性与事件关系衔接性的度量和融合,生成文档衔接连贯性的评测结果,其中,所述事件论元连贯性为两个文档事件集合中出现事件论元连贯的事件数量占所有事数量的比例;所述事件关系衔接性为两个文档事件集合中具有事件关系的事件对数量占所有事件对的比例。
[0022]优选地,所述事件描述语句还原单元具体用于:
[0023]S201,以事件实例中的事件触发词为事件描述重构语句的初始状态,将事件实例中的事件论元按其自身长度分组后,按升序每轮选取一个事件论元组作为候选论元集合;
[0024]S202,调用预训练语言模型对所述候选论元集中每一论元在当前事件描述重构语句中所有待填充位置进行预测,并选取在本轮预测中获得最高置信度的论元填充至事件描述重构语句的对应位置;
[0025]S203,更新事件重构语句并将该论元从候选论元集合中移除;
[0026]S204,进行下一次预测,重复上述过程,直至所有论元填充完毕。
[0027]优选地,所述事件关系预测结果选取单元具体用于:
[0028]采用Prompt学习的方式将两个事件实例对应的事件描述语句使用遮盖标记进行拼接,
[0029]通过预训练语言模型对所述遮盖标记进行预测,选取拥有最高置信度的连接词并将其映射得到两个事件间的事件关系。
[0030]优选地,所述文档衔接连贯性为所述事件论元连贯性与所述事件关系衔接性的乘积。
[0031]本专利技术第三实施例提供了一种文档衔接连贯性的评测设备,包括存储器以及处理器,所述存储器内存储有计算机程序,所述计算机程序能够被所述处理器执行,以实现如上任意一项所述的一种文档衔接连贯性的评测方法。
[0032]本专利技术第四实施例提供了一种计算机可读存储介质,其特征在于,存储有计算机程序,所述计算机程序能够被所述计算机可读存储介质所在设备的处理器执行,以实现如上任意一项所述的一种文档衔接连贯性的评测方法。
[0033]基于本专利技术提供的一种文档衔接连贯性的评测方法、装置、设备及存储介质,通过先调用预训练语言模型并以掩码预测的方式将事件论元逐个进行填充,将事件实例还原为事件描述语句,接着,将两个事件描述语句之间的事件关系映射为关联词集合,选取置信度最高的关联词作为事件关系预测结果,其中,所述事件关系预测结果包括事件论元连贯性
与事件关系衔接性,最后,根据所述事件论元连贯性与所述事件关系衔接性的度量和融合,生成文档衔接连贯性的评测结果,其中,所述事件论元连贯性为两个文档事件集合中出现事件论元连贯的事件数量占所有事数量的比例;所述事件关系衔接性为两个文档事件集合中具有事件关系的事件对数量占所有事件对的比例,通过文档衔接连贯性评测,拓宽自动作文评测的适用题型与应用场景。
附图说明
[0034]图1是本专利技术第一实施例提供的一种文档衔接连贯性的评测方法的流程示意图;
[0035]图2是本专利技术第二实施例提供的一种文档衔接连贯性的评测装置的模块示意图。
具体实施方式
[0036]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0037]为了更好的理解本专利技术的技术方案,下面结合附图对本专利技术实施例进行详细描述。
[0038]应当明确,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文档衔接连贯性的评测方法,其特征在于,包括:调用预训练语言模型并以掩码预测的方式将事件论元逐个进行填充,将事件实例还原为事件描述语句;将两个事件描述语句之间的事件关系映射为关联词集合,选取置信度最高的关联词作为事件关系预测结果,其中,所述事件关系预测结果包括事件论元连贯性与事件关系衔接性;根据所述事件论元连贯性与所述事件关系衔接性的度量和融合,生成文档衔接连贯性的评测结果,其中,所述事件论元连贯性为两个文档事件集合中出现事件论元连贯的事件数量占所有事数量的比例;所述事件关系衔接性为两个文档事件集合中具有事件关系的事件对数量占所有事件对的比例。2.根据权利要求1所述的一种文档衔接连贯性的评测方法,其特征在于,所述调用预训练语言模型并以掩码预测的方式将事件论元逐个进行填充,将事件实例还原为事件描述语句,具体为:S201,以事件实例中的事件触发词为事件描述重构语句的初始状态,将事件实例中的事件论元按其自身长度分组后,按升序每轮选取一个事件论元组作为候选论元集合;S202,调用预训练语言模型对所述候选论元集中每一论元在当前事件描述重构语句中所有待填充位置进行预测,并选取在本轮预测中获得最高置信度的论元填充至事件描述重构语句的对应位置;S203,更新事件重构语句并将该论元从候选论元集合中移除;S204,进行下一次预测,重复上述过程,直至所有论元填充完毕。3.根据权利要求1所述的一种文档衔接连贯性的评测方法,其特征在于,所述将两个事件描述语句之间的事件关系映射为关联词集合,选取置信度最高的关联词作为事件关系预测结果,具体为:采用Prompt学习的方式将两个事件实例对应的事件描述语句使用遮盖标记进行拼接,通过预训练语言模型对所述遮盖标记进行预测,选取拥有最高置信度的连接词并将其映射得到两个事件间的事件关系。4.根据权利要求1所述的一种文档衔接连贯性的评测方法,其特征在于,所述文档衔接连贯性为所述事件论元连贯性与所述事件关系衔接性的乘积。5.一种文档衔接连贯性的评测装置,其特征在于,包括:事件描述语句还原单元,用于调用预训练语言模型并以掩码预测的方式将事件论元逐个进行填充,将事件实例还原为事件描述语句;事件关系预测结果...

【专利技术属性】
技术研发人员:王华珍赵荐轩何霆李弼程
申请(专利权)人:华侨大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1