一种文档衔接连贯性的评测方法、装置、设备及存储介质制造方法及图纸

技术编号：38466836 阅读：81 留言：0更新日期：2023-08-11 14:44

本发明专利技术提供了一种文档衔接连贯性的评测方法、装置、设备及存储介质，通过先调用预训练语言模型并以掩码预测的方式将事件论元逐个进行填充，将事件实例还原为事件描述语句，接着，将两个事件描述语句之间的事件关系映射为关联词集合，选取置信度最高的关联词作为事件关系预测结果，事件关系预测结果包括事件论元连贯性与事件关系衔接性，最后，根据事件论元连贯性与事件关系衔接性的度量和融合，生成文档衔接连贯性的评测结果，通过文档衔接连贯性评测，拓宽自动作文评测的适用题型与应用场景。景。景。

全部详细技术资料下载

【技术实现步骤摘要】
一种文档衔接连贯性的评测方法、装置、设备及存储介质

[0001]本专利技术涉及自然语言处理
，特别涉及一种文档衔接连贯性的评测方法、装置、设备及存储介质。

技术介绍

[0002]事件关系客观存在于事件之间，并且作用于原本孤立的事件集合中。事件关系能将离散于文本中的事件相连接，形成事件关系网络和事件发展的拓扑脉络，然而在现有技术中，无法基于文档衔接连贯性评测来进一步拓宽自动作文评测的适用题型与应用场景。
[0003]有鉴于此，提出本申请。

技术实现思路

[0004]本专利技术公开了一种文档衔接连贯性的评测方法、装置、设备及存储介质，旨在基于文档衔接连贯性评测，来拓宽自动作文评测的适用题型与应用场景。
[0005]本专利技术第一实施例提供了一种文档衔接连贯性的评测方法，包括：
[0006]调用预训练语言模型并以掩码预测的方式将事件论元逐个进行填充，将事件实例还原为事件描述语句；
[0007]将两个事件描述语句之间的事件关系映射为关联词集合，选取置信度最高的关联词作为事件关系预测结果，其中，所述事件关系预测结果包括事件论元连贯性与事件关系衔接性；
[0008]根据所述事件论元连贯性与所述事件关系衔接性的度量和融合，生成文档衔接连贯性的评测结果，其中，所述事件论元连贯性为两个文档事件集合中出现事件论元连贯的事件数量占所有事数量的比例；所述事件关系衔接性为两个文档事件集合中具有事件关系的事件对数量占所有事件对的比例。
[0009]优选地，所述调用预训练语言模...

【技术保护点】

【技术特征摘要】
1.一种文档衔接连贯性的评测方法，其特征在于，包括：调用预训练语言模型并以掩码预测的方式将事件论元逐个进行填充，将事件实例还原为事件描述语句；将两个事件描述语句之间的事件关系映射为关联词集合，选取置信度最高的关联词作为事件关系预测结果，其中，所述事件关系预测结果包括事件论元连贯性与事件关系衔接性；根据所述事件论元连贯性与所述事件关系衔接性的度量和融合，生成文档衔接连贯性的评测结果，其中，所述事件论元连贯性为两个文档事件集合中出现事件论元连贯的事件数量占所有事数量的比例；所述事件关系衔接性为两个文档事件集合中具有事件关系的事件对数量占所有事件对的比例。2.根据权利要求1所述的一种文档衔接连贯性的评测方法，其特征在于，所述调用预训练语言模型并以掩码预测的方式将事件论元逐个进行填充，将事件实例还原为事件描述语句，具体为：S201，以事件实例中的事件触发词为事件描述重构语句的初始状态，将事件实例中的事件论元按其自身长度分组后，按升序每轮选取一个事件论元组作为候选论元集合；S202，调用预训练语言模型对所述候选论元集中每一论元在当前事件描述重构语句中所有待填充位置进行预测，并选取在本轮预测中获得最高置信度的论元填充至事件描述重构语句的对应位置；S203，更新事件重构语句并将该论元从候选论元集合中移除；S204，进行下一次预测，重复上述过程，直至所有论元填充完毕。3.根据权利要求1所述的一种文档衔接连贯性的评测方法，其特征在于，所述将两个事件描述语句之间的事件关系映射为关联词集合，选取置信度最高的关联词作为事件关系预测结果，具体为：采用Prompt学习的方式将两个事件实例对应的事件描述语句使用遮盖标记进行拼接，通过预训练语言模型对所述遮盖标记进行预测，选取拥有最高置信度的连接词并将其映射得到两个事件间的事件关系。4.根据权利要求1所述的一种文档衔接连贯性的评测方法，其特征在于，所述文档衔接连贯性为所述事件论元连贯性与所述事件关系衔接性的乘积。5.一种文档衔接连贯性的评测装置，其特征在于，包括：事件描述语句还原单元，用于调用预训练语言模型并以掩码预测的方式将事件论元逐个进行填充，将事件实例还原为事件描述语句；事件关系预测结果...

【专利技术属性】
技术研发人员：王华珍，赵荐轩，何霆，李弼程，
申请(专利权)人：华侨大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人