一种作文类文本智能评分方法、系统与设备技术方案

技术编号:31157638 阅读:14 留言:0更新日期:2021-12-04 09:55
本发明专利技术提供一种作文类文本智能评分方法、系统与设备,属于考试测评技术领域。对待评分的作文文本进行体裁判别,将输入文本分类至议论文、散文、说明文、记叙文和应用文共五个类型中的一个类型;依据输入文本的体裁类别,选择特定的判别模型对输入文本进行基础等级判别,输入的作文文本被判定为A、B、C和D共四个等级中的一个等级;依据其他评分规则进行加分或扣分,输入作文文本的最终分由基础等级分值和浮动分值共同构成。本发明专利技术能够实现对多种体裁作文的智能判分,具有较高的评分准确度和评分效率。本发明专利技术对作文的评价从体裁、主旨、思想内容、语言表达和层次结构等多个维度进行考察,并将多个维度进行综合评价之后形成了一个最终分。终分。终分。

【技术实现步骤摘要】
一种作文类文本智能评分方法、系统与设备


[0001]本专利技术涉及考试测评
,尤其涉及一种作文类文本智能评分方法、系统与设备。

技术介绍

[0002]作文作为一种对考生语言、逻辑、思想等综合能力进行考查的题型,具有很大的开放性和自由度,但同时又要求与特定主题相关联。传统的作文评阅方法一般使用浅层分析的结果构建特征,如文章的长度、段落数、词汇丰富性等,依据这类特征判别一篇文章的优劣。不难发现,很多特征与人工评价作文时所考察的维度和深度相距较远。作文的评价一般从体裁、主旨、思想内容、语言表达和层次结构等多个维度进行考察,但是各个维度又不是孤立的,它们彼此联系,相互影响。因此利用机器模型孤立地对作文的多个维度进行测评,会产生较大偏差。
[0003]作文自动评分的另一个难题是不同体裁的作文的侧重点是不同的,比如议论文需要论点、论据和论证,要求语言准确,层次分明,结构严谨;记叙文则需要交代事情发生的时间、地点、人物等等,要求语言流畅,结构清晰。单一的机器模型是很难同时对不同体裁的作文给出准确客观评价的。

技术实现思路

[0004]为了克服上述现有技术中的不足,本专利技术提供一种作文类文本智能评分方法,方法能够实现对多种体裁作文的智能判分,具有较高的评分准确度和评分效率。
[0005]方法包括:S1、作文体裁判别模块对输入的作文文本进行体裁判别;S2、作文基础等级判别模块依据输入文本的体裁类别,选择预设的判别模型对输入文本进行基础等级判别;S3、浮动分值判别模块依据预设评分规则进行加分或扣分;S4、合分模块基于合并基础等级分值和浮动分值形成输入作文文本的最终分。
[0006]进一步需要说明的是,步骤S1中,作文体裁判别模型的训练方式为基于预训练语言模型的迁移学习方式,具体实施步骤:S11,收集大量不同类别的作文语料,对作文的体裁类型进行标注,形成训练数据;S12,基于预训练语言模型构建作文体裁判别模型,模型包括:语义抽取网络层和分类预测层;S13,在已标注的作文语料上进行作文体裁判别模型的精调训练。
[0007]进一步需要说明的是,步骤S2中,作文基础等级判别模型的训练方式为基于预训练语言模型的渐进式迁移学习方式,具体实施步骤:S21,收集同一体裁已标注的作文数据,将分值映射到A,B,C和D四个基础等级类别上,结合作文的题目要求共同形成训练数据;
每条作文数据的形式为:作文题目要求的文本以及考生作文文本;除真实数据外,通过将不匹配的作文题目要求和作文文本结合的方式构造一部分类别为D类别的伪数据;S22,基于预训练语言模型构建作文基础等级判别基础模型,模型包括:语义抽取网络层和分类预测层;S23,在大量已标注的作文数据集上进行精调训练,训练时对全部语义抽取网络层和分类预测层的权重进行更新,训练完成的模型为作文基础等级判别领域模型;S24,在特定的考试测评任务中,收集预设数量专家定标的作文数据,在作文基础等级判别领域模型的基础之上再一次进行模型精调训练,训练时保持语义抽取网络层的权重不变,对分类预测层的权重进行更新,精调完成的模型为作文基础等级判别任务模型。
[0008]进一步需要说明的是,步骤S3中浮动分值判别模块提供以下内容的判别:S31,统计词汇丰富度,对每一篇待评分作文文本进行分词并去掉停用词,然后统计词汇量,并除以题目要求最低字数进行归一化,对所有待评分作文的相对词汇丰富度进行降序排序,前N名待评分作文的相对词汇丰富度定为A级别,后M名待评分作文的相对词汇丰富度定为C级别,中间待评分作文的相对词汇丰富度定为B级别,每个级别代表的分值以及每个级别的人数比例则根据具体考试设置;S32,检测篇章顺畅度,篇章顺畅度的检测包括字、词错误统计和语言表达顺畅检测,对于字、词错误统计每出现一个错误点所扣分值以及最大可扣分值根据具体考试的评分细则设置;对于语言表达流畅度则分为A、B和C三个等级,每个级别代表的分值则根据具体考试设置;S33,统计字数,字数不足时的扣分规则根据具体考试的评分细则设置;S34,检查题目,题目缺失时的扣分规则根据具体考试的评分细则设置。
[0009]进一步需要说明的是,构建篇章顺畅度检测模型,构建的建篇章顺畅度检测模型包括:语义抽取网络层、条件随机场层和顺畅度分类层。
[0010]进一步需要说明的是,合并基础等级分值和浮动分值得到输入作文文本的最终分;最终分最低不低于本等级最低分数,最高不高于本等级最高分数;通过下述计算式来计算最终分:上式中表示最终分,MAX函数表示取两者较大,MIN函数表示取两者较小,BL表示某等级最低分数,BU表示某等级最高分数,B表示某等级的基础分值,F表示浮动分值,浮动分值可为负值。
[0011]本专利技术还提供一种作文类文本智能评分系统,包括:作文体裁判别模块、作文基础等级判别模块、浮动分值判别模块和合分模块;作文体裁判别模块,包含作文体裁判别器训练子模块和作文体裁推理子模块,作文体裁判别器训练子模块用于基于预训练语言模型在经过体裁标注的作文文本数据上的模型训练,作文体裁推理子模块实现对待评分的作文文本体裁判别;作文基础等级判别模块,包含作文基础等级判别器训练子模块和作文基础等级推
理子模块,作文基础等级判别器训练子模块用于基于预训练语言模型的作文基础等级判别器渐进式迁移训练,作文基础等级推理子模块实现对对待评分的作文文本基础等级判别;浮动分值判别模块,包含规则设置子模块和检测子模块,规则设置子模块用于设置考题的一般规则,检查子模块依据设置的评分规则对文本进行检查,实现加分或扣分;合分模块,将基础等级分值与浮动分值进行合并得到输入作文文本的最终分。
[0012]本专利技术还提供一种作文类文本智能评分设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算程序时实现的作文类文本智能评分方法步骤。
[0013]从以上技术方案可以看出,本专利技术具有以下优点:本专利技术提供的作文类文本智能评分方法、系统与设备中,作文体裁判别模块对待评分的作文文本进行体裁判别,将输入文本分类至议论文、散文、说明文、记叙文和应用文共五个类型中的一个类型;作文基础等级判别模块依据输入文本的体裁类别,选择特定的判别模型对输入文本进行基础等级判别,输入的作文文本被判定为A、B、C和D共四个等级中的一个等级;浮动分值判别模块依据其他评分规则进行加分或扣分,输入作文文本的最终分由基础等级分值和浮动分值共同构成。本专利技术能够实现对多种体裁作文的智能判分,具有较高的评分准确度和评分效率。
[0014]本专利技术对作文的评价从体裁、主旨、思想内容、语言表达和层次结构等多个维度进行考察,并将多个维度进行综合评价之后形成了一个最终分,客观的、全面的给了作文的评价。避免了各个维度又不是孤立的,彼此联系,相互影响来评价作文的弊端。
[0015]本专利技术还对作文的交代的事情发生时间、地点、人物等等进行提取评价,避免了单一的机器模型是很难同时对不同体裁的作文给出准确客观评价的问题。
附图说明
[0016]为了更清楚地说明本专利技术的技术方案,下面将对描本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种作文类文本智能评分方法,其特征在于,方法包括:S1、作文体裁判别模块对输入的作文文本进行体裁判别;作文体裁判别模型的训练方式为基于预训练语言模型的迁移学习方式,具体实施步骤:S11,收集大量不同类别的作文语料,对作文的体裁类型进行标注,形成训练数据;S12,基于预训练语言模型构建作文体裁判别模型,模型包括:语义抽取网络层和分类预测层;S13,在已标注的作文语料上进行作文体裁判别模型的精调训练;S2、作文基础等级判别模块依据输入文本的体裁类别,选择预设的判别模型对输入文本进行基础等级判别;步骤S2中,作文基础等级判别模型的训练方式为基于预训练语言模型的渐进式迁移学习方式,具体实施步骤:S21,收集同一体裁已标注的作文数据,将分值映射到A,B,C和D四个基础等级类别上,结合作文的题目要求共同形成训练数据;每条作文数据的形式为:作文题目要求的文本以及考生的作文文本;除真实数据外,通过将不匹配的作文题目要求和作文文本结合的方式构造一部分类别为D类别的伪数据;S22,基于预训练语言模型构建作文基础等级判别基础模型,模型包括:语义抽取网络层和分类预测层;S23,在大量已标注的作文数据集上进行精调训练,训练时对全部语义抽取网络层和分类预测层的权重进行更新,训练完成的模型为作文基础等级判别领域模型;S24,在特定的考试测评任务中,收集预设数量专家定标的作文数据,在作文基础等级判别领域模型的基础之上再一次进行模型精调训练,训练时保持语义抽取网络层的权重不变,对分类预测层的权重进行更新,精调完成的模型为作文基础等级判别任务模型;S3、浮动分值判别模块依据预设评分规则进行加分或扣分;S4、合分模块基于合并基础等级分值和浮动分值形成输入作文文本的最终分。2.根据权利要求1所述的作文类文本智能评分方法,其特征在于,作文体裁的类型为议论文、散文、说明文、记叙文和应用文。3.根据权利要求1所述的作文类文本智能评分方法,其特征在于,作文基础等级所代表的分值根据考试的评分细则设置。4.根据权利要求1所述的作文类文本智能评分方法,其特征在于,步骤S3中浮动分值判别模块提供以下内容的判别:S31,统计词汇丰富度,对每一篇待评分作文文本进行分词并去掉停用词,然后统计词汇量,并除以题目要求最低字数进行归一化,对所有待评分作文的相对词汇丰富度进行降序排序,前N名待评分作文的相对词汇丰富度定为A级别,后M名待评分...

【专利技术属性】
技术研发人员:马磊郭成锋袁峰邢金宝薛勇赵瑞瑞
申请(专利权)人:山东山大鸥玛软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1