英语试卷打分系统技术方案

技术编号：7974983 阅读：196 留言：0更新日期：2012-11-15 23:17

本发明专利技术公开了一种英语作文自动评分系统，包括由一组英语作文集合而成的训练集、文本特征项、回归方程和带有输入和输出装置的电脑；训练集通过输入装置贮存在电脑中；文本特征项是通过对训练集中的作文进行文本分析而得到的信息，并将此信息作为自变量；回归方程是将训练集中的作文人评得分作为因变量与自变量进行多元回归分析并通过统计模型而建立的运行方式；对输入电脑中的待评分作文进行文本分析，将得到的文本特征项作为自变量，经过回归方程运算后得到评分结果，并通过电脑显示。本发明专利技术可实现对中国学生英语作文的大规模机器评分，资源消耗低、评分信度可靠。它广泛适用于各种大规模英语作文考试的评分中，具有极大的实用价值。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种对试卷进行自动评分的系统，具体地说是一种英语作文自动评分系统。
技术介绍
目前，国内还没有对英语作文进行自动评分的系统，国际上针对中国学生英语作文评分的技术也未见过任何报导。国际上对英语作文自动评分系统的研究主要有三种软件，都是利用人工评分培训机器评分模型，通过提取作文中的众多文本特征项，利用统计学的回归方法计算作文得分。这三种软件分别是PEG (由University of Duke开发)，IEA (由 University of Colorado 开发)和 E-rater (由 Educational TestingService 开发)。然而这三种软件并非针对中国学生的英语作文自动评分而设计，运行的总体原理基本相同，但提取的文本特征项各不相同并对外保密。从零星出版公开的研究报告来看，PEG和IEA似乎主要为评阅以英语为母语的学生的作文而设计，E-rater主要为评阅GMAT考试中的学生作文而设计。各软件分别提取哪些具体的文本特征项作为评分模型的变量，无从得知。对英语写作质量的评价，一般应从语言、内容和篇章结构三个方面入手，而对其语言质量的评价往往从流利度(fluency)、准确性(accuracy)和复杂性(complexity)三个方面入手，其中的复杂性又分别从词和句子两个方面加以观察。国外现有的作文评分系统因为没有遵循这样的第二语言写作评判原则，因而对中国学生英语作文的评分针对性不强，方法不力，要么只能适应对以英语为母语的学生的作文的评分，要么只能适应于对某种考试中作文的自动评分。因此，上述三种英语作文自动评分系统都存在以下缺...

【技术保护点】
一种英语作文自动评分系统，其特征是：它包括由一组英语作文集合而成的训练集、文本特征项、回归方程和带有输入和输出装置的电脑；所述训练集通过输入装置贮存在电脑中；文本特征项是通过对训练集中的作文进行文本分析而得到的信息，并将此信息作为自变量；回归方程是将训练集中的作文人评得分作为因变量与自变量进行多元回归分析并通过统计模型而建立的运行方式；对输入电脑中的待评分作文进行文本分析，将得到的文本特征项作为自变量，经过回归方程运算后得到评分结果，并通过电脑的输出装置显示。

【技术特征摘要】
1.一种英语作文自动评分系统，其特征是它包括由一组英语作文集合而成的训练集、文本特征项、回归方程和带有输入和输出装置的电脑；所述训练集通过输入装置贮存在电脑中；文本特征项是通过对训练集中的作文进行文本分析而得到的信息，并将此信息作为自变量；回归方程是将训练集中的作文人评得分作为因变量与自变量进行多元回归分析并通过统计模型而建立的运行方式；对输入电脑中的待评分作文进行文本分析，将得到的文本特征项作为自变量，经过回归方程运算后得到评分结果，并通过电脑的输出装置显示。2.根据权利要求I所述的英语作文自动评分系统，其特征是通过对训练集中的作文进行文本分析而得到的自变量包括能够体现作文特征...

【专利技术属性】
技术研发人员：李德霞，
申请(专利权)人：李德霞，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人