一种基于智能算法的在线作业自动批改方法技术

技术编号:38020164 阅读:22 留言:0更新日期:2023-06-30 10:47
本申请提供一种基于智能算法的在线作业自动批改方法,包括:作业撰写系统以及评估作业分数算法,其具体包括:根据学习行为分析撰写作业专注度,分析学生课程熟练度,提示关键词汇;获取学生作业数据批改学生作业,构建作业书法评价模型,基于OCR处理后的学生作业数据,评估作业内容的独特性,分析学生解决不同问题的能力;构建识别批改算法漏洞模型;构建识别作业撰写人员模型攻击,所述构建识别作业撰写人员模型攻击,包括:基于学生撰写专注度、解决不同问题的偏差权重,调整识别作业撰写人员模型攻击参数;通过根据作业每秒作业撰写的文字数量与独特性判断作业真实性,根据作业的书法评价分数评估作业的真实性。书法评价分数评估作业的真实性。书法评价分数评估作业的真实性。

【技术实现步骤摘要】
一种基于智能算法的在线作业自动批改方法


[0001]本专利技术涉及信息
,尤其涉及一种基于智能算法的在线作业自动批改方法。

技术介绍

[0002]有些同学在了解到作业是系统进行批改的之后,会对作业进行攻击,例如,算法会对作业撰写篇幅进行判断,获得一定分数,而有些同学就可以基于该算法,复制大量的没有价值的文章,以便增加分数。有时算法会基于某些关键词模型来为作业加分,当一个同学评估后获得结果,他就会把相关的经验告诉其他同学,其他同学也通过类似关键词得到高分。因为当前的技术还无法让在线评估系统像真正的老师一样,能够得到最客观的评价,因此对在线批改算法的攻击一直存在。

技术实现思路

[0003]本专利技术提供了一种基于智能算法的在线作业自动批改方法,主要包括:
[0004]构建作业撰写系统;获取学生作业数据批改学生作业,评估学生作业分数;构建识别批改算法漏洞模型;基于特定用户数据构建优化调参模型;构建识别作业撰写人员模型攻击;判断作业内容的真实性;
[0005]进一步可选地,所述构建作业撰写系统包括:
[0006]所述作业撰写系统,作业撰写系统包括个人信息录入单元、用户查询单元、作业显示单元、作业撰写单元;用户通过信息录入单元将学生、教师对应的班级课程及作业信息输入该系统;作业显示单元显示作业信息,对作业信息进行数据管理;用户查询单元包括对历史作业的查询,历史作业分数的查询,历史作业独特性的查询,历史作业问题解决能力的查询,系统对历史作业书法评价的查询;作业撰写单元包括使用电容笔写入作业内容,其中,用户在作业撰写过程中系统记录撰写时间;包括:根据学习行为分析撰写作业专注度;基于每秒作业撰写的文字数量分析学生课程熟练度;基于作业撰写思考数据,题干提示关键词汇;
[0007]所述根据学习行为分析撰写作业专注度,具体包括:
[0008]根据学习行为分析撰写作业专注度。识别用户是否有进行撰写,用户未进行撰写的时间为思考时间。首先建立专注度分析模型,即F=100

W1*L1

W2*L2
‑……‑
Wn*Ln

H,其中F表示专注度,根据作业大标题划分1至n部分,Wn表示作业第n部分实际思考时间与人工预设理想思考时间差值的绝对值,Ln表示作业不同部分内容的撰写字数与该部分标准答案字数比,H表示作业提交次数。计算所有学生的作业专注度,同时计算平均学习专注度。若某位学生的作业专注度高于平均学习专注度,则表示该同学较其他同学专注撰写。
[0009]所述基于每秒作业撰写的文字数量分析学生课程熟练度,具体包括:
[0010]首先,建立数学公式模型分析学生课程熟练度。根据撰写频率与思考行为,建立分析学生课程熟练度数学模型,根据作业大标题划分1至n部分,即F=N1/T1+N2/T2+
……
+Nn/
Tn,其中F表示课程熟练度,Tn表示第n部分实际使用时间,Nn表示作业第n部分内容的撰写字数,Nn/Tn为每秒作业撰写的文字数量。计算每一位学生的课程熟练度,同时计算平均课程熟练度。若某位学生的课程熟练度高于平均课程熟练度,则表示该同学更熟练掌握该门课程。
[0011]所述基于作业撰写思考数据,题干提示关键词汇,具体包括:
[0012]所述作业思考数据包括作业撰写停顿位置,系统判定用户正在思考信号。根据作业思考数据,分析停顿位置语句。停顿位置语句使用jieba分词,提取停顿位置语句词汇,题干使用jieba分词提取题干语句词汇。根据提取到的词汇人工标记不同的属性标签。使用最近邻算法建立提示题干题干与作业思考数据相同分类的词汇模型,设有t个训练样本,(X1,θ1)、(X2,θ2)、...、(Xt,θt),Xi为第i个数据样本,θi为第i个样本的分类标签。使用欧几里得距离公式计算作业思考数据与题干数据点的距离,得到分类结果。根据分类结果,系统判定用户思考时间超过设置的阈值,提示题干与作业思考数据相同分类的词汇。
[0013]进一步可选地,所述获取学生作业数据批改学生作业,评估学生作业分数包括:
[0014]所述学生作业数据包括作业撰写内容图像,学生个人信息,作业提交次数,作业提交时间,作业不同部分的完成时间;学生作业数据进行图像识别,通过OCR算法识别学生作业所含内容,并提取图像中所含文字;OCR算法通过图像预处理提取灰度图像,并计算灰度图像的阈值,通过阈值进行图像二值化,并将文字线条细化;根据预处理得到的数据,提取预处理数据中的RILBP特征,组成多个特征向量样本集,并通过SVM支持向量机对多个特征向量样本分类识别,得到识别的结果;根据识别的结果使用向量空间算法,答案预设的向量与识别结果的特征向量使用余弦相似度,即Cosθ=a/c,c为斜边,a为与c的夹角边;累计所述余弦相似度小于预设阈值的个数,得到与正确答案相似的答案数;评估学生的作业分数,建立数学公式,即累计与正确答案相似的答案数/总答案数=正确率;根据计算得到的正确率乘以100得到评估学生作业的分数;包括:基于宋体汉子图形数据,构建作业书法评价模型;基于OCR处理后的学生作业数据,评估作业内容的独特性;基于作业完成数据,分析学生解决不同问题的能力;
[0015]所述基于宋体汉子图形数据,构建作业书法评价模型,具体包括:
[0016]根据获取的作业数据图像,使用图像二值化算法,设置全局阈值,将RGB图像实现图像的二值化,其中,撰写的内容对应像素1,背景图像对应像素0。系统建立标准宋体汉字图像库,数字图像库,英文图像库,其中,图像库进行二值化处理,作为书法评分标准数据集。根据OCR算法识别图像中的每个的字符,比对二值数据图像中每个字符1像素点的分布与评分标准数据集每个字符1像素点的分布,设置选取像素点的阈值个数,使用欧氏距离L2范数公式,计算学生作业字体与标准字体的偏差值。累加所得的偏差值,得到偏差值总数。书法评价分数=100

偏差值总数。
[0017]所述基于OCR处理后的学生作业数据,评估作业内容的独特性,具体包括:
[0018]所述OCR处理后的学生作业数据包括OCR识别后的作业文字内容。根据作业文字内容,计算所有不同正确答案的频率,即某正确答案的答题数/所有正确答案的答题数。若某学生使用频率最低的正确答案,则表示该学生的答案具有独特性。计算该同学的独特性分数,其中,独特性分数=使用该正确答案的人数/学生总数。
[0019]所述基于作业完成数据,分析学生解决不同问题的能力,具体包括:
[0020]作业完成数据包括学生在作业不同部分的完成时间。根据作业不同部分的内容,人工设置标准阈值。根据学生实际不同部分完成的时间,与标准阈值的差值得到标准差,即,标准差=实际完成时间

标准阈值,若完成时间小于标准阈值,则所得标准差为0。计算偏差权重,即,偏差权重=标准差/标准阈值,得到偏差权重的数值。比较偏差权重数值大小,偏差权重最小表示该同学解决该部分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于智能算法的在线作业自动批改方法,其特征在于,所述方法包括:构建作业撰写系统,所述构建作业撰写系统,具体包括:根据学习行为分析撰写作业专注度,基于每秒作业撰写的文字数量分析学生课程熟练度,基于作业撰写思考数据,题干提示关键词汇;获取学生作业数据批改学生作业,评估学生作业分数,所述获取学生作业数据批改学生作业,评估学生作业分数,具体包括:基于宋体汉子图形数据,构建作业书法评价模型,基于OCR处理后的学生作业数据,评估作业内容的独特性,基于作业完成数据,分析学生解决不同问题的能力;构建识别批改算法漏洞模型;基于特定用户数据构建优化调参模型;构建识别作业撰写人员模型攻击,所述构建识别作业撰写人员模型攻击,具体包括:基于学生课程熟练度调整识别作业撰写人员模型攻击参数,基于学生撰写专注度、解决不同问题的偏差权重,调整识别作业撰写人员模型攻击参数;判断作业内容的真实性,所述判断作业内容的真实性,具体包括:根据作业每秒作业撰写的文字数量与独特性判断作业真实性,根据作业的书法评价分数评估作业的真实性。2.根据权利要求1所述的方法,其中,所述构建作业撰写系统,包括:所述作业撰写系统,作业撰写系统包括个人信息录入单元、用户查询单元、作业显示单元、作业撰写单元;用户通过信息录入单元将学生、教师对应的班级课程及作业信息输入该系统;作业显示单元显示作业信息,对作业信息进行数据管理;用户查询单元包括对历史作业的查询,历史作业分数的查询,历史作业独特性的查询,历史作业问题解决能力的查询,系统对历史作业书法评价的查询;作业撰写单元包括使用电容笔写入作业内容,其中,用户在作业撰写过程中系统记录撰写时间;包括:根据学习行为分析撰写作业专注度;基于每秒作业撰写的文字数量分析学生课程熟练度;基于作业撰写思考数据,题干提示关键词汇;所述根据学习行为分析撰写作业专注度,具体包括:根据学习行为分析撰写作业专注度;识别用户是否有进行撰写,用户未进行撰写的时间为思考时间;首先建立专注度分析模型,即F=100

W1*L1

W2*L2
‑……‑
Wn*Ln

H,其中F表示专注度,根据作业大标题划分1至n部分,Wn表示作业第n部分实际思考时间与人工预设理想思考时间差值的绝对值,Ln表示作业不同部分内容的撰写字数与该部分标准答案字数比,H表示作业提交次数;计算所有学生的作业专注度,同时计算平均学习专注度;若某位学生的作业专注度高于平均学习专注度,则表示该同学较其他同学专注撰写;所述基于每秒作业撰写的文字数量分析学生课程熟练度,具体包括:首先,建立数学公式模型分析学生课程熟练度;根据撰写频率与思考行为,建立分析学生课程熟练度数学模型,根据作业大标题划分1至n部分,即F=N1/T1+N2/T2+
……
+Nn/Tn,其中F表示课程熟练度,Tn表示第n部分实际使用时间,Nn表示作业第n部分内容的撰写字数,Nn/Tn为每秒作业撰写的文字数量;计算每一位学生的课程熟练度,同时计算平均课程熟练度;若某位学生的课程熟练度高于平均课程熟练度,则表示该同学更熟练掌握该门课程;所述基于作业撰写思考数据,题干提示关键词汇,具体包括:所述作业思考数据包括作业撰写停顿位置,系统判定用户正在思考信号;根据作业思考数据,分析停顿位置语句;停顿位置语句使用jieba分词,提取停顿位置语句词汇,题干使用jieba分词提取题干语句词汇;根据提取到的词汇人工标记不同的属性标签;使用最近邻算法建立提示题干题干与作业思考数据相同分类的词汇模型,设有t个训练样本,(X1,θ1)、
(X2,θ2)、...、(Xt,θt),Xi为第i个数据样本,θi为第i个样本的分类标签;使用欧几里得距离公式计算作业思考数据与题干数据点的距离,得到分类结果;根据分类结果,系统判定用户思考时间超过设置的阈值,提示题干与作业思考数据相同分类的词汇。3.根据权利要求1所述的方法,其中,所述获取学生作业数据批改学生作业,评估学生作业分数,包括:所述学生作业数据包括作业撰写内容图像,学生个人信息,作业提交次数,作业提交时间,作业不同部分的完成时间;学生作业数据进行图像识别,通过OCR算法识别学生作业所含内容,并提取图像中所含文字;OCR算法通过图像预处理提取灰度图像,并计算灰度图像的阈值,通过阈值进行图像二值化,并将文字线条细化;根据预处理得到的数据,提取预处理数据中的RILBP特征,组成多个特征向量样本集,并通过SVM支持向量机对多个特征向量样本分类识别,得到识别的结果;根据识别的结果使用向量空间算法,答案预设的向量与识别结果的特征向量使用余弦相似度,即Cosθ=a/c,c为斜边,a为与c的夹角边;累计所述余弦相似度小于预设阈值的个数,得到与正确答案相似的答案数;评估学生的作业分数,建立数学公式,即累计与正确答案相似的答案数/总答案数=正确率;根据计算得到的正确率乘以100得到评估学生作业的分数;包括:基于宋体汉子图形数据,构建作业书法评价模型;基于OCR处理后的学生作业数据,评估作业内容的独特性;基于作业完成数据,分析学生解决不同问题的能力;所述基于宋体汉子图形数据,构建作业书法评价模型,具体包括:根据获取的作业数据图像,使用图像二值化算法,设置全局阈值,将RGB图像实现图像的二值化,其中,撰写的内容对应像素1,背景图像对应像素0;系统建立标准宋体汉字图像库,数字图像库,英文图像库,其中,图像库进行二值化处理,作为书法评分标准数据集;根据OCR算法识别图像中的每个的字符,比对二值数据图像中每个字符1像素点的分布与评分标准数据集每个字符1像素点的分布,设置选取像素点的阈值个数,使用欧氏距离L2范数公式,计算学生作业字体与标准字体的偏差值;累加所得的偏差值,得到偏差值总数;书法评价分数=100

偏差值总数;所述基于OCR处理后的学生作业数据,评估作业内容的独特性,具体包括:所述OCR处理后的学生作业数据包括OCR识别后的作业文字内容;根据作业文字内容,计算所有不同正确答案的频率,即某正确答案的答题数/所有正确答案的答题数;若某学生使用频率最低的正确答案,则表示该学生的答案具有独特性;计算该同学的独特性分数,其中,独特性分数=使用该正确答案...

【专利技术属性】
技术研发人员:李自臣伍智
申请(专利权)人:广东水利电力职业技术学院广东省水利电力技工学校
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1