人机结合的中文作文批改系统和方法技术方案

技术编号:29980642 阅读:21 留言:0更新日期:2021-09-08 10:13
本申请涉及一种人机结合的中文作文批改系统和方法,所述系统包括作文获取系统、预处理系统、批改系统和素材推荐系统,其中,预处理系统对作文获取系统获取的图片格式的待批改作文进行预处理后,由批改系统进行自动批改,并在作文纸的原始图片上给出批改信息,从而教师和学生能够看到直观的批改结果;此外,给出的批改信息是可编辑形式的,从而教师能够根据自身经验对批改信息进行进一步修改,使批改结果更加符合实际情况;并且,素材推荐系统可以根据批改结果中作文的缺点自动推荐优秀的作文素材,便于学生提升作文能力。也就是说,采用本申请的技术方案,能够解决现有技术存在的问题,能够呈现直观的批改结果,且提供更多功能。且提供更多功能。且提供更多功能。

【技术实现步骤摘要】
人机结合的中文作文批改系统和方法


[0001]本申请涉及计算机
,尤其涉及一种人机结合的中文作文批改系统和方法。

技术介绍

[0002]nlp(Natural Language Processing,自然语言处理)技术在语文作文等领域开始逐渐渗透,在一些作文基础维度诊断和统计分析类的工作上,都可以由计算机来分担一部分老师比较琐碎的工作。
[0003]现有的作文自动批改系统大多是需要两阶段的操作,首先需要进行ocr识别(Optical Character Recognition,光学字符识别),将上传的作文图片转换为文字形式的结果,然后再基于nlp技术对转换的文字内容进行识别、批改。其批改结果最终也是以单独的文本形式展示的,不能同步到作文纸上,也即批改结果呈现方式不太直观;并且现有的大多系统只是实现批改功能,功能单一。

技术实现思路

[0004]本申请提供一种人机结合的中文作文批改系统和方法,以解决现有的作文自动批改系统的批改结果呈现方式不太直观,且功能单一的问题。
[0005]本申请的上述目的是通过以下技术方案实现的:
[0006]第一方面,本申请实施例提供一种人机结合的中文作文批改系统,其包括:
[0007]作文获取系统,用于获取用户上传的图片格式的待批改作文;其中,所述的图片格式包括PDF格式;
[0008]预处理系统,用于利用ocr识别引擎,对获取的待批改作文进行版面分析以提取实际作文区域,得到文本位置坐标信息和文本内容信息,并进行标题提取和分段处理
[0009]批改系统,用于对预处理系统得到的文本内容信息进行批改,并将批改信息添加至原始的图片格式的待批改作文的对应位置;其中,所述批改信息为可编辑形式,且所述批改系统提供批改工具,以使用户能够对所述批改信息进行修改;
[0010]素材推荐系统,用于根据作文存在的缺点自动推荐优秀作文素材。
[0011]可选的,所述作文获取系统能够获取单张图片或获取批量上传的多张图片,若为批量上传的多张图片,则自动将多张图片与对应的姓名进行匹配;匹配过程包括:对各图片进行版面分析,以提取姓名区域得到多张姓名区域图片,利用ocr识别引擎对各所述姓名区域图片进行识别,得到姓名信息;根据得到的姓名信息将对应的图片与对应的姓名进行匹配。
[0012]可选的,所述预处理系统提取实际作文区域的过程包括:
[0013]提取图片外围最大连通区域,并在超过设定区域阈值时,确定连通区域内部的区域为实际作文区域;
[0014]对最大连通区域轮廓上的每个点与上传图片四个顶点进行距离计算,分别选取距
离原始图片四个顶点距离最近的四个点作为实际作文区域的四个顶点;
[0015]基于上述选取得到的实际作文区域的四个顶点,进行透视变换,以矫正图片。
[0016]可选的,所述预处理系统进行标题提取和分段处理的过程包括:
[0017]将矫正后的图片输入ocr识别引擎,针对返回的所述文本位置坐标信息中的行坐标信息进行标题提取和分段处理;其中,若一页纸中最开始的连续的两行最左顶点位置的横坐标都大于下一行,且大于预设的第一阈值,则确定第一行为标题区域;若当前行最左侧顶点位置的横坐标大于下一行,且大于预设的第二阈值,则认为当前行为新的一段的开始。
[0018]可选的,所述中文作文批改系统设置有预先训练的作文体裁分类模型和评语库,其中,所述作文体裁分类模型是基于深度学习算法训练得到的;
[0019]所述批改系统进行批改的过程中,利用所述作文体裁分类模型,基于所述文本内容信息识别作文体裁,并根据识别出的作文体裁自动从所述评语库中选择相关评语进行推送,以便用户进行选择和修改。
[0020]可选的,所述批改系统中在批改过程中,根据预先设置的多个待检测的能力点,确定作文内容信息中未出现的能力点;其中,每种作文体裁对应设置有多个能力点;
[0021]所述素材推荐系统根据作文内容信息中未出现的能力点,自动推荐对应的优秀作文素材。
[0022]可选的,所述批改信息包括文字评语信息和标记,所述标记包括线条、图形和符号;
[0023]所述批改系统在将批改信息添加至原始的图片格式的待批改作文的对应位置时,根据用户习惯,针对不同的文本内容信息将不同形式的标记添加至图片中的对应位置,并添加文字评语信息。
[0024]可选的,还包括总评系统,用于根据各批改信息对作文进行整体评价,包括针对作文的不同方面进行打分并给出总分和总评建议,以及对作文的字数、词语和句子进行统计。
[0025]第二方面,本申请实施例还提供一种人机结合的中文作文批改方法,其应用于第一方面任一项所述的人机结合的中文作文批改系统,所述方法包括:
[0026]所述作文获取系统获取用户上传的图片格式的待批改作文;
[0027]所述预处理系统利用ocr识别引擎,对获取的待批改作文进行版面分析以提取实际作文区域,得到文本位置坐标信息和文本内容信息,并进行标题提取和分段处理;
[0028]所述批改系统对预处理系统得到的文本内容信息进行批改,并将批改信息添加至原始的图片格式的待批改作文的对应位置;
[0029]所述素材推荐系统根据作文存在的缺点自动推荐优秀作文素材。
[0030]本申请的实施例提供的技术方案可以包括以下有益效果:
[0031]本申请的实施例提供的人机结合的中文作文批改系统中,包括作文获取系统、预处理系统、批改系统和素材推荐系统,其中,预处理系统对作文获取系统获取的图片格式的待批改作文进行预处理后,由批改系统进行自动批改,并在作文纸的原始图片上给出批改信息,从而教师和学生能够看到直观的批改结果;此外,给出的批改信息是可编辑形式的,从而教师能够根据自身经验对批改信息进行进一步修改,使批改结果更加符合实际情况;并且,素材推荐系统可以根据批改结果中作文的缺点自动推荐优秀的作文素材,便于学生提升作文能力。也就是说,采用本申请的技术方案,能够解决现有技术存在的问题,能够呈
现直观的批改结果,且提供更多功能。
[0032]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
[0033]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
[0034]图1为本申请实施例提供的一种人机结合的中文作文批改系统的工作流程示意图;
[0035]图2为本申请实施例提供的一种批改结果的示意图;
[0036]图3为本申请实施例提供的一种姓名匹配过程示意图;
[0037]图4为本申请实施例提供的一种整体评价结果示意图;
[0038]图5为本申请实施例提供的一种素材推荐过程示意图。
具体实施方式
[0039]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人机结合的中文作文批改系统,其特征在于,包括:作文获取系统,用于获取用户上传的图片格式的待批改作文;其中,所述的图片格式包括PDF格式;预处理系统,用于利用ocr识别引擎,对获取的待批改作文进行版面分析以提取实际作文区域,得到文本位置坐标信息和文本内容信息,并进行标题提取和分段处理;批改系统,用于对预处理系统得到的文本内容信息进行批改,并将批改信息添加至原始的图片格式的待批改作文的对应位置;其中,所述批改信息为可编辑形式,且所述批改系统提供批改工具,以使用户能够对所述批改信息进行修改;素材推荐系统,用于根据作文存在的缺点自动推荐优秀作文素材。2.根据权利要求1所述的系统,其特征在于,所述作文获取系统能够获取单张图片或获取批量上传的多张图片,若为批量上传的多张图片,则自动将多张图片与对应的姓名进行匹配;匹配过程包括:对各图片进行版面分析,以提取姓名区域得到多张姓名区域图片,利用ocr识别引擎对各所述姓名区域图片进行识别,得到姓名信息;根据得到的姓名信息将对应的图片与对应的姓名进行匹配。3.根据权利要求1所述的系统,其特征在于,所述预处理系统提取实际作文区域的过程包括:提取图片外围最大连通区域,并在超过设定区域阈值时,确定连通区域内部的区域为实际作文区域;对最大连通区域轮廓上的每个点与上传图片四个顶点进行距离计算,分别选取距离原始图片四个顶点距离最近的四个点作为实际作文区域的四个顶点;基于上述选取得到的实际作文区域的四个顶点,进行透视变换,以矫正图片。4.根据权利要求3所述的系统,其特征在于,所述预处理系统进行标题提取和分段处理的过程包括:将矫正后的图片输入ocr识别引擎,针对返回的所述文本位置坐标信息中的行坐标信息进行标题提取和分段处理;其中,若一页纸中最开始的连续的两行最左顶点位置的横坐标都大于下一行,且大于预设的第一阈值,则确定第一行为标题区域;若当前行最左侧顶点位置的横坐标大于下一行,且大于预设...

【专利技术属性】
技术研发人员:杨林雷思东
申请(专利权)人:北京阅神智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1