一种针对主观题自然语言的语义理解及批改的方法技术

技术编号:20485316 阅读:24 留言:0更新日期:2019-03-02 19:08
本发明专利技术公开了一种针对主观题自然语言的语义理解及批改的方法,包括以下步骤:题目要点分析、媒体转化、对答案进行预处理、粗粒度批改、精确批改、人工批复、人工批复;该方法通过主观题进行拍照然后将照片或图片识别转化为计算机语言,在通过深层神经网络的特征模式学习,利用深层神经网络对解析后的数据进行粗粒度批改和精确批改,大大加快了主观题的判题时间,解决了主观题评判标准不统一的问题,可以由系统对于缺失的答案进行标注以达到精确批改的目的。

【技术实现步骤摘要】
一种针对主观题自然语言的语义理解及批改的方法
本专利技术涉及本专利技术涉及教育学习系统
,特别涉及一种主观题的自动判题方法。
技术介绍
目前,在线教育蓬勃发展,各个在线教育公司的主攻方向层出不穷。主要的服务对象都是在校学生和老师,目的都是要解决学生学习和老师工作中的各种痛点。在学校教学的过程中,老师判作业是工作量很大的一个负担。判作业里面尤其是主观题(一般称为问答题)的判题工作量超大。存在以下问题:1.题量巨大,一般数学老师带两个班,100名学生左右。即使每次作业留3道主观题,合计也要300题。以判一题2分钟计算,需要10小时完成主观题作业判题;2.主观题判题标准不统一。即使同一个老师在不同的心情下,对于同一道题不同答题人的答案会有判题标准的误差;3.由于时间的关系,在一般情况下很多题目做不到精批;4.判题反馈时间过长,一般情况是学生当日的作业,老师要到第二天下午才可以把判好的答案发回给学生;5.手动记录学生成绩费事费力,还容易产生差错。
技术实现思路
为了解决现有的主观题判题费时费力的问题,本专利技术提供一种能够自动对于主观题打分的方法。为了实现上述目的,本专利技术提供的技术方案是:一种针对主观题自然语言的语义理解及批改的方法,包括以下步骤:题目要点分析:对参考答案中的得分要点进行分解并且根据得分要点权重分布分析,并由人工精确校验后传输至服务器;媒体转化:应试者通过将答案拍照或扫描传输至服务器,服务器会对照片或图片进行分析提取并识别文字和公式部分,再混合排版为数字信息;对答案进行预处理:对参考答案和应试者的答案进行解析,由自然语言转换为机器语言,其中包括特殊字符的解析与转换,以及对答案中的文字、数学公式进行提取和混排;粗粒度批改:将手动批改的答案和正确答案作为学习样本,利用深层神经网络对学习样本匹配识别,让机器完成特征模式学习;利用训练好的机器模型对预处理后的答案进行粗粒度批改,并输出批改结果;精确批改:混合添加预定义的混淆度的规则,在粗粒度批改后的批改结果利用该规则进行精确批改,并返回精确批改结果以及批改的可信度;人工批复:批改可信度低于标准可信度时,触发人工批复提醒,该部分将交由人工进行核审,核审结果进入记录。在上述技术方案的基础上,进一步的,还包括再学习和模型迭代,具体是将人工批改步骤中的审核结果存储并循环交替给深层神经网络,作为机器的学习样本,让机器更好的识别出混淆样例提升批改质量,并且阶段性的进行阶段审阅迭代修改模型。在上述技术方案中,所述深层神经网络通过获取多组内容混排特征数据;将所述特征数据输入到深度循环神经网络模型中进行训练,每组数据通过网络输出预测结果并以训练数据更新神经网络模型参数,使用更新后的神经网络进行下一组训练,直到神经网络模型参数收敛。在上述技术方案中,进一步的,所述特征数据包括公式、中英文、特殊符号。在上述技术方案中,进一步的,所述数学公式的混排包括等号两边内容的等价交换、提取公因式。在上述技术方案中,进一步的,所述文字的混排同义词近义词替换、语序变换。进一步作为优选的技术方案,所述标准可信度预定是60可信度,系统里定义是0-100的值。作为优选的技术方案,所述混淆度的规则包括中文表达方式和数字等价,带数分数等价表达,方程组等价。作为优选的技术方案,所述媒体转化步骤中照片或图片识别采用OCR识别。本专利技术相对于现有技术的有益效果是:该方法通过主观题进行拍照然后将照片或图片识别转化为计算机语言,在通过深层神经网络的特征模式学习,利用深层神经网络对解析后的数据进行粗粒度批改和精确批改,大大加快了主观题的判题时间,解决了主观题评判标准不统一的问题,可以由系统对于缺失的答案进行标注以达到精确批改的目的。附图说明图1是本专利技术的流程图。具体实施方式下面结合附图对本专利技术的具体实施方式作进一步说明。在此需要说明的是,对于这些实施方式的说明用于帮助理解本专利技术,但并不构成对本专利技术的限定。此外,下面所描述的本专利技术各个实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互组合。如图1所示,一种针对主观题自然语言的语义理解以及批改方法,具体包括以下步骤:第一步:题目要点分析,对参考答案中的得分要点进行分解并且根据得分要点权重分布分析,比如一道题目考察几个关键给分步骤,每个步骤占总分比重百分之多少,分析完成由人工精确校验后将具体数据传输至服务器;第二步:媒体转化,应试者通过将答案拍照或扫描传输至服务器,服务器通过OCR技术对照片或图片进行分析提取并识别文字和公式部分,再混合排版为数字信息;第三步:对答案进行预处理,具体是对参考答案和应试者的答案进行解析,将参考答案以及应试者的答案自然语言转换为机器语言,其中包括特殊字符的解析与转换,即特征归一化处理,由于该技术手段属于本领域中的现有技术,所以在本实施例中就不再赘述。还需要对答案中的文字、数学公式进行提取和混排,包括对数学公式等号两边内容的等价交换例如x+y=1变换成x=1-y,y=1-x,y+x=1,进行穷举式的变换,还需要提取公因式例如ab+ac=d变换为a(b+c)=d;另外,还需要对文字进行提取混排,包括对文字同义词近义词替换、语序变换例如主语谓语宾语的省略或者陈述句与反问句或者双重否定句之间的转换等等。第四步:粗粒度批改,具体的包括两个小步骤,首先将手动批改的答案和正确答案作为学习样本,利用深层神经网络对学习样本匹配识别,让机器完成特征模式学习、通过大量老师手动批改的学生答案和正确答案历史记录,这是为了让机器具有智能批改的效果,例如那些属于近义词哪些语句是同一个意思,哪些属于等价变化等等,深层神经网络通过获取多组内容混排特征数据,特征数据包括公式、中英文、特殊符号等等;将所述特征数据输入到深度循环神经网络模型中进行训练,每组数据通过网络输出预测结果并以训练数据更新神经网络模型参数,使用更新后的神经网络进行下一组训练,直到神经网络模型参数收敛。然后利用训练好的机器模型对预处理后的答案进行粗粒度批改,具体的就是让训练好的机器模型对处理后的公式以及文字数据公式、中英文、特殊符号等等进行判断是否与参考答案一致或与参考答案的相似程度,最后输出批改结果;第五步:精确批改,具体的是混合添加预定义的混淆度的规则,混淆度的规则包括中文表达方式和数字等价,带数分数等价表达,方程组等价等等,在粗粒度批改后的批改结果利用该规则进行精确批改,并返回精确批改结果以及批改的可信度;该步骤能够有效的提高判题的准确度,批改的可信度是通过对于参考答案的数据与应试者答案的数据对比后的相似度以及机器学习后的数据加权平均后得到的。第六步:人工批复,具体的是批改可信度低于标准可信度时,触发人工批复提醒,标准可信度预定是60可信度,系统里定义是0-100的值,该部分将交由人工进行核审,核审结果进入记录。作为进一步的一种技术方案,还包括第七步:再学习和模型迭代,具体是将人工批改步骤中的审核结果存储并循环交替给深层神经网络,作为机器的学习样本,让机器更好的识别出混淆样例提升批改质量,并且阶段性的进行阶段审阅迭代修改模型。通过该步骤能够让机器不断的学习,不断的提高自身的判题正确率,从而大幅度减少了老师的批改负担。另外,由于参考答案以及应试者的答案数据都储存在服务器中,服务器可以通过该数据对本文档来自技高网...

【技术保护点】
1.一种针对主观题自然语言的语义理解及批改的方法,其特征在于,包括以下步骤:题目要点分析:对参考答案中的得分要点进行分解并且根据得分要点权重分布分析,并由人工精确校验后传输至服务器;媒体转化:应试者通过将答案拍照或扫描传输至服务器,服务器会对照片或图片进行分析提取并识别文字和公式部分,再混合排版为数字信息;对答案进行预处理:对参考答案和应试者的答案进行解析,由自然语言转换为机器语言,其中包括特殊字符的解析与转换,以及对答案中的文字、数学公式进行提取和混排;粗粒度批改:将手动批改的答案和正确答案作为学习样本,利用深层神经网络对学习样本匹配识别,让机器完成特征模式学习;利用训练好的机器模型对预处理后的答案进行粗粒度批改,并输出批改结果;精确批改:混合添加预定义的混淆度的规则,在粗粒度批改后的批改结果利用该规则进行精确批改,并返回精确批改结果以及批改的可信度;人工批复:批改可信度低于标准可信度时,触发人工批复提醒,该部分将交由人工进行核审,核审结果进入记录。

【技术特征摘要】
1.一种针对主观题自然语言的语义理解及批改的方法,其特征在于,包括以下步骤:题目要点分析:对参考答案中的得分要点进行分解并且根据得分要点权重分布分析,并由人工精确校验后传输至服务器;媒体转化:应试者通过将答案拍照或扫描传输至服务器,服务器会对照片或图片进行分析提取并识别文字和公式部分,再混合排版为数字信息;对答案进行预处理:对参考答案和应试者的答案进行解析,由自然语言转换为机器语言,其中包括特殊字符的解析与转换,以及对答案中的文字、数学公式进行提取和混排;粗粒度批改:将手动批改的答案和正确答案作为学习样本,利用深层神经网络对学习样本匹配识别,让机器完成特征模式学习;利用训练好的机器模型对预处理后的答案进行粗粒度批改,并输出批改结果;精确批改:混合添加预定义的混淆度的规则,在粗粒度批改后的批改结果利用该规则进行精确批改,并返回精确批改结果以及批改的可信度;人工批复:批改可信度低于标准可信度时,触发人工批复提醒,该部分将交由人工进行核审,核审结果进入记录。2.根据权利要求1所述的方法,其特征在于:还包括再学习和模型迭代,具体是将人工批改步骤中的审核结果存...

【专利技术属性】
技术研发人员:余海涛刘宁陈明
申请(专利权)人:蓝舰信息科技南京有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1