用于文字性客观题的智能阅卷方法及系统技术方案

技术编号:10866651 阅读:142 留言:0更新日期:2015-01-07 07:54
本发明专利技术公开了一种用于文字性客观题的智能阅卷方法及系统,该方法包括:获取文字性客观题答案图像;对所述答案图像进行切分,获得待识别答案字符串的一个或多个切分结果;判断是否有字数与标准答案字数相同的切分结果;如果没有,则确定答案错误;否则,计算所述字数与标准答案字数相同的切分结果的识别置信度,和/或计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度;根据计算得到的识别置信度确定答案是否正确。利用本发明专利技术,可以实现文字性客观题的自动阅卷,减少人力资源消耗,提高阅卷效率及准确性。

【技术实现步骤摘要】
用于文字性客观题的智能阅卷方法及系统
本专利技术涉及信息处理
,具体涉及一种用于文字性客观题的智能阅卷方法及系统。
技术介绍
随着计算机技术和教育信息化的不断推进,计算机和人工智能技术已经逐步应用于日常的教育教学各项活动中,在教学辅助、教学评测等实际应用场景下都得到了相应的应用。国内现有的基础教育、学生学习状况的主要考察形式仍是各种类型的考试或测试,在此状况下,教师背负着很大的批改作业和试卷的工作压力。针对这种现象,在大中型或重要性高的考试或测试中已经逐渐推广和采用了各类自动阅卷系统,这类系统能够一定程度上减轻教师阅卷的工作量。然而,在现有的自动阅卷系统中,完全由计算机完成阅卷的部分多是对填涂性客观题(如选择题)的阅卷,而对于像填空题等文字性客观试题的阅卷,现今仍需要大量的教师集中进行,且在大型考试阅卷前还需要对阅卷老师进行集中培训、考试。因此,传统的自动阅卷系统人力资源消耗仍然较大,且在阅卷时因不同教师风格、情绪、心理状态等主观性因素可能造成判卷结果出现不公平不公正的现象。
技术实现思路
本专利技术实施例提供一种用于文字性客观题的智能阅卷方法及系统,以实现文字性客观题的自动阅卷,减少人力资源消耗,提高阅卷效率及准确性。为此,本专利技术实施例提供如下技术方案:一种用于文字性客观题的智能阅卷方法,包括:获取文字性客观题答案图像;对所述答案图像进行切分,获得待识别答案字符串的一个或多个切分结果;判断是否有字数与标准答案字数相同的切分结果;如果没有,则确定答案错误;否则,计算所述字数与标准答案字数相同的切分结果的识别置信度,和/或计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度;根据计算得到的识别置信度确定答案是否正确。优选地,所述获取文字性客观题答案图像包括:获取答题卡图像;根据答题卡布局信息,分割并提取目标答题区域;从所述目标答题区域提取文字性客观题答案图像。优选地,所述获取答题卡图像包括:利用光标阅读设备、或者高拍仪、或者移动终端设备获取答题卡图像。优选地,所述对所述答案图像进行切分,获得待识别答案字符串的一个或多个切分结果包括:对所述答案图像进行细切分,得到多个细切分子块;对所述细切分子块进行合并,并计算合并可信度;根据所述可信度确定合并结果,得到待识别答案字符串的一个或多个切分结果。优选地,所述计算合并可信度包括:提取合并得到的字符的字符特征;利用预先训练得到的规则统计模型和所述字符特征计算该合并的可信度。优选地,所述计算所述字数与标准答案字数相同的切分结果的识别置信度包括:将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐;基于全字符集的声学模型及通用的语言模型,对所述字数与标准答案字数相同的切分结果进行手写解码识别,得到各识别结果的似然得分;选取识别结果中解码路径与标准答案一致的路径的似然得分;计算所述路径的后验得分,并将所述后验得分作为所述字数与标准答案字数相同的切分结果的识别置信度;相应地,所述根据计算得到的识别置信度确定答案是否正确包括:如果有任一字数与标准答案字数相同的切分结果的识别置信度大于第一置信度阈值,则确定答案正确;否则确定答案错误。优选地,所述计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度包括:将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐;基于全字符集的声学模型,计算所述字数与标准答案字数相同的切分结果中各字符的识别结果的似然得分;选取所述识别结果中与标准答案一致的字符的识别结果的似然得分;计算选取的识别结果的后验得分,并将所述后验得分作为所述字符的识别置信度;相应地,所述根据计算得到的识别置信度确定答案是否正确包括:如果有任一字数与标准答案字数相同的切分结果中各字符的识别置信度均大于第二置信度阈值,则确定答案正确;否则确定答案错误。优选地,所述计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度包括:将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐;基于全字符集的声学模型及通用的语言模型,对所述字数与标准答案字数相同的切分结果进行手写解码识别,得到各识别结果的似然得分;计算各识别结果的后验概率,并根据各识别结果的后验概率,针对所述切分结果中的每个字符,累积各识别结果中该字符的识别结果与标准答案一致的后验概率,并将该后验概率作为该字符的置信度;相应地,所述根据计算得到的识别置信度确定答案是否正确包括:如果有任一字数与标准答案字数相同的切分结果中各字符的识别置信度均大于第三置信度阈值,则确定答案正确;否则确定答案错误。一种用于文字性客观题的智能阅卷系统,包括:图像获取模块,用于获取文字性客观题答案图像;切分模块,用于对所述答案图像进行切分,获得待识别答案字符串的一个或多个切分结果;第一判断模块,用于判断是否有字数与标准答案字数相同的切分结果,并在判断结果为没有与标准答案字数相同的切分结果时,触发输出模块输出答案错误的指示信息;否则,触发计算模块进行识别置信度计算;;所述计算模块包括:第一计算模块、和/或第二计算模块;所述第一计算模块用于计算所述字数与标准答案字数相同的切分结果的识别置信度,所述第二计算模块用于计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度;第二判断模块,用于根据所述计算模块计算得到的识别置信度确定答案是否正确,并在判断答案正确时,触发所述输出模块输出答案正确的指示信息;在判断答案错误时,触发所述输出模块输出答案错误的指示信息。优选地,所述图像获取模块包括:图像获取单元,用于获取答题卡图像;答题区域提取单元,用于根据答题卡布局信息,分割并提取目标答题区域;答案内容提取单元,从所述目标答题区域提取文字性客观题答案图像。优选地,所述图像获取单元具体为光标阅读设备、或者高拍仪、或者移动终端设备。优选地,所述切分模块包括:切分单元,用于对所述答案图像进行细切分,得到多个细切分子块;可信度计算单元,用于对所述细切分子块进行合并,并计算合并可信度;合并结果确定单元,用于根据所述可信度确定合并结果,得到待识别答案字符串的一个或多个切分结果。优选地,所述可信度计算单元包括:合并子单元,用于对所述细切分子块进行合并;提取子单元,用于提取合并得到的字符的字符特征;计算子单元,用于利用预先训练得到的规则统计模型和所述字符特征计算该合并的可信度。优选地,所述第一计算模块包括:对齐单元,用于将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐;第一识别单元,用于基于全字符集的声学模型及通用的语言模型,对所述字数与标准答案字数相同的切分结果进行手写解码识别,得到各识别结果的似然得分;第一选择单元,用于选取识别结果中解码路径与标准答案一致的路径的似然得分;第一计算单元,用于计算所述路径的后验得分,并将所述后验得分作为所述切分结果的识别置信度;所述第二判断模块具体用于在有任一字数与标准答案字数相同的切分结果的识别置信度大于第一置信度阈值时,判断答案正确;否则判断答案错误。优选地,所述第二计算模块包括:对齐单元,用于将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐;第二识别单元,用于基于全字符集的声学模型,计算所述字数与标准答案字数相同的切分结果中各字符的识别本文档来自技高网...
用于文字性客观题的智能阅卷方法及系统

【技术保护点】
一种用于文字性客观题的智能阅卷方法,其特征在于,包括:获取文字性客观题答案图像;对所述答案图像进行切分,获得待识别答案字符串的一个或多个切分结果;判断是否有字数与标准答案字数相同的切分结果;如果没有,则确定答案错误;否则,计算所述字数与标准答案字数相同的切分结果的识别置信度,和/或计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度;根据计算得到的识别置信度确定答案是否正确。

【技术特征摘要】
1.一种用于文字性客观题的智能阅卷方法,其特征在于,包括:获取文字性客观题答案图像;对所述答案图像进行切分,获得待识别答案字符串的一个或多个可信的切分结果;判断是否有字数与标准答案字数相同的切分结果;如果没有,则确定答案错误;否则,计算所述字数与标准答案字数相同的切分结果的识别置信度,和/或计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度;根据计算得到的识别置信度确定答案是否正确。2.根据权利要求1所述的方法,其特征在于,所述获取文字性客观题答案图像包括:获取答题卡图像;根据答题卡布局信息,分割并提取目标答题区域;从所述目标答题区域提取文字性客观题答案图像。3.根据权利要求2所述的方法,其特征在于,所述获取答题卡图像包括:利用光标阅读设备、或者高拍仪、或者移动终端设备获取答题卡图像。4.根据权利要求1所述的方法,其特征在于,所述对所述答案图像进行切分,获得待识别答案字符串的一个或多个切分结果包括:对所述答案图像进行细切分,得到多个细切分子块;对所述细切分子块进行合并,并计算合并可信度;根据所述可信度确定合并结果,得到待识别答案字符串的一个或多个切分结果。5.根据权利要求4所述的方法,其特征在于,所述计算合并可信度包括:提取合并得到的字符的字符特征;利用预先训练得到的规则统计模型和所述字符特征计算该合并的可信度。6.根据权利要求1至5任一项所述的方法,其特征在于,所述计算所述字数与标准答案字数相同的切分结果的识别置信度包括:将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐;基于全字符集的声学模型及通用的语言模型,对所述字数与标准答案字数相同的切分结果进行手写解码识别,得到各识别结果的似然得分;选取识别结果中解码路径与标准答案一致的路径的似然得分;计算所述路径的后验得分,并将所述后验得分作为所述字数与标准答案字数相同的切分结果的识别置信度;所述根据计算得到的识别置信度确定答案是否正确包括:如果有任一字数与标准答案字数相同的切分结果的识别置信度大于第一置信度阈值,则确定答案正确;否则确定答案错误。7.根据权利要求1至5任一项所述的方法,其特征在于,所述计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度包括:将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐;基于全字符集的声学模型,计算所述字数与标准答案字数相同的切分结果中各字符的识别结果的似然得分;选取所述识别结果中与标准答案一致的字符的识别结果的似然得分;计算选取的识别结果的后验得分,并将所述后验得分作为所述字符的识别置信度;所述根据计算得到的识别置信度确定答案是否正确包括:如果有任一字数与标准答案字数相同的切分结果中各字符的识别置信度均大于第二置信度阈值,则确定答案正确;否则确定答案错误。8.根据权利要求1至5任一项所述的方法,其特征在于,所述计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度包括:将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐;基于全字符集的声学模型及通用的语言模型,对所述字数与标准答案字数相同的切分结果进行手写解码识别,得到各识别结果的似然得分;计算各识别结果的后验概率,并根据各识别结果的后验概率,针对所述切分结果中的每个字符,累积各识别结果中该字符的识别结果与标准答案一致的后验概率,并将该后验概率作为该字符的置信度;所述根据计算得到的识别置信度确定答案是否正确包括:如果有任一字数与标准答案字数相同的切分结果中各字符的识别置信度均大于第三置信度阈值,则确定答案正确;否则确定答案错误。9.一种用于文字性客观题的智能阅卷系统,其特征在于,包括:图像获取模块,用于获取文字性客观题答案图像;切分模块,用于对所述答案图像进行切分,获得待识别答案字符串的一个或多个可信的切分结果;第一判断模块,用于判断是否有字数与标准答案字...

【专利技术属性】
技术研发人员:胡雨隆张银田竺博魏思胡国平胡郁刘庆峰
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1