全自动口语评测管理与评分系统及其评分方法技术方案

技术编号:8801839 阅读:175 留言:0更新日期:2013-06-13 06:19
本发明专利技术涉及计算机辅助教育领域,提供一种全自动口语评测管理与评分系统,其包括依次连接的客户端、落地服务器以及网络服务器,所述考生作答结果包括朗读题的口语测评结果以及自发性口语表述题的口语测评结果中的一种,所述落地服务器还包括评分装置,该评分装置包括识别模块和评分模块,所述识别模块包括声学子模块、语言子模块以及识别子模块;所述评分模块包括特征提取子模块和评分子模块。本发明专利技术还提供一种全自动口语评测管理与评分方法。本发明专利技术的全自动口语评测管理与评分系统及其评分方法可以完全由计算机自动控制考生的准备答题时间和作答时间,无需人工干预,并且比人工计时更为准确,进一步确保了评测的公平性。

【技术实现步骤摘要】

本专利技术涉及计算机辅助教育领域,尤其涉及一种。
技术介绍
随着我国英语教学的普及,哑巴英语的问题也越来越严重,因此英语口语的教学与评测也日益受到重视。英语的口语评测已经在我国多个省市开展起来,其中广东省已经把英语口语评测纳入到了普通高考的必考范围。由于口语评测方式与内容的特殊性,目前英语口语的评分主要还是通过人工判分的方式来解决。人工评分有着很多很难克服的缺占-^ \\\.老师与学生面对面口语评测缺乏公平性与准确性。不同老师针对同一考生的评分很难保证完全一致,同一老师针对不同考生的评分标准也很难保证完全一致,这一切都将极大的降低评测的公平性。本系统制定一套大家都认可的公正统一的机器自动评分标准,从而可避免因人工音素而造成的评分差异,确保了评测的公平性。人工评分口语评测评分效率十分低下。本专利技术设计的一套全自动全自动口语评测管理与评分系统,以机器评分代替人工评分,从评测试卷的分发,到评测的开始和结束,到考生答案音频的保存,再到自动评分全部是由机器自动完成的,评分效率大大提高。传统的口语评测组织管理十分复杂。传统的人对人口语评测由于采用面试的形式,需要大量经过专业培训的口语考官;与此同时,每场评测只能对几名学生进行考评,如果要对全年级甚至全校学习英语课程的学生开展一次口语评测,不但费时耗力还存在漏题泄题的风险。本专利技术设计的一套 全自动全自动口语评测管理与评分系统可以同时为全年级甚至全校学生同时开展一次公平、安全、高效的英语口语水平评测,并可极大地节约人力物力,还可避免因为分批次评测而带来的泄题风险。传统口语评测需要人工控制评测开始和结束的时间,每次更换题目,甚至每道小题都需要重新计时,非常麻烦。
技术实现思路
本专利技术为解决上述技术问题,提供一种无需人工干预、计时更为准确且一步确保评测公平性的全自动口语评测管理与评分系统,其包括依次连接的客户端、落地服务器以及网络服务器,其中,网络服务器主要负责评测结果的整理、收集以及试卷的分发,落地服务器主要负责机器自动评分,客户端主要负责评测,试卷从网络服务器通过落地服务器分发到客户端,考生作答结果从客户端通过落地服务器上传到网络服务器,所述考生作答结果包括朗读题的口语测评结果以及自发性口语表述题的口语测评结果中的一种,所述落地服务器还包括评分装置,该评分装置包括识别模块和评分模块,所述识别模块包括声学子模块、语言子模块以及识别子模块,所述声学子模块提取考生作答音频的声学特征得到声学模型,所述语言子模块根据题目信息及训练文本得到语言模型,所述识别子模块通过声学模型和语言模型对考生作答音频进行解码得到识别结果;所述评分模块包括特征提取子模块和评分子模块,所述特征提取子模块用于提取所述识别结果中的语流综合特征,所述语流综合特征包括口语测评中发音准确度方向的特征、流利度方向的特征以及文本语义相似度方向的特征,所述评分子模块对语流综合特征进行评分训练,得到评分模型,并依据评分模型对识别结果进行评分。优选地,所述发音准确度方向的特征通过以下步骤获得:针对考生作答音频进行解码识别,得到识别结果;将识别结果与正确文本进行强制对齐,计算每个音素的强制对齐得分;构建单音素解码模型并解码每个音素,计算每个音素的最大似然得分;利用强制对齐得分与最大似然得分的差值得到发音准确度方向的特征。优选地,所述流利度方向的特征包括语速特征以及短时停顿时长特征,所述语速特征通过以下步骤获得:针对考生作答音频进行解码识别,得到识别结果;根据识别结果统计出语音识别结果中每个音素对应的帧数;利用音素总个数与所有音素的持续时间的比值得到语速特征;所述短时停顿时长特征通过以下步骤获得:针对考生作答音频进行解码识别,得到识别结果;根据识别结果统计出语音识别结果中每个音素对应的帧数和音频总的帧数;利用所有音素短时停顿的时长的总和与总的发音时长的比值得到短时停顿时长特征。优选地,所述文本语义相似度方向的特征包括语义相关度特征以及语法结构相似度特征。优选地,所述语义相关度特征包括以下步骤:针对考生作答音频进行解码识别,得到识别结果;计算识别结果中的每一个单词和标准答案中每一个单词的语义相似度得分;计算识别结果中的每一个单词和标准答案中每一个句子的语义相似度得分;计算识别结果中每一个单词和标准答案中每一个句子中的语义相似度得分最大值或者平均值作为单词与句子之间的相似度得分;计算考生答案和标准答案之间的相似度得分。优选地,所述语法结构相似度特征包括以下步骤:针对考生作答音频进行解码识别,得到识别结果;分别为识别结果的每一个句子建立语法顺序矢量;分别求出识别结果中的每一个句子和标准答案中的每一个句子的语法结构相似度得分,取识别结果中每一个句子语法结构相似度得分最大值作为这个句子的语法结构相似度得分;通过对识别结果中每一个句子语法结构相似度得分加权平均计算考生答案和标准答案之间的语法结构相似度特征。优选地,网络服务器包括调度模块,用于在落地服务器与网络服务器之间调度评测信息;采用联网评测模式,使得分布在不同地点的考场之间落地服务器的通信由所述网络服务器调度模块统一调度管理。优选地,所述系统包含三种不同权限的角色:考生、教师和管理员,考生主要负责评测与作答;教师主要负责制卷、发布评测、管理评测、检查评测结果以及评分工作,评分方面采用系统评分和老师评分相结合的方法;管理员主要负责评测的管理以及试卷分发的时间掌控。优选地,对于角色扮演题可以利用每道小题已经给出的参考答案作为文本语义相似度分析的参考文本,进而扩展出其它参考答案;对于复述题可以利用音频内容的转写文本作为文本语义相似度分析的参考文本,进而扩展出其它参考答案。本专利技术另外提供一种全自动口语评测管理与评分方法,其包括如下几个步骤:A0、选取若干考生进行如步骤Al A5所述的过程,然后将所述语流综合特征与老师评分结合进行自动评分模型训练,形成评分模型;Al、收集考生作答音频;A2、提取考生作答音频的声学特征得到声学模型,并根据题目信息及训练文本得到语言模型;A3、根据建立的声学模型和语言模型对考生作答音频进行解码得到识别结果;A4、提取识别结果中的语流综合特征,所述语流综合特征包括口语测评中发音准确度方向的特征、流利度方向的特征以及文本语义相似度方向的特征;A5、根据语流综合特征形成的评分模型进行自动评分。本专利技术的:在传统的朗读题口语测评基础上增加了文本语义相似度方向的特征,从而可以针对自发性口语表述进行测评;设计了独特的云端评测系统架构,确保评测高效进行,同时充分利用了整个系统的资源,大大提升了组织口语评测效率,节约了大量的人力物力;可以在大范围同时组织口语评测,满足了省市范围内甚至全国范围内同时组织口语评测的需求;口语评测的形式也将更加多元化,对考生口语水平的考察更为全面公正。附图说明图1为本专利技术一实施例全自动口语评测管理与评分方法流程示意图;图2为本专利技术一实施例全自动口语评测管理与评分系统架构示意图;图3为本专利技术一实施例语义相关度特征提取流程示意图;图4为本专利技术另一实施例语义相关度特征提取流程示意图;图5为本专利技术一实施例语法结构相似度特征提取流程图。具体实施例方式下面将结合附图以及具体实施例来对本专利技术作进一步详细说明。实施例:本专利技术提供一种全自动口语评测管理与评分系统,本文档来自技高网
...

【技术保护点】
一种全自动口语评测管理与评分系统,其包括依次连接的客户端、落地服务器以及网络服务器,其中,网络服务器主要负责评测结果的整理、收集以及试卷的分发,落地服务器主要负责机器自动评分,客户端主要负责评测,试卷从网络服务器通过落地服务器分发到客户端,考生作答结果从客户端通过落地服务器上传到网络服务器,所述考生作答结果包括朗读题的口语测评结果以及自发性口语表述题的口语测评结果中的一种,其特征在于:所述落地服务器还包括评分装置,该评分装置包括识别模块和评分模块,所述识别模块包括声学子模块、语言子模块以及识别子模块,所述声学子模块提取考生作答音频的声学特征得到声学模型,所述语言子模块根据题目信息及训练文本得到语言模型,所述识别子模块通过声学模型和语言模型对考生作答音频进行解码得到识别结果;所述评分模块包括特征提取子模块和评分子模块,所述特征提取子模块用于提取所述识别结果中的语流综合特征,所述语流综合特征包括口语测评中发音准确度方向的特征、流利度方向的特征以及文本语义相似度方向的特征,所述评分子模块对语流综合特征进行评分训练,得到评分模型,并依据评分模型对识别结果进行评分。

【技术特征摘要】
2013.01.23 CN 201310027676.51.一种全自动口语评测管理与评分系统,其包括依次连接的客户端、落地服务器以及网络服务器,其中,网络服务器主要负责评测结果的整理、收集以及试卷的分发,落地服务器主要负责机器自动评分,客户端主要负责评测,试卷从网络服务器通过落地服务器分发到客户端,考生作答结果从客户端通过落地服务器上传到网络服务器,所述考生作答结果包括朗读题的口语测评结果以及自发性口语表述题的口语测评结果中的一种,其特征在于:所述落地服务器还包括评分装置,该评分装置包括识别模块和评分模块,所述识别模块包括声学子模块、语言子模块以及识别子模块,所述声学子模块提取考生作答音频的声学特征得到声学模型,所述语言子模块根据题目信息及训练文本得到语言模型,所述识别子模块通过声学模型和语言模型对考生作答音频进行解码得到识别结果;所述评分模块包括特征提取子模块和评分子模块,所述特征提取子模块用于提取所述识别结果中的语流综合特征,所述语流综合特征包括口语测评中发音准确度方向的特征、流利度方向的特征以及文本语义相似度方向的特征,所述评分子模块对语流综合特征进行评分训练,得到评分模型,并依据评分模型对识别结果进行评分。2.如权利要求1所述的全自动口语评测管理与评分系统,其特征在于:所述发音准确度方向的特征通过以下步骤获得: 针对考生作答音频进行解码识别,得到识别结果; 将识别结果与正确文本进行强制对齐,计算每个音素的强制对齐得分; 构建单音素解码模型并解码每个音素,计算每个音素的最大似然得分; 利用强制对齐得分与最大似然得分的差值得到发音准确度方向的特征。3.如权利要求1所述的全自动口语评测管理与评分系统,其特征在于:所述流利度方向的特征包括语速特征以及短时停顿时长特征,所述语速特征通过以下步骤获得: 针对考生作答音频进行解码识别,得到识别结果; 根据识别结果统计出语音识别结果中每个音素对应的帧数; 利用音素总个数与所有音素的持续时间的比值得到语速特征; 所述短时停顿时长特征通过以下步骤获得: 针对考生作答音频进行解码识别,得到识别结果; 根据识别结果统计出语音识别结果中每个音素对应的帧数和音频总的帧数; 利用所有音素短时停顿的时长的总和与总的发音时长的比值得到短时停顿时长特征。4.如权利要求1所述的全自动口语评测管理与评分系统,其特征在于:所述文本语义相似度方向的特征包括语义相关度特征以及语法结构相似度特征。5.如权利要求4所述的全自动口语评测管理与评分系统,其特征在于:所述语义相关度特...

【专利技术属性】
技术研发人员:王岚宋阳陈蒙金晓虎李阳
申请(专利权)人:中国科学院深圳先进技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1