一种评分方法、装置、计算设备及存储介质制造方法及图纸

技术编号:32586675 阅读:19 留言:0更新日期:2022-03-09 17:19
本申请公开了一种评分方法,包括:获取题目信息以及针对该题目信息的答题音频;根据该题目信息对答题音频进行语音识别,得到该答题音频对应的语音识别文本;根据该语音识别文本对答题音频进行评分。由于结合了题目信息来对答题音频进行语音识别,这相比于基于通用的语音识别模型进行语音识别的方式而言,将题目信息作为对答题音频进行语音识别的先验信息,可以提高语音识别的准确性,进而可以提高对答题音频进行评分的准确性。此外,本申请还提供了对应的装置、计算设备以及存储介质。计算设备以及存储介质。计算设备以及存储介质。

【技术实现步骤摘要】
一种评分方法、装置、计算设备及存储介质


[0001]本申请涉及人工智能
,特别是涉及一种评分方法、装置、计算设备及存储介质。

技术介绍

[0002]随着科技技术的发展,语音识别技术广泛应用于多个场景中。比如,为提高学生英语口语语言技能、促进学生英语综合能力的提升与发展,多个教育地区逐渐重视对于学生英语口语的训练和考核,并通过自动化智能语音评测技术为口语考试进行评分。
[0003]其中,一种常见的考核题型为问答题,即学生(或其他类型的考生)根据看到的文字描述,通过语音给出问题答案。相应的,在利用语音评测技术进行评分时,先基于通用的语音识别模型来识别学生回答的语音内容,该语音识别模型预先通过至少一组音频数据以及该音频数据对应的文本完成训练;然后,再根据语音识别得到的文本进行相应的评分。
[0004]但是,实际应用时,根据语音内容所最终得到的评分结果,与预期的评分结果经常会存在较大偏差,如部分回答正确的学生所获得的评分较低,甚至可能会低于回答错误的学生所获得的评分等,从而影响自动评分的准确性。

技术实现思路

[0005]本申请实施例提供了一种评分方法、装置、计算设备及存储介质,以提高对答题音频的语音识别的准确性,进而提高对该答题音频进行自动评分的准确性。
[0006]第一方面,本申请实施例提供了一种评分方法,所述方法包括:
[0007]获取题目信息以及针对所述题目信息的答题音频;
[0008]根据所述题目信息,对所述答题音频进行语音识别,得到所述答题音频对应的语音识别文本;
[0009]根据所述语音识别文本,对所述答题音频进行评分。
[0010]在一种可能的实施方式中,所述根据所述题目信息,对所述答题音频进行语音识别,得到所述答题音频对应的语音识别文本,包括:
[0011]将所述题目信息以及所述答题音频输入至语音识别模型,得到所述语音识别模型输出的语音识别文本,所述语音识别模型预先通过样本数据进行训练,所述样本数据包括样本题目信息、针对所述样本题目信息的样本答题音频、所述样本答题音频对应的转写文本。
[0012]在一种可能的实施方式中,所述语音识别模型包括编码器以及解码器,所述方法还包括:
[0013]获取所述样本数据;
[0014]将所述样本数据中文本格式的样本题目信息、所述样本答题音频作为所述编码器的输入,将所述样本答题音频对应的转写文本作为所述解码器的输入,训练所述语音识别模型。
[0015]在一种可能的实施方式中,在利用所述样本数据训练所述语音识别模型之前,所述方法还包括:
[0016]获取初始样本数据,所述初始样本数据包括初始样本音频以及所述初始样本音频对应的转写文本;
[0017]将所述初始样本数据中所述初始样本音频、所述初始样本音频对应的转写文本中的部分文本作为所述编码器的输入,将所述初始样本音频对应的转写文本作为所述解码器的输入,训练所述语音识别模型。
[0018]在一种可能的实施方式中,在利用所述样本数据训练所述语音识别模型之后,所述方法还包括:
[0019]获取测试数据,所述测试数据包括测试题目信息以及所述测试题目信息对应的测试答题音频;
[0020]将所述测试数据输入至所述语音识别模型,得到所述语音识别模型输出的测试结果;
[0021]利用所述测试数据、所述测试结果以及所述样本数据,训练所述语音识别模型。
[0022]在一种可能的实施方式中,所述题目信息包括音频格式的题目信息或者文本格式的题目信息。
[0023]在一种可能的实施方式中,所述获取针对所述题目信息的答题音频,包括:
[0024]呈现答题界面,所述答题界面包括文本格式的题目信息;
[0025]获取用户输入的针对所述题目信息的答题音频。
[0026]在一种可能的实施方式中,所述方法还包括:
[0027]呈现评分界面,所述评分界面包括针对所述答题音频的评分分数。
[0028]第二方面,本申请实施例还提供了一种评分装置,所述装置包括:
[0029]第一获取模块,用于获取题目信息以及针对所述题目信息的答题音频;
[0030]语音识别模块,用于根据所述题目信息,对所述答题音频进行语音识别,得到所述答题音频对应的语音识别文本;
[0031]评分模块,用于根据所述语音识别文本,对所述答题音频进行评分。
[0032]在一种可能的实施方式中,所述语音识别模块,包括:
[0033]提取单元,用于提取所述题目信息对应的文本特征以及所述答题音频对应的声学特征;
[0034]编码单元,用于对所述文本特征以及所述声学特征进行编码,得到编码数据;
[0035]解码单元,用于对所述编码数据进行解码,得到所述答题音频对应的语音识别文本。
[0036]在一种可能的实施方式中,所述语音识别模块,具体用于将所述题目信息以及所述答题音频输入至语音识别模型,得到所述语音识别模型输出的语音识别文本,所述语音识别模型预先通过样本数据进行训练,所述样本数据包括样本题目信息、针对所述样本题目信息的样本答题音频、所述样本答题音频对应的转写文本。
[0037]在一种可能的实施方式中,所述语音识别模型包括编码器以及解码器,所述装置还包括:
[0038]第二获取模块,用于获取所述样本数据;
[0039]第一模型训练模块,用于将所述样本数据中文本格式的样本题目信息、所述样本答题音频作为所述编码器的输入,将所述样本答题音频对应的转写文本作为所述解码器的输入,训练所述语音识别模型。
[0040]在一种可能的实施方式中,在所述第一模型训练模块利用所述样本数据训练所述语音识别模型之前,所述装置还包括:
[0041]第三获取模块,用于获取初始样本数据,所述初始样本数据包括初始样本音频以及所述初始样本音频对应的转写文本;
[0042]第二模型训练模块,用于将所述初始样本数据中所述初始样本音频、所述初始样本音频对应的转写文本中的部分文本作为所述编码器的输入,将所述初始样本音频对应的转写文本作为所述解码器的输入,训练所述语音识别模型。
[0043]在一种可能的实施方式中,在所述第一模型训练模块利用所述样本数据训练所述语音识别模型之后,所述装置还包括:
[0044]第四获取模块,用于获取测试数据,所述测试数据包括测试题目信息以及所述测试题目信息对应的测试答题音频;
[0045]测试模块,用于将所述测试数据输入至所述语音识别模型,得到所述语音识别模型输出的测试结果;
[0046]第三模型训练模块,用于利用所述测试数据、所述测试结果以及所述样本数据,训练所述语音识别模型。
[0047]在一种可能的实施方式中,所述题目信息包括音频格式的题目信息或者文本格式的题目信息。
[0048]在一种可能的实施方式中,其特征在于,所述第一获取模块,包括:
[0049]呈现单元,用于呈现答本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种评分方法,其特征在于,所述方法包括:获取题目信息以及针对所述题目信息的答题音频;根据所述题目信息,对所述答题音频进行语音识别,得到所述答题音频对应的语音识别文本;根据所述语音识别文本,对所述答题音频进行评分。2.根据权利要求1所述的方法,其特征在于,所述根据所述题目信息,对所述答题音频进行语音识别,包括:提取所述题目信息对应的文本特征以及所述答题音频对应的声学特征;对所述文本特征以及所述声学特征进行编码,得到编码数据;对所述编码数据进行解码,得到所述答题音频对应的语音识别文本。3.根据权利要求1所述的方法,其特征在于,所述题目信息包括音频格式的题目信息或者文本格式的题目信息。4.根据权利要求1所述的方法,其特征在于,所述获取针对所述题目信息的答题音频,包括:呈现答题界面,所述答题界面包括文本格式的题目信息;获取用户输入的针对所述题目信息的答题音频。5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:呈现评分界面,所述评分界面包括针对所述答题音频的评分分数。6.根据权利要求1所述的方法,其特征在于,所述根据所述题目信息,对所述答题音频进行语音识别,包括:将所述题目信息以及所述答题音频输入至语音识别模型,得到所述语音识别模型输出的语音识别文本,所述语音识别模型预先通过样本数据进行训练,所述样本数据包括样本题目信息、针对所述样本题目信息的样本答题音频、所述样本答题音频对应的转写文本。7.根据权利要求6所述的方法,其特征在于,所述语音识别模型包括编码器以及解码器,所述方法还包括:获取所述样本数据;将所述样本数据中文本格式的样本题目信息、所述样本答题音频作为所述编码器的输入,将所述...

【专利技术属性】
技术研发人员:张志勇吴奎盛志超金海
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1