本发明专利技术提供一种用于英语口语考试自动评分的参考语法生成方法和设备。该方法包括:人工编写少量基于ABNF规则的参考语法;利用单词发音词表,将基于ABNF规则的参考语法转译成音素词图;对音素词图做以元音音素为断点的音素链切分操作,构成基础音素链集中的音素链;计算基础音素链集中的音素链与考生语音数据音素链集中的音素链的编辑距离;以编辑距离为特征,对考生语音数据音素链集进行聚类,计算同类音素链的出现频率占总数的比例;剔除中占比小的音素链,将保留下来的音素链用音素链连接算法连接成完整的语法句式,最后以树结构的音素词图保存为参考答案。本发明专利技术的方法在构造参考语法的过程中只需少量的人工干预,大大减少了口语自动评分中的人工工作量,并减少了不相关人工干预对系统的不良影响。
【技术实现步骤摘要】
本专利技术属于计算机自动评分
,具体地说,本专利技术涉及一种用于英语口语考试自动评分的参考语法生成算法。
技术介绍
将机器评分系统应用到大规模的考试当中具有重要的意义,一方面大幅减少了人工重复劳动,另一方面又克服了人类主观评价的不稳定性。但是要将计算机自动评分技术应用到英语口语考试中,特别是针对非母语学生的内容较开放的口语考试就显得尤为困难。首先现有的语音识别器对这种内容开放且口音较重的语音识别率很低,无法满足常规的基于单词的语意分析;另外内容的开放性导致无法用固定的一套标准来做内容正确性的评价。一般的解决办法是只考虑语音的发音质量和节奏韵律,但是这必然导致系统无法应用于对内容有较高要求的场合。为此基于音素混淆网络的语法对齐被应用到了 口语考试评分系统中。所谓基于音素混淆网络的语法对齐,是将语音解码结果和人工编制多候选参考答案以音素混淆网络这种格式进行强制对齐。例如,图1是一个包括解码结果和多候选参考答案的示例,图2则是基于音素的强制对齐示例。这一方法的意义在于显示了考生回答的内容与期望的答案的符合程度。为了使这种对齐的结果尽量准确,那么就需要一套符合评分规则且覆盖所有可能句式的参考答案。现在参考答案采用人工编写的方法,一般是聘请具有较高英语水平的多个专门人员,在参考考生整体水平的前提下写出他们所有能够想到的回答形式,并以扩展巴克斯范式ABNF语法的标准格式写出。这样做可以使得参考语法覆盖考生回答的可能性大幅提高,ABNF语法可以用更少的文字输入表达更多的句式和内容。但是人工编写语法仍然是一个耗时费力的繁琐过程,也不可能穷尽所有的回答,还会因为编写者的主观性使得参考答案超越考生实际水平。
技术实现思路
本专利技术的目的是克服原来编写方式耗费人工和编写者主观性强的缺点,提供一种用于英语口语考试自动评分的参考语法生成算法和设备,该方法和设备基于考生语音识别结果切分音素链,统计词频信息,连接音素链,从而的自动生成参考语法。在第一方面,本专利技术提供一种用于英语口语考试自动评分的参考语法生成方法,其特征在于,包括如下步骤:人工编写少量基于ABNF规则的参考语法;利用单词发音词表,将基于ABNF规则的参考语法转译成音素词图;对音素词图做以元音音素为断点的音素链切分操作,构成基础音素链集中的音素链;计算基础音素链集中的音素链与考生语音数据音素链集中的音素链的编辑距离;以编辑距离为特征,对考生语音数据音素链集进行聚类,计算同类音素链的出现频率占总数的比例;剔除中占比小的音素链,将保留下来的音素链用音素链连接算法连接成完整的语法句式,最后以树结构的音素词图保存为参考答案。优选地,所述对音素词图做以元音音素为断点的音素链切分操作,构成基础音素链集中的音素链的步骤中的音素链切分操作包括:记录音素词图中的元音音素位置,然后保存所述元音音素作为单音素音素链;从所述元音音素记录的各个位置开始依次向下搜索,每次将搜索到的下一音素加入音素链,然后再向后搜索,直到碰到元音音素或句尾为止;完成全部搜索,存储生成的音素链和句头音素链,并剔除单音素音素链。优选地,考生语音数据音素链集采用下列步骤产生:将考生语音送入大词汇量连续语音识别器,输出以单词为单位的词图解码结果;设置剪枝参数,把词图按词聚类算法压缩成单词的混淆网络;对混淆网络,先将各混淆层的单词转译成音素的形式,再利用元音音素点分割算法和跨词的音素链连接算法将混淆网络切分成头尾为元音音素的音素链,最后记录音素链和它的出现频率统计值。优选地,所述跨词的音素链连接算法包括:将混淆网络每一层的单词由它的元音音素位置切分,然后将头尾的每个元音音素分入前后的音素链中;保存单词中间部分的音素链,头尾的音素链则留待跨词连接;找到所有跨词连接层,连接跨词连接层间的所有单词头尾音素链。优选地,包括在计算基础音素链集中的音素链与考生语音数据音素链集中的音素链的编辑距离的步骤之前,以人工参考语法为基础,把考生语音数据音素链集中出现频率大于阈值的音素链加入基础语法的音素链集当中,以生成一个用于替代基础音素链集作为参照基准的扩展基础音素链集。 优选地,所述计算基础音素链集中的音素链与考生语音数据音素链集中的音素链的编辑距离包括将与所有基础音素链的编辑距离都高于阈值的音素链剔除出音素链集。优选地,所述音素链连接算法包括:标示出所有在语音中处于开头位置的音素链,并以他们作为树结构的起始根节点;利用占比大小逆序排列待连接的音素链,然后依次将可连接的音素链与根节点连接成为新的树节点;由新的树节点向下搜索找到更新的树节点,当出现在新节点中的音素链有结尾标识或树的层数达到阈值时则该节点为叶子节点,结束搜索。在第二方面,本专利技术提供一种用于英语口语考试自动评分的参考语法生成设备,该设备包括如下:输入模块,接收人工编写的少量基于ABNF规则的参考语法;利用单词发音词表,将基于ABNF规则的参考语法转译成音素词图的转译模块;对音素词图做以兀音音素为断点的音素链切分操作,构成基础音素链集中的音素链的音素链切分模块;计算基础音素链集中的音素链与考生语音数据音素链集中的音素链的编辑距离的编辑距离计算模块;以编辑距离为特征,对考生语音数据音素链集进行聚类,计算同类音素链的出现频率占总数的比例的聚类模块;剔除中占比小的音素链,将保留下来的音素链用音素链连接算法连接成完整的语法句式,最后以树结构的音素词图保存为参考答案的连接模块。本专利技术实施例的优点是,采用机器自动生成参考语法只需要人工编写少量的标准答案种子,原来耗时费力的过程得以大大减小。按现有的方法,聘请专业人员编写参考语法,为了尽量提高对考生回答的覆盖率就不得不耗费时间将所有能想到的答案编写进语法,虽然其标准性和正确性很高,但是需要大量时间,而且很多不符合考生实际水平的句式也被加入参考语法,在对齐时也增加了额外的计算消耗。本专利技术则只要求人工编写很少的句式简单的标准答案,然后依据考生实际语音的识别结果进行音素链的词频统计,让计算机根据设定的算法来生成参考语法,因此消耗的人工劳动很少,且不会在语法中出现超越考生水平的答案。附图说明图1是解码结果和多候选参考答案的示例图;图2是基于首素的强制对齐的不意图;图3是本专利技术一个实施例的机器自动生成参考语法算法的流程图;图4是音素词图参考语法音素切分的算法流程图;图5是考生语音混淆网络的音素切分算法流程图;图6是音素链连接的算法流程图;图7 (a)和图7 (b)分别是只用音素混淆网络的语法对齐特征建立分数映射模型的各分档评分一致率和加入发音特征和流利度特征后建立分数映射模型的评分一致率。具体实施例方式下面结合附图及具体实施例对本专利技术的机器自动生成参考语法的方法做进一步地描述。图3是本专利技术一个实施例的机器自动生成参考语法方法的流程图。如图3所示,本专利技术提供的用于英语口语考试自动评分中的机器自动生成参考语法方法包括如下步骤:首先,在步骤I)每道题人工编写1-2个基于ABNF规则的参考语法。在步骤2)利用单词发音词表,将ABNF语法转译成音素词图。在步骤3)考虑到英语单词的发音结构和当前识别器对元音音素识别率相对较高的情况,对步骤2)中生成的音素词图做以元音音素为断点的音素链切分操作。具体的音素链切分操作将在下文结合图4详细讨论。在步骤4)将考生语音送本文档来自技高网...
【技术保护点】
一种用于英语口语考试自动评分的参考语法生成方法,其特征在于,包括如下步骤:人工编写少量基于ABNF规则的参考语法;利用单词发音词表,将基于ABNF规则的参考语法转译成音素词图;对音素词图做以元音音素为断点的音素链切分操作,构成基础音素链集中的音素链;计算基础音素链集中的音素链与考生语音数据音素链集中的音素链的编辑距离;以编辑距离为特征,对考生语音数据音素链集进行聚类,计算同类音素链的出现频率占总数的比例;剔除其中占比小的音素链,将保留下来的音素链用音素链连接算法连接成完整的语法句式,最后以树结构的音素词图保存为参考答案。
【技术特征摘要】
【专利技术属性】
技术研发人员:潘复平,丁铭,颜永红,
申请(专利权)人:中国科学院声学研究所,北京中科信利技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。