本发明专利技术公开了基于偏误字典和序列对齐的中文口音偏误评估方法与系统,涉及文本分析技术领域,方法包括如下步骤:采集评估对象朗读标准音素文本的语音信号,识别生成待评估音素文本;对比待评估音素文本和标准音素文本,构建口音偏误字典;基于口音偏误字典计算待评估音素文本和标准音素文本的编辑距离;基于编辑距离评估该评估对象的口音偏误。本发明专利技术构建了一个详尽的口音偏误字典,在此基础上利用Levenshtein序列对齐算法进行待评估文本与标准文本的编辑距离计算,再基于字典统计字典偏误编辑距离以及其它错误编辑距离;通过对这两个距离进行加权向量得到了一个综合的偏误量化得分,该得分能够更准确地反映学习者的口音偏误程度。
【技术实现步骤摘要】
本专利技术涉及文本分析,尤其涉及基于偏误字典和序列对齐的中文口音偏误评估方法与系统。
技术介绍
1、在中文学习过程中,非母语学习者常因母语影响、年龄及教学方法等因素,在声调和语调上出现偏误。对非母语学习者的口音偏误进行分析并评估,有助于深入了解他们对目标语言的掌握程度。通过分析具体的语音偏误,如声母、韵母和声调错误,使学习者能够有针对性地练习并克服这些难题。总而言之,偏误分析有助于提升国际中文教学质量,促进对第二语言习得机制的理解,更深入了解学生需求,为教学提供针对性的改进策略。
2、口音偏误评估研究目前面临许多的挑战。首先,口音偏误评估的研究往往依赖于有限的数据集,这可能导致评估结果的泛化性不足。其次,当前的研究多集中在单一的口音或方言上,缺乏对多种口音综合评估的研究。此外,对于口音偏误的评估标准尚未统一,不同的研究可能采用不同的评估方法,这给研究的比较和综合带来了困难。
技术实现思路
1、本专利技术的目的在于解决现有技术中对于口音偏误缺乏评估标准的问题。
2、本专利技术解决其技术问题所采用的技术方案是:提供一种基于偏误字典和序列对齐的中文口音偏误评估方法,包括如下步骤:
3、采集评估对象朗读标准音素文本的语音信号,识别生成待评估音素文本;
4、对比待评估音素文本和标准音素文本,构建口音偏误字典;
5、基于口音偏误字典计算待评估音素文本和标准音素文本的编辑距离;
6、基于编辑距离评估该评估对象的口音偏误。p>7、优选的,所述构建口音偏误字典,包括以下步骤:
8、对比通过待评估音素文本和标准朗读音素文本,统计错误映射的音节对,筛选出现频率高于预设阈值的错误映射,得到高频错误映射集合,其中,表示错误的语音识别音素,表示标准音素;
9、将高频错误映射对集合和全球口音偏误数据集进行集成,得到口音偏误字典,所述全球口音偏误数据集包含了不同国家的发音偏误的音节替代模式。
10、优选的,所述基于口音偏误字典计算待评估音素文本和标准音素文本的编辑距离,采用levenshtein序列对齐算法,包括以下步骤:
11、以标准音素文本作为a序列,以待评估音素文本作为b序列;
12、初始化矩阵,设定矩阵的大小为(m+1)×(n+1),其中m为a序列的长度,n为b序列的长度;矩阵第一行和第一列分别初始化为从0到n的序列和从0到m的序列;
13、填充矩阵,从i=1,j=1开始,逐步填充矩阵中的每一个位置(i, j);i∈[0,m]表示行索引,j∈[0,n]表示列索引;填充到位置(i, j)的值dp[i][j]表示编辑距离,根据a序列第i个元素与b序列第j个元素的比较结果确定;
14、完成矩阵的填充后,以(m,n)作为回溯点,计算回溯点的值与回溯点相邻位置中的最小值的差值作为距离,并以该最小值的位置作为新的回溯点继续计算距离,直到位置(0,0),然后连接所有回溯点的距离作为代表最小编辑操作路径的序列;对于回溯点(i,j),其相邻位置包括(i-1,j),(i,j-1),(i-1,j-1);
15、基于口音偏误字典在代表最小编辑操作路径的序列中统计编辑距离。
16、优选的,所述填充到位置(i, j)的值根据a序列第i个元素与b序列第j个元素的比较结果确定,具体为:
17、如果等于,则 ,表示不需要任何操作;
18、如果不等于,则 ,表示需要编辑操作;其中,表示插入操作,表示删除操作,表示替换操作;、和均表示操作权重,且,。
19、优选的,所述基于口音偏误字典在代表最小编辑操作路径的序列中统计编辑距离,包括:
20、对代表最小编辑操作路径的序列中的编辑距离进行分类,若编辑距离所对应的编辑操作为替换操作且该替换操作符合口音偏误字典d的错误映射,则将该编辑距离分类为字典偏误编辑距离;否则将编辑距离分类为错误编辑距离;
21、对代表最小编辑操作路径的序列中编辑距离进行分类相加,将所有字典偏误编辑距离相加得到总字典偏误编辑距离,将所有错误编辑距离相加得到总错误编辑距离。
22、优选的,所述基于编辑距离评估该评估对象的口音偏误,具体为:赋予不同类型的编辑距离不同的权重,对编辑距离进行权重相加得到口音偏误评分,分值越高说明该评估对象的发音偏误越严重;口音偏误评分表示为:
23、;
24、其中,为的权重,为的权重。
25、本专利技术还提供一种基于偏误字典和序列对齐的中文口音偏误评估系统,包括:
26、语音采集模块,采集评估对象朗读标准音素文本的语音信号,进行语音识别生成待评估音素文本;
27、字典构建模块,对比待评估音素文本和标准音素文本,构建口音偏误字典;
28、距离计算模块,基于口音偏误字典计算待评估音素文本和标准音素文本的编辑距离;
29、口音评分模块,基于编辑距离评估该评估对象的口音偏误。
30、本专利技术具有如下有益效果:
31、(1)本专利技术构建了一个详尽的口音偏误字典。在此基础上,利用levenshtein序列对齐算法,对语音识别得到的音素文本与标准音素文本进行编辑距离的计算,并通过算法的回溯机制,统计了字典中偏误的编辑距离以及其它的错误编辑距离;通过加权这两个距离得到了一个综合的偏误量化得分,该得分能够更准确地反映学习者的口音偏误程度;这种方法不仅关注了非母语中文学习者口语交际的适用性,而且通过精确的量化评估,为教学和学习提供了针对性的改进建议。通过这种方法的应用,可以显著提高中文教学的质量和效果,促进学习者口语能力的进一步提升。
32、(2)本专利技术的创新之处在于其对偏误识别过程的深入分析和量化评估,这为中文作为第二语言的教学领域提供了新的视角和工具。通过对偏误的系统性研究和量化,对于不同编辑操作赋予不同编辑权重(对于音素来说,如若需要进行替换,则意味着两个音素序列的差异较大,反映出的发音偏误则更大,对替换赋予更大的编辑权重可以更好的体现出偏误程度),有助于教师更有效地识别和纠正学习者的口语错误,同时也为学习者提供了明确的学习目标和反馈,从而促进了教学和学习的双向互动和优化。
33、以下结合附图及实施例对本专利技术作进一步详细说明,但本专利技术不局限于实施例。
本文档来自技高网...
【技术保护点】
1.一种基于偏误字典和序列对齐的中文口音偏误评估方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于偏误字典和序列对齐的中文口音偏误评估方法,其特征在于,所述构建口音偏误字典,包括以下步骤:
3.根据权利要求2所述的基于偏误字典和序列对齐的中文口音偏误评估方法,其特征在于,所述基于口音偏误字典计算待评估音素文本和标准音素文本的编辑距离,采用Levenshtein序列对齐算法,包括以下步骤:
4.根据权利要求3所述的基于偏误字典和序列对齐的中文口音偏误评估方法,其特征在于,所述填充到位置(i, j)的值根据A序列第i个元素与B序列第j个元素的比较结果确定,具体为:
5.根据权利要求4所述的基于偏误字典和序列对齐的中文口音偏误评估方法,其特征在于,所述基于口音偏误字典在代表最小编辑操作路径的序列中统计编辑距离,包括:
6.根据权利要求4所述的基于偏误字典和序列对齐的中文口音偏误评估方法,其特征在于,所述基于编辑距离评估该评估对象的口音偏误,具体为:赋予不同类型的编辑距离不同的权重,对编辑距离进行权重相加得到口音偏误评分,分值越高说明该评估对象的发音偏误越严重;口音偏误评分表示为:
7.一种基于偏误字典和序列对齐的中文口音偏误评估系统,其特征在于,包括:
...
【技术特征摘要】
1.一种基于偏误字典和序列对齐的中文口音偏误评估方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于偏误字典和序列对齐的中文口音偏误评估方法,其特征在于,所述构建口音偏误字典,包括以下步骤:
3.根据权利要求2所述的基于偏误字典和序列对齐的中文口音偏误评估方法,其特征在于,所述基于口音偏误字典计算待评估音素文本和标准音素文本的编辑距离,采用levenshtein序列对齐算法,包括以下步骤:
4.根据权利要求3所述的基于偏误字典和序列对齐的中文口音偏误评估方法,其特征在于,所述填充到位置(i, j)的值根据a序列第i个元素与...
【专利技术属性】
技术研发人员:周浩,王华珍,戴朝,陈建国,马贺阳,
申请(专利权)人:华侨大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。