一种语言学习方法及系统技术方案

技术编号:28562287 阅读:14 留言:0更新日期:2021-05-25 17:57
本发明专利技术提供一种语言学习方法及系统,基于用户信息及其相应的用户终端编号成功登陆系统后,对系统捕获的原始语音信号进行处理,对单词发音的孤立词语音分析,求取每个滤波器组输出的对数能量;对输出的对数能量进行离散余弦变换,最终得到MFCC参数;基于MFCC参数生成对应语音模型,保存语音模型文件;采用生成的语音模型调用语音识别引擎进行对标准音特征数据进行识别处理,生成并保存标准音数据模型;采用预生成数据模型在应用产品中直接加载预生成数据模型进行对用户录音进行识别评分。以提高英文学习效率和用户体验。

【技术实现步骤摘要】
一种语言学习方法及系统
本专利技术涉及软件信息
,具体涉及一种语言学习方法及系统。
技术介绍
语言作为一个交流工具,能够正确标准的发音是现代语言教学与学习的一个重要目标。在发音学习中,有效的反馈是必不可少的一个重要环节。在传统的课堂教学中教师是一个有效的反馈源,然而由于课堂时间和教师资源都是有限的,不能保证每个学生的发音都能得到有效的反馈。另外,语言的学习是需要反复训练的,这也是传统课堂教学方式所不能提供的。在学习时,学生需要一个“教师”随时随地的对自己的听说训练进行有效的反馈和指导。目前,随着互联网的迅猛发展,计算机辅助语言学习(CALL,Computer-AidedLanguageLeaming)技术‘11的兴起和发展为语言发音教学提供了新的途径。CALL是指在一定的语言学和心理学的理论基础上,利用计算机和信息技术辅助外语学习。结合自动语音分析技术的CALL可以用来进行辅助发音学习,学习者可以随时随地的得到即时的有效反馈,根据反馈信息及时调整改进自己的发音,有效的弥补了传统课堂语言教学中发音反馈的不足。但是,单纯的机器学习仍有不足,无法根据个体经验实时对进行在线指导和纠正。
技术实现思路
针对现有技术中的缺陷,本专利技术提供一种语言学习方法及系统,面向于外文的辅助学习对上传的语音和作业进行评分,从而增加了系统的可行性。本专利技术的目的是采用下述技术方案实现的:一种语言学习方法,所述方法包括:基于用户信息及其相应的用户终端编号成功登陆系统后,对系统捕获的原始语音信号进行处理,对单词发音的孤立词语音分析,求取每个滤波器组输出的对数能量;对输出的对数能量进行离散余弦变换,最终得到MFCC参数;基于MFCC参数生成对应语音模型,保存语音模型文件;采用生成的语音模型调用语音识别引擎进行对标准音特征数据进行识别处理,生成并保存标准音数据模型;采用预生成数据模型在应用产品中直接加载预生成数据模型进行对用户录音进行识别评分。优选的,所述用户信息成功登陆系统前包括预先存储步骤,预先将用户信息及其相应的用户终端编号保存到学生信息库,所述学生信息包括学生的标准照片。优选的,所述对系统捕获的原始语音信号进行处理具体包括:对系统捕获的原始语音信号进行预加重、分帧、加窗预处理,得到每个语音帧的时域信号,然后对实施离散傅里叶变换得到线性频谱。优选的,对单词发音的孤立词语音分析,求取每个滤波器组输出的对数能量包括:计算所述线性频谱的能量谱,使用一组Mel尺度的三角形滤波器在频域对能量谱进行带通滤波。进一步地,所述计算所述线性频谱的能量谱包括:对于音素qi,给出与其相关的第i段语音的每一帧xi;音素qi在第i段语音每一帧下的后验概率取对数,然后逐帧累加,得到音素qi在第i段语音下的对数后验概率得分进一步地,通过下式计算qi基于帧的后验概率:其中,p(xi、qi)为给定音素qi下观测到的xi的概率分布,在分母上,p(q)为音素qi的先验概率,M为当前语料中与文本无关的音素总数。进一步地,通过下式计算音素qi在第i段语音下的对数后验概率得分:其中,τi表示音素qi所对应的第i段语音的起始时间。优选的,所述标准音特征识别数据生成的步骤如下:使用编辑好的标准音频和标准文本配置文件和编辑好的发音词典使用语音识别引擎工具生成该文段的文段语音模型,文段语音模型是用于描述用户发音空间,在识别用户发音时,使语音识别引擎在约束词汇条件下进行快速高效剪枝,快速识别出用户发音内容。优选的,所述语音模型生成模块的步骤如下:调用语音识别引擎,传入声学模型和生成的文段语音模型,依次对在预先生成配置文件里面的每个节点配置单词或者句子进行语音识别,保存识别引擎返回每个节点配置的音频文件识别数据到本地文本文件,至此,已获得每个单词或者句子标准音的文本,发音,节奏,重音,语调的特征数据模型,在对用户发音识别评分时只需把数据模型传入识别引擎,识别引擎把用户发音识别后直接跟标准音数据模型进行对比评分即可,无需对标准音进行识别来获取标准音数据模型。一种语言学习系统,所述系统包括:处理模块,用于基于用户信息及其相应的用户终端编号成功登陆系统后,对系统捕获的原始语音信号进行处理,对单词发音的孤立词语音分析,求取每个滤波器组输出的对数能量;获取模块,用于对输出的对数能量进行离散余弦变换,最终得到MFCC参数;第一生成模块,用于基于MFCC参数生成对应语音模型,保存语音模型文件;第二生成模块,用于采用生成的语音模型调用语音识别引擎进行对标准音特征数据进行识别处理,生成并保存标准音数据模型;评分模块,用于采用预生成数据模型在应用产品中直接加载预生成数据模型进行对用户录音进行识别评分。与最接近的现有技术比,本专利技术的有益效果为:本专利技术提供一种语言学习系统方法及系统,解决l外语学习课堂上教师和时间资源的有限性,作为反馈源随时随地对学习者发音进行指导。本专利技术利用自动语音分析技术对单词发音学习进行指导,使得本文工作是语音分析技术和语言教学的一个有效契合点,对语音技术和外语教学的进一步结合发展具有较强的参考意义。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。图1示出了本专利技术所提供的方法流程图。具体实施方式下面将结合附图对本专利技术技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,因此只是作为示例,而不能以此来限制本专利技术的保护范围。需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本专利技术所属领域技术人员所理解的通常意义。实施例一本专利技术涉及软件信息
,实施例提供一种语言学习方法,所述方法包括:S101基于用户信息及其相应的用户终端编号成功登陆系统后,对系统捕获的原始语音信号进行处理,对单词发音的孤立词语音分析,求取每个滤波器组输出的对数能量;S102对输出的对数能量进行离散余弦变换,最终得到MFCC参数;S103基于MFCC参数生成对应语音模型,保存语音模型文件;S104采用生成的语音模型调用语音识别引擎进行对标准音特征数据进行识别处理,生成并保存标准音数据模型;S105采用预生成数据模型在应用产品中直接加载预生成数据模型进行对用户录音进行识别评分。步骤S101中,所述用户信息成功登陆系统前包括预先存储步骤,预先将用户信息及其相应的用户终端编号保存到学生信息库,所述学生信息包括学生的标准照片。步骤S102中,所述对系统捕获的原始语音信号进行处理具体包括:对系统捕获的原始语音信号进行预加重、分帧、加窗预处理,得到每个本文档来自技高网
...

【技术保护点】
1.一种语言学习方法,其特征在于,所述方法包括:/n基于用户信息及其相应的用户终端编号成功登陆系统后,对系统捕获的原始语音信号进行处理,对单词发音的孤立词语音分析,求取每个滤波器组输出的对数能量;/n对输出的对数能量进行离散余弦变换,最终得到MFCC参数;/n基于MFCC参数生成对应语音模型,保存语音模型文件;/n采用生成的语音模型调用语音识别引擎进行对标准音特征数据进行识别处理,生成并保存标准音数据模型;/n采用预生成数据模型在应用产品中直接加载预生成数据模型进行对用户录音进行识别评分。/n

【技术特征摘要】
1.一种语言学习方法,其特征在于,所述方法包括:
基于用户信息及其相应的用户终端编号成功登陆系统后,对系统捕获的原始语音信号进行处理,对单词发音的孤立词语音分析,求取每个滤波器组输出的对数能量;
对输出的对数能量进行离散余弦变换,最终得到MFCC参数;
基于MFCC参数生成对应语音模型,保存语音模型文件;
采用生成的语音模型调用语音识别引擎进行对标准音特征数据进行识别处理,生成并保存标准音数据模型;
采用预生成数据模型在应用产品中直接加载预生成数据模型进行对用户录音进行识别评分。


2.根据权利要求1所述的方法,其特征在于,所述用户信息成功登陆系统前包括预先存储步骤,预先将用户信息及其相应的用户终端编号保存到学生信息库,所述学生信息包括学生的标准照片。


3.根据权利要求1所述的方法,其特征在于,所述对系统捕获的原始语音信号进行处理具体包括:对系统捕获的原始语音信号进行预加重、分帧、加窗预处理,得到每个语音帧的时域信号,然后对实施离散傅里叶变换得到线性频谱。


4.根据权利要求1所述的方法,其特征在于,对单词发音的孤立词语音分析,求取每个滤波器组输出的对数能量包括:
计算所述线性频谱的能量谱,使用一组Mel尺度的三角形滤波器在频域对能量谱进行带通滤波。


5.根据权利要求4所述的方法,其特征在于,所述计算所述线性频谱的能量谱包括:
对于音素qi,给出与其相关的第i段语音的每一帧xi;
音素qi在第i段语音每一帧下的后验概率取对数,然后逐帧累加,得到音素qi在第i段语音下的对数后验概率得分。


6.根据权利要求5所述的方法,其特征在于,通过下式计算qi基于帧的后验概率:



其中,p(xi、qi)为给定音素qi下观测到的xi的概率分布,在分母上,p(q)为音素qi的先验概率,M为当前语料中与...

【专利技术属性】
技术研发人员:乐妙王小波
申请(专利权)人:北京策腾教育科技集团有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1