【技术实现步骤摘要】
本专利技术属于语音识别
,具体地说,本专利技术涉及一种用于语种识别的语种模型的训练方法及系统。
技术介绍
语种识别是语音识别技术的重点难点之一。对于跨语言的语音识别系统,相对于确定语言的语音识别系统语音识别性能会有大幅度的下降,准确识别出语音的语种信息的语种识别技术,使跨语言的语音识别转换为确定语言的语音识别,成为语音识别系统满足实际应用需求的必要手段。对于如何利用有限的语种训练数据,训练具有语种鉴别性的模型,从而快速准确的识别出语音的语种信息,目前尚未出现有效的方案,这对于语种识别技术进一步研究及应用造成困难。
技术实现思路
针对上述问题,本专利技术实施例提出一种用于语种识别的语种模型的训练方法及系统。在第一方面,本专利技术实施例提出一种用于语种识别的语种模型的训练方法,所述方法包括采集多个目标语种语音数据,提取各语种的语音声学谱特征;利用所述声学谱特征训练每个目标语种的高斯混合模型,作为其初始模型;利用每个目标语种的初始模型量化对应语种训练数据的混淆度;利用最大后验估计将各语种训练数据从声学谱特征转换到高斯超向量空间;对所述各语种训练数据的高斯超向量空间,根据所述混淆度赋予各语种训练数据的高斯超向量不同的权重,并利用权重较高的几个语种的训练数据来训练语种模型。在第二方面,本专利技术实施例提出一种用于语种识别的语种模型的训练系统,所述系统包括声学谱特征提取模块,用于采集多个目标语种语音数据,提取各语种的语音声学谱特征;初始模型生成模块,用于利用所述声学谱特征训练每个目标语种的高斯混合模型,作为其初始模型;混淆度量化模块,用于利用每个目标语种的初始模型 ...
【技术保护点】
一种用于语种识别的语种模型的训练方法,其特征在于,所述方法包括:采集多个目标语种语音数据,提取各语种的语音声学谱特征;利用所述声学谱特征训练每个目标语种的高斯混合模型,作为其初始模型;利用每个目标语种的初始模型量化对应语种训练数据的混淆度;利用最大后验估计将各语种训练数据从声学谱特征转换到高斯超向量空间;对所述各语种训练数据的高斯超向量空间,根据所述混淆度赋予各语种训练数据的高斯超向量不同的权重,并利用权重较高的几个语种的训练数据来训练语种模型。
【技术特征摘要】
1.一种用于语种识别的语种模型的训练方法,其特征在于,所述方法包括 采集多个目标语种语音数据,提取各语种的语音声学谱特征; 利用所述声学谱特征训练每个目标语种的高斯混合模型,作为其初始模型; 利用每个目标语种的初始模型量化对应语种训练数据的混淆度; 利用最大后验估计将各语种训练数据从声学谱特征转换到高斯超向量空间; 对所述各语种训练数据的高斯超向量空间,根据所述混淆度赋予各语种训练数据的高斯超向量不同的权重,并利用权重较高的几个语种的训练数据来训练语种模型。2.如权利要求1所述的用于语种识别的语种模型的训练方法,其特征在于,所述利用权重较高的几个语种的训练数据来训练语种模型,具体为利用权重较高的几个语种的训练数据的高斯超向量进行最大似然估计得到代表每个语种高斯超向量空间分布的中心点,根据每个语种高斯超向量空间分布的中心点,更新每个语种的高斯混合模型的均值,得到每个语种的新的高斯混合模型。3.如权利要求1或2所述的用于语种识别的语种模型的训练方法,其特征在于,所述利用每个目标语种的初始模型量化对应语种训练数据的混淆度,具体为若语种Ii的某条语音数据的声学谱特征为X,该条语音数据混淆度4.按权利要求3所述的用于语种识别的语种模型的训练方法,其特征在于,所述根据所述混淆度赋予的语种Ii的训练数据的高斯超向量的权重5.按权利要求4所述的用于语种识别的语种模型的训练方法,其特征在于,所述通过最大似然计算每个目标语种高斯超向量的中心点依据公式6.一种用于语种识别的语种模型的训练系统,其特征在于,所述...
【专利技术属性】
技术研发人员:周若华,颜永红,杨金超,索宏彬,
申请(专利权)人:中国科学院声学研究所,北京中科信利技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。