模型训练方法及装置、存储介质及电子装置制造方法及图纸

技术编号:28945224 阅读:42 留言:0更新日期:2021-06-18 21:57
本发明专利技术公开了一种模型训练方法及装置、存储介质及电子装置,其中,上述方法包括:获取麦克风阵列接收到的纯净语料和第一噪声数据,其中,纯净语料用于指示不包括噪声数据的语音信号;将所述纯净语料中的部分纯净语料中加入混响数据,得到目标音频;根据所述目标音频和所述第一噪声数据对降噪模型进行训练,得到训练后的降噪模型。采用上述技术方案,解决了传统降噪模型对带噪声的语料进行降噪处理的过程中,语料频谱可能会收到损伤等问题。

【技术实现步骤摘要】
模型训练方法及装置、存储介质及电子装置
本专利技术涉及通信领域,具体而言,涉及一种模型训练方法及装置、存储介质及电子装置。
技术介绍
随着科技的发展,麦克风阵列在人工智能领域被广泛应用,如智能家居,包括:智能冰箱、洗衣机、热水器等,都会使用双麦、多麦等线阵或环阵,但不论是哪种麦克风阵列,都涉及到语音信号降噪处理技术,这是当今人机交互领域的一项关键技术。降噪信号处理虽然能抑制噪声,但可能会使得语音频谱受到损伤,目前主要的降噪训练手段是给降噪模型较充足的纯净语料和各种噪声,让模型适应并实现噪声抑制。针对相关技术,传统降噪模型对带噪声的语料进行降噪处理的过程中,语料频谱可能会收到损伤等问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种模型训练方法及装置、存储介质及电子装置,以至少解决传统降噪模型对带噪声的语料进行降噪处理的过程中,语料频谱可能会收到损伤等问题。根据本专利技术实施例的一个实施例,提供了一种模型训练方法,获取麦克风阵列接收到的纯净语料和第一噪声数据,其中,纯净语料用于指示不包括噪声数据的语音信号;将所述纯净语料中的部分纯净语料中加入混响数据,得到目标音频;根据所述目标音频和所述第一噪声数据对降噪模型进行训练,得到训练后的降噪模型。在一个示例性实施例中,根据所述目标音频和所述第一噪声数据对降噪模型进行训练,得到训练后的降噪模型之后,所述方法还包括:获取麦克风阵列从多个音频发声装置所获取到的唤醒词和第二噪声数据,得到与所述多个音频发声装置对应的多个唤醒词和多个第二噪声数据,其中,所述多个音频发声装置位于相对于所述麦克风阵列的多个方向上,每个方向对应一个唤醒词和一个第二噪声数据;将所述多个唤醒词和所述多个第二噪声数据输入到所述训练好的降噪模型中,得到多个唤醒数据,其中,所述唤醒数据用于指示所述唤醒词对应的唤醒操作,每个第二噪声数据对应一个唤醒数据。在一个示例性实施例中,获取麦克风阵列从多个音频发声装置所获取到的唤醒词和第二噪声数据,得到与所述多个音频发声装置对应的多个唤醒词和多个第二噪声数据,包括:以所述麦克风阵列为原点,确定相对于所述麦克风阵列的多个方向的多个目标位置;确定音频发生装置在所述多个目标位置播放的多个唤醒词,以及在所述多个目标位置的多个第二噪声数据。在一个示例性实施例中,将所述多个唤醒词和所述多个第二噪声数据输入到所述训练好的降噪模型中,得到多个唤醒数据,包括:按照不同的功率比叠加所述多个唤醒词和所述多个第二噪声数据,得到带噪声的唤醒词数据;将所述带噪声的唤醒词数据输入到所述训练好的降噪模型中,得到多个唤醒数据。在一个示例性实施例中,将所述多个唤醒词和所述多个第二噪声数据输入到所述训练好的降噪模型中,得到多个唤醒数据之后,所述方法还包括:将所述多个唤醒数据输入到唤醒模型中进行训练,得到训练后的唤醒模型;根据所述训练后的唤醒模型对接收到的唤醒词进行识别,得到所述唤醒词对应的唤醒操作。在一个示例性实施例中,将所述纯净语料中的部分纯净语料中加入混响数据,得到目标音频,包括:获取不同混响程度的混响数据;向所述部分纯净预料中的每一个纯净预料中分别加入不同混响程度的混响数据,得到所述目标音频。根据本专利技术实施例的又一实施例,包括:获取模块,用于获取麦克风阵列获取到的纯净语料和第一噪声数据,其中,纯净语料用于指示不包括噪声数据的语音信号;融合模块,用于将所述纯净语料中的部分纯净语料中加入混响数据,得到目标音频;训练模块,用于根据所述目标音频和所述第一噪声数据对降噪模型进行训练,得到训练后的降噪模型。在一个示例性实施例中,所述训练模块,用于获取麦克风阵列从多个音频发声装置所获取到的唤醒词和第二噪声数据,得到与所述多个音频发声装置对应的多个唤醒词和多个第二噪声数据,其中,所述多个音频发声装置位于相对于所述麦克风阵列的多个方向上,每个方向对应一个唤醒词和一个第二噪声数据;将所述多个唤醒词和所述多个第二噪声数据输入到所述训练好的降噪模型中,得到多个唤醒数据,其中,所述唤醒数据用于指示所述唤醒词对应的唤醒操作,每个第二噪声数据对应一个唤醒数据。根据本专利技术实施例的又一实施例,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述模型训练方法。根据本专利技术实施例的又一实施例,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述模型训练方法。通过本专利技术,引入一种模型训练方法,获取麦克风阵列接收到的纯净语料和第一噪声数据,将纯净语料和第一噪声数据输入到降噪模型中进行训练以前,将纯净语料中的部分纯净语料中加入混响数据,得到目标音频,随后才将目标音频和第一噪声数据一起输入到降噪模型中,对降噪模型进行训练,得到训练后的降噪模型。采用上述技术方案,解决了传统降噪模型对带噪声的语料进行降噪处理的过程中,语料频谱可能会收到损伤等问题,进而通过在部分纯净语料中加入混响数据,使得训练处理的降噪模型对带噪声的语料进行降噪处理的过程中,语料频谱不会收到损伤。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示例性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是本专利技术实施例的模型训练方法的计算机终端的硬件结构框图;图2是根据本专利技术实施例的模型训练方法的流程图;图3是根据本专利技术实施例的模型训练方法的RNN模型原理流程图;图4是根据本专利技术实施例的模型训练方法的麦克风阵列语音信号降噪处理联合唤醒训练数据适配方法流程图;图5是根据本专利技术实施例的模型训练装置的结构框图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请实施例中所提供的方法实施例可以在计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1是本专利技术实施例的一种模型训练方法的计算机终端的硬件结构框图。如图1所示,计算机终端可以包括一个本文档来自技高网
...

【技术保护点】
1.一种模型训练方法,其特征在于,包括:/n获取麦克风阵列接收到的纯净语料和第一噪声数据,其中,纯净语料用于指示不包括噪声数据的语音信号;/n将所述纯净语料中的部分纯净语料中加入混响数据,得到目标音频;/n根据所述目标音频和所述第一噪声数据对降噪模型进行训练,得到训练后的降噪模型。/n

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:
获取麦克风阵列接收到的纯净语料和第一噪声数据,其中,纯净语料用于指示不包括噪声数据的语音信号;
将所述纯净语料中的部分纯净语料中加入混响数据,得到目标音频;
根据所述目标音频和所述第一噪声数据对降噪模型进行训练,得到训练后的降噪模型。


2.根据权利要求1所述的方法,其特征在于,根据所述目标音频和所述第一噪声数据对降噪模型进行训练,得到训练后的降噪模型之后,所述方法还包括:
获取麦克风阵列从多个音频发声装置所获取到的唤醒词和第二噪声数据,得到与所述多个音频发声装置对应的多个唤醒词和多个第二噪声数据,其中,所述多个音频发声装置位于相对于所述麦克风阵列的多个方向上,每个方向对应一个唤醒词和一个第二噪声数据;
将所述多个唤醒词和所述多个第二噪声数据输入到所述训练好的降噪模型中,得到多个唤醒数据,其中,所述唤醒数据用于指示所述唤醒词对应的唤醒操作,每个第二噪声数据对应一个唤醒数据。


3.根据权利要求2所述的方法,其特征在于,获取麦克风阵列从多个音频发声装置所获取到的唤醒词和第二噪声数据,得到与所述多个音频发声装置对应的多个唤醒词和多个第二噪声数据,包括:
以所述麦克风阵列为原点,确定相对于所述麦克风阵列的多个方向的多个目标位置;
确定音频发生装置在所述多个目标位置播放的多个唤醒词,以及在所述多个目标位置的多个第二噪声数据。


4.根据权利要求2所述的方法,其特征在于,将所述多个唤醒词和所述多个第二噪声数据输入到所述训练好的降噪模型中,得到多个唤醒数据,包括:
按照不同的功率比叠加所述多个唤醒词和所述多个第二噪声数据,得到带噪声的唤醒词数据;
将所述带噪声的唤醒词数据输入到所述训练好的降噪模型中,得到多个唤醒数据。


5.根据权利要求2所述的方法,其特征在于,将所述多个唤醒词和所述多个第二噪声数据输...

【专利技术属性】
技术研发人员:赵欣葛路奇赵培苏腾荣
申请(专利权)人:青岛海尔科技有限公司海尔智家股份有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1