用于产生音频信号的系统和方法技术方案

技术编号:39245502 阅读:11 留言:0更新日期:2023-10-30 11:57
一种用于产生音频信号的方法,可以包括获得骨传导音频信号和空气传导音频信号。所述方法还可包括获得经过训练的机器学习模型,所述经过训练的机器学习模型提供源于特定骨传导音频信号的骨传导数据集与源于特定等效空气传导音频信号的一个或多个等效空气传导数据集之间的映射关系。该方法还可以包括基于骨传导音频信号和空气传导音频信号,使用经过训练的机器学习模型来确定对应于骨传导音频信号的等效空气传导数据目标集。该方法还可以包括使音频信号输出设备基于等效空气传导数据目标集输出表示使用者语音的目标音频信号。标集输出表示使用者语音的目标音频信号。标集输出表示使用者语音的目标音频信号。

【技术实现步骤摘要】
【国外来华专利技术】用于产生音频信号的系统和方法


[0001]本专利技术总体上涉及信号处理领域,具体地,涉及用于基于骨传导音频信号和空气传导音频信号产生音频信号的系统和方法。

技术介绍

[0002]随着电子设备的广泛使用,人们之间的交流越来越方便。当使用电子设备进行通信时,使用者可以在说话时依靠麦克风(例如骨传导麦克风或空气传导麦克风)获得音频信号。由麦克风获取的音频信号可以表示使用者的语音。然而,有时难以确保麦克风获取的音频信号足够清晰。例如,由骨传导麦克风获取的骨传导音频信号可能会丢失一些重要信息。由空气传导麦克风获取的空气传导音频信号可能有大量噪音。因此,希望提供用于产生具有较少噪声和较好保真度的音频信号的系统和方法。

技术实现思路

[0003]根据本专利技术的一个方面,可以提供一种用于产生音频信号的系统。该系统可以包括至少一个存储介质和与至少一个存储介质通信的至少一个处理器。至少一个存储介质可以包括一组指令。当至少一个处理器执行该组指令时,可以引导至少一个处理器使系统执行以下操作中的一个或多个。该系统可以获得由骨传导传感器获取的骨传导音频信号和由空气传导传感器获取的空气传导音频信号。骨传导音频信号和空气传导音频信号可以表示使用者的语音。该系统还可以获得经过训练的机器学习模型,该经过训练的机器学习模型提供来源于特定骨传导音频信号的骨传导数据集和来源于特定等效空气传导音频信号的一个或多个等效空气传导数据集之间的映射关系。该系统还可以使用基于骨传导音频信号和空气传导音频信号的所述经过训练的机器学习模型来确定与骨传导音频信号相对应的等效空气传导数据的目标集。等效空气传导数据的目标集可以指示使用者语音的语义内容。该系统还可以使音频信号输出设备基于等效空气传导数据目标集而输出表示使用者语音的目标音频信号。
[0004]在一些实施例中,基于骨传导音频信号和空气传导音频信号来确定与骨传导音频信号相对应的等效空气传导数据目标集,该系统可以使用基于骨传导音频信号的经过训练的机器学习模型来确定与骨传导音频信号相对应的一个或多个等效空气传导数据集。所述系统还可以基于空气传导音频信号,从一个或多个等效空气传导数据集中识别目标等效空气传导数据集。
[0005]在一些实施例中,使用基于骨传导音频信号的经过训练的机器学习模型来确定与骨传导音频信号相对应的一个或多个等效空气传导数据集,该系统可以将骨传导音频信号输入到经过训练的机器学习模型中,以获得与骨传导音频信号相对应的一个或多个等效空气传导数据集。
[0006]在一些实施例中,为了使用基于骨传导音频信号的经过训练的机器学习模型来确定与骨传导音频信号相对应的一个或多个等效空气传导数据集,系统可以从骨传导音频信
号中提取骨传导声学特征。该系统还可以基于骨传导声学特征来确定骨传导数据集。该系统还可以将该骨传导数据集输入到经过训练的机器学习模型中,以获得对应于骨传导音频信号的一个或多个等效空气传导数据集。
[0007]在一些实施例中,为了基于空气传导音频信号从一个或多个等效空气传导数据集中识别等效空气传导数据目标集,系统可以从空气传导音频信号中提取空气传导声学特征。该系统还可以基于空气传导声学特征来确定一个空气传导数据集。对于一个或多个等效空气传导数据集中的每一个,该系统还可以确定等效空气传导数据集与空气传导数据集之间的关联度。系统还可以确定一个或多个等效空气传导数据集中的一个,该等效空气传导数据集与一个或多个等效空气传导数据集中的一个空气传导数据集具有最大关联度。系统还可以基于一个或多个等效空气传导数据集中的一个来确定等效空气传导数据目标集。
[0008]在一些实施例中,为了使音频信号输出设备基于等效空气传导数据目标集而输出代表使用者语音的目标音频信号,系统可以将等效空气传导数据目标集转换为目标等效空气传导音频信号。所述系统还可以基于目标等效空气传导音频信号来确定目标音频信号。该系统还可以使音频信号输出设备输出目标音频信号。
[0009]在一些实施例中,目标音频信号的噪声等级可以小于空气传导音频信号的噪声等级。
[0010]在一些实施例中,为了基于目标等效空气传导音频信号来确定目标音频信号,系统可以通过在目标等效空气传导音频信号中添加噪声来产生目标音频信号。
[0011]在一些实施例中,为了产生经过训练的机器学习模型,系统可以执行以下一个或多个操作。该系统可以获得多组训练数据。多组训练数据中的每组可包括表示相同语音样本的第一音频信号和第二音频信号。第一音频信号可由骨传导音频采集设备获取,第二音频信号可由空气传导音频采集设备在无噪声条件下获取。系统可以使用多组训练数据来训练初步机器学习模型,以获得经过训练的机器学习模型。
[0012]在一些实施例中,可以基于隐马尔科夫模型来构造初步机器学习模型。
[0013]在一些实施例中,为了使用多组训练数据来训练初步机器学习模型以获得经过训练的机器学习模型,系统可以从第一音频信号中提取第一声学特征。该系统还可以从第二音频信号中提取第二声学特征。所述系统还可以基于第一声学特征来确定一个或多个第一骨传导数据集。所述系统还可以基于第二声学特征来确定一个或多个第二空气传导数据集。该系统还可以确定多对空气传导数据集和骨传导数据集,每对包括表示相同语义的第一骨传导数据集和第二空气骨传导数据集。所述系统还可以基于多对空气传导数据和骨传导数据在每一个第一骨传导数据集和至少一个第二空气传导数据集之间建立映射关系。
[0014]在一些实施例中,一个或多个第一骨传导数据集和一个或多个第二空气传导数据集中的每一个可以包括由一个或多个音素组成的音节。
[0015]在一些实施例中,经过训练的机器学习模型可以提供在骨传导音频信号中的每个音节与空气传导音频信号中的一个或多个音节之间的映射关系。
[0016]在一些实施例中,在骨传导音频数据中的每个音节与一个或多个等效空气传导数据集中的一个或多个音节之间的映射关系可以包括,骨传导音频数据中的每个音节与一个或多个等效空气传导数据集中一个或多个音节中的每个音节匹配的概率。
[0017]根据本专利技术的另一方面,可以提供一种用于产生音频信号的系统。该系统可以包
括至少一个存储介质和与该至少一个存储介质通信的至少一个处理器。所述至少一个存储介质可以包括一组指令。当所述至少一个处理器执行所述指令集时,可以引导至少一个处理器使系统执行以下操作中的一个或多个。该系统可以获得由骨传导传感器获取的骨传导音频信号和由空气传导传感器获取的空气传导音频信号。骨传导音频信号和空气传导音频信号可以表示使用者的语音。该系统还可以获得经过训练的机器学习模型。该系统可以基于骨传导音频信号和空气传导音频信号,使用经过训练的机器学习模型来产生表示使用者语音的目标音频信号。该系统还可以使音频信号输出设备输出音频信号。目标音频信号的噪声等级可以小于空气传导音频信号的噪声等级。
[0018]根据本专利技术的又一方面,可以提供一种用于产生音频信号的方法。该方法可以包括获得由骨传导传感器获取的骨传导音频信号和本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种系统,包括:至少一存储介质,所述至少一存储介质包括指令集;与所述至少一存储介质通信的至少一处理器,其特征在于,当执行所述指令集时,所述至少一处理器使所述系统执行操作,所述操作包括:获得由骨传导传感器获取的骨传导音频信号;获得由空气传导传感器获取的空气传导音频信号,所述骨传导音频信号和所述空气传导音频信号表示使用者语音;获得经过训练的机器学习模型,所述经过训练的机器学习模型提供源于特定骨传导音频信号的骨传导数据集和源于特定等效空气传导音频信号的一个或多个等效空气传导数据集之间的映射关系;基于所述骨传导音频信号和所述空气传导音频信号,使用所述经过训练的机器学习模型来确定与所述骨传导音频信号相对应的等效空气传导数据目标集,所述等效空气传导数据目标集指示所述使用者语音的语义内容;以及基于所述等效空气传导数据目标集,使音频信号输出设备输出表示所述使用者语音的目标音频信号。2.如权利要求1所述的系统,其特征在于,基于所述骨传导音频信号和所述空气传导音频信号,确定与所述骨传导音频信号相对应的等效空气传导数据目标集,包括:基于所述骨传导音频信号,使用所述经过训练的机器学习模型来确定与所述骨传导音频信号相对应的一个或多个等效空气传导数据集;以及基于所述空气传导音频信号,从所述一个或多个等效空气传导数据集中识别所述等效空气传导数据目标集。3.如权利要求2所述的系统,其特征在于,基于所述骨传导音频信号,使用所述经过训练的机器学习模型来确定与所述骨传导音频信号相对应的一个或多个等效空气传导数据集,包括:将所述骨传导音频信号输入到所述经过训练的机器学习模型中,以获得与所述骨传导音频信号相对应的一个或多个等效空气传导数据集。4.如权利要求3所述的系统,其特征在于,基于所述骨传导音频信号,使用经过训练的机器学习模型来确定与所述骨传导音频信号相对应的一个或多个等效空气传导数据集,包括:从所述骨传导音频信号中提取骨传导声学特征;基于所述骨传导声学特征来确定所述骨传导数据集;以及将所述骨传导数据集输入到所述经过训练的机器学习模型中,以获得与所述骨传导音频信号相对应的一个或多个等效空气传导数据集。5.如权利要求3所述的系统,其特征在于,基于所述空气传导音频信号,从所述一个或多个等效空气传导数据中识别所述等效空气传导数据目标集,包括:从所述空气传导音频信号中提取空气传导声学特征;基于所述空气传导声学特征确定空气传导数据集;对于所述一个或多个等效空气传导数据集中的每一个,确定所述等效空气传导数据集与所述空气传导数据集之间的关联度;
确定所述一个或多个等效空气传导数据集中与所述空气传导数据集具有最大关联度的一个等效空气传导数据集;以及基于所述一个或多个等效空气传导数据集中的所述一个等效空气传导数据集,确定所述等效空气传导数据目标集。6.如权利要求1至5中任一项所述的系统,其特征在于,基于所述等效空气传导数据目标集,使所述音频信号输出设备输出表示所述使用者语音的目标音频信号,包括:将所述等效空气传导数据目标集转换为目标等效空气传导音频信号;基于所述目标等效空气传导音频信号确定所述目标音频信号;以及使所述音频信号输出设备输出所述目标音频信号。7.如权利要求6所述的系统,其特征在于,所述目标音频信号包括小于所述空气传导音频信号的噪声等级。8.如权利要求6所述的系统,其特征在于,基于所述目标等效空气传导音频信号来确定所述目标音频信号,包括:通过在所述目标等效空气传导音频信号中添加噪声来产生所述目标音频信号。9.如权利要求1所述的系统,其特征在于,所述经过训练的机器学习模型由流程提供,所述流程包括:获得多组训练数据,所述多组训练数据中的每组训练数据包括表示相同语音样本的第一音频信号和第二音频信号,其中,所述第一音频信号由骨传导音频采集设备采集,所述第二音频信号由空气传导音频采集设备在无噪声条件下采集;以及使用所述多组训练数据来训练初步机器学习模型,以获得所述经过训练的机器学习模型。10.如权利要求9所述的系统,其特征在于,基于隐马尔科夫模型构建所述初步机器学习模型。11.如权利要求9或10所述的系统,其特征在于,使用所述多组训练数据来训练初步机器学习模型,以获得所述经过训练的机器学习模型,包括:从所述第一音频信号中提取第一声学特征;从所述第二音频信号中提取第二声学特征;基于所述第一声学特征确定一个或多个第一骨传导数据集;基于所述第二声学特征确定一个或多个第二空气传导数据集;确定多对空气传导数据和骨传导数据,每对包括表示相同语义的第一骨传导数据集和第二空气传导数据集;以及基于所述多对空气传导数据集和骨传导数据集,在所述一个或多个第一骨传导数据集中的每一个与所述一个或多个第二空气传导数据集中的至少一个之间建立映射关系。12.如权利要求11所述的系统,其特征在于,所述一个或多个第一骨传导数据集和所述一个或多个第二空气传导数据集中的每一个包括由一个或多个音素组成的音节。13.如权利要求1所述的系统,其特征在于,所述经过训练的机器学习模型提供所述骨传导音频信号中的每个音节与所述空气传导音频信号中的一个或多个音节之间的映射关系。14.如权利要求13所述的系统,其特征在于,所述骨传导音频数据中的每个音节与一个
或多个所述等效空气传导数据中的一个或...

【专利技术属性】
技术研发人员:齐心
申请(专利权)人:深圳市韶音科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1