【技术实现步骤摘要】
【国外来华专利技术】使用嵌套卷积神经网络架构进行音频处理的方法和装置
[0001]相关申请的交叉引用
[0002]本申请要求以下优先申请的优先权:于2020年10月19日提交的PCT国际申请PCT/CN2020/121829,于2020年11月11日提交的美国临时申请63/112,220,于2020年12月3日提交的欧洲申请20211501.0,于2021年3月2日提交的PCT国际申请PCT/CN2021/078705,以及于2021年3月22日提交的美国临时申请63/164,028。
[0003]本公开总体上涉及使用卷积神经网络(CNN)进行音频处理的方法和装置。更具体地,本公开涉及使用聚合多尺度嵌套CNN架构从原始有噪语音信号中提取语音。
[0004]尽管本文将特别参考该公开内容来描述一些实施例,但是应当理解,本公开不限于这种使用领域,并且可应用于更广泛的背景。
技术介绍
[0005]在整个公开内容中对
技术介绍
的任何讨论绝不应视为承认这种技术是本领域众所周知的或形成本领域公知常识的一部分。
[0006]深度神经网络(DNN)已经成为解决各种音频处理问题的可行选择。DNN的类型包括前馈多层感知器(MLP)、卷积神经网络(CNN)、循环神经网络(RNN)和生成对抗网络(GAN)。其中,CNN是一类前馈网络。
[0007]近年来,CNN架构已经被用于音频处理领域。特别地,CNN架构已经被成功地应用于各种音频处理问题,包括声音分离、语音增强和语音源分离。语音源分离旨在从背景干扰中恢复目标语音,并在语音 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种实施卷积神经网络(CNN)架构的计算系统,所述CNN架构包括多尺度输入块和多尺度嵌套块,其中,所述多尺度输入块被配置为
·
接收输入数据,
·
通过对所述输入数据进行下采样来生成第一下采样输入数据集,以及并且其中,所述多尺度嵌套块包括:
·
第一编码层,所述第一编码层被配置为通过基于所述输入数据执行卷积来生成第一编码数据集,
·
第二编码层,所述第二编码层被配置为通过基于所述第一下采样输入数据集执行卷积来生成第二编码数据集,以及
·
第一卷积层,所述第一卷积层被配置为通过基于所述第一编码数据集和上采样的第二编码数据集执行卷积来生成第一输出数据集,其中,所述上采样的第二编码数据集是通过对所述第二编码数据集进行上采样而获得的。2.根据权利要求1所述的计算系统,其中,所述多尺度嵌套块进一步包括:
·
第二卷积层,所述第二卷积层被配置为通过基于所述第二编码数据集执行卷积来生成第二输出数据集;以及
·
第三卷积层,所述第三卷积层被配置为通过基于所述第一输出数据集和上采样的第二输出数据集执行卷积来生成第三输出数据集,其中,所述上采样的第二输出数据集是通过对所述第二输出数据集进行上采样而获得的。3.根据权利要求2所述的计算系统,其中,
·
所述多尺度输入块进一步被配置为通过对所述第一下采样输入数据集进行下采样来生成第二下采样输入数据集,
·
所述多尺度嵌套块进一步包括第三编码层,所述第三编码层被配置为通过基于所述第二下采样输入数据集执行卷积来生成第三编码数据集,并且
·
所述第二卷积层被配置为通过基于所述第二编码数据集和上采样的第三编码数据集执行卷积来生成所述第二输出数据集,其中,所述上采样的第三编码数据集是通过对所述第三编码数据集进行上采样而获得的。4.根据前述权利要求中任一项所述的计算系统,其中,
·
所述第二编码层被配置为通过基于所述第一下采样输入数据集和下采样的第一编码数据集执行卷积来生成所述第二编码数据集,其中,所述下采样的第一编码数据集是通过对所述第一编码数据集进行下采样而获得的。5.根据权利要求2至4中任一项所述的计算系统,其中,
·
所述第二卷积层被配置为通过基于所述第二编码数据集、下采样的第一输出数据集和上采样的第三编码数据集执行卷积来生成所述第二输出数据集,其中,所述下采样的第一输出数据集是通过对所述第一输出数据集进行下采样而获得的,并且所述上采样的第三编码数据集是通过对所述第三编码数据集进行上采样而获得的。6.根据权利要求2至5中任一项所述的计算系统,其中,
·
所述第三卷积层被配置为通过基于所述第一输出数据集、上采样的第二输出数据集和所述第一编码数据集执行卷积来生成所述第三输出数据集,其中,所述上采样的第二输出数据集是通过对所述第二输出数据集进行上采样而获得的。7.根据权利要求3或从属于权利要求3的任何权利要求所述的计算系统,其中,
·
所述
第三编码层被配置为通过基于所述第二下采样输入数据集、下采样的第一编码数据集和下采样的第二编码数据集执行卷积来生成所述第三编码数据集,其中,所述下采样的第一编码数据集是通过对所述第一编码数据集进行下采样而获得的,并且所述下采样的第二编码数据集是通过对所述第二编码数据集进行下采样而获得的。8.根据权利要求2至7中任一项所述的计算系统,其中,所述CNN架构包括加权加法块,所述加权加法块被配置为
·
将第一权重应用于所述第三输出数据集,
·
将第二权重应用于所述第二输出数据集,以及
·
基于所述加权的第三输出数据集和所述加权的第二输出数据集生成所述多尺度嵌套块的输出。9.根据前述权利要求中任一项所述的计算系统,其中,
·
所述第一编码层被配置为通过基于所述输入数据和上采样的第一下采样输入数据集执行卷积来生成所述第一编码数据集,其中,所述上采样的第一下采样输入数据集是通过对所述第一下采样输入数据集进行上采样而获得的,或者
·
所述第二编码层被配置为通过基于所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。