一种信号处理方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号：25759370 阅读：20 留言：0更新日期：2020-09-25 21:07

本发明专利技术实施例提供一种信号处理方法、装置、设备及计算机可读存储介质。其中方法可包括：采集待处理的音频信号，并提取待处理的音频信号的频谱特征，该频谱特征包括N维对数能量频谱特征；调用噪声优化模型对对数能量频谱特征进行处理，得到N维对数能量频谱特征对应的M维噪声修正系数，N和M为正整数；对N维对数能量频谱特征和M维噪声修正系数进行计算，得到处理后的音频信号。本申请实施例通过噪声优化模型来生成噪声修正系数，并通过噪声修正系数来降低或消除待处理的音频信号中的噪声，从而提高通信质量。

全部详细技术资料下载

【技术实现步骤摘要】
一种信号处理方法、装置、设备及计算机可读存储介质
本专利技术涉及计算机
，具体涉及一种信号处理方法、装置、设备及计算机可读存储介质。
技术介绍
随着通信技术的不断发展，人们对信号质量的要求不断提高，特别是在一些诸如利用计算机网络、移动通信网络召开网络会议的场景下，既希望会议的通话信号清晰可辨，又能够最大限度地减少一些随着参会人员的语音一并输入的非必要的信号。在一个场景中，该非必要信号主要是指噪声信号，该噪声信号可以是一些不需要的回声音频信号。在多方远程会议的场景中，会出现多端参会人员同时说话的情况，此时，本地的语音通信设备不仅要播放其他地区参会人员的语音，还要收集本地的参会人员的本地语音，由于会议室环境等因素的影响，语音通信设备收集到的本地语音中会存在一部分特殊的噪声信号，比如会议室反射的关于所述语音通信设备所播放语音的回声。这些回声信号会给诸如交互的会议语音信号带来不利影响，比如这些回声可能在语音会议中带来“滋啦”等杂音，降低了语音交互的质量。
技术实现思路
本专利技术实施例提供一种信号处理方法、装置、设备及计算机可读存储介质，可提高语音交互的质量。一方面，本申请实施例提供了一种信号处理方法，该方法包括：采集待处理的音频信号，并提取所述待处理的音频信号的频谱特征，所述频谱特征包括N维对数能量频谱特征；调用噪声优化模型对所述对数能量频谱特征进行处理，得到所述N维对数能量频谱特征对应的M维噪声修正系数，N和M为正整数；对所述N维对数能量频谱特征和...

【技术保护点】
1.一种信号处理方法，其特征在于，所述方法包括：/n采集待处理的音频信号，并提取所述待处理的音频信号的频谱特征，所述频谱特征包括N维对数能量频谱特征；/n调用噪声优化模型对所述N维对数能量频谱特征进行处理，得到所述N维对数能量频谱特征对应的M维噪声修正系数，N和M为正整数；/n对所述N维对数能量频谱特征和所述M维噪声修正系数进行计算，得到处理后的音频信号；/n其中，所述噪声优化模型是根据包括噪声音频信号的音频训练数据训练得到的，所述噪声优化模型输出的M维噪声修正系数中包括：用于对输入的N维对数能量频谱特征中关于噪声音频信号的特征进行修正的p维系数，p小于M。/n

【技术特征摘要】
1.一种信号处理方法，其特征在于，所述方法包括：
采集待处理的音频信号，并提取所述待处理的音频信号的频谱特征，所述频谱特征包括N维对数能量频谱特征；
调用噪声优化模型对所述N维对数能量频谱特征进行处理，得到所述N维对数能量频谱特征对应的M维噪声修正系数，N和M为正整数；
对所述N维对数能量频谱特征和所述M维噪声修正系数进行计算，得到处理后的音频信号；
其中，所述噪声优化模型是根据包括噪声音频信号的音频训练数据训练得到的，所述噪声优化模型输出的M维噪声修正系数中包括：用于对输入的N维对数能量频谱特征中关于噪声音频信号的特征进行修正的p维系数，p小于M。

2.如权利要求1所述的方法，其特征在于，所述方法还包括：
在播放有音频信号的目标环境中采集噪声音频信号；
获取人声音频信号；
将获取到的人声音频信号和噪声音频信号在时域上叠加，得到混合音频信号，根据所述混合音频信号生成音频训练数据；
其中，所述音频训练数据包括X段混合音频信号，第i段混合音频信号包括人声音频信号与噪声音频信号，其中，i，X为正整数，且i小于或等于X。

3.如权利要求1所述的方法，其特征在于，所述方法还包括：
在播放有音频信号的多个目标环境中进行音频录制操作，得到多段噪声音频信息，每段噪声音频信息包括噪声音频信号和录制设备信息；
根据所述多段噪声音频信息生成各录制设备信息所对应的音频训练数据；
其中，所述音频训练数据包括Y段噪声音频信号，其中Y为正整数。

4.如权利要求2所述的方法，其特征在于，
所述噪声优化模型是将基于第一干净对数频谱特征、与第二干净对数频谱特征的均方误差构建的损失函数来对初始模型进行优化后得到的；
所述第一干净对数频谱特征是根据所述音频训练数据中的混合音频信号、和通过所述初始模型对所述音频训练数据中的混合音频信号进行处理后输出的训练噪声修正系数相乘后得到的，所述第二干净频谱特征是根据所述人声音频信号得到的。

5.如权利要求4所述的方法，其特征在于，
构建的所述初始模型输出的训练噪声修正系数用于体现第二干净对数频谱特征所对应的人声音频信号的对数频谱能量、与混合音频信号所对应的对数频谱能量的比值；
其中，所述混合音频信号所对应的对数频谱能量为：混合音频信号中噪声音频的对数频谱能量、与混合音频信号中人声音频信号的对数频谱能量之和。

6.如权利要求1所述的方法，其特征在于，所述待处理的音频信号是在检测到进入会议会话界面时采集到的，所述处理后的音频信号是指所述N维对数能量频谱特征和所述M维噪...

【专利技术属性】
技术研发人员：夏咸军，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人