对音乐进行通透处理的方法及设备技术

技术编号:30223473 阅读:21 留言:0更新日期:2021-09-29 09:44
本发明专利技术实施例提出了一种对音乐进行通透处理的方法及设备。该方法包括:获取待播放音乐的特征;将所述特征输入至通透增强神经网络,得到通透增强参数,所述通透增强参数用于对所述待播放音乐进行通透处理。由此可见,本发明专利技术实施例中可以构建通透增强神经网络,具体地基于深度学习预先构建通透概率神经网络并且构建可通透概率与通透增强参数之间的映射关系,从而可以对待播放音乐自动地进行通透处理。该过程极大地简化用户的操作的同时,保证音乐的音质,从而提升了用户体验。从而提升了用户体验。从而提升了用户体验。

【技术实现步骤摘要】
对音乐进行通透处理的方法及设备
[0001]本申请是申请日为2018年6月5日、申请号为201810583109.0、专利技术创造名称为“对音乐进行通透处理的方法及设备”的分案申请


[0002]本专利技术实施例涉及声音领域,并且更具体地,涉及一种对音乐进行通透处理的方法及设备。

技术介绍

[0003]音质是人对音频质量的主观评价。一般地音质被划分成几十个指标,这些指标中音乐的通透性(transparency)是音乐音质的一项重要指标,它指的是音乐中类似混响和回音的效果,有适当的回音会使音乐具有空间感,形成余音绕梁的效果。某些类型的音乐,如交响乐、有大自然风格的音乐,通透度被增强会产生更好的音质效果,但并不是所有类型音乐都适合通透度增强,因此判断哪些音乐适合通透度增强,增强参数如何设置,就成了通透度调整的主要问题。
[0004]目前的音质调节(如通透性调节)方法,主要是由用户自己调节,如用户手动选择是否对音乐进行混响效果处理,选择事先给定的一组参数产生特定环境的混响效果,如产生小房间,浴室之类的混响效果,这样给用户带来了操作复杂度,影响了用户的体验。

技术实现思路

[0005]本专利技术实施例提供了一种对音乐的通透性进行自动调节的方法及设备,可以基于深度学习实现对音乐的通透性进行调节,免去用户操作,从而提升了用户的体验。
[0006]第一方面,提供了一种对音乐进行通透处理的方法,包括:
[0007]获取待播放音乐的特征;
[0008]将所述特征输入至通透概率神经网络,得到所述待播放音乐的可通透概率;
[0009]确定与所述可通透概率对应的通透增强参数,所述通透增强参数用于对所述待播放音乐进行通透处理。
[0010]在本专利技术的一种实现方式中,在所述将所述特征输入至通透概率神经网络之前,还包括:
[0011]基于训练数据集,通过训练得到所述通透概率神经网络。
[0012]在本专利技术的一种实现方式中,所述训练数据集中的每个训练数据均为音乐数据,且每个训练数据均具有特征以及可通透概率。
[0013]在本专利技术的一种实现方式中,通过以下方式得到所述训练数据的特征:
[0014]获取所述训练数据的时域波形;
[0015]对所述时域波形进行分帧;
[0016]对所述分帧后的每帧进行特征提取得到所述训练数据的所述特征。
[0017]在本专利技术的一种实现方式中,通过以下方式得到所述训练数据的可通透概率:
[0018]对所述训练数据进行通透处理,得到处理后的训练数据;
[0019]获取一组评测者中每个评测者的打分,所述打分表示所述处理后的训练数据的音质在所述评测者的主观上是否优于所述训练数据的音质;
[0020]根据所有评测者的打分得到所述训练数据的所述可通透概率。
[0021]在本专利技术的一种实现方式中,所述根据所有评测者的打分得到所述训练数据的所述可通透概率,包括:
[0022]将所述所有评测者的打分的均值确定为所述训练数据的所述可通透概率。
[0023]在本专利技术的一种实现方式中,所述确定与所述可通透概率对应的通透增强参数,包括:
[0024]根据预先构建的可通透概率与通透增强参数之间的映射关系,确定与所述可通透概率对应的所述通透增强参数。
[0025]在本专利技术的一种实现方式中,所述映射关系被预先设定为:
[0026]若所述可通透概率大于阈值,则所述通透增强参数为p0。
[0027]在本专利技术的一种实现方式中,通过以下方式确定所述映射关系:
[0028]对可通透概率为s的未通透音乐进行多个通透处理,通透增强参数依次为:p+Δp*i,i=0,1,2


[0029]获取所述多个通透处理对应的多个主观感受t(i),其中t(i)是基于多个评测者对按照通透参数p+Δp*i处理后的音乐的音质与按照通透参数p+Δp*(i

1)处理后的音乐的音质进行比较打分得到的;
[0030]根据t(i)的大小关系确定所述映射关系。
[0031]在本专利技术的一种实现方式中,所述根据t(i)的大小关系确定所述映射关系,包括:
[0032]若满足t(n+1)<t(n),且t(j+1)>t(j),j=0,1,

,n

1,则确定所述映射关系中与可通透概率s所对应的通透增强参数为p+Δp*n。
[0033]在本专利技术的一种实现方式中,还包括:
[0034]基于所述通透增强参数对所述待播放音乐进行通透处理;
[0035]播放所述通透处理后的音乐。
[0036]第二方面,提供了一种对音乐进行通透处理的方法,包括:
[0037]获取待播放音乐的特征;
[0038]将所述特征输入至通透增强神经网络,得到通透增强参数,所述通透增强参数用于对所述待播放音乐进行通透处理。
[0039]在本专利技术的一种实现方式中,在将所述特征输入至通透增强神经网络之前,还包括:
[0040]基于训练数据集,通过训练得到所述通透增强神经网络,其中所述训练数据集中的每个训练数据均为音乐数据,且每个训练数据均具有特征以及推荐的通透增强参数。
[0041]第三方面,提供了一种对音乐进行通透处理的设备,所述设备用于实现前述第一方面或任一实现方式所述方法的步骤,所述设备包括:
[0042]获取模块,用于获取待播放音乐的特征;
[0043]可通透概率确定模块,用于将所述特征输入至通透概率神经网络,得到所述待播放音乐的可通透概率;
[0044]通透增强参数确定模块,用于确定与所述可通透概率对应的通透增强参数,所述通透增强参数用于对所述待播放音乐进行通透处理。
[0045]第四方面,提供了一种对音乐进行通透处理的设备,所述设备用于实现前述第二方面或任一实现方式所述方法的步骤,所述设备包括:
[0046]获取模块,用于获取待播放音乐的特征;
[0047]确定模块,用于将所述特征输入至通透增强神经网络,得到通透增强参数,所述通透增强参数用于对所述待播放音乐进行通透处理。
[0048]第五方面,提供了一种对音乐进行通透处理的设备,包括存储器、处理器及存储在所述存储器上且在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现前述第一方面或第二方面或任一实现方式所述方法的步骤。
[0049]第六方面,提供了一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现前述第一方面或第二方面或任一实现方式所述方法的步骤。
[0050]由此可见,本专利技术实施例中可以构建通透增强神经网络,具体地基于深度学习预先构建通透概率神经网络并且构建可通透概率与通透增强参数之间的映射关系,从而可以对待播放音乐自动地进行通透处理。该过程极大地简化用户的操作的同时,保证音乐的音质,从而提升了用户体验本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对音乐进行通透处理的方法,其特征在于,包括:获取待播放音乐的特征;将所述特征输入至通透增强神经网络,得到通透增强参数,所述通透增强参数用于对所述待播放音乐进行通透处理。2.根据权利要求1所述的方法,其特征在于,在将所述特征输入至通透增强神经网络之前,还包括:基于训练数据集,通过训练得到所述通透增强神经网络。3.根据权利要求2所述的方法,其特征在于,其中所述训练数据集中的每个训练数据均为音乐数据,且每个训练数据均具有特征以及推荐的通透增强参数。4.根据权利要求3所述的方法,其特征在于,通过以下方式得到所述训练数据的特征:获取所述训练数据的时域波形;对所述时域波形进行分帧;对所述分帧后的每帧进行特征提取得到所述训练数据的所述特征。5.根据权利要求3所述的方法,其特征在于,通过以下方式得到所述训练数据的通透增强参数:对所述训练数据进行通透处理,得到处理后的训练数据;获取一组评测者中每个评测者的打分,所述打分表示所述处理后的训练数据的音质在所述评测者的主观上是否优于所述训练数据的音质;根据所有评测者的打分得到所述训练数据的可通透概率;根据预先构建的可通透概率与通透增强参数之间的映射关系,确定与可通透概率对应的通透增强参数。6.根据权利要求5所述的方法,其特征在于,所述根据所有评测者的打分得到所述训练数据的所述可通透概率,包括:将所述所有评测者的打分的均值确定为所述训练数据的所述可通透概率。7.根据权利要求5所述的方法,其特征在于,所述确定与所述可通透概率对应的通透增强参数,包括:根据预先构建的可通透概率与通透增强参数之间的映射关系,确定与所述可通透概率对应的所述通透增强参数。8.根据权利要求7所述的方法,其特征在于,所述映射关系被预先设定为:若所述可通...

【专利技术属性】
技术研发人员:姚青山秦宇喻浩文卢峰
申请(专利权)人:安克创新科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1