音质评价方法、装置及计算机存储介质制造方法及图纸

技术编号:32607773 阅读:15 留言:0更新日期:2022-03-12 17:32
本发明专利技术公开了一种音质评价方法、装置及计算机存储介质。音质评价方法,包括:获取待测均衡器参数调整后的待评价音乐;将所述待评价音乐输入预先训练好的神经网络;获取所述神经网络输出的对所述待评价音乐的在所述待测均衡器参数的音质的评价结果。可见,本发明专利技术实施例使用预先训练好的神经网络来评价音乐的音质,操作简单,无需组织专家团队,并且结果更加准确可靠。确可靠。确可靠。

【技术实现步骤摘要】
音质评价方法、装置及计算机存储介质


[0001]本专利技术实施例涉及声音领域,并且更具体地,涉及一种音质评价方法、装置及计算机存储介质。

技术介绍

[0002]音质的优劣取决于多种因素,为了对再现声音的质量进行评价,可以使用音质评价方法。一般地,音质评价方法包括主观评价和客观评价两种方法。
[0003]其中,主观评价方法是组织专家团队对声音的音质进行打分来评价,但是这种方式代价太高。其中,客观评价方法是使用仪器来测试声音的技术指标,但是这种测量方法与主观聆听方法差距比较大,会导致具有完美的频响曲线的声音的音质并不好。
[0004]因此,目前对再现的声音的音质评价的难度较大。

技术实现思路

[0005]本专利技术提供了一种音质评价方法、装置及计算机存储介质,能够方便进行音质评价,且结果准确可靠。
[0006]根据本专利技术的第一方面,提供了一种音质评价方法,包括:
[0007]获取待测均衡器参数调整后的待评价音乐;
[0008]将所述待评价音乐输入预先训练好的神经网络;
[0009]获取所述神经网络输出的对所述待评价音乐的在所述待测均衡器参数的音质的评价结果。
[0010]在本专利技术的一种实现方式中,将所述待评价音乐输入预先训练好的神经网络,包括:对所述待评价音乐进行傅立叶变换,进而得到所述待评价音乐的特征向量;将所述待评价音乐的特征向量输入所述预先训练好的神经网络。
[0011]在本专利技术的一种实现方式中,所述神经网络通过下述方式训练得到:构建训练集,所述训练集包括多个训练数据以及与所述多个训练数据对应的音质评价,每个训练数据包括音频信息以及对应的均衡器参数,且所述对应的音质评价为所述音频信息在不同的均衡器参数下的音质的评价;基于所述训练集对所述神经网络进行训练。
[0012]在本专利技术的一种实现方式中,所述构建训练集,包括:针对某一个音频信息,进行多种不同的均衡器参数调整,并获取某一个人针对所述多种不同的均衡器参数调整后的所述音频信息的音质评价。
[0013]在本专利技术的一种实现方式中,所述基于所述训练集对所述神经网络进行训练,包括:对所述训练集中的训练数据进行预处理,得到预处理后的数据;提取所述预处理后的数据的特征向量;将所述特征向量输入至所述神经网络进行训练。
[0014]在本专利技术的一种实现方式中,所述预处理包括:将所述训练集中的训练数据按照预定时长进行截断,得到具有多个预定时长的数据。
[0015]在本专利技术的一种实现方式中,所述提取所述预处理后的数据的特征向量,包括:将
所述预处理后的数据进行快速傅立叶变换、交叠、梅尔谱变换,进而得到每个数据的特征向量。
[0016]第二方面,提供了一种音质评价装置,所述装置用于实现前述第一方面或任一实现方式所述方法的步骤,所述装置包括:
[0017]获取模块,用于获取待测均衡器参数调整后的待评价音乐;
[0018]输入模块,用于将所述待评价音乐输入预先训练好的神经网络;
[0019]输出模块,用于获取所述神经网络输出的对所述待评价音乐的在所述待测均衡器参数的音质的评价结果。
[0020]第三方面,提供了一种音质评价装置,包括存储器、处理器及存储在所述存储器上且在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现前述第一方面或任一实现方式所述方法的步骤。
[0021]第四方面,提供了一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现前述第一方面或任一实现方式所述方法的步骤。
[0022]可见,本专利技术实施例在进行训练集构建的过程中,兼顾了客观与主观的方法,并使用深度学习技术进行训练,得到了可靠的用于评价音质的神经网络,并且该神经网络得到的音质评价不仅成本低,无需组织大量的专家团队人力,而且结果准确可靠。
附图说明
[0023]通过结合附图对本专利技术实施例进行更详细的描述,本专利技术的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本专利技术实施例的进一步理解,并且构成说明书的一部分,与本专利技术实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
[0024]图1是现有技术仪器测试耳机的频响曲线的一个场景图;
[0025]图2是现有技术专家团队对耳机的音质进行打分的一个场景图;
[0026]图3是本专利技术实施例的对神经网络进行训练的一个示意图;
[0027]图4是本专利技术实施例的训练正确率的一个示意图;
[0028]图5是本专利技术实施例的训练误差的一个示意图;
[0029]图6是本专利技术实施例的验证正确率的一个示意图;
[0030]图7是本专利技术实施例的音质评价方法的一个示意性流程图;
[0031]图8是本专利技术实施例的音质评价装置的一个示意性框图;
[0032]图9是本专利技术实施例的音质评价装置的另一个示意性框图。
具体实施方式
[0033]为了使得本专利技术的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本专利技术的示例实施例。显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是本专利技术的全部实施例,应理解,本专利技术不受这里描述的示例实施例的限制。基于本专利技术中描述的本专利技术实施例,本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本专利技术的保护范围之内。
[0034]声音(例如音乐等)的音质的优劣取决于多种因素,包括但不限于:声源特性、音响
器材的信号特性、声场特性、听觉特性等。其中,声源特性可以包括例如声压、频率、频谱等;音响器材的信号特性可以包括例如失真度、频响、动态范围、信噪比、瞬态特性、立体声分离度等;声场特性可以包括例如直达声、前期反射声、混响声、两耳间互相关系数、基准振动、吸声率等;听觉特性可以包括例如响度曲线、可听范围、各种听感等。因此,也就导致了对音质进行的评价的难度较大。
[0035]客观评价的方法是使用仪器测试技术指标,例如可以测试器材(如耳机)的频响曲线。示例性地,测试耳机的频响曲线的一个场景图如图1所示。图1中,用于测试的仪器包括测试部分、测试套件1、测试套件2和测试套件3,其中,测试套件3为信号发生器、测试套件2为测试主要部分、测试套件1为接收器。具体地,可以由电脑产生扫频信号,如200Hz~8kHz,经由信号发生器输入至待测的耳机,对耳机的输出进行测试,得到频响曲线。进一步地,可以将得到的频响曲线与目标频响曲线进行比对,进而能够客观地判断音质的好坏。
[0036]主观评价的方法是组织专家团队,并由专家团队进行打分。示例性地,一个场景图如图2所示。图2中,电脑产生声音,随后可以对该声音的均衡器(Equalizer,eq)参数进行不同的调整,得到若干个调整后的声音,通过耳机输出,由专家团队打分确定哪个eq参数对应的音质高,如图2中的位于上面的一支。图2中,电脑产生声音,通过不同的耳机输出,由专家团队打分确定哪个耳本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音质评价方法,其特征在于,包括:获取待测均衡器参数调整后的待评价音乐;将所述待评价音乐输入预先训练好的神经网络;获取所述神经网络输出的对所述待评价音乐的在所述待测均衡器参数的音质的评价结果。2.根据权利要求1所述的方法,其特征在于,将所述待评价音乐输入预先训练好的神经网络,包括:对所述待评价音乐进行傅立叶变换,进而得到所述待评价音乐的特征向量;将所述待评价音乐的特征向量输入所述预先训练好的神经网络。3.根据权利要求1或2所述的方法,其特征在于,所述神经网络通过下述方式训练得到:构建训练集,所述训练集包括多个训练数据以及与所述多个训练数据对应的音质评价,每个训练数据包括音频信息以及对应的均衡器参数,且所述对应的音质评价为所述音频信息在不同的均衡器参数下的音质的评价;基于所述训练集对所述神经网络进行训练。4.根据权利要求3所述的方法,其特征在于,所述构建训练集,包括:针对某一个音频信息,进行多种不同的均衡器参数调整,并获取某一个人针对所述多种不同的均衡器参数调整后的所述音频信息的音质评价。5.根据权利要求3所述的方法,其特征在于,所述基于所述训练集对所述神经网络进行训练,包括:...

【专利技术属性】
技术研发人员:章浩侯杰秦宇
申请(专利权)人:安克创新科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1