音乐标签的预测方法、相关设备技术

技术编号:32298860 阅读:20 留言:0更新日期:2022-02-12 20:09
本申请实施例提供了一种音乐标签的预测方法、相关设备,其中方法包括按照目标采样率加载目标音乐,目标音乐对应多个加载采样率,目标采样率是多个加载采样率中的其中一个;在通过加载目标音乐得到目标音频数据后,根据目标采样率动态计算目标音频数据对应的傅里叶变换参数;基于计算出的傅里叶变换参数对目标音频数据进行变采样离散傅里叶变换,得到目标频谱图;根据目标频谱图对目标音乐的类别进行预测,得到目标音乐的类别预测标签。本申请具有较高的适用性,可以提升标签预测的处理效率,以及节省标签预测所需的成本。以及节省标签预测所需的成本。以及节省标签预测所需的成本。

【技术实现步骤摘要】
音乐标签的预测方法、相关设备


[0001]本申请涉及音频处理
,尤其涉及一种音乐标签的预测方法、相关设备。

技术介绍

[0002]近年来,随着数字音乐行业的迅速发展,用户可以通过各类音乐播放平台对海量的音乐进行收听。音乐播放平台可以预先对音乐设定语种、风格等类别标签,以便用户可以在进行音乐检索时利用这些类别标签,查找到满足个性化需求的资源。目前,在对预测不同音乐的类别标签时,通常需先按照一个固定采样率对不同音乐进行数据插分处理,以将不同音乐统一成标准格式的采样数据,再基于标准格式的采样数据对各个音乐进行类别标签的预测。然而,数据插分处理这一操作会消耗大量的处理时间和处理资源,这样会导致标签预测的处理效率较低,且标签预测所需的成本较高。

技术实现思路

[0003]本申请实施例提供一种音乐标签的预测方法、相关设备,具有较高的适用性,可以提升标签预测的处理效率,以及节省标签预测所需的成本。
[0004]一方面,本申请实施例提供了一种音乐标签的预测方法,该方法包括:按照目标采样率加载目标音乐,所述目标音乐对应多个加载采样率,所述目标采样率是所述多个加载采样率中的其中一个;在通过加载所述目标音乐得到目标音频数据后,根据所述目标采样率动态计算所述目标音频数据对应的傅里叶变换参数;基于计算出的傅里叶变换参数对所述目标音频数据进行变采样离散傅里叶变换,得到目标频谱图;根据所述目标频谱图对所述目标音乐的类别进行预测,得到所述目标音乐的类别预测标签。
[0005]另一方面,本申请实施例提供了一种音乐标签预测装置,该装置包括:加载单元,用于按照目标采样率加载目标音乐,所述目标音乐对应多个加载采样率,所述目标采样率是所述多个加载采样率中的其中一个;处理单元,用于在通过加载所述目标音乐得到目标音频数据后,根据所述目标采样率动态计算所述目标音频数据对应的傅里叶变换参数;所述处理单元,还用于基于计算出的傅里叶变换参数对所述目标音频数据进行变采样离散傅里叶变换,得到目标频谱图;预测单元,用于根据所述目标频谱图对所述目标音乐的类别进行预测,得到所述目标音乐的类别预测标签。
[0006]再一方面,本申请实施例提供了一种计算机设备,包括输入接口和输出接口,所述计算机设备还包括:处理器,适于实现一条或多条指令;以及,
计算机存储介质,所述计算机存储介质存储有一条或多条指令,所述一条或多条指令适于由所述处理器加载并执行如下步骤:按照目标采样率加载目标音乐,所述目标音乐对应多个加载采样率,所述目标采样率是所述多个加载采样率中的其中一个;在通过加载所述目标音乐得到目标音频数据后,根据所述目标采样率动态计算所述目标音频数据对应的傅里叶变换参数;基于计算出的傅里叶变换参数对所述目标音频数据进行变采样离散傅里叶变换,得到目标频谱图;根据所述目标频谱图对所述目标音乐的类别进行预测,得到所述目标音乐的类别预测标签。
[0007]再一方面,本申请实施例提供了一种计算机存储介质,所述计算机存储介质中存储有一条或多条指令,所述一条或多条指令适于由所述处理器加载并执行上述所提及的音乐标签的预测方法。
[0008]再一方面,本申请实施例提供了一种计算机程序产品,该计算机程序产品包括计算机程序,所述计算机程序被处理器执行时,实现上述所提及的音乐标签的预测方法。
[0009]本申请实施例可在加载目标音乐得到目标音频数据后,根据音乐加载时所使用目标采样率来动态计算傅里叶变换系数,从而基于动态计算得到的傅里叶变换系数来对目标音频数据进行变采样离散傅里叶变换,来得到目标频谱图,进而基于该目标频谱图来预测得到目标音乐的类别预测标签。由此可见,在整个音乐标签的预测过程中,频谱图的生成与加载音乐时所采用的采样率相关,这样可使得本申请实施例针对采用任一采样率所得到的音频数据,均可对其进行傅里叶变换,使得本申请实施例具有较高的适用性。并且,通过参考音乐加载时所采用的采样率来进行变采样傅里叶变换,可使得在加载目标音乐得到目标音频数据的过程中,无需对目标音乐进行数据插分等处理,这样不仅可减少处理过程的耗时,提高了处理效率,还可有效节省标签预测所需的成本。
附图说明
[0010]为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。
[0011]图1是本申请实施例提供的一种音乐标签预测方案的流程示意图;图2a是本申请实施例提供的一种由终端和服务器共同执行音乐标签预测方案的示意图;图2b是本申请实施例提供的又一种由终端和服务器共同执行音乐标签预测方案的示意图;图3是本申请实施例提供的一种音乐标签的预测方法的流程示意图;图4是本申请实施例提供的一种音频数据分帧原理示意图;图5是本申请实施例提供的一种分类模型的训练方法的流程示意图;图6是本申请实施例提供的一种相同音乐采取不同加载采样率得到的对数梅尔频谱示意图;图7是本申请实施例提供的一种用于预测类别标签的卷积神经网络模型架构示意
图;图8是本申请实施例提供的一种音乐标签预测装置的结构示意图;图9是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
[0012]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0013]本申请实施例涉及人工智能(artificial intelligence,AI),所谓的AI是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,其主要通过了解智能的实质,生产出一种新的能以人类智能相似的方式做出反应的智能机器,使得智能机器具有感知、推理与决策等多种功能。
[0014]具体的,AI技术可包括但不限于机器学习(machine learning,ML)技术;所谓的机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是AI的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习/深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
[0015]基于AI技术中的机器学习技术,本申请实施例提出了一种基于神经网络模型的音乐标签预测方案;此处的神经网络模型是指具有预测音乐的类别标签这一能力的模型,后续可称为分类模型。具体的,该方案主要包括模型优化过程和模型推理过程(即模型的实际应用过程);并且,各过程的大致原理如下:在模型优化过程中,可对分类模型的样本音乐随机选取采样率进行加载,以得到样本音频数据;然后,可按照针对样本音乐所采用的采样率,对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音乐标签的预测方法,其特征在于,包括:按照目标采样率加载目标音乐,所述目标音乐对应多个加载采样率,所述目标采样率是所述多个加载采样率中的其中一个;在通过加载所述目标音乐得到目标音频数据后,根据所述目标采样率动态计算所述目标音频数据对应的傅里叶变换参数;基于计算出的傅里叶变换参数对所述目标音频数据进行变采样离散傅里叶变换,得到目标频谱图;根据所述目标频谱图对所述目标音乐的类别进行预测,得到所述目标音乐的类别预测标签。2.如权利要求1所述的方法,其特征在于,所述根据所述目标采样率动态计算所述目标音频数据对应的傅里叶变换参数,包括:根据所述目标采样率,对所述目标音频数据进行变采样离散傅里叶变换时所需的帧移参数进行动态计算,得到目标帧移参数;确定所述目标音乐的音乐时长,并基于所述音乐时长、所述目标帧移参数以及所述目标采样率计算所述目标音频数据对应的分帧数;将所述目标帧移参数和所述分帧数,添加至所述目标音频数据对应的傅里叶变换参数中。3.如权利要求2所述的方法,其特征在于,所述根据所述目标采样率,对所述目标音频数据进行变采样离散傅里叶变换时所需的帧移参数进行动态计算,得到目标帧移参数,包括:确定基准帧移参数,以及所述基准帧移参数所对应的固定采样率;其中,所述基准帧移参数是指任一音频数据进行离散傅里叶变换时所需的帧移参数;计算所述目标采样率和所述固定采样率之间的比例,并根据计算得到的比例对所述基准帧移参数进行动态缩放处理,得到所述目标音频数据在进行变采样离散傅里叶变换时所需的目标帧移参数。4.如权利要求2或3所述的方法,其特征在于,所述基于所述音乐时长、所述目标帧移参数以及所述目标采样率计算所述目标音频数据对应的分帧数,包括:根据所述音乐时长和所述目标采样率,计算所述目标音频数据包括的时间点位的点位数;对所述点位数和所述目标帧移参数进行求和运算,并根据求和运算结果和所述目标帧移参数之间的比值,得到所述目标音频数据对应的分帧数。5.如权利要求1所述的方法,其特征在于,所述目标音乐的类别预测标签是通过调用目标模型进行标签预测得到的,所述目标音乐被下载至多个终端设备中,加载采样率是指终端设备存储所述目标音乐时所使用的采样率;所述方法包括:响应于所述多个终端设备中的目标终端设备上传所述目标音乐的请求,从所述请求中解析出所述目标终端设备对应的加载采样率;...

【专利技术属性】
技术研发人员:彭博
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1