一种歌曲识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:35119591 阅读:32 留言:0更新日期:2022-10-05 09:48
本申请涉及计算机技术领域,公开了一种歌曲识别方法、装置、电子设备及存储介质,通过采用预先构建的分类模型对待检测音频片段进行特征提取,得到待检测音频片段的特征信息后,将待检测音频片段的特征信息与原唱音频的特征信息进行比较;若待检测音频片段的特征信息与原唱音频的特征信息之间的相似度大于预设相似度,则确定待检测音频片段为翻唱音频,从而可以准确识别音频为原唱音频或翻唱音频。而可以准确识别音频为原唱音频或翻唱音频。而可以准确识别音频为原唱音频或翻唱音频。

【技术实现步骤摘要】
一种歌曲识别方法、装置、电子设备及存储介质


[0001]本申请涉及人工智能
,尤其涉及一种歌曲识别方法、装置、电子设备及存储介质。

技术介绍

[0002]伴随网络的高速发展,移动终端可实现的功能也越来越多,尤其是智能手机、平板电脑等智能移动终端的普及,使得音乐爱好者仅仅通过智能移动终端的应用程序就可以进行歌曲的录制。
[0003]由于用户群体遍布各个年龄段以及各种音乐层次,使得歌手发布的一首原唱音频可能存在多种不同的翻唱音频。而,如何识别翻唱音频,目前尚未提供技术方案。

技术实现思路

[0004]本申请实施例提供一种歌曲识别方法、装置、电子设备及存储介质,可以准确识别音频为原唱音频或翻唱音频。
[0005]一方面,本申请一实施例提供了一种歌曲识别方法,包括:
[0006]采用预先构建的分类模型对待检测音频片段进行特征提取,得到所述待检测音频片段的特征信息;
[0007]将所述待检测音频片段的特征信息与原唱音频的特征信息进行比较;
[0008]若所述待检测音频片段的特征信息与所述原唱音频的特征信息之间的相似度大于预设相似度,则确定所述待检测音频片段为翻唱音频;
[0009]其中,所述分类模型用于提取音频样本的特征,并基于所述音频样本的特征识别所述音频样本的对应的原唱音频标识。
[0010]一种可选的实施方式为,提取的所述特征信息为所述分类模型的瓶颈特征;
[0011]其中,所述分类模型是根据以下方法构建的:
[0012]获取所述音频样本及其对应的标注标签,所述标注标签包括所述音频样本对应的原唱音频的标识;
[0013]将所述音频样本输入所述分类模型以使所述分类模型输出所述音频样本的预测标签;
[0014]基于所述预测标签和所述标注标签之间的损失,训练所述分类模型。
[0015]一种可选的实施方式为,所述对待检测音频片段进行特征提取之前,所述方法还包括:
[0016]获取多个验证样本,所述验证样本中包括所述音频样本之外的音频片段;
[0017]将所述多个验证样本输入所述预先训练的分类模型,得到各验证样本的特征信息;
[0018]由原唱音频对应的验证样本和所述原唱音频的翻唱音频对应的验证样本构成第一类样本对,并由不同音乐的验证样本构成第二类样本对,得到多个第一类样本对中两样
本的相似度,以及多个第二类样本对中两样本的相似度;
[0019]对多个第一类样本对中两样本的相似度,以及多个第二类样本对中两样本的相似度进行分类处理,得到能够区分第一类样本对和第二类样本对的分界点作为所述预设相似度。
[0020]一种可选的实施方式为,所述采用预先构建的分类模型对待检测音频片段进行特征提取,包括:
[0021]获取所述待检测音频片段的梅尔倒谱系数;
[0022]采用所述分类模型对所述梅尔倒谱系数进行特征提取。
[0023]一种可选的实施方式为,所述采用预先构建的分类模型对待检测音频片段进行特征提取之前,所述方法还包括:
[0024]将待检测音频等间隔切分为指定时长的多个音频段,得到所述待检测音频片段,其中,所述待检测音频片段为所述多个音频段的任一段。
[0025]一种可选的实施方式为,通过以下方式获取所述待检测音频片段的梅尔倒谱系数:
[0026]基于预设窗长、预设每帧移动距离、以及预设梅尔倒谱系数的维度,对所述待检测音频片段进行分帧加窗,确定所述待检测音频片段的梅尔倒谱系数。
[0027]一种可选的实施方式为,所述采用预先构建的分类模型对所述待检测音频片段进行特征提取,包括:
[0028]将所述待检测音频片段输入至所述分类模型,进行特征提取,输出所述待检测音频片段的预测标签、以及所述分类模型的瓶颈特征;
[0029]在所述将所述待检测音频片段的特征信息与原唱音频的特征信息进行比较之前,所述方法还包括:
[0030]基于所述音频样本的预测标签,在所述原唱音频中筛选与所述待检测音频片段的预测标签关联度大于预设标签关联度的原唱音频作为与所述待检测音频片段的特征信息进行比较的原唱音频。
[0031]一方面,本申请一实施例提供了一种歌曲识别装置,包括:
[0032]特征提取单元,被配置为执行采用预先构建的分类模型对待检测音频片段进行特征提取,得到所述待检测音频片段的特征信息;
[0033]比较单元,被配置为执行将所述待检测音频片段的特征信息与原唱音频的特征信息进行比较;
[0034]确定单元,被配置为执行若所述待检测音频片段的特征信息与所述原唱音频的特征信息之间的相似度大于预设相似度,则确定所述待检测音频片段为翻唱音频;
[0035]其中,所述分类模型用于提取音频样本的特征,并基于所述音频样本的特征识别所述音频样本的对应的原唱音频标识。
[0036]一种可选的实施方式为,提取的所述特征信息为所述分类模型的瓶颈特征;
[0037]其中,所述分类模型是根据以下方法构建的:
[0038]获取所述音频样本及其对应的标注标签,所述标注标签包括所述音频样本对应的原唱音频的标识;
[0039]将所述音频样本输入所述分类模型以使所述分类模型输出所述音频样本的预测
标签;
[0040]基于所述预测标签和所述标注标签之间的损失,训练所述分类模型。
[0041]一种可选的实施方式为,在所述特征提取单元之前,所述装置还包括:
[0042]获取单元,被配置为执行获取多个验证样本,所述验证样本中包括所述音频样本之外的音频片段;
[0043]第一确定单元,被配置为执行将所述多个验证样本输入所述分类模型,得到各验证样本的特征信息;
[0044]第二确定单元,被配置为执行由原唱音频对应的验证样本和所述原唱音频的翻唱音频对应的验证样本构成第一类样本对,并由不同音乐的验证样本构成第二类样本对,得到多个第一类样本对中两样本的相似度,以及多个第二类样本对中两样本的相似度;
[0045]第三确定单元,被配置为执行对多个第一类样本对中两样本的相似度,以及多个第二类样本对中两样本的相似度进行分类处理,得到能够区分第一类样本对和第二类样本对的分界点作为所述预设相似度。
[0046]一种可选的实施方式为,所述特征提取单元,被配置为执行:
[0047]获取所述待检测音频片段的梅尔倒谱系数;
[0048]采用所述分类模型对所述梅尔倒谱系数进行特征提取。
[0049]一种可选的实施方式为,所述特征提取单元对待检测音频片段进行特征提取之前,所述装置还包括:
[0050]将待检测音频等间隔切分为指定时长的多个音频段,得到所述待检测音频片段,其中,所述待检测音频片段为所述多个音频段的任一段。
[0051]一种可选的实施方式为,所述特征提取单元,被配置为执行:
[0052]基于预设窗长、预设每帧移动距离、以及预设梅尔倒本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种歌曲识别方法,其特征在于,包括:采用预先构建的分类模型对待检测音频片段进行特征提取,得到所述待检测音频片段的特征信息;将所述待检测音频片段的特征信息与原唱音频的特征信息进行比较;若所述待检测音频片段的特征信息与所述原唱音频的特征信息之间的相似度大于预设相似度,则确定所述待检测音频片段为翻唱音频;其中,所述分类模型用于提取音频样本的特征,并基于所述音频样本的特征识别所述音频样本的对应的原唱音频标识。2.根据权利要求1所述的方法,其特征在于,提取的所述特征信息为所述分类模型的瓶颈特征;其中,所述分类模型是根据以下方法构建的:获取所述音频样本及其对应的标注标签,所述标注标签包括所述音频样本对应的原唱音频的标识;将所述音频样本输入所述分类模型以使所述分类模型输出所述音频样本的预测标签;基于所述预测标签和所述标注标签之间的损失,训练所述分类模型。3.根据权利要求2所述的方法,其特征在于,所述对待检测音频片段进行特征提取之前,所述方法还包括:获取多个验证样本,所述验证样本中包括所述音频样本之外的音频片段;将所述多个验证样本输入所述分类模型,得到各验证样本的特征信息;由原唱音频对应的验证样本和所述原唱音频的翻唱音频对应的验证样本构成第一类样本对,并由不同音乐的验证样本构成第二类样本对,得到多个第一类样本对中两样本的相似度,以及多个第二类样本对中两样本的相似度;对多个第一类样本对中两样本的相似度,以及多个第二类样本对中两样本的相似度进行分类处理,得到能够区分第一类样本对和第二类样本对的分界点作为所述预设相似度。4.根据权利要求1所述的方法,其特征在于,所述采用预先构建的分类模型对待检测音频片段进行特征提取,包括:获取所述待检测音频片段的梅尔倒谱系数;采用所述分类模型对所述梅尔倒谱系数进行特征提取。5.根据权利要求1所述的方法,其特征在于,所述采用预先构建的分类模型对待检测音频片段进行特征提取之前,所述方法还包括:将待检测音频...

【专利技术属性】
技术研发人员:张冉王晓瑞李岩
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1