音乐流派的分类方法、装置及存储介质制造方法及图纸

技术编号:24888925 阅读:44 留言:0更新日期:2020-07-14 18:16
本发明专利技术实施例公开了一种音乐流派的分类方法、装置及存储介质。该方案通过收集预设流派音乐的正负样本,提取正负样本中音乐的第一歌词文本数据,并对第一歌词文本数据进行预处理,提取正负样本中音乐的音频数据,并对音频数据进行预处理,对音频数据进行压缩,并提取压缩后的音频数据中的第一音频特征,根据训练后的预设语言模型提取第一歌词文本数据的语义编码,将语义编码与第一音频特征进行结合,并将结合后的数据输入至基于语言模型生成的音乐分类模型以进行训练,并根据训练后的音乐分类模型确定待分类音乐的音乐流派。本申请实施例所提供的方案通过训练完成后的分类模型确定待分类音乐的流派,提升了音乐流派分类的准确性。

【技术实现步骤摘要】
音乐流派的分类方法、装置及存储介质
本专利技术涉及数据处理
,具体涉及一种音乐流派的分类方法、装置及存储介质。
技术介绍
目前,随着互联网的发展,人们可以越来越多的接触到互联网提供的音乐内容,同时对音乐服务的要求也越来越高。高效的音乐信息检索可以帮助人们从海量数据中,找出满足个性化需求的音乐资源。一种普遍的检索方式,可以通过曲风和流派的标签进行歌曲的搜索。但由于曲库歌曲数量庞大及人工分配标签成本过高的原因,仍然存在大量歌曲没有曲风或流派的标签,因此各大音乐平台通常会采用构建曲风/流派分类器的方式,为歌曲自动分配相应标签。目前,对歌曲进行流派分类主要是基于音频内容的方式。但这种方式对于一些特定流派的分类效果并不理想,比如古风流派。古风歌曲最重要的特征,是它的歌词有别于其他流派歌曲,具有独特的艺术特点。因此,如果采用基于纯音频内容的方式进行古风流派的分类,会由于忽略了古风歌曲最本质的特点,而造成分类准确率较低的问题。
技术实现思路
本专利技术实施例提供一种音乐流派的分类方法、装置及存储介质,旨在提升音乐流派分类的准确性。本专利技术实施例提供一种音乐流派的分类方法,包括:收集预设流派音乐的正负样本,提取所述正负样本中音乐的第一歌词文本数据,并对所述第一歌词文本数据进行预处理;提取所述正负样本中音乐的音频数据,并对所述音频数据进行预处理;对所述音频数据进行压缩,并提取所述压缩后的音频数据中的第一音频特征;根据所述训练后的预设语言模型提取所述第一歌词文本数据的语义编码;将所述语义编码与所述第一音频特征进行结合,并将结合后的数据输入至基于语言模型生成的音乐分类模型以进行训练,并根据训练后的音乐分类模型确定待分类音乐的音乐流派。本专利技术实施例还提供一种音乐流派的分类装置,包括:第一收集单元,用于收集曲库当中音乐的第二歌词文本数据,并对所述第二歌词文本数据进行预处理;第一训练单元,用于根据所述第二歌词文本数据对预设语言模型进行训练;第二收集单元,用于收集预设流派音乐的正负样本,提取所述正负样本中音乐的第一歌词文本数据,并对所述第一歌词文本数据进行预处理,提取所述正负样本中音乐的音频数据,并对所述音频数据进行预处理,对所述音频数据进行压缩,并提取所述压缩后的音频数据中的第一音频特征;编码提取单元,用于根据所述训练后的预设语言模型提取所述第一歌词文本数据的语义编码;第二训练单元,用于将所述语义编码与所述第一音频特征进行结合,并将结合后的数据输入至基于语言模型生成的音乐分类模型以进行训练,并根据训练后的音乐分类模型确定待分类音乐的音乐流派。本专利技术实施例还提供一种存储介质,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本专利技术实施例所提供的任一音乐流派的分类方法。本专利技术实施例提供的音乐流派的分类方案,通过收集预设流派音乐的正负样本,提取正负样本中音乐的第一歌词文本数据,并对第一歌词文本数据进行预处理,提取正负样本中音乐的音频数据,并对音频数据进行预处理,对音频数据进行压缩,并提取压缩后的音频数据中的第一音频特征,根据训练后的预设语言模型提取第一歌词文本数据的语义编码,将语义编码与第一音频特征进行结合,并将结合后的数据输入至基于语言模型生成的音乐分类模型以进行训练,并根据训练后的音乐分类模型确定待分类音乐的音乐流派。本申请实施例所提供的方案从古风流派歌曲最为重要的歌词特征入手,对音乐分类模型进行训练,通过训练完成后的分类模型确定待分类音乐的风格流派,可以有效提升音乐流派分类的准确性。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1a是本专利技术实施例提供的音乐流派的分类方法的第一流程示意图;图1b是本专利技术实施例提供的音乐流派的分类方法的第二流程示意图;图2是本专利技术实施例提供的音乐分类模型的结构示意图;图3a是本专利技术实施例提供的音乐流派的分类装置的第一种结构示意图;图3b是本专利技术实施例提供的音乐流派的分类装置的第二种结构示意图;图4是本专利技术实施例提供的服务器的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本专利技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。本专利技术实施例提供一种音乐流派的分类方法,该音乐流派的分类方法的执行主体可以是本专利技术实施例提供的音乐流派的分类装置,或者集成了该音乐流派的分类装置的服务器,其中该音乐流派的分类装置可以采用硬件或者软件的方式实现。目前,现有技术当中针对音乐流派的分类方法主要有两种,分别是基于音频内容的流派分类方法和基于歌词文本的情感分类方法。具体的,基于音频内容的流派分类方法通常包含以下模块:1.音频特征提取模块音频特征提取模块可以提供一种,或多种由音频数据直接产生的特征,例如mel频率倒谱系数(MFCC),频谱平坦度,能量等;音频特征提取模块也可以不进行特征提取,而直接使用原始音频数据作为后续模块的输入。2.深度学习模型对于流派分类问题,可以利用输入的音频特征和其对应的流派标签来进行监督学习的训练。常用于处理音频输入数据的深度学习模型,包括卷积神经网络(CNN),长短时记忆(LSTM)等。通过梯度下降的方式优化分类损失,使模型学会对目标流派的区分。但是上述这种基于音频内容的流派分类方法对于一些区分度不完全在音频的流派(如古风流派),这种方式无法提供令人满意的分类准确率。基于歌词文本的情感分类方法,一种做法是,通过标注了感情类型的歌词样本获取各类型的感情词库,再利用感情词库建立歌词样本的特征向量,最后利用各歌词的特征向量及其对应的情感标签进行分类模型的训练。除此之外,利用歌词进行情感分类,同样也包括使用CNN,LSTM等模型进行目标任务训练的方法。对于流派分类,无法采用类似构建感情词库的方法,因为大多数流派并没有特别的词汇表征。另外,对于一些歌曲,部分词组具有古意也不能代表其为古风歌曲。对于使用CNN进行歌词分析的方法,考虑到CNN的卷积核机制,会使得网络受到部分词组的影响比较大,无法关注到整体的内容。类似的,使用LSTM的模型,由于其模型结构存在时序上的依赖,使得训练时间会很长,本文档来自技高网...

【技术保护点】
1.一种音乐流派的分类方法,其特征在于,包括:/n收集预设流派音乐的正负样本,提取所述正负样本中音乐的第一歌词文本数据,并对所述第一歌词文本数据进行预处理;/n提取所述正负样本中音乐的音频数据,并对所述音频数据进行预处理;/n对所述音频数据进行压缩,并提取所述压缩后的音频数据中的第一音频特征;/n根据所述训练后的预设语言模型提取所述第一歌词文本数据的语义编码;/n将所述语义编码与所述第一音频特征进行结合,并将结合后的数据输入至基于语言模型生成的音乐分类模型以进行训练,并根据训练后的音乐分类模型确定待分类音乐的音乐流派。/n

【技术特征摘要】
1.一种音乐流派的分类方法,其特征在于,包括:
收集预设流派音乐的正负样本,提取所述正负样本中音乐的第一歌词文本数据,并对所述第一歌词文本数据进行预处理;
提取所述正负样本中音乐的音频数据,并对所述音频数据进行预处理;
对所述音频数据进行压缩,并提取所述压缩后的音频数据中的第一音频特征;
根据所述训练后的预设语言模型提取所述第一歌词文本数据的语义编码;
将所述语义编码与所述第一音频特征进行结合,并将结合后的数据输入至基于语言模型生成的音乐分类模型以进行训练,并根据训练后的音乐分类模型确定待分类音乐的音乐流派。


2.如权利要求1所述的音乐流派的分类方法,其特征在于,在收集预设流派音乐的正负样本,提取所述正负样本中音乐的第一歌词文本数据之前,所述方法还包括:
收集曲库当中音乐的第二歌词文本数据,并对所述第二歌词文本数据进行预处理;
根据所述第二歌词文本数据对预设语言模型进行训练。


3.如权利要求2所述的音乐流派的分类方法,其特征在于,在收集曲库当中音乐的第二歌词文本数据,并对所述第二歌词文本数据进行预处理之前,所述方法还包括:
从文本语料库当中提取语句序列;
将所述语句序列输入至预设语言模型以进行预训练。


4.如权利要求1-2任一项所述的音乐流派的分类方法,其特征在于,对所述第二歌词文本数据或第一歌词文本数据进行预处理,包括:
删除所述第二歌词文本或第一歌词文本中的非标准字符;和/或
对所述第二歌词文本或第一歌词文本进行截取,以保留预设数量的字符。


5.如权利要求2所述的音乐流派的分类方法,其特征在于,根据所述第二歌词文本数据对预设语言模型进行训练,包括:
根据所述第二歌词文本数据计算所述预设语言模型损失函数的损失值;
根据所述损失函数的损失值,调整所述预设语言模型中的模型参数。


6.如权利要求1所述的音乐流派的分...

【专利技术属性】
技术研发人员:林梅露吴康健吴斌王征韬夏志强雷兆恒
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1