游戏音乐风格分类方法、装置、可读介质及电子设备制造方法及图纸

技术编号:31501526 阅读:15 留言:0更新日期:2021-12-22 23:19
本申请属于人工智能技术领域,具体涉及人工智能中的游戏音乐风格自动识别。本申请公开了游戏音乐风格分类方法、装置、可读介质及电子设备。本申请对应的方法通过将游戏音乐数据集中的游戏音频进行无监督聚类,得到游戏音频聚类集,然后从游戏音频聚类集中选取多个游戏音频样本,并根据多个游戏音频样本的内容相关性确定游戏音频聚类集的音乐风格标签;利用本申请的方法可以实现对游戏音乐的音乐风格标签确定,用户可以根据本申请的音乐风格标签对应的分类进行游戏音乐的收藏聆听,大大的提高了用户对于游戏音乐的用户体验,促进游戏音乐的发展。的发展。的发展。

【技术实现步骤摘要】
游戏音乐风格分类方法、装置、可读介质及电子设备


[0001]本申请属于人工智能
,具体涉及一种游戏音乐风格分类方法、游戏音乐风格分类装置、计算机可读介质以及电子设备。

技术介绍

[0002]音乐风格是反映音乐总体特征的标签,一首音乐的音乐风格分类可以分为乡村音乐、爵士、摇滚、重金属音乐、朋克等等。现在对于音乐风格的分类一般通过音乐的类型。
[0003]然而,对于游戏音乐,更多的是配乐,很多没有歌手演唱,直接照搬音乐风格的分类很难对游戏音乐进行有效的分类。而在实际使用中,用户经常会根据特定分类进行游戏音乐的收藏聆听,而无法获得游戏音乐的分类,将大大的降低了游戏音乐的用户体验,对游戏音乐的发展产生阻碍。
[0004]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]本申请的目的在于提供一种游戏音乐风格分类方法、游戏音乐风格分类装置、计算机可读介质以及电子设备。至少在一定程度上克服相关技术中无法对游戏音乐风格进行分类等技术问题。
[0006]本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
[0007]根据本申请实施例的一个方面,提供一种游戏音乐风格分类方法,包括:
[0008]获取游戏音乐数据集,所述游戏音乐数据集包括游戏音频;
[0009]将所述游戏音乐数据集中的游戏音频进行无监督聚类,得到游戏音频聚类集,所述游戏音频聚类集包括经过无监督聚类后聚集在一个集合中的游戏音频;
[0010]从所述游戏音频聚类集中选取多个游戏音频样本,并根据所述多个游戏音频样本的内容相关性确定所述游戏音频聚类集的音乐风格标签;
[0011]对所述游戏音乐数据集中的游戏音频添加音乐风格标签,得到音频标签数据集。
[0012]根据本申请实施例的一个方面,提供一种游戏音乐风格分类装置,包括:
[0013]获取模块,所述获取模块用于获取游戏音乐数据集,所述游戏音乐数据集包括游戏音频;
[0014]聚类模块,所述聚类模块连接获取模块,所述聚类模块用于将所述游戏音乐数据集中的游戏音频进行无监督聚类,得到游戏音频聚类集,所述游戏音频聚类集包括经过无监督聚类后聚集在一个集合中的游戏音频;
[0015]识别模块,所述识别模块连接聚类模块,用于从所述游戏音频聚类集中选取多个游戏音频样本,并根据所述多个游戏音频样本的内容相关性确定所述游戏音频聚类集的音乐风格标签;
[0016]添加模块,所述添加模块连接识别模块,用于对所述游戏音乐数据集中的游戏音频添加音乐风格标签,得到音频标签数据集。
[0017]在本申请的一些实施例中,基于以上技术方案,还包括:
[0018]音频获取模块,所述音频获取模块被配置为获取所述音频标签数据集和待分类游戏音频;
[0019]变换模块,所述变换模块被配置为将所述音频标签数据集中带有音乐风格标签的游戏音频通过短时傅里叶变换得到梅尔频谱图,以及将待分类游戏音频通过短时傅里叶变换得到梅尔频谱图;
[0020]预测训练模块,所述预测训练模块被配置为将音频标签数据集对应的梅尔频谱图输入预设的深度卷积神经网络进行训练,得到用于音乐风格标签预测的网络模型;
[0021]风格识别模块,所述风格识别模块被配置为将待分类游戏音频对应的梅尔频谱图输入所述用于音乐风格标签预测的网络模型中,得到待分类游戏音频的音乐风格标签。
[0022]在本申请的一些实施例中,基于以上技术方案,所述预测训练模块还被配置为利用所述音频标签数据集中带有音乐风格标签的游戏音频通过短时傅里叶变换得到的频谱图集对深度卷积神经网络进行有监督的学习,得到合适的权重参数矩阵和偏移量;并将权重参数矩阵和偏移量对应地赋值给所述深度卷积神经网络的各个层。
[0023]在本申请的一些实施例中,基于以上技术方案,所述聚类模块包括无监督训练单元和无监督聚类单元。
[0024]在本申请的一些实施例中,基于以上技术方案,所述无监督训练单元被配置为随机裁剪游戏音乐数据集中每一个游戏音频的任意两个片段,将所述每一个游戏音频的任意两个片段转换成音频特征向量后组成音频切片对;
[0025]所述无监督训练单元还被配置为将所述音频切片对输入到多类交叉熵对比损失函数中进行无监督训练,得到无监督训练的游戏音乐数据集,所述多类交叉熵对比损失函数用于减小音频切片对的对内特征距离并增大音频切片对的对间特征距离。
[0026]在本申请的一些实施例中,基于以上技术方案,所述无监督聚类单元被配置为将所述无监督训练的游戏音乐数据集中每一个音频对应的音频特征向量输入到贪心算法中进行无监督聚类,得到游戏音频聚类集。
[0027]在本申请的一些实施例中,基于以上技术方案,将所述无监督训练的游戏音乐数据集中每一个音频对应的音频特征向量输入到贪心算法中进行无监督聚类的方法,包括:
[0028]选取所述无监督训练的游戏音乐数据集中距离最小的一对音频特征向量;
[0029]若所述距离最小的一对音频特征向量的距离小于指定阈值,则将距离最小的一对音频特征向量聚为一类,组成一个游戏音频聚类集。
[0030]在本申请的一些实施例中,基于以上技术方案,所述识别模块包括:
[0031]特征提取单元,所述特征提取单元被配置为提取游戏音乐数据集中游戏音频的游戏音乐特征和提取所述游戏音频聚类集中多个游戏音频样本的游戏音乐特征;
[0032]标签训练单元,所述标签训练单元被配置为将所述游戏音乐特征与游戏音乐特征对应的音乐风格标签输入到机器学习模型中进行训练,得到基于游戏音乐特征进行音乐风格标签预测的标签标定模型;
[0033]标签预测单元,所述标签预测单元被配置为将所述游戏音频聚类集中多个游戏音
频样本的游戏音乐特征输入到所述标签标定模型中,得到所述游戏音频聚类集的音乐风格标签。
[0034]根据本申请实施例的一个方面,提供一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如以上技术方案中的游戏音乐风格分类方法。
[0035]根据本申请实施例的一个方面,提供一种电子设备,该电子设备包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器被配置为经由执行所述可执行指令来执行如以上技术方案中的游戏音乐风格分类方法。
[0036]根据本申请实施例的一个方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行如以上技术方案中的游戏音乐风格分类方法。
[0037]在本申请实施例提供的技术方案中,本申请通过无监督聚类的方式将游戏音乐数据集中的游戏音频按照音乐风格标签聚集本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种游戏音乐风格分类方法,其特征在于,包括:获取游戏音乐数据集,所述游戏音乐数据集包括游戏音频;将所述游戏音乐数据集中的游戏音频进行无监督聚类,得到游戏音频聚类集,所述游戏音频聚类集包括经过无监督聚类后聚集在一个集合中的游戏音频;从所述游戏音频聚类集中选取多个游戏音频样本,并根据所述多个游戏音频样本的内容相关性确定所述游戏音频聚类集的音乐风格标签;对所述游戏音乐数据集中的游戏音频添加音乐风格标签,得到音频标签数据集。2.根据权利要求1所述的游戏音乐风格分类方法,其特征在于,还包括:获取音频标签数据集和待分类游戏音频;将所述音频标签数据集中带有音乐风格标签的游戏音频通过短时傅里叶变换得到梅尔频谱图;将所述梅尔频谱图输入预设的深度卷积神经网络进行训练,得到用于音乐风格标签预测的网络模型;将待分类游戏音频通过短时傅里叶变换得到梅尔频谱图,并输入所述用于音乐风格标签预测的网络模型得到待分类游戏音频的音乐风格标签。3.根据权利要求2所述的游戏音乐风格分类方法,其特征在于,将所述梅尔频谱图输入预设的深度卷积神经网络进行训练,得到用于音乐风格标签预测的网络模型,包括:利用所述音频标签数据集中带有音乐风格标签的游戏音频通过短时傅里叶变换得到的频谱图集对深度卷积神经网络进行有监督的学习,得到合适的权重参数矩阵和偏移量;将权重参数矩阵和偏移量对应地赋值给所述深度卷积神经网络的各个层。4.根据权利要求1所述的游戏音乐风格分类方法,其特征在于,将所述游戏音乐数据集中的游戏音频进行无监督聚类,得到游戏音频聚类集,包括:随机裁剪游戏音乐数据集中每一个游戏音频的任意两个片段,将所述每一个游戏音频的任意两个片段转换成音频特征向量后组成音频切片对;将所述音频切片对输入到多类交叉熵对比损失函数中进行无监督训练,得到无监督训练的游戏音乐数据集,所述多类交叉熵对比损失函数用于减小音频切片对的对内特征距离并增大音频切片对的对间特征距离。5.根据权利要求4所述的游戏音乐风格分类方法,其特征在于,将所述游戏音乐数据集中的游戏音频进行无监督聚类,得到游戏音频聚类集,还包括:将所述无监督训练的游戏音乐数据集中每一个音频对应的音频...

【专利技术属性】
技术研发人员:彭博
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1