基于生成式对抗网络的音乐旋律编曲方法、装置及系统制造方法及图纸

技术编号:36810020 阅读:23 留言:0更新日期:2023-03-09 00:38
本发明专利技术公开了一种基于生成式对抗网络的音乐旋律编曲方法、装置及系统,所述方法包括:接收客户端发送的表单,根据表单中的信息,利用机器学习模型合成音乐文件;其中所述机器学习模型采用改进的生成式对抗网络模型;所述改进的生成式对抗网络模型将一个判别器改进为两个判别器,同时将生成器中的长短期记忆结构改进为关系记忆单元;将所述音乐文件的路径返回给客户端,以使客户端使用ref属性动态绑定页面中音频控件中所述音乐文件的路径,并且自动进行所述音乐文件的播放。本发明专利技术通过采用生成式对抗网络模型,极大程度增加了音乐旋律生成的多样性与真实性,生成的音乐旋律更加优美动听;通过合成音乐文件,使适用人群扩展到一般人群。般人群。般人群。

【技术实现步骤摘要】
基于生成式对抗网络的音乐旋律编曲方法、装置及系统


[0001]本专利技术属于人工智能机器学习领域,特别涉及一种基于生成式对抗网络的音乐旋律编曲方法、装置及系统。

技术介绍

[0002]目前,此领域大多是使用了只有一个根据歌词生成旋律数据的算法而不是最终的音频。这类软件的缺点是只面向于数据从业人员而不是真实有编曲业务需求的人员,并且此类算法在音乐生成效果上也不尽如人意。因此,需要提供一种既可以根据歌词生成更加合适的音乐旋律数据,也能将其转化为音乐文件,同时还能提供音乐播放,信息管理,用户权限管理等功能的软件系统。

技术实现思路

[0003]为了解决上述现有技术的不足,本专利技术提供了一种基于生成式对抗网络的音乐旋律编曲方法、装置、系统、服务器及存储介质,根据用户输入的歌词和选择的乐器,采用机器学习模型合成音乐文件,机器学习模型使用生成式对抗网络模型并将一个判别器改为两个判别器,同时将生成器中的长短期记忆结构替换为关系记忆单元,从而极大程度增加了音乐旋律生成的多样性与真实性,同时生成的音乐旋律更加优美与动听。此外,通过合成音乐文件,从而使适用人群从数据从业人员扩展到一般人群。
[0004]本专利技术的第一个目的在于提供一种基于生成式对抗网络的音乐旋律编曲方法。
[0005]本专利技术的第二个目的在于提供一种基于生成式对抗网络的音乐旋律编曲装置。
[0006]本专利技术的第三个目的在于提供一种基于生成式对抗网络的音乐旋律编曲系统。
[0007]本专利技术的第四个目的在于提供一种服务器。
[0008]本专利技术的第五个目的在于提供一种存储介质。
[0009]本专利技术的第一个目的可以通过采取如下技术方案达到:
[0010]一种基于生成式对抗网络的音乐旋律编曲方法,所述方法包括:
[0011]接收客户端发送的表单,根据表单中的信息,利用机器学习模型合成音乐文件;其中所述机器学习模型采用改进的生成式对抗网络模型;所述改进的生成式对抗网络模型将一个判别器改进为两个判别器,同时将生成器中的长短期记忆结构改进为关系记忆单元;
[0012]将所述音乐文件的路径返回给客户端,以使客户端使用ref属性动态绑定页面中音频控件中所述音乐文件的路径,并且自动进行所述音乐文件的播放。
[0013]进一步的,所述表单中的信息包括歌词和乐器信息;
[0014]所述根据表单中的信息,利用机器学习模型合成音乐文件,包括:
[0015]利用词典模块,将所述歌词转化成向量;
[0016]根据所述向量,利用机器学习模型生成音乐旋律;
[0017]根据所述音乐旋律和乐器信息,生成音乐文件。
[0018]进一步的,所述根据所述向量,利用机器学习模型生成音乐旋律,包括:
[0019]在网络上获取大量现有的歌曲作为数据集,利用数据集中的歌曲对所述机器学习模型进行训练;在训练阶段过程中,根据两个判别器的输出结果对生成器中的参数进行调整;
[0020]将所述向量输入训练好的机器学习模型中,通过生成器输出音乐旋律。
[0021]进一步的,两个判别器分别为歌词判别器和旋律判别器,其中,所述歌词判别器包括线性层、双向LSTM层以及sigmoid函数,所述旋律判别器包括线性层、两个串联的LSTM层、线性层及Dropout模块以及sigmoid函数;
[0022]所述利用数据集中的歌曲对所述机器学习模型进行训练,包括:
[0023]利用词典模块将歌曲中的歌词转化成向量,将所述向量与噪声拼接后输入生成器中,生成器输出音乐旋律;其中,所述噪声为与所述向量同样维度大小的随机数向量;
[0024]将所述音乐旋律、向量以及歌曲中的旋律输入所述歌词判别器中,依次通过线性层、双向LSTM层以及sigmoid函数,得到歌词判别器的输出;
[0025]将所述音乐旋律以及歌曲中的旋律输入所述旋律判别器中,依次通过线性层、两个串联的LSTM层、线性层及Dropout模块以及sigmoid函数,得到旋律判别器的输出;
[0026]通过两个判别器的输出对生成器产生正向反馈作用,使生成器能够生成更加逼真的旋律数据。
[0027]进一步的,所述根据所述音乐旋律和乐器信息,生成音乐文件,包括:
[0028]将tensor格式的音乐旋律保存为npy文件;
[0029]读取所述npy文件为ndarray文件;
[0030]将所述ndarray文件和乐器信息转化为mid文件;
[0031]将所述mid文件转化成mp3文件或wav文件,即得到音乐文件。
[0032]本专利技术的第二个目的可以通过采取如下技术方案达到:
[0033]一种基于生成式对抗网络的音乐旋律编曲装置,所述装置包括:
[0034]音乐文件合成单元,用于接收客户端发送的表单,根据表单中的信息,利用机器学习模型合成音乐文件;其中所述机器学习模型采用改进的生成式对抗网络模型;所述改进的生成式对抗网络模型将一个判别器改进为两个判别器,同时将生成器中的长短期记忆结构改进为关系记忆单元;
[0035]音乐文件播放单元,用于将所述音乐文件的路径返回给客户端,以使客户端使用ref属性动态绑定页面中音频控件中所述音乐文件的路径,并且自动进行所述音乐文件的播放。
[0036]本专利技术的第三个目的可以通过采取如下技术方案达到:
[0037]一种基于生成式对抗网络的音乐旋律编曲系统,包括客户端和服务器,其中:
[0038]所述客户端由Vue3框架构建,用于页面展示以及用户与系统的交互,包括生成音乐文件模块;所述生成音乐文件模块,用于根据用户在表单页面输入的歌词以及选择的乐器,通过ajax的方式将表单信息发送至服务器进行处理,在接收到服务器返回的音乐文件的路径后,使用ref属性动态绑定页面中音频控件中音乐文件的路径,并且自动进行音乐文件的播放;
[0039]所述服务器的主体部分由Django框架构建,包括合成音乐模块;所述合成音乐模块,用于根据接收到的客户端发送的表单,利用机器学习模型合成音乐文件并将音乐文件
的路径返回至客户端。
[0040]进一步的,所述客户端还包括登录模块、查看模块和评论模块;其中,所述登录模块,用于对用户的身份信息进行验证以及提供登录系统的入口;所述查看模块,用于登录用户根据个人身份的权限查看相应的信息;所述评论模块,用于提供用户与管理员之间进行交流的渠道,主要通过用户直接在界面下方的输入框中输入评论,点击提交评论之后发送axios请求到服务器,服务器通过django对其进行解析并将解析后的信息发送至数据库中储存。
[0041]进一步的,所述系统还提供了超级用户,用于管理和查看全部音乐生成的历史记录,所述历史记录存储在数据库中。
[0042]本专利技术的第四个目的可以通过采取如下技术方案达到:
[0043]一种服务器,包括处理器以及用于存储处理器可执行程序的存储器,所述处理器执行存储器存储的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于生成式对抗网络的音乐旋律编曲方法,其特征在于,所述方法包括:接收客户端发送的表单,根据表单中的信息,利用机器学习模型合成音乐文件;其中所述机器学习模型采用改进的生成式对抗网络模型;所述改进的生成式对抗网络模型将一个判别器改进为两个判别器,同时将生成器中的长短期记忆结构改进为关系记忆单元;将所述音乐文件的路径返回给客户端,以使客户端使用ref属性动态绑定页面中音频控件中所述音乐文件的路径,并且自动进行所述音乐文件的播放。2.根据权利要求1所述的音乐旋律编曲方法,其特征在于,所述表单中的信息包括歌词和乐器信息;所述根据表单中的信息,利用机器学习模型合成音乐文件,包括:利用词典模块,将所述歌词转化成向量;根据所述向量,利用机器学习模型生成音乐旋律;根据所述音乐旋律和乐器信息,生成音乐文件。3.根据权利要求2所述的音乐旋律编曲方法,其特征在于,所述根据所述向量,利用机器学习模型生成音乐旋律,包括:在网络上获取大量现有的歌曲作为数据集,利用数据集中的歌曲对所述机器学习模型进行训练;在训练阶段过程中,根据两个判别器的输出结果对生成器中的参数进行调整;将所述向量输入训练好的机器学习模型中,通过生成器输出音乐旋律。4.根据权利要求3所述的音乐旋律编曲方法,其特征在于,两个判别器分别为歌词判别器和旋律判别器,其中,所述歌词判别器包括线性层、双向LSTM层以及sigmoid函数,所述旋律判别器包括线性层、两个串联的LSTM层、线性层及Dropout模块以及sigmoid函数;所述利用数据集中的歌曲对所述机器学习模型进行训练,包括:利用词典模块将歌曲中的歌词转化成向量,将所述向量与噪声拼接后输入生成器中,生成器输出音乐旋律;其中,所述噪声为与所述向量同样维度大小的随机数向量;将所述音乐旋律、向量以及歌曲中的旋律输入所述歌词判别器中,依次通过线性层、双向LSTM层以及sigmoid函数,得到歌词判别器的输出;将所述音乐旋律以及歌曲中的旋律输入所述旋律判别器中,依次通过线性层、两个串联的LSTM层、线性层及Dropout模块以及sigmoid函数,得到旋律判别器的输出;通过两个判别器的输出对生成器产生正向反馈作用,使生成器能够生成更加逼真的旋律数据。5.根据权利要求2所述的音乐旋律编曲方法,其特征在于,所述根据所述音乐旋律和乐器信息,生成音乐文件,包括:将tensor格式的音乐旋律保存为npy文件;读...

【专利技术属性】
技术研发人员:胡剑桥陶乾
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1