音频推荐模型的训练方法及装置、介质及设备制造方法及图纸

技术编号：34087148 阅读：8 留言：0更新日期：2022-07-11 20:17

本公开提供一种音频推荐模型的训练方法及装置、计算机可读存储介质以及电子设备，涉及人工智能技术领域。该包括：获取M组样本数据，每组样本数据包括目标音乐和用户播放目标音乐后的N首候选音乐；获取用户在播放第j组中目标音乐后播放第j组中第i首候选音乐的实际概率，得到关于第j组中音乐的实际概率分布；基于音频推荐模型的待优化模型参数，确定用户在播放第j组中目标音乐后播放第j组中第i首候选音乐的模拟概率，得到关于第j组中音乐的模拟概率分布；根据实际概率分布和模拟概率分布确定损失函数，基于损失函数优化模型参数，得到训练后的音频推荐模型。本方案能够提升音乐的曝光率，同时还能够提升推荐音乐的预测准确度。度。度。

全部详细技术资料下载

【技术实现步骤摘要】
音频推荐模型的训练方法及装置、介质及设备

[0001]本公开涉及人工智能
，具体而言，涉及一种音频推荐模型的训练方法及装置，以及实现上述方法的计算机可读存储介质以及电子设备。

技术介绍

[0002]在播放音乐的场景中音乐应用一般会为用户提供歌单(随心听、音乐流、歌单推荐等等)，以方便用户收听。随着人工智能技术的发展，确定推荐歌单的过程中也越来越多的考虑到用户喜好。
[0003]相关技术中，获取用户听歌的音乐序列，借助Word2vec等思想来间接地得到音乐表示，进而训练音乐推荐模型以向用户推荐音乐。然而，该音乐推荐方案所推荐的歌曲中虽然可以刻画用户的听歌行为，但是由于用户行为一般均表现在头部热门音乐，因而，通过该方案推荐的歌曲中一般不能够包含缺乏用户行为的音乐。
[0004]可见，相关技术提供的音频推荐方案存在音乐曝光率低的问题。
[0005]需要说明的是，在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0006]本公开的目的在于提供一种音频推荐模型的训练方法及装置、电子设备以及计算机可读存储介质，进而在一定程度上提升音乐的曝光率。
[0007]根据本公开的第一方面，提供一种音频推荐模型的训练方法，该方法包括：获取M组样本数据，每组样本数据包括目标音乐和用户播放上述目标音乐后的N首候选音乐，M、N为正整数；获取用户在播放第j组中目标音乐后播放上述第j组中第i首候选音乐的实际概率...

【技术保护点】

【技术特征摘要】
1.一种音频推荐模型的训练方法，其特征在于，所述方法包括：获取M组样本数据，每组样本数据包括目标音乐和用户播放所述目标音乐后的N首候选音乐，M、N为正整数；获取用户在播放第j组中目标音乐后播放所述第j组中第i首候选音乐的实际概率，得到关于所述第j组中音乐的实际概率分布，j为不大于M的正整数；基于所述音频推荐模型的待优化模型参数，确定用户在播放所述第j组中目标音乐后播放所述第j组中第i首候选音乐的模拟概率，得到关于所述第j组中音乐的模拟概率分布；根据所述实际概率分布和所述模拟概率分布确定损失函数，基于所述损失函数优化所述模型参数，得到训练后的音频推荐模型。2.根据权利要求1所述的方法，其特征在于，获取用户在播放第j组中目标音乐后播放所述第j组中第i首候选音乐的实际概率，包括：收集海量用户的关于所述第j组中目标音乐的听歌行为序列；在所述听歌行为序列中，对与所述第j组中目标音乐处于同一计算窗口之内的N首匹配音乐进行统计；获取第i首候选音乐出现的次数，并对所述第i首候选音乐出现的次数进行归一化，得到所述用户在播放所述第j组中目标音乐后播放第i首候选音乐的实际概率。3.根据权利要求1所述的方法，其特征在于，基于所述音频推荐模型的待优化模型参数，确定用户在播放所述第j组中目标音乐后播放所述第j组中第i首候选音乐的模拟概率，包括：基于所述音频推荐模型的第一参数对所述第j组中目标音乐进行特征提取，获取所述目标音乐对应的目标特征向量；基于所述音频推荐模型的第二参数和所述目标特征向量，确定用户在播放所述第j组中目标音乐后播放所述第j组中第i首候选音乐的模拟概率。4.根据权利要求3所述的方法，其特征在于，基于所述音频推荐模型的第二参数和所述目标特征向量，确定用户在播放所述第j组中目标音乐后播放所述第j组中第i首候选音乐的模拟概率，包括：根据所述音频推荐模型的第二参数和所述目标特征向量，对所述N首候选音乐对应的模拟概率进行指数归一化处理，得到用户在播放所述第j组中目标音乐后播放所述第j组中第i首候选音乐的模拟概率。5.根据权利要求3所述的方法，其特征在于，基于所述音频推荐模型的第一参数对所述第j组中目标音乐进行特征提取，包括：获取所述目标音乐对应的P个频域特征序列，P为大于1的整数；基于所述音频推荐模型的第一参数，对所述P个频域特征序列进行特征提取，得到所述目标音乐对应的目标特征向量。6.根据权利要求5所述的方法，其特征在于，获取所述目标音乐对应的P个频域特征序列，包括：将所述目标音乐按照时域窗口划分为至少P个音频片段；对属于同一音频片段中的多个采样点进行时频转换，得到P个音频片段对应的频域序列；
分别对所述P个频域序列进行采样，将得到所述P个音频片段分别对应的P个频域特征序列。7.根据权利要求5所述的方法，其特征在于，基于所述音频推荐模型的第一参数，对所述P个频域特征序列进行特征提取，包括：调用所述音频推荐模型中级联的S层卷积神经网络层，以基于所述S层卷积神经网络层的第一参数对第x个频域特征序列进行特征提取，得到所述第x个频域特征序列对应的S个卷积特征向量，x为不大于P的整数；将所述第x个频域特征序列对应的S个卷积特征向量进行拼接，得到所述第x个频域特...

【专利技术属性】
技术研发人员：缪畅宇，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人