音频推荐模型的训练方法及装置、介质及设备制造方法及图纸

技术编号:34087148 阅读:8 留言:0更新日期:2022-07-11 20:17
本公开提供一种音频推荐模型的训练方法及装置、计算机可读存储介质以及电子设备,涉及人工智能技术领域。该包括:获取M组样本数据,每组样本数据包括目标音乐和用户播放目标音乐后的N首候选音乐;获取用户在播放第j组中目标音乐后播放第j组中第i首候选音乐的实际概率,得到关于第j组中音乐的实际概率分布;基于音频推荐模型的待优化模型参数,确定用户在播放第j组中目标音乐后播放第j组中第i首候选音乐的模拟概率,得到关于第j组中音乐的模拟概率分布;根据实际概率分布和模拟概率分布确定损失函数,基于损失函数优化模型参数,得到训练后的音频推荐模型。本方案能够提升音乐的曝光率,同时还能够提升推荐音乐的预测准确度。度。度。

【技术实现步骤摘要】
音频推荐模型的训练方法及装置、介质及设备


[0001]本公开涉及人工智能
,具体而言,涉及一种音频推荐模型的训练方法及装置,以及实现上述方法的计算机可读存储介质以及电子设备。

技术介绍

[0002]在播放音乐的场景中音乐应用一般会为用户提供歌单(随心听、音乐流、歌单推荐等等),以方便用户收听。随着人工智能技术的发展,确定推荐歌单的过程中也越来越多的考虑到用户喜好。
[0003]相关技术中,获取用户听歌的音乐序列,借助Word2vec等思想来间接地得到音乐表示,进而训练音乐推荐模型以向用户推荐音乐。然而,该音乐推荐方案所推荐的歌曲中虽然可以刻画用户的听歌行为,但是由于用户行为一般均表现在头部热门音乐,因而,通过该方案推荐的歌曲中一般不能够包含缺乏用户行为的音乐。
[0004]可见,相关技术提供的音频推荐方案存在音乐曝光率低的问题。
[0005]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0006]本公开的目的在于提供一种音频推荐模型的训练方法及装置、电子设备以及计算机可读存储介质,进而在一定程度上提升音乐的曝光率。
[0007]根据本公开的第一方面,提供一种音频推荐模型的训练方法,该方法包括:获取M组样本数据,每组样本数据包括目标音乐和用户播放上述目标音乐后的N首候选音乐,M、N为正整数;获取用户在播放第j组中目标音乐后播放上述第j组中第i首候选音乐的实际概率,得到关于上述第j组中音乐的实际概率分布,j为不大于M的正整数;基于上述音频推荐模型的待优化模型参数,确定用户在播放上述第j组中目标音乐后播放上述第j组中第i首候选音乐的模拟概率,得到关于上述第j组中音乐的模拟概率分布;以及,根据上述实际概率分布和上述模拟概率分布确定损失函数,基于上述损失函数优化上述模型参数,得到训练后的音频推荐模型。。
[0008]根据本公开的第二方面,提供了一种音频推荐模型的训练装置包括:样本获取模块、实际概率确定模块、模拟概率确定模块以及模型参数优化模块。
[0009]其中,上述样本获取模块,被配置为:获取M组样本数据,每组样本数据包括目标音乐和用户播放上述目标音乐后的N首候选音乐,M、N为正整数;上述模拟概率确定模块,被配置为:获取用户在播放第j组中目标音乐后播放上述第j组中第i首候选音乐的实际概率,得到关于上述第j组中音乐的实际概率分布,j为不大于M的正整数;上述实际概率确定模块,被配置为:基于上述音频推荐模型的待优化模型参数,确定用户在播放上述第j组中目标音乐后播放上述第j组中第i首候选音乐的模拟概率,得到关于上述第j组中音乐的模拟概率分布;上述模型参数优化模块,被配置为:根据上述实际概率分布和上述模拟概率分布确定
损失函数,基于上述损失函数优化上述模型参数,得到训练后的音频推荐模型。
[0010]在本公开的一种示例性实施例中,基于前述实施例,上述实际概率确定模块,被具体配置为:收集海量用户的关于上述第j组中目标音乐的听歌行为序列;在上述听歌行为序列中,对与上述第j组中目标音乐处于同一计算窗口之内的N首匹配音乐进行统计;以及,获取第i首候选音乐出现的次数,并对上述第i首候选音乐出现的次数进行归一化,得到上述用户在播放上述第j组中目标音乐后播放第i首候选音乐的实际概率
[0011]在本公开的一种示例性实施例中,基于前述实施例,上述模拟概率确定模块,包括:特征提取子模块和归一化子模块。
[0012]其中,上述特征提取子模块被配置为:基于上述音频推荐模型的第一参数对上述第j组中目标音乐进行特征提取,获取上述目标音乐对应的目标特征向量;上述归一化单元被配置为:基于上述音频推荐模型的第二参数和上述目标特征向量,确定用户在播放上述第j组中目标音乐后播放上述第j组中第i首候选音乐的模拟概率。
[0013]本公开的一种示例性实施例中,基于前述实施例,上述归一化子模块,被具体配置为:根据上述音频推荐模型的第二参数和上述目标特征向量,对上述N首候选音乐对应的模拟概率进行指数归一化处理,得到用户在播放上述第j组中目标音乐后播放上述第j组中第i首候选音乐的模拟概率。
[0014]在本公开的一种示例性实施例中,基于前述实施例,上述特征提取子模块,包括:特征序列获取单元和特征提取单元。
[0015]其中,上述特征序列获取单元被配置为:获取上述目标音乐对应的P个频域特征序列,P为大于1的整数;上述特征提取单元:基于上述音频推荐模型的第一参数,对上述P个频域特征序列进行特征提取,得到上述目标音乐对应的目标特征向量。
[0016]本公开的一种示例性实施例中,基于前述实施例,上述特征序列获取单元,被具体配置为:将上述目标音乐按照时域窗口划分为至少P个音频片段;对属于同一音频片段中的多个采样点进行时频转换,得到P个音频片段对应的频域序列;以及,分别对上述P个频域序列进行采样,将得到上述P个音频片段分别对应的P个频域特征序列。
[0017]本公开的一种示例性实施例中,基于前述实施例,上述特征提取单元,被具体配置为:调用上述音频推荐模型中级联的S层卷积神经网络层,以基于上述S层卷积神经网络层的第一参数对第x个频域特征序列进行特征提取,得到上述第x个频域特征序列对应的S个卷积特征向量,x为不大于P的整数;以及,将上述第x个频域特征序列对应的S个卷积特征向量进行拼接,得到上述第x个频域特征序列对应的片段特征向量,并拼接上述P个频域特征序列对应的片段特征向量,得到上述目标音乐对应的目标特征向量。
[0018]本公开的一种示例性实施例中,基于前述实施例,上述特征提取单元,还被具体配置为:在拼接上述P个频域特征序列对应的片段特征向量之后,对拼接后的片段特征向量进行池化处理,并将池化处理之后的向量作为上述目标音乐对应的目标特征向量。
[0019]在本公开的一种示例性实施例中,基于前述实施例,该音频推荐模型的训练装置还包括:子模型预训练模块。
[0020]其中,上述子模型预训练模块被配置为:基于上述S层卷积神经网络层的第一参数对预训练样本音频的频域特征序列进行特征提取,得到样本特征向量,以及与上述样本特征向量存在时域前后关系的正样本特征向量;获取与上述样本特征向量不存在时域前后关
系的负样本特征向量;以及,基于上述样本特征向量、上述正样本特征向量和上述负样本特征向量确定三元组损失函数,并基于上述三元组损失函数优化上述第一参数
[0021]在本公开的一种示例性实施例中,基于前述实施例,上述模型参数优化模块被具体配置为:根据上述实际概率分布和上述模拟概率分布确定相对熵函数;以及,通过计算上述相对熵函数的最小值,优化上述音频推荐模型的第二参数。
[0022]本公开的一种示例性实施例中,基于前述实施例,上述特征提取单元,还被具体配置为:将上述频域特征序列的第y个音频向量输入门控循环单元的第y个节点,y为不大于P的正整数;基于上述第一参数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频推荐模型的训练方法,其特征在于,所述方法包括:获取M组样本数据,每组样本数据包括目标音乐和用户播放所述目标音乐后的N首候选音乐,M、N为正整数;获取用户在播放第j组中目标音乐后播放所述第j组中第i首候选音乐的实际概率,得到关于所述第j组中音乐的实际概率分布,j为不大于M的正整数;基于所述音频推荐模型的待优化模型参数,确定用户在播放所述第j组中目标音乐后播放所述第j组中第i首候选音乐的模拟概率,得到关于所述第j组中音乐的模拟概率分布;根据所述实际概率分布和所述模拟概率分布确定损失函数,基于所述损失函数优化所述模型参数,得到训练后的音频推荐模型。2.根据权利要求1所述的方法,其特征在于,获取用户在播放第j组中目标音乐后播放所述第j组中第i首候选音乐的实际概率,包括:收集海量用户的关于所述第j组中目标音乐的听歌行为序列;在所述听歌行为序列中,对与所述第j组中目标音乐处于同一计算窗口之内的N首匹配音乐进行统计;获取第i首候选音乐出现的次数,并对所述第i首候选音乐出现的次数进行归一化,得到所述用户在播放所述第j组中目标音乐后播放第i首候选音乐的实际概率。3.根据权利要求1所述的方法,其特征在于,基于所述音频推荐模型的待优化模型参数,确定用户在播放所述第j组中目标音乐后播放所述第j组中第i首候选音乐的模拟概率,包括:基于所述音频推荐模型的第一参数对所述第j组中目标音乐进行特征提取,获取所述目标音乐对应的目标特征向量;基于所述音频推荐模型的第二参数和所述目标特征向量,确定用户在播放所述第j组中目标音乐后播放所述第j组中第i首候选音乐的模拟概率。4.根据权利要求3所述的方法,其特征在于,基于所述音频推荐模型的第二参数和所述目标特征向量,确定用户在播放所述第j组中目标音乐后播放所述第j组中第i首候选音乐的模拟概率,包括:根据所述音频推荐模型的第二参数和所述目标特征向量,对所述N首候选音乐对应的模拟概率进行指数归一化处理,得到用户在播放所述第j组中目标音乐后播放所述第j组中第i首候选音乐的模拟概率。5.根据权利要求3所述的方法,其特征在于,基于所述音频推荐模型的第一参数对所述第j组中目标音乐进行特征提取,包括:获取所述目标音乐对应的P个频域特征序列,P为大于1的整数;基于所述音频推荐模型的第一参数,对所述P个频域特征序列进行特征提取,得到所述目标音乐对应的目标特征向量。6.根据权利要求5所述的方法,其特征在于,获取所述目标音乐对应的P个频域特征序列,包括:将所述目标音乐按照时域窗口划分为至少P个音频片段;对属于同一音频片段中的多个采样点进行时频转换,得到P个音频片段对应的频域序列;
分别对所述P个频域序列进行采样,将得到所述P个音频片段分别对应的P个频域特征序列。7.根据权利要求5所述的方法,其特征在于,基于所述音频推荐模型的第一参数,对所述P个频域特征序列进行特征提取,包括:调用所述音频推荐模型中级联的S层卷积神经网络层,以基于所述S层卷积神经网络层的第一参数对第x个频域特征序列进行特征提取,得到所述第x个频域特征序列对应的S个卷积特征向量,x为不大于P的整数;将所述第x个频域特征序列对应的S个卷积特征向量进行拼接,得到所述第x个频域特...

【专利技术属性】
技术研发人员:缪畅宇
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1