一种音频的相似度匹配方法、装置及存储介质制造方法及图纸

技术编号:24121726 阅读:40 留言:0更新日期:2020-05-13 03:17
本发明专利技术实施例公开了一种音频的相似度匹配方法、装置及存储介质。该方案根据用户的音频列表从多个用户中确定相似用户群;基于音频对应的用户行为数据,确定相似用户群的特征音频集合;根据特征音频集合计算训练集中的样本音频对之间的相似度,并根据样本音频对之间的相似度确定训练集中的正样本和负样本;使用正样本和负样本,训练孪生网络模型,其中,孪生网络模型包括用于获取音频的特征向量的两个基础网络,两个基础网络的结构相同且共享权重;基于训练后的孪生网络模型进行音频的相似度匹配。提高了音频相似度匹配的准确度。

【技术实现步骤摘要】
一种音频的相似度匹配方法、装置及存储介质
本专利技术涉及音频处理
,具体涉及一种音频的相似度匹配方法、装置及存储介质。
技术介绍
随着网络的普及和歌曲的制作越来越便利,每天都有成千上万的新歌曲涌现,未来的一段时间内歌曲量将呈现指数增长。歌曲海量化累计的同时,用户也表现出明显的个性化音乐喜好。例如,用户偏爱某一首歌曲,往往希望继续收听这种类型的歌曲。在数量庞大的歌曲库中,如何根据用户偏爱的这首歌曲,向用户推荐与该歌曲相似的其他歌曲,成为目前所要解决的问题。传统的歌曲推荐多是采用协同过滤的方式进行推荐,而协同过滤的推荐方式多是将歌曲的属性信息,例如艺术家、流派、语种等作为依据查找相似歌曲,例如,将具有相同流派、语言标签的歌曲认定为相似歌曲,进行歌曲的推荐。但是,这种协同过滤的方式过于依赖歌曲的属性信息,只有在歌曲具有足够的属性信息时,才能够进行相似性判断,从而具有进入推荐池的可能性,但是在实际情况中,歌曲的属性信息经常是缺失或者不可靠的,而这些缺失属性信息的歌曲往往难以被匹配为其他歌曲的相似歌曲,导致相似歌曲的匹配准确度低。
技术实现思路
本专利技术实施例提供一种音频的相似度匹配方法、装置及存储介质,旨在提高音频相似度匹配的准确度。本专利技术实施例提供一种音频的相似度匹配方法,包括:根据用户的音频列表从多个用户中确定相似用户群;基于音频对应的用户行为数据,确定所述相似用户群的特征音频集合;根据所述特征音频集合计算训练集中的样本音频对之间的相似度,并根据样本音频对之间的相似度确定所述训练集中的正样本和负样本;使用所述正样本和所述负样本,训练孪生网络模型,其中,所述孪生网络模型包括用于获取音频的特征向量的两个基础网络,所述两个基础网络的结构相同且共享权重;基于训练后的所述孪生网络模型进行音频的相似度匹配。本专利技术实施例还提供一种音频的相似度匹配装置,包括:用户分群单元,用于根据用户的音频列表从多个用户中确定相似用户群;集合确定单元,用于基于音频对应的用户行为数据,确定所述相似用户群的特征音频集合;样本获取单元,用于根据所述特征音频集合计算训练集中的样本音频对之间的相似度,并根据样本音频对之间的相似度确定所述训练集中的正样本和负样本;模型训练单元,用于使用所述正样本和所述负样本,训练孪生网络模型,其中,所述孪生网络模型包括用于获取音频的特征向量的两个基础网络,所述两个基础网络的结构相同且共享权重;音频匹配单元,用于基于训练后的所述孪生网络模型进行音频的相似度匹配。本专利技术实施例还提供一种存储介质,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本专利技术实施例所提供的任一音频的相似度匹配方法。本专利技术实施例提供的音频的相似度匹配方案,根据用户的音频列表从多个用户中确定相似用户群;基于音频对应的用户行为数据,确定相似用户群的特征音频集合;根据特征音频集合计算训练集中的样本音频对之间的相似度,并根据样本音频对之间的相似度确定训练集中的正样本和负样本;使用正样本和负样本,训练孪生网络模型,其中,孪生网络模型包括用于获取音频的特征向量的两个基础网络,两个基础网络的结构相同且共享权重;基于训练后的孪生网络模型进行音频的相似度匹配。本方案根据相似用户群初步确定音频之间的相似度,以训练孪生网络模型,在查找某一歌曲的相似歌曲时,使用该孪生网络模型进行歌曲之间相似度的匹配,无需使用歌曲的属性信息,只需要根据歌曲本身即可实现相似歌曲的匹配,提高了相似歌曲的匹配准确度。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1a是本专利技术实施例提供的音频的相似度匹配方法的第一流程示意图;图1b是本专利技术实施例提出的音频的相似度匹配方法中孪生网络模型的结构示意图;图2a是本专利技术实施例提供的音频的相似度匹配方法的第二流程示意图;图2b是本专利技术实施例提供的音频的相似度匹配方法的第三流程示意图;图3a是本专利技术实施例提供的音频的相似度匹配装置的第一种结构示意图;图3b是本专利技术实施例提供的音频的相似度匹配装置的第二种结构示意图;图3c是本专利技术实施例提供的音频的相似度匹配装置的第三种结构示意图;图4是本专利技术实施例提供的电子设备的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本专利技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。本专利技术实施例提供一种音频的相似度匹配方法,该音频的相似度匹配方法的执行主体可以是本专利技术实施例提供的音频的相似度匹配装置,或者集成了该音频的相似度匹配装置的电子设备,其中该音频的相似度匹配装置可以采用硬件或者软件的方式实现。其中,电子设备可以是服务器。请参阅图1a,图1a是本专利技术实施例提供的音频的相似度匹配方法的第一流程示意图。该音频的相似度匹配方法的具体流程可以如下:101、根据用户的音频列表从多个用户中确定相似用户群。该实施例的方案的音频可以是歌曲、视频中的音轨等各种形式的音频数据。其中,歌曲可以是既有歌词又有旋律的歌曲,也可以是只有旋律没有歌词的纯音乐等。以下以歌曲为例进行说明,本方案可以应用于音乐应用程序或者音乐网站等对用的服务器,以音乐应用程序为例,某音乐应用程序的服务器中维护有歌曲库,该歌曲库中存储有大量的歌曲,有些歌曲之间具有一定的相似度,如果对歌曲之间的相似性进行匹配,服务器可以根据用户的听歌习惯或者根据客户端发送的推荐请求,将相似的一些歌曲推荐给用户,提高音乐运营效率。该方案无需获取歌曲的属性信息,而是根据用户在听歌时产生的用户行为数据以及歌曲内容本身来确定歌曲之间的相似性,其中,用户行为数据包括用户对歌曲的播放量、收藏量、评论量等数据。具体地,本方案主要通过孪生网络模型来确定歌曲之间的相似性。其中,孪生网络模型包括用于获取歌曲的特征向量的两个基础网络,两个基础网络的结构相同且共享权重。以下对该孪生网络模型的训练方法进行说明。为训练该孪生网络模型,需要准备训练集。首先,用户在使用该音乐应用程序时,会根据个人的听歌习惯以及喜好创建歌单并将音频收藏到各个歌单,因此,可以根据用户的歌曲收藏列表来确定两个用户之间的相似度本文档来自技高网...

【技术保护点】
1.一种音频的相似度匹配方法,其特征在于,包括:/n根据用户的音频列表从多个用户中确定相似用户群;/n基于音频对应的用户行为数据,确定所述相似用户群的特征音频集合;/n根据所述特征音频集合计算训练集中的样本音频对之间的相似度,并根据样本音频对之间的相似度确定所述训练集中的正样本和负样本;/n使用所述正样本和所述负样本,训练孪生网络模型,其中,所述孪生网络模型包括用于获取音频的特征向量的两个基础网络,所述两个基础网络的结构相同且共享权重;/n基于训练后的所述孪生网络模型进行音频的相似度匹配。/n

【技术特征摘要】
1.一种音频的相似度匹配方法,其特征在于,包括:
根据用户的音频列表从多个用户中确定相似用户群;
基于音频对应的用户行为数据,确定所述相似用户群的特征音频集合;
根据所述特征音频集合计算训练集中的样本音频对之间的相似度,并根据样本音频对之间的相似度确定所述训练集中的正样本和负样本;
使用所述正样本和所述负样本,训练孪生网络模型,其中,所述孪生网络模型包括用于获取音频的特征向量的两个基础网络,所述两个基础网络的结构相同且共享权重;
基于训练后的所述孪生网络模型进行音频的相似度匹配。


2.如权利要求1所述的音频的相似度匹配方法,其特征在于,所述根据用户的音频列表从多个用户中确定相似用户群,包括:
获取用户的音频列表,计算每两个用户的音频列表的杰卡德系数,作为两个用户之间的相似度;
根据用户之间的相似度将多个用户划分为多个相似用户群,其中,一个相似用户群中的任意两个用户之间的相似度大于第一预设阈值。


3.如权利要求1所述的音频的相似度匹配方法,其特征在于,所述根据所述特征音频集合计算训练集中的样本音频对之间的相似度,包括:
对于训练集中任一样本音频对,计算同时具有样本音频对中的两个音频的特征音频集合的数量;
将所述数量除以特征音频集合的总数量,得到所述样本音频对的相似度。


4.如权利要求1所述的音频的相似度匹配方法,其特征在于,所述使用所述正样本和所述负样本,训练孪生网络模型,包括:
提取所述正样本和负样本中音频的音频特征;
基于正样本的音频特征和相似度、以及负样本的音频特征和相似度,训练孪生网络模型,直至损失函数的损失值达到最小。


5.如权利要求4所述的音频的相似度匹配方法,其特征在于,所述提取所述正样本和负样本中音频的音频特征,包括:
对于正样本和负样本中的任一音频,将所述音频分割为多个音频片段;
对每一个所述音频片段进行短时傅里叶变换,得到频域信号;
对所述频域信号进行梅尔尺度变换,得到音频片段的梅尔频谱特征;
合并所述多个音频片段的梅尔频谱特征,得到所述音频的音频特征。


6.如权利要求1所述的音频的相似度匹配方法,其特征在于,所述用户行为数据为收藏量;所述基于音频对应的用户行为数据,确定所述相似用户群的特征音频集合,包括:
从相似用户群对应的音频中,确定收藏量大于第二预设阈值的音频,构成所述相似用户群的特征音频集合。


7.如权利要求1-6任一项所述的音频的相似度匹配方法,其特征在于,所述基...

【专利技术属性】
技术研发人员:王征韬
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1