一种音频的相似度匹配方法、装置及存储介质制造方法及图纸

技术编号：24121726 阅读：40 留言：0更新日期：2020-05-13 03:17

本发明专利技术实施例公开了一种音频的相似度匹配方法、装置及存储介质。该方案根据用户的音频列表从多个用户中确定相似用户群；基于音频对应的用户行为数据，确定相似用户群的特征音频集合；根据特征音频集合计算训练集中的样本音频对之间的相似度，并根据样本音频对之间的相似度确定训练集中的正样本和负样本；使用正样本和负样本，训练孪生网络模型，其中，孪生网络模型包括用于获取音频的特征向量的两个基础网络，两个基础网络的结构相同且共享权重；基于训练后的孪生网络模型进行音频的相似度匹配。提高了音频相似度匹配的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种音频的相似度匹配方法、装置及存储介质
本专利技术涉及音频处理
，具体涉及一种音频的相似度匹配方法、装置及存储介质。
技术介绍
随着网络的普及和歌曲的制作越来越便利，每天都有成千上万的新歌曲涌现，未来的一段时间内歌曲量将呈现指数增长。歌曲海量化累计的同时，用户也表现出明显的个性化音乐喜好。例如，用户偏爱某一首歌曲，往往希望继续收听这种类型的歌曲。在数量庞大的歌曲库中，如何根据用户偏爱的这首歌曲，向用户推荐与该歌曲相似的其他歌曲，成为目前所要解决的问题。传统的歌曲推荐多是采用协同过滤的方式进行推荐，而协同过滤的推荐方式多是将歌曲的属性信息，例如艺术家、流派、语种等作为依据查找相似歌曲，例如，将具有相同流派、语言标签的歌曲认定为相似歌曲，进行歌曲的推荐。但是，这种协同过滤的方式过于依赖歌曲的属性信息，只有在歌曲具有足够的属性信息时，才能够进行相似性判断，从而具有进入推荐池的可能性，但是在实际情况中，歌曲的属性信息经常是缺失或者不可靠的，而这些缺失属性信息的歌曲往往难以被匹配为其他歌曲的相似歌曲，导致相似歌曲的匹配准确度低。
技术实现思路
本专利技术实施例提供一种音频的相似度匹配方法、装置及存储介质，旨在提高音频相似度匹配的准确度。本专利技术实施例提供一种音频的相似度匹配方法，包括：根据用户的音频列表从多个用户中确定相似用户群；基于音频对应的用户行为数据，确定所述相似用户群的特征音频集合；根据所述特征音频集合计算训练集中的样本音频对之间的相似度，并...

【技术保护点】
1.一种音频的相似度匹配方法，其特征在于，包括：/n根据用户的音频列表从多个用户中确定相似用户群；/n基于音频对应的用户行为数据，确定所述相似用户群的特征音频集合；/n根据所述特征音频集合计算训练集中的样本音频对之间的相似度，并根据样本音频对之间的相似度确定所述训练集中的正样本和负样本；/n使用所述正样本和所述负样本，训练孪生网络模型，其中，所述孪生网络模型包括用于获取音频的特征向量的两个基础网络，所述两个基础网络的结构相同且共享权重；/n基于训练后的所述孪生网络模型进行音频的相似度匹配。/n

【技术特征摘要】
1.一种音频的相似度匹配方法，其特征在于，包括：
根据用户的音频列表从多个用户中确定相似用户群；
基于音频对应的用户行为数据，确定所述相似用户群的特征音频集合；
根据所述特征音频集合计算训练集中的样本音频对之间的相似度，并根据样本音频对之间的相似度确定所述训练集中的正样本和负样本；
使用所述正样本和所述负样本，训练孪生网络模型，其中，所述孪生网络模型包括用于获取音频的特征向量的两个基础网络，所述两个基础网络的结构相同且共享权重；
基于训练后的所述孪生网络模型进行音频的相似度匹配。

2.如权利要求1所述的音频的相似度匹配方法，其特征在于，所述根据用户的音频列表从多个用户中确定相似用户群，包括：
获取用户的音频列表，计算每两个用户的音频列表的杰卡德系数，作为两个用户之间的相似度；
根据用户之间的相似度将多个用户划分为多个相似用户群，其中，一个相似用户群中的任意两个用户之间的相似度大于第一预设阈值。

3.如权利要求1所述的音频的相似度匹配方法，其特征在于，所述根据所述特征音频集合计算训练集中的样本音频对之间的相似度，包括：
对于训练集中任一样本音频对，计算同时具有样本音频对中的两个音频的特征音频集合的数量；
将所述数量除以特征音频集合的总数量，得到所述样本音频对的相似度。

4.如权利要求1所述的音频的相似度匹配方法，其特征在于，所述使用所述正样本和所述负样本，训练孪生网络模型，包括：
提取所述正样本和负样本中音频的音频特征；
基于正样本的音频特征和相似度、以及负样本的音频特征和相似度，训练孪生网络模型，直至损失函数的损失值达到最小。

5.如权利要求4所述的音频的相似度匹配方法，其特征在于，所述提取所述正样本和负样本中音频的音频特征，包括：
对于正样本和负样本中的任一音频，将所述音频分割为多个音频片段；
对每一个所述音频片段进行短时傅里叶变换，得到频域信号；
对所述频域信号进行梅尔尺度变换，得到音频片段的梅尔频谱特征；
合并所述多个音频片段的梅尔频谱特征，得到所述音频的音频特征。

6.如权利要求1所述的音频的相似度匹配方法，其特征在于，所述用户行为数据为收藏量；所述基于音频对应的用户行为数据，确定所述相似用户群的特征音频集合，包括：
从相似用户群对应的音频中，确定收藏量大于第二预设阈值的音频，构成所述相似用户群的特征音频集合。

7.如权利要求1-6任一项所述的音频的相似度匹配方法，其特征在于，所述基...

【专利技术属性】
技术研发人员：王征韬，
申请(专利权)人：腾讯音乐娱乐科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人