本发明专利技术是关于一种相似歌曲推荐方法及装置,其中,方法包括:获取预设歌曲库中多首歌曲的歌曲内容;计算所述多首歌曲中每首歌曲的歌曲内容的统计值;根据所述每首歌曲的歌曲内容的统计值,确定所述多首歌曲对应的第一预设维度的第一向量模型;对所述第一向量模型进行降维处理,得到第二预设维度的第二向量模型;根据所述第二向量模型确定与所述多首歌曲中的目标歌曲相似的相似歌曲。通过该技术方案,可以使相似歌曲与目标歌曲的相似程度更高。
【技术实现步骤摘要】
本专利技术涉及数据处理
,尤其涉及一种相似歌曲推荐方法及装置。
技术介绍
在互联网应用中,音乐类型的网站给人们的生活带来了很多的便利。用户在音乐网站上可以选择在线收听他们喜欢的歌曲,甚至还可以在音乐网站上结交相同音乐偏好的朋友。现有的音乐网站可以向用户进行歌曲推荐,例如当用户收听歌手汪峰的歌曲《北京北京》时,向其推荐专辑《勇敢的心》中的其他歌曲。但是现有的歌曲推荐方法,存在推荐歌曲与用户之间的匹配度不够高的问题,这导致了用户对推荐歌曲的满意度较低。
技术实现思路
本专利技术实施例提供一种相似歌曲推荐方法及装置,用以解决现有技术中存在推荐歌曲与用户之间的匹配度不高、用户满意度低的缺陷。根据本专利技术实施例的第一方面,提供一种相似歌曲推荐方法,包括:获取预设歌曲库中多首歌曲的歌曲内容;计算所述多首歌曲中每首歌曲的歌曲内容的统计值;根据所述每首歌曲的歌曲内容的统计值,确定所述多首歌曲对应的第一预设维度的第一向量模型;对所述第一向量模型进行降维处理,得到第二预设维度的第二向量模型;根据所述第二向量模型确定与所述多首歌曲中的目标歌曲相似的相似歌曲。在该实施例中,根据歌曲内容为目标歌曲确定与其相似的相似歌曲,其中,歌曲内容可以是歌词、歌手、作词、作曲、专辑、年代等,这样,根据歌曲内容为目标歌曲确定相似歌曲,可以使相似歌曲与目标歌曲的相似程度更高。在一个实施例中,所述计算所述多首歌曲中每首歌曲的歌曲内容的统计值,包括:对每首歌曲的歌曲内容进行分词操作,得到多个词;计算所述多个词中的每个词在所述每首歌曲中的权重值。在该实施例中,歌曲内容可以是歌词、歌手、作词、作曲、专辑、年代等,这样,对歌曲内容进行分词操作,进而计算每个词在歌曲中的权重值,即可得到每个词对应的统计值。其中,统计值包括tf值和idf值。tf-某个词在该歌曲中出现的频率,idf-逆文档频率(频率不高但很重要)。歌手、作词、作曲、专辑、年代等词语,这些词语的idf值比较高。在一个实施例中,所述根据所述每首歌曲的歌曲内容的统计值,确定所述多首歌曲对应的第一预设维度的第一向量模型,包括:将所述多首歌曲中的所有词的权重值组合,得到第一预设维度的第一向量模型,其中,所述第一向量模型表示为:其中,xc,n表示第c个词在第n首歌曲中的权重值,所述第一预设维度为n维。在该实施例中,假设n首歌曲中一共包含c个词,根据每个词的权重值,则组合成上述第一向量模型,其中,每一行代表一个词的向量该向量描述了该词和所有歌曲的关系,每一列代表一个歌曲向量该向量描述了该歌曲与所有词的关系。在一个实施例中,对所述第一向量模型进行降维处理,得到第二预设维度的第二向量模型,包括:获取所述第二预设维度的预设训练模型,其中,所述第二预设维度为m维,m<n;根据所述预设训练模型,对所述第一向量模型进行降维处理,得到所述第二向量模型。在该实施例中,预设训练模型可以是m维的向量空间,m可能是100,远小于n。m维的向量空间是经过大量歌曲训练得到的,M维就是m个分类。将n维向量做空间变换,变换到m维的向量空间,相当于做降维处理,也是特征聚合处理,同时减少计算量。其中,可以采用LSA(LatentSemanticAnalysis,潜在语义分析)算法进行降维处理。在一个实施例中,所述根据所述第二向量模型确定与所述多首歌曲中的目标歌曲相似的相似歌曲,包括:根据所述第二向量模型和预设的计算公式,计算所述目标歌曲与所述多首歌曲中其他歌曲的相似度,其中,所述预设的计算公式为:其中,Sim(di,dj)表示第i首歌曲与第j首歌曲的相似度,xm,i表示第m个词在第i首歌曲中的权重值,xm,j表示第m个词在第j首歌曲中的权重值;将相似度大于或者等于预设相似度的歌曲确定为与所述目标歌曲相似的相似歌曲。在该实施例中,在确定了第二向量模型后,根据第二向量模型和预设的计算公式分别计算目标歌曲与歌曲库中其他歌曲的相似度。从而将与目标歌曲之间的相似度大于或者等于预设相似度的歌曲确定为相似歌曲。例如,预设相似度为80%,则计算目标歌曲与预设歌曲库中其他歌曲之间的相似度,从而将所有相似度大于或者等于80%的歌曲确定为相似歌曲。在一个实施例中,在获取预设歌曲库中多首歌曲的歌曲内容之前,所述方法还包括:根据目标终端对所述预设歌曲库中歌曲的历史操作确定所述目标终端的使用者喜好的所述目标歌曲;在确定与所述目标歌曲相似的相似歌曲之后,所述方法还包括:推送所述相似歌曲至所述目标终端。在该实施例中,可以根据目标终端的使用者对预设歌曲库中歌曲的历史操作确定用户喜好的目标歌曲,进而根据歌曲内容,如歌词、歌手、作词、作曲、专辑、年代等确定与目标歌曲相似的相似歌曲,从而将相似歌曲推荐给目标终端的使用者,这样,可以使得推荐歌曲与用户之间的匹配度更高,推荐歌曲更符合用户的喜好,提高用户的满意度。根据本专利技术实施例的第二方面,提供一种相似歌曲推荐装置,包括:获取模块,用于获取预设歌曲库中多首歌曲的歌曲内容;计算模块,用于计算所述多首歌曲中每首歌曲的歌曲内容的统计值;第一确定模块,用于根据所述每首歌曲的歌曲内容的统计值,确定所述多首歌曲对应的第一预设维度的第一向量模型;降维模块,用于对所述第一向量模型进行降维处理,得到第二预设维度的第二向量模型;第二确定模块,用于根据所述第二向量模型确定与所述多首歌曲中的目标歌曲相似的相似歌曲。在一个实施例中,所述计算模块包括:分词子模块,用于对每首歌曲的歌曲内容进行分词操作,得到多个词;第一计算子模块,用于计算所述多个词中的每个词在所述每首歌曲中的权重值。在一个实施例中,所述第一确定模块用于:将所述多首歌曲中的所有词的权重值组合,得到第一预设维度的第一向量模型,其中,所述第一向量模型表示为:其中,xc,n表示第c个词在第n首歌曲中的权重值,所述第一预设维度为n维。在一个实施例中,所述降维模块包括:获取子模块,用于获取所述第二预设维度的预设训练模型,其中,所述第二预设维度为m维,m<n;降维子模块,用于根据所述预设训练模型,对所述第一向量模型进行降维处理,得到所述第二向量模型。在一个实施例中,所述第二确定模块包括:第二计算子模块,用于根据所述第二向量模型和预设的计算公式,计算所述目标歌曲与所述多首歌曲中其他歌曲的相似度,其中,所述预设的计算公式为:其中,Sim(di,dj)表示第i首歌曲与第j首歌曲的相似度,xm,i表示第m个词在第i首歌曲中的权重值,xm,j表示第m个词在第j首歌曲中的权重值;确定子模块,用于将相似度大于或者等于预设相似度的歌曲确定为与所述目标歌曲相似的相似歌曲。在一个实施例中,所述装置还包括:第三确定模块,用于在获取预设歌曲库中多首歌曲的歌曲内容之前,根据目标终端对所述预设歌曲库中歌曲的历史操作确定所述目标终端的使用者喜好的所述目标歌曲;推送模块,用于在确定与所述目标歌曲相似的相似歌曲之后,推送所述相似歌曲至所述目标终端。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。下面通本文档来自技高网...

【技术保护点】
一种相似歌曲推荐方法,其特征在于,包括:获取预设歌曲库中多首歌曲的歌曲内容;计算所述多首歌曲中每首歌曲的歌曲内容的统计值;根据所述每首歌曲的歌曲内容的统计值,确定所述多首歌曲对应的第一预设维度的第一向量模型;对所述第一向量模型进行降维处理,得到第二预设维度的第二向量模型;根据所述第二向量模型确定与所述多首歌曲中的目标歌曲相似的相似歌曲。
【技术特征摘要】
1.一种相似歌曲推荐方法,其特征在于,包括:获取预设歌曲库中多首歌曲的歌曲内容;计算所述多首歌曲中每首歌曲的歌曲内容的统计值;根据所述每首歌曲的歌曲内容的统计值,确定所述多首歌曲对应的第一预设维度的第一向量模型;对所述第一向量模型进行降维处理,得到第二预设维度的第二向量模型;根据所述第二向量模型确定与所述多首歌曲中的目标歌曲相似的相似歌曲。2.根据权利要求1所述的方法,其特征在于,所述计算所述多首歌曲中每首歌曲的歌曲内容的统计值,包括:对每首歌曲的歌曲内容进行分词操作,得到多个词;计算所述多个词中的每个词在所述每首歌曲中的权重值。3.根据权利要求2所述的方法,其特征在于,所述根据所述每首歌曲的歌曲内容的统计值,确定所述多首歌曲对应的第一预设维度的第一向量模型,包括:将所述多首歌曲中的所有词的权重值组合,得到第一预设维度的第一向量模型,其中,所述第一向量模型表示为:其中,xc,n表示第c个词在第n首歌曲中的权重值,所述第一预设维度为n维。4.根据权利要求3所述的方法,其特征在于,对所述第一向量模型进行降维处理,得到第二预设维度的第二向量模型,包括:获取所述第二预设维度的预设训练模型,其中,所述第二预设维度为m维,m<n;根据所述预设训练模型,对所述第一向量模型进行降维处理,得到所述第二向量模型。5.根据权利要求4所述的方法,其特征在于,所述根据所述第二向量模型确定与所述多首歌曲中的目标歌曲相似的相似歌曲,包括:根据所述第二向量模型和预设的计算公式,计算所述目标歌曲与所述多首歌曲中其他歌曲的相似度,其中,所述预设的计算公式为:Sim(di,dj)=cosθ=x1,i*x1,j+x2,i*x2j+...+xm,i*xm,jx1,i2+...+xm,i2*x1,j2+...+xm,j2]]>其中,Sim(di,dj)表示第i首歌曲与第j首歌曲的相似度,xm,i表示第m个词在第i首歌曲中的权重值,xm,j表示第m个词在第j首歌曲中的权重值;将相似度大于或者等于预设相似度的歌曲确定为与所述目标歌曲相似的相似歌曲。6.根据权利要求1至5中任一项所述的方法,其特征在于,在获取预设歌曲库中多首歌曲的歌曲内容之前,所述方法还包括:根据目标终端对所述预设歌曲库中歌曲的历史操作确定所述目标终端的使用者喜好的所述目标歌曲;在确定与所述目标歌曲相似的相似歌曲之后,所述方法还包括:推送所述相似歌曲至所述目标...
【专利技术属性】
技术研发人员:李勤,
申请(专利权)人:北京云知声信息技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。