System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及计算机,特别是涉及一种异常歌曲识别方法、装置、计算机设备、存储介质和计算机程序产品。
技术介绍
1、在音乐领域中,为了鼓励和扶持音乐人发表音乐作品,互联网音乐平台会推出一系列扶持政策,为音乐人提供流量和资金等,以激励音乐人创作更多高质量的音乐作品,部分不良用户会利用互联网音乐平台推出的扶持政策,通过刷量等违规操作,使特定音乐作品的作品数据虚高,为避免黑产音乐作品在音乐平台泛滥,同时,也为了打击黑产音乐人,保证资源的合理分配,需要对音乐平台的黑产歌手和黑产歌曲进行筛查。
2、传统技术主要基于规则识别,从业务角度出发,结合歌曲内容和歌曲评论等数据,对存在有明显异常数据的歌曲进行重点筛查,针对黑产歌曲等异常歌曲的识别效率不高,且存在异常歌曲的遗漏,不利于提高异常歌曲的识别效率。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提高异常歌曲的识别效率的异常歌曲识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本申请提供了一种异常歌曲识别方法,包括:
3、获取预训练的决策树模型;所述预训练的决策树模型包括至少一个孤立树模型;每个所述孤立树模型分别与一歌曲特征维度对应,所述孤立树模型为按照样本歌曲集中的样本歌曲在所述孤立树模型对应的歌曲特征维度下的歌曲特征数据,对所述样本歌曲集进行分类得到的二叉搜索树;
4、根据待识别歌曲的歌曲特征数据,确定所述待识别歌曲在各所述孤立树模型中对应的搜索路径;所
5、根据各所述搜索路径的路径长度,确定所述待识别歌曲是否为异常歌曲的歌曲识别结果。
6、在其中一个实施例中,所述根据各所述搜索路径的路径长度,确定所述待识别歌曲是否为异常歌曲的歌曲识别结果,包括:
7、获取各所述孤立树模型对应的平均路径长度;
8、根据各所述搜索路径的路径长度和各所述孤立树模型对应的平均路径长度,确定所述待识别歌曲对应的标准化路径长度;
9、根据所述标准化路径长度,确定所述待识别歌曲是否为异常歌曲的歌曲识别结果。
10、在其中一个实施例中,所述根据所述标准化路径长度,确定所述待识别歌曲是否为异常歌曲的歌曲识别结果,包括:
11、按照预设的映射关系,将所述标准化路径长度映射为歌曲异常分数;
12、根据所述歌曲异常分数,确定所述待识别歌曲是否为异常歌曲的歌曲识别结果。
13、在其中一个实施例中,所述根据所述歌曲异常分数,确定所述待识别歌曲是否为异常歌曲的歌曲识别结果,包括:
14、在所述歌曲异常分数与预设的第一分数阈值之间的差值小于预设的第一差值阈值的情况下,判定所述待识别歌曲的歌曲识别结果为异常歌曲;
15、在所述歌曲异常分数与预设的第二分数阈值之间的差值大于预设的第二差值阈值的情况下,判定所述待识别歌曲的歌曲识别结果为正常歌曲。
16、在其中一个实施例中,所述方法还包括:
17、获取待识别歌曲数据集中各待识别歌曲对应的歌曲异常分数;
18、在所述各待识别歌曲对应的歌曲异常分数与所述预设的第二分数阈值之间的差值小于预设的第三差值阈值的情况下,判定所述待识别歌曲数据集对应的歌曲识别结果为所述待识别歌曲数据集中不存在异常歌曲。
19、在其中一个实施例中,所述获取预训练的决策树模型,包括:
20、根据所述样本歌曲集,确定各所述歌曲特征维度对应的样本歌曲子集;
21、针对各所述歌曲特征维度中的任一歌曲特征维度,对所述歌曲特征维度对应的样本歌曲子集在所述歌曲特征维度下的歌曲特征数据进行分类,得到所述歌曲特征维度对应的孤立树模型;
22、根据各所述歌曲特征维度对应的孤立树模型,构建所述预训练的决策树模型。
23、在其中一个实施例中,所述对所述歌曲特征维度对应的样本歌曲子集在所述歌曲特征维度下的歌曲特征数据进行分类,得到所述歌曲特征维度对应的孤立树模型,包括:
24、获取所述歌曲特征维度下的歌曲特征数据中的特征数据最值;
25、根据所述特征数据最值,确定针对所述歌曲特征维度的数据分类参数;
26、根据所述数据分类参数,逐级确定针对所述歌曲特征维度对应的样本歌曲子集的歌曲分类分支;所述歌曲分类分支用于对所述歌曲特征维度下的歌曲特征数据进行分类;
27、根据针对所述歌曲特征维度的歌曲分类分支,构建所述歌曲特征维度对应的孤立树模型。
28、在其中一个实施例中,所述根据所述数据分类参数,逐级确定针对所述歌曲特征维度对应的样本歌曲子集的歌曲分类分支,包括:
29、对比所述数据分类参数和所述歌曲特征维度下的歌曲特征数据,确定针对所述歌曲特征维度对应的样本歌曲子集的当前歌曲分类分支;
30、获取所述当前歌曲分类分支对应的数据分类参数,对比所述当前歌曲分类分支对应的数据分类参数和所述当前歌曲分类分支下的样本歌曲的歌曲特征数据,得到下一歌曲分类分支;
31、将所述下一歌曲分类分支作为新的所述当前歌曲分类分支,返回所述获取所述当前歌曲分类分支对应的数据分类参数的步骤,直至所述当前歌曲分类分支只包含一种所述歌曲特征数据,得到针对所述歌曲特征维度对应的样本歌曲子集的歌曲分类分支。
32、第二方面,本申请还提供了一种异常歌手识别方法,所述方法包括:
33、获取预训练的决策树模型;所述预训练的决策树模型包括至少一个孤立树模型;每个所述孤立树模型分别与一歌手特征维度对应,所述孤立树模型为按照样本歌手标识集中的样本歌手标识在所述孤立树模型对应的歌手特征维度下的歌手特征数据,对所述样本歌手标识集进行分类得到的二叉搜索树;
34、根据待识别歌手标识的歌手特征数据,确定所述待识别歌手标识在各所述孤立树模型中对应的搜索路径;所述搜索路径在所述孤立树模型中所指向的歌手特征数据与所述待识别歌手标识的歌手特征数据在同一个所述歌手特征维度上相匹配;
35、根据各所述搜索路径的路径长度,输出确定所述待识别歌手标识对应的歌手是否为异常歌手的歌手识别结果。
36、第三方面,本申请还提供了一种异常歌曲识别装置,包括:
37、获取模块,用于获取预训练的决策树模型;所述预训练的决策树模型包括至少一个孤立树模型;每个所述孤立树模型分别与一歌曲特征维度对应,所述孤立树模型为按照样本歌曲集中的样本歌曲在所述孤立树模型对应的歌曲特征维度下的歌曲特征数据,对所述样本歌曲集进行分类得到的二叉搜索树;
38、确定模块,用于根据待识别歌曲的歌曲特征数据,确定所述待识别歌曲在各所述孤立树模型中对应的搜索路径;所述搜索路径在所述孤立树模型中所指向的歌曲特征数据与所述待识别歌曲的歌曲特征数据在同一个所本文档来自技高网...
【技术保护点】
1.一种异常歌曲识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述根据各所述搜索路径的路径长度,确定所述待识别歌曲是否为异常歌曲的歌曲识别结果,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述标准化路径长度,确定所述待识别歌曲是否为异常歌曲的歌曲识别结果,包括:
4.根据权利要求3所述的方法,其特征在于,所述根据所述歌曲异常分数,确定所述待识别歌曲是否为异常歌曲的歌曲识别结果,包括:
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
6.根据权利要求1所述的方法,其特征在于,所述获取预训练的决策树模型,包括:
7.根据权利要求6所述的方法,其特征在于,所述对所述歌曲特征维度对应的样本歌曲子集在所述歌曲特征维度下的歌曲特征数据进行分类,得到所述歌曲特征维度对应的孤立树模型,包括:
8.根据权利要求7所述的方法,其特征在于,所述根据所述数据分类参数,逐级确定针对所述歌曲特征维度对应的样本歌曲子集的歌曲分类分支,包括:
9.一种异常歌
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至9中任一项所述的方法的步骤。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。
...【技术特征摘要】
1.一种异常歌曲识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述根据各所述搜索路径的路径长度,确定所述待识别歌曲是否为异常歌曲的歌曲识别结果,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述标准化路径长度,确定所述待识别歌曲是否为异常歌曲的歌曲识别结果,包括:
4.根据权利要求3所述的方法,其特征在于,所述根据所述歌曲异常分数,确定所述待识别歌曲是否为异常歌曲的歌曲识别结果,包括:
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
6.根据权利要求1所述的方法,其特征在于,所述获取预训练的决策树模型,包括:
7.根据权利要求6所述的方法,...
【专利技术属性】
技术研发人员:李希鹏,张俊,
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。