本发明专利技术公开了一种音频文件的相似计算方法及装置,其中的方法可包括:构建第一音频文件的Pitch序列,以及构建第二音频文件的Pitch序列;根据所述第一音频文件的Pitch序列,计算所述第一音频文件的特征向量,以及根据所述第二音频文件的Pitch序列,计算所述第二音频文件的特征向量;根据所述第一音频文件的特征向量和所述第二音频文件的特征向量,计算所述第一音频文件与所述第二音频文件的相似度。本发明专利技术可提高音频文件的相似计算的效率、准确性和智能性。
【技术实现步骤摘要】
一种音频文件的相似计算方法及装置
本专利技术涉及互联网
,具体涉及音频处理
,尤其涉及一种音频文 件的相似计算方法及装置。
技术介绍
目前,音频文件的相似计算主要存在以下两种方案,其一为人工相似计算,即需要 专业人员对两个音频文件进行分析,判断两个音频文件是否相似,并由专业人员为两个音 频文件确定相似度;此种方式的人力资源成本较高、相似计算效率较低、智能性较低。其二 为基于属性的相似计算,即可利用计算机装置基于两个音频文件的所属流派、所属专辑、作 者等属性信息进行相似计算,获得两个音频文件的相似度;此种方式完全摒弃了音频文件 本身的音频内容,仅属于简单的属性关联计算,相似计算的准确性较低。
技术实现思路
本专利技术实施例提供一种音频文件的相似计算方法及装置,可提高音频文件的相似 计算的效率、准确性和智能性。 本专利技术第一方面提供一种音频文件的相似计算方法,可包括: 构建第一音频文件的Pitch (音高)序列,以及构建第二音频文件的Pitch序列; 根据所述第一音频文件的Pitch序列,计算所述第一音频文件的特征向量,以及 根据所述第二音频文件的Pitch序列,计算所述第二音频文件的特征向量; 根据所述第一音频文件的特征向量和所述第二音频文件的特征向量,计算所述第 一音频文件与所述第二音频文件的相似度。 本专利技术第二方面提供一种音频文件的相似计算装置,可包括: 构建模块,用于构建第一音频文件的Pitch序列,以及构建第二音频文件的Pitch 序列; 向量计算模块,用于根据所述第一音频文件的Pitch序列,计算所述第一音频文 件的特征向量,以及根据所述第二音频文件的Pitch序列,计算所述第二音频文件的特征 向量; 相似计算模块,用于根据所述第一音频文件的特征向量和所述第二音频文件的特 征向量,计算所述第一音频文件与所述第二音频文件的相似度。 实施本专利技术实施例,具有如下有益效果: 本专利技术实施例通过构建第一音频文件的Pitch序列和第二音频文件的Pitch序 列,基于第一音频文件的Pitch序列计算第一音频文件的特征向量,基于第二音频文件的 Pitch序列计算第二音频文件的特征向量;从而可采用特征向量抽象化音频文件所包含的 音频内容;进一步,本专利技术实施例根据所述第一音频文件的特征向量和所述第二音频文件 的特征向量,计算所述第一音频文件与所述第二音频文件的相似度,由于基于音频文件所 包含的音频内容进行相似计算,摒弃了音频内容之外的其他因素的干扰,可有效地提高音 频文件的相似计算的效率、准确性和智能性。 【附图说明】 为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他的附图。 图1为本专利技术实施例提供的一种音频文件的相似计算方法的流程图; 图2为本专利技术实施例提供的另一种音频文件的相似计算方法的流程图; 图3为本专利技术实施例提供的一种音频文件的相似计算装置的结构示意图; 图4为本专利技术实施例提供的构建模块的结构示意图; 图5为本专利技术实施例提供的向量计算模块的结构示意图; 图6为本专利技术实施例提供的相似计算模块的结构示意图。 【具体实施方式】 下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于 本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他 实施例,都属于本专利技术保护的范围。 本专利技术实施例中,音频文件可以包括但不限于:歌曲、歌曲片段、音乐、音乐片段等 文件。第一音频文件可以为任一音频文件;第二音频文件可以为除第一音频文件之外的任 一音频文件。本专利技术实施例的音频文件的相似计算方案可以应用于互联网音频库的相似音 频文件的查询,例如:可以应用于互联网音频库中的相似歌曲查询,若需要查询歌曲A的相 似歌曲,可分别计算歌曲A与互联网音频库中所有歌曲之间的相似度,将互联网音频库中 与歌曲A的相似度最大的歌曲确定为歌曲A的相似歌曲;再如:可以应用于互联网音频库 中的相似音乐查询,若需要查询音乐B的相似音乐,可分别计算音乐B与互联网音频库中所 有音乐之间的相似度,将互联网音频库中与音乐B的相似度最大的歌曲确定为音乐B的相 似音乐;等等。本专利技术实施例的音频文件的相似计算方案还可以应用于互联网中的音频文 件的推荐,例如:可以应用于互联网的歌曲推荐,若用户当前正在收听歌曲C,可从互联网 音频库中查找与歌曲C相似的歌曲,将查找到的相似歌曲推荐给用户;再如:可以应用于互 联网的音乐推荐,若用户当前正在收听音乐D,可从互联网音频库中查找与音乐D相似的音 乐,将查找到的相似音乐推荐给用户;等等。 下面将结合附图1-附图2,对本专利技术实施例提供的音频文件的相似计算方法进行 详细介绍。 请参见图1,为本专利技术实施例提供的一种音频文件的相似计算方法的流程图;该 方法可包括以下步骤S101-步骤S103。 S101,构建第一音频文件的Pitch序列,以及构建第二音频文件的Pitch序列。 -个音频文件可以表不为以时间T为巾贞长,Ts为巾贞移的多个音频巾贞组成的一个中贞 序列;其中,帧长T和帧移Ts的取值可以根据实际需要进行确定,例如:针对一首歌曲,帧 长T可以为20ms,巾贞移Ts可以为10ms ;再如:针对一曲音乐,巾贞长T可以为10ms,巾贞移Ts可 以为5ms ;等等。不同的音频文件,帧长T的取值可能相同,也可能不同;帧移Ts的取值可 能相同,也可能不同。音频文件所包含的每个音频帧均携带音高,各个音频帧的音高按照各 个音频帧的时间先后顺序构成该音频文件的旋律信息。本步骤可根据第一音频文件所包含 的每个音频帧的音高,构建该第一音频文件的Pitch序列;以及可根据第二音频文件所包 含的每个音频帧的音高,构建该第二音频文件的Pitch序列。其中,第一音频文件的Pitch 序列包含该第一音频文件的每个音频帧的音高,第一音频文件的Pitch序列中所包含的各 个音高按序构成该第一音频文件的旋律信息。第二音频文件的Pitch序列包含该第二音频 文件的每个音频帧的音高,第二音频文件的Pitch序列中所包含的各个音高按序构成该第 二音频文件的旋律信息。 S102,根据所述第一音频文件的Pitch序列,计算所述第一音频文件的特征向量, 以及根据所述第二音频文件的Pitch序列,计算所述第二音频文件的特征向量。 其中,音频文件的特征向量可用于抽象化表征该音频文件所包含的音频内容;具 体地,音频文件的特征向量可通过特征参数,抽象化表征音频文件所包含的音频内容。其 中,第一音频文件的特征向量包含该第一音频文件的特征参数,第二音频文件的特征向量 包含该第二音频文件的特征参数;该特征参数包括但不限于以下参数中的至少一个:音高 均值、音高标准差、音高变化宽度、音高上升比例、音高下降比例、零音高比例、音高本文档来自技高网...
【技术保护点】
一种音频文件的相似计算方法,其特征在于,包括:、构建第一音频文件的音高Pitch序列,以及构建第二音频文件的Pitch序列;根据所述第一音频文件的Pitch序列,计算所述第一音频文件的特征向量,以及根据所述第二音频文件的Pitch序列,计算所述第二音频文件的特征向量;根据所述第一音频文件的特征向量和所述第二音频文件的特征向量,计算所述第一音频文件与所述第二音频文件的相似度。
【技术特征摘要】
1. 一种音频文件的相似计算方法,其特征在于,包括:、 构建第一音频文件的音高Pitch序列,以及构建第二音频文件的Pitch序列; 根据所述第一音频文件的Pitch序列,计算所述第一音频文件的特征向量,以及根据 所述第二音频文件的Pitch序列,计算所述第二音频文件的特征向量; 根据所述第一音频文件的特征向量和所述第二音频文件的特征向量,计算所述第一音 频文件与所述第二音频文件的相似度。2. 如权利要求1所述的方法,其特征在于,所述构建第一音频文件的Pitch序列,包 括: 提取第一音频文件所包含的每个音频帧的音高; 根据所述第一音频文件的每个音频帧的音高,构建所述第一音频文件的Pitch序列; 所述构建第二音频文件的Pitch序列,包括: 提取第二音频文件所包含的每个音频帧的音高; 根据所述第二音频文件的每个音频帧的音高,构建所述第二音频文件的Pitch序列。3. 如权利要求2所述的方法,其特征在于,所述根据所述第一音频文件的Pitch序列, 计算所述第一音频文件的特征向量,包括: 根据所述第一音频文件的Pitch序列,计算所述第一音频文件的特征参数; 将所述第一音频文件的特征参数采用数组进行存储,生成所述第一音频文件的特征向 量; 所述根据所述第二音频文件的Pitch序列,计算所述第二音频文件的特征向量,包括: 根据所述第二音频文件的Pitch序列,计算所述第二音频文件的特征参数; 将所述第二音频文件的特征参数采用数组进行存储,生成所述第二音频文件的特征向 量。4. 如权利要求3所述的方法,其特征在于,所述特征参数包括以下参数中的至少一个: 音高均值、音高标准差、音高变化宽度、音高上升比例、音高下降比例、零音高比例、音高上 升的平均速率和音高下降的平均速率。5. 如权利要求1-4任一项所述的方法,其特征在于,根据所述第一音频文件的特征向 量和所述第二音频文件的特征向量,计算所述第一音频文件与所述第二音频文件的相似 度,包括: 计算所述第一音频文件的特征向量和所述第二音频文件的特征向量之间的欧氏距 离; 将计算获得的所述欧氏距离确...
【专利技术属性】
技术研发人员:赵伟峰,李深远,张李伟,陈剑锋,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。