一种音频指纹的提取方法、装置、电子设备及存储介质制造方法及图纸

技术编号:26602253 阅读:14 留言:0更新日期:2020-12-04 21:25
本公开提供一种音频指纹的提取方法、装置、电子设备及存储介质,涉及声纹识别技术领域,用于提高音频指纹的鲁棒性。该方法包括:确定待处理的音频信号,并对待处理的音频信号进行频谱特征提取处理,获得目标频谱图;从目标频谱图中提取局部区域峰值点,获得局部峰值点候选集,局部峰值点候选集包括目标频谱图上按照预设频段划分的各区域中的峰值点;从目标频谱图的平坦区域中提取峰值点,获得平坦区域的局部峰值点集合;基于局部峰值点候选集和平坦区域的局部峰值点集合,得到目标局部峰值点集合,并根据目标局部峰值点集合确定待处理的音频信号的音频指纹,目标局部峰值点集合包括从局部峰值点候选集中剔除平坦区域的局部峰值点集合中的峰值点。

【技术实现步骤摘要】
一种音频指纹的提取方法、装置、电子设备及存储介质
本公开涉及声纹识别
,尤其涉及一种音频指纹的提取方法、装置、电子设备及存储介质。
技术介绍
目前,基于音频指纹的音频检索在听歌识曲、身份认证等多种场景有较为广泛的应用。相关技术中,在提取音频指纹时,存在提取的音频信号对应频谱上的局部峰值点数量过多,对噪声处理的鲁棒性较差,从而导致音频指纹变多,即在一定程度上降低了基于音频指纹检索方法中音频指纹的索引性能。
技术实现思路
本公开提供一种音频指纹的提取方法、装置、电子设备及存储介质,以提高音频指纹的鲁棒性。本公开的技术方案如下:根据本公开实施例的第一方面,提供一种音频指纹的提取方法,所述方法包括:确定待处理的音频信号,并对所述待处理的音频信号进行频谱特征提取处理,获得目标频谱图;从所述目标频谱图中提取局部区域峰值点,获得局部峰值点候选集,所述局部峰值点候选集包括所述目标频谱图上按照预设频段划分的各区域中的峰值点;以及,从所述目标频谱图的平坦区域中提取峰值点,获得平坦区域的局部峰值点集合,其中,所述平坦区域为所述目标频谱图中与相邻能量值的差值属于第一预定范围,且能量值小于第一预定值的多个能量值所组成的连通区域;基于所述局部峰值点候选集和所述平坦区域的局部峰值点集合,得到目标局部峰值点集合,并根据所述目标局部峰值点集合确定所述待处理的音频信号的音频指纹,其中,所述目标局部峰值点集合包括从所述局部峰值点候选集中剔除所述平坦区域的局部峰值点集合中的峰值点。在一种可能的实施方式中,所述从所述目标频谱图的平坦区域中提取峰值点,获得平坦区域的局部峰值点集合,包括:确定所述目标频谱图的平坦区域;对所述平坦区域进行蚀刻处理,获得第一平坦区域,并对所述第一平坦区域进行最大值池化处理,以获得所述第一平坦区域的局部峰值点集合。在本公开实施例中,可以先确定目标频谱图中的平坦区域,然后对平坦区域进行蚀刻处理以获得第一平坦区域,并获得第一平坦区域的局部峰值点集合。这样的方式,可以确定与其它音频信号可能会相同的平坦区域,减少了容易造成混淆的峰值点,使得提取音频指纹更具有鲁棒性。在一种可能的实施方式中,所述确定所述目标频谱图的平坦区域,包括:对所述目标频谱图进行均值池化处理,得到所述目标频谱图对应的局部平均值图;将所述目标频谱图的能量值减去所述局部平均值图中的能量值,获得处理值集;若确定所述处理值集中的多个处理值与第二预定阈值的差值属于预定范围,则根据所述多个处理值对应的能量值在所述目标频谱图中的位置,确定所述目标频谱图的平坦区域。在本公开实施例中,可以将目标频谱图的能量值减去局部平均值图中的能量值获得处理值集,并当确定处理值集中的多个处理值与第二预定阈值的差值属于预定范围时,确定平坦区域。这样的方式,可以高效且准确的确定平坦区域。在一种可能的实施方式中,所述对所述平坦区域进行蚀刻处理,获得第一平坦区域,包括:确定所述平坦区域中的第一处理子区域,其中,所述第一处理子区域为所述平坦区域中按照第一预设频段划分的各区域中的任一子区域;将所述第一处理子区域中的处理值进行蚀刻处理,获得蚀刻处理后的对应值;将所述对应值中与预设值相同的值对应删除,获得第一处理子区域对应的能量值,以获得所述第一平坦区域。在本公开实施例中,可以先确定平坦区域中的第一处理子区域,然后对第一处理子区域中的处理值进行蚀刻处理,这样的方式,可以对平坦区域中每个区域进行处理,且由于对平坦区域中的第一处理子区域进行蚀刻处理,即从第一处理子区域对应的局部峰值点中去掉鲁棒性较好的峰值点,获得第一平坦区域,为后续音频指纹的提取提供良好的实施基础,使得提取的音频指纹的鲁棒性更好。在一种可能的实施方式中,从所述目标频谱图中提取局部区域峰值点,获得局部峰值点候选集,包括:对所述目标频谱图进行最大值池化处理,获得局部峰值点候选集。在本公开实施例中,通过对目标频谱图进行最大值池化处理,可以简单快速的确定目标频谱图的局部峰值点候选集,提升音频指纹的提取效率。根据本公开实施例的第二方面,提供一种音频指纹的提取装置,所述装置包括:处理单元,被配置为执行确定待处理的音频信号,并对所述待处理的音频信号进行频谱特征提取处理,获得目标频谱图;第一获得单元,被配置为执行从所述目标频谱图中提取局部区域峰值点,获得局部峰值点候选集,所述局部峰值点候选集包括所述目标频谱图上按照预设频段划分的各区域中的峰值点;以及,第二获得单元,被配置为执行从所述目标频谱图的平坦区域中提取峰值点,获得平坦区域的局部峰值点集合,其中,所述平坦区域为所述目标频谱图中与相邻能量值的差值属于第一预定范围,且能量值小于第一预定值的多个能量值所组成的连通区域;确定单元,基于所述局部峰值点候选集和所述平坦区域的局部峰值点集合,得到目标局部峰值点集合,并根据所述目标局部峰值点集合确定所述待处理的音频信号的音频指纹,其中,所述目标局部峰值点集合包括从所述局部峰值点候选集中剔除所述平坦区域的局部峰值点集合中的峰值点。在一种可能的实施方式中,所述第二获得单元被配置为执行:确定所述目标频谱图的平坦区域;对所述平坦区域进行蚀刻处理,获得第一平坦区域,并对所述第一平坦区域进行最大值池化处理,以获得所述第一平坦区域的局部峰值点集合。在一种可能的实施方式中,所述第二获得单元被配置为执行:对所述目标频谱图进行均值池化处理,得到所述目标频谱图对应的局部平均值图;将所述目标频谱图中的能量值减去所述局部平均值图中的能量值,获得处理值集;若确定所述处理值集中的多个处理值与第二预定阈值的差值属于预定范围,则根据所述多个处理值对应的能量值在所述目标频谱图中的位置,确定所述目标频谱图的平坦区域。在一种可能的实施方式中,所述第二获得单元被配置为执行:确定所述平坦区域中的第一处理子区域,其中,所述第一处理子区域为所述平坦区域中按照第一预设频段划分的各区域中的任一子区域;将所述第一处理子区域中的处理值进行蚀刻处理,获得蚀刻处理后的对应值;将所述对应值中与预设值相同的值对应删除,获得第一处理子区域对应的能量值,以获得所述第一平坦区域。在一种可能的实施方式中,所述第一获得单元,被配置为执行:对所述目标频谱图进行最大值池化处理,获得局部峰值点候选集。根据本公开实施例的第三方面,提供一种电子设备,所述电子设备包括:处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为执行指令,以实现本公开实施例上述第一方面以及第一方面涉及的任一可能涉及的方法。根据本公开实施例的第四方面,提供一种存储介质,当存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行本公开实施例上述第一方面以及第一方面涉及的任一可能涉及的方法。根据本公开实施例的第五方面,提供一种计算机程序产品本文档来自技高网...

【技术保护点】
1.一种音频指纹的提取方法,其特征在于,所述方法包括:/n确定待处理的音频信号,并对所述待处理的音频信号进行频谱特征提取处理,获得目标频谱图;/n从所述目标频谱图中提取局部区域峰值点,获得局部峰值点候选集,所述局部峰值点候选集包括所述目标频谱图上按照预设频段划分的各区域中的峰值点;以及,/n从所述目标频谱图的平坦区域中提取峰值点,获得平坦区域的局部峰值点集合,其中,所述平坦区域为所述目标频谱图中与相邻能量值的差值属于第一预定范围,且能量值小于第一预定值的多个能量值所组成的连通区域;/n基于所述局部峰值点候选集和所述平坦区域的局部峰值点集合,得到目标局部峰值点集合,并根据所述目标局部峰值点集合确定所述待处理的音频信号的音频指纹,其中,所述目标局部峰值点集合包括从所述局部峰值点候选集中剔除所述平坦区域的局部峰值点集合中的峰值点。/n

【技术特征摘要】
1.一种音频指纹的提取方法,其特征在于,所述方法包括:
确定待处理的音频信号,并对所述待处理的音频信号进行频谱特征提取处理,获得目标频谱图;
从所述目标频谱图中提取局部区域峰值点,获得局部峰值点候选集,所述局部峰值点候选集包括所述目标频谱图上按照预设频段划分的各区域中的峰值点;以及,
从所述目标频谱图的平坦区域中提取峰值点,获得平坦区域的局部峰值点集合,其中,所述平坦区域为所述目标频谱图中与相邻能量值的差值属于第一预定范围,且能量值小于第一预定值的多个能量值所组成的连通区域;
基于所述局部峰值点候选集和所述平坦区域的局部峰值点集合,得到目标局部峰值点集合,并根据所述目标局部峰值点集合确定所述待处理的音频信号的音频指纹,其中,所述目标局部峰值点集合包括从所述局部峰值点候选集中剔除所述平坦区域的局部峰值点集合中的峰值点。


2.如权利要求1所述的方法,其特征在于,所述从所述目标频谱图的平坦区域中提取峰值点,获得平坦区域的局部峰值点集合,包括:
确定所述目标频谱图的平坦区域;
对所述平坦区域进行蚀刻处理,获得第一平坦区域,并对所述第一平坦区域进行最大值池化处理,以获得所述第一平坦区域的局部峰值点集合。


3.如权利要求2所述的方法,其特征在于,所述确定所述目标频谱图的平坦区域,包括:
对所述目标频谱图进行均值池化处理,得到所述目标频谱图对应的局部平均值图;
将所述目标频谱图的能量值减去所述局部平均值图中的能量值,获得处理值集;
若确定所述处理值集中的多个处理值与第二预定阈值的差值属于预定范围,则根据所述多个处理值对应的能量值在所述目标频谱图中的位置,确定所述目标频谱图的平坦区域。


4.如权利要求3所述的方法,其特征在于,所述对所述平坦区域进行蚀刻处理,获得第一平坦区域,包括:
确定所述平坦区域中的第一处理子区域,其中,所述第一处理子区域为所述平坦区域中按照第一预设频段划分的各区域中的任一子区域;
将所述第一处理子区域中的处理值进行蚀刻处理,获得蚀刻处理后的对应值;
将所述对应值中与预设值相同的值对应删除,获得第一处理子区域对应的能量值,以获得所述第一平坦区域。


5.如权利要求1所述的方法,其特征在于,从所述目标频谱图中提取局部区域峰值点,获得局部峰值点候...

【专利技术属性】
技术研发人员:陈晓敏姜涛
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1