音频数据排查方法及其装置、设备、介质、产品制造方法及图纸

技术编号:31487531 阅读:23 留言:0更新日期:2021-12-18 12:23
本申请涉及音频处理领域,公开一种音频数据排查方法及其装置、设备、介质、产品,所述方法包括:从音频文件中提取音频数据,所述音频数据以预定采样位数采样而成;根据所述音频数据中所述预定采样位数的低位部分相对应的低位数据在该音频数据的时域上的数据分布特征确定该音频数据的采样精度等级;将所述采样精度等级对应的采样位数低于所述预定采样位置的音频数据相对应的音频文件标记为缺陷数据。本申请从时域上实现对音频数据的音质分析排查,使音质评估更准确高效,具有广泛的应用前景。景。景。

【技术实现步骤摘要】
音频数据排查方法及其装置、设备、介质、产品


[0001]本申请涉及音频处理
,尤其涉及一种音频数据排查方法及其相应的装置、计算机设备、计算机可读存储介质,以及计算机程序产品。

技术介绍

[0002]伴随互联网在线音乐服务的发展,曲库中的歌曲作品越来越丰富,然而质量却参差不齐。随着人们对歌曲作品的音质要求越来越高,以及出于维护曲库实现去伪存真的需要,对曲库中的音频文件的音质进行检测也就变得更为必要。
[0003]现有技术中,对歌曲之类的音乐作品实施质量评估的方法,多依赖于音乐作品的音频数据的功率谱密度数据进行分析,功率谱密度是表征信号的功率能量与频率的关系的物理量,通过对功率谱密度数据进行频域分析来评估音频数据的音质信息,从而判定音乐作品的音质。
[0004]现有技术仅在频域对音乐作品的音质进行分析,忽略了音频数据在时域上的表现,常导致无法有效分析出音质较差的音频数据,影响评估效果,也影响相关业务的正常进行,例如一些音乐辅助创作领域需要调用高音质背景音乐相对应的音频数据时,为其推荐的音频数据却是劣质的,这种情况下便会影响辅助创作效率,降低用户体验。

技术实现思路

[0005]本申请的首要目的在于解决上述问题至少之一而提供一种音频数据排查方法及其相应的装置、计算机设备、计算机可读存储介质、计算机程序产品。
[0006]为满足本申请的各个目的,本申请采用如下技术方案:
[0007]适应本申请的目的之一而提供的一种音频数据排查方法,包括如下步骤:
[0008]从音频文件中提取音频数据,所述音频数据以预定采样位数采样而成;
[0009]根据所述音频数据中所述预定采样位数的低位部分相对应的低位数据在该音频数据的时域上的数据分布特征确定该音频数据的采样精度等级;
[0010]将所述采样精度等级对应的采样位数低于所述预定采样位置的音频数据相对应的音频文件标记为缺陷数据。
[0011]深化的实施例中,从音频文件中提取音频数据,所述音频数据以预定采样位数采样而成,包括如下步骤:
[0012]获取曲库中的音频文件,所述音频文件为无损音频文件;
[0013]以预定采样位数将所述音频文件转换为脉冲编码调制格式的音频数据。
[0014]深化的实施例中,根据所述音频数据中所述预定采样位数的低位部分相对应的低位数据在该音频数据的时域上的数据分布特征确定该音频数据的采样精度等级,包括如下步骤:
[0015]将所述音频数据转换为绝对值形式;
[0016]获取所述音频数据中的低位部分相对应的低位数据,将所有低位数据聚类为多个
分类相对应的数值标签,所述低位部分的位长为预设定值;
[0017]统计所述数值标签在所述音频数据中出现的频度,构成频度数据序列;
[0018]识别出所述频率数据序列的数据分布特征,根据所述数据分布特征判定出相应的采样精度等级。
[0019]具体化的实施例中,所述数据分布特征包括如下任意至少一种:
[0020]表征所述低位数据均呈现为全零数据的特征;表征所述低位数据呈现沿序列递减的特征;表征所述低位数据呈现沿序列递增的特征;表征所述低位数据呈现沿序列呈奇偶数频率高低交替的特征。
[0021]扩展的实施例中,本方法还包括如下步骤:
[0022]根据所述音频数据的功率谱密度确定该音频数据的截止频率;
[0023]将所述截止频率小于预设阈值的音频数据相对应的音频文件标记为缺陷数据。
[0024]深化的实施例中,根据所述音频数据的功率谱密度确定该音频数据的截止频率,包括如下步骤:
[0025]根据所述音频数据转换出语谱图相对应的元数据;
[0026]将所述元数据转换为第一功率谱密度数据,根据第一功率谱密度数据确定第一候选截止频率;
[0027]将所述元数据二值化后转换为第二功率谱密度数据,根据第二功率谱密度数据确定第二候选截止频率;
[0028]选取第一候选截止频率与第二候选截止频率中最小者作为所述的截止频率。
[0029]具体化的实施例中,将所述元数据转换为第一功率谱密度数据,根据第一功率谱密度数据确定第一候选截止频率,包括如下步骤:
[0030]根据所述元数据确定第一功率谱密度数据相对应的第一频率序列,第一频率序列包括多个频率相对应的功率总值,所述功率总值为与其相对应的频率沿音频数据时域上分布的多个功率值之和;
[0031]根据第一频率序列中的各个功率总值拟合成的平滑曲线数据确定出曲线斜率变化最大时所对应的频率为第一候选截止频率。
[0032]具体化的实施例中,将所述元数据二值化后转换为第二功率谱密度数据,根据第二功率谱密度数据确定第二候选截止频率,包括如下步骤:
[0033]对所述元数据进行二值化转换,获得二值化数据序列;
[0034]根据所述二值化数据序列确定第二功率谱密度数据相对应的第二频率序列,第二频率序列包括多个频率相对应的二值化累加值,所述二值化累加值为与其对应的频率沿音频数据时域上分布的多个二值化数据的累加和;
[0035]根据第二频率序列中的各个二值化累加值拟合成的平滑曲线数据确定出曲线斜率变化最大时所对应的频率为第二候选截止频率。
[0036]扩展的实施例中,本方法包括如下后续步骤:
[0037]构造缺陷数据列表,所述缺陷数据列表包括多个被标记为缺陷数据的音频文件的访问地址。
[0038]较佳的实施例中,所述低位部分的预设定值为低8位。
[0039]适应本申请的目的之一而提供的一种音频数据排查装置,包括:数据获取模块、时
域分析模块,以及时域标记模块,其中,所述数据获取模块,用于从音频文件中提取音频数据,所述音频数据以预定采样位数采样而成;所述时域分析模块,用于根据所述音频数据中所述预定采样位数的低位部分相对应的低位数据在该音频数据的时域上的数据分布特征确定该音频数据的采样精度等级;所述时域标记模块,用于将所述采样精度等级对应的采样位数低于所述预定采样位置的音频数据相对应的音频文件标记为缺陷数据。
[0040]深化的实施例中,所述数据获取模块包括:文件获取子模块,用于获取曲库中的音频文件,所述音频文件为无损音频文件;采样转换子模块,用于以预定采样位数将所述音频文件转换为脉冲编码调制格式的音频数据。
[0041]深化的实施例中,所述时域分析模块包括:坐标转换子模块,用于将所述音频数据转换为绝对值形式;低位提取子模块,用于获取所述音频数据中的低位部分相对应的低位数据,将所有低位数据聚类为多个分类相对应的数值标签,所述低位部分的位长为预设定值;频度统计子模块,用于统计所述数值标签在所述音频数据中出现的频度,构成频度数据序列;精度判定子模块,用于识别出所述频率数据序列的数据分布特征,根据所述数据分布特征判定出相应的采样精度等级。
[0042]具体化的实施例中,所述数据分布特征包括如下任意至少一种:表征所述低位数据均呈本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频数据排查方法,其特征在于,包括如下步骤:从音频文件中提取音频数据,所述音频数据以预定采样位数采样而成;根据所述音频数据中所述预定采样位数的低位部分相对应的低位数据在该音频数据的时域上的数据分布特征确定该音频数据的采样精度等级;将所述采样精度等级对应的采样位数低于所述预定采样位置的音频数据相对应的音频文件标记为缺陷数据。2.根据权利要求1所述的音频数据排查方法,其特征在于,从音频文件中提取音频数据,所述音频数据以预定采样位数采样而成,包括如下步骤:获取曲库中的音频文件,所述音频文件为无损音频文件;以预定采样位数将所述音频文件转换为脉冲编码调制格式的音频数据。3.根据权利要求1所述的音频数据排查方法,其特征在于,根据所述音频数据中所述预定采样位数的低位部分相对应的低位数据在该音频数据的时域上的数据分布特征确定该音频数据的采样精度等级,包括如下步骤:将所述音频数据转换为绝对值形式;获取所述音频数据中的低位部分相对应的低位数据,将所有低位数据聚类为多个分类相对应的数值标签,所述低位部分的位长为预设定值;统计所述数值标签在所述音频数据中出现的频度,构成频度数据序列;识别出所述频率数据序列的数据分布特征,根据所述数据分布特征判定出相应的采样精度等级。4.根据权利要求3所述的音频数据排查方法,其特征在于,所述数据分布特征包括如下任意至少一种:表征所述低位数据均呈现为全零数据的特征;表征所述低位数据呈现沿序列递减的特征;表征所述低位数据呈现沿序列递增的特征;表征所述低位数据呈现沿序列呈奇偶数频率高低交替的特征。5.根据权利要求1所述的音频数据排查方法,其特征在于,本方法还包括如下步骤:根据所述音频数据的功率谱密度确定该音频数据的截止频率;将所述截止频率小于预设阈值的音频数据相对应的音频文件标记为缺陷数据。6.根据权利要求5所述的音频数据排查方法,其特征在于,根据所述音频数据的功率谱密度确定该音频数据的截止频率,包括如下步骤:根据所述音频数据转换出语谱图相对应的元数据;将所述元数据转换为第一功率谱密度数据,根据第一功率谱密度数据确定第一候选截止频率;将所述元数据二值化后转换为第二功率谱密度数据,根据第二功...

【专利技术属性】
技术研发人员:张金华黄裕佳张舒婷
申请(专利权)人:广州世音联软件科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1