本发明专利技术公开了一种音频比对系统及其音频能量比对方法,该音频比对系统,包括音频序列确定单元、音频序列处理单元和音频相似性判定单元。该音频能量比对方法通过去除异常帧得到能量平均比值(K值),然后通过统计大于K值正常区间内的点数来判定二路音频的相似性。本发明专利技术的音频比对系统是对待对比音频整体分割出多个音频帧,以音频帧之间能量对比而得出对比音频的相似度,此种对比方式受外界环境影响较小,即使在噪声较大、干扰较大的环境下也不会出现误报现象,对广播上的音频传输有重大意义。
【技术实现步骤摘要】
本专利技术涉及语音识别领域,尤指一种音频识别系统及其音频比对 方法。
技术介绍
传统的语音识别是从语音中识别 一段特定内容并根据内容产生其它相关应用。现有的音频比对技术都是基于梅尔倒频i普系数(Mel Frequency Cepstrum Coefficient, MFCC)算法,通过MFCC算法提耳又音 频特征参数,再根据音频特征参数的欧氏距离来判定音频的相似性, 而实际使用中表明这样的方法在音频质量较高情况下可正常工作,但 在噪声较大、干扰较大的场合有一定的误报现象,对于音频内容为音 乐的情况,误报尤为频繁。在实际的应用中,比对的应用通常是对通过不同的信号接收方法 得到的相同节目进行比对,例如卫星节目与空收节目的比对,而不同 的信号接收方法必然导致两路音频内容存在一定差异,空收的内容因 外界因素干扰也与源内容存在差异,MFCC算法是根据人耳的听觉特 性提取音频特征参数,因此音频内容的差异会导致算法产生误4艮。
技术实现思路
针对现有技术存在的问题,本专利技术的目的之一在于提供一种受外 界干扰小、能够准确识别音频相似性的音频比对系统。本专利技术的另 一 目的在于提供一种准确识别音频能量的比对方法。为实现上述目的,本专利技术的音频比对系统,包括音频序列确定单 元、音频序列处理单元和音频相似性判定单元;音频帧、音频序列确定单元用于确定需要比对的音频序列的长度, 以及其中音频帧的个数;音频序列处理单元用于处理需要比对的音频序列的各个音频帧的比值,根据比值的大小确定为正常音频帧或者异常音频帧,并根据正常音频帧进行平均值处理,得到待比对音频帧能量的平均比值k值, 根据音频能量平均比值的区间,得到待比对音频中音频帧的比值在区 间内的个凄t;音频相似性判定单元用于根据音频序列处理单元得到的待比对音 频间能量比值在区间内的个数与音频帧总数的比值范围来确定待比对 音频的相似性。进一步,所述音频序列处理单元中的音频序列由多个音频帧构成, 音频帧为音频上选取的N个取样点集合,其涵盖的时间为50-100ms。 进一步,所述N的值为512或1024。进一步,所述相邻音频帧之间有一段重迭区域,该重迭区域包含 了 M个取j羊点,且M为所述N值的 一半。进一步,所述音频序列中的音频帧个数为100-200个。进一步,所述待比对音频帧能量的平均值K小于10,则表明两对 比音频帧为正常音频帧,否则为异常音频帧。上述音频比对系统采用音频能量比对方法,具体步骤为l)确定 音频帧、音频序列乂人待比对音频中选取N个耳又样点组成对应的音频 帧,并选:f又100-200个音频帧构成对应的音频序列;2)计算音频帧的 能量值得到每一个取样点的能量值,根据音频能量的对称特性,计 算得出音频帧的能量值;3)计算待比对音频帧能量平均比值K值首 先根据待比对音频中每一对应的音频帧的能量比值将音频帧分为正常 音频帧或异常音频帧;其次通过对正常音频帧求和和平均的值相比后 得到待比对音频能量的平均比值K值;4)计算待比对音频中超过音频 能量平均比值K值的音频帧个数K值的取值范围为r,音频能量的比 值区间为(K-r, K+r),计算得出待比对音频中对应音频帧能量之比在 区间内的个数;5)判定待比对音频的相似性根据步骤4)中得出在 音频能量比值区间内的音频帧个数与音频帧总数的比值大小s来判定 二路音频的相似性。进一 步,所述取样点的个lt N为512或1024。进一步,步骤l)中选取的相邻音频帧之间有一段重迭区域,该区 域包含了 M个耳又样点,且M为所述N值的一半。进一步,步骤2)中计算两路音频能量值时只需计算能量值为正值 的采样点,将音频帧包含的采样点的能量值累加就得到音频帧的能量 值。进一步,所述待比对音频中对应的音频帧能量之比小于10,则表 明是正常音频帧,否则该音频帧为异常音频帧。 进一步,所述KK3,所述0.1〈s〈0.2。本专利技术的音频比对系统是对待对比音频整体分割出多个音频帧, 以音频帧之间能量对比而得出对比音频的相似度,此种对比方式受外 界环境影响较小,即使在噪声较大、干扰较大的环境下也不会出现误 报现象。该音频比对系统可以应用在音频传输上,在卫星与卫星间比 对,可以实时发现比对卫星的传输节目是否正常;另外音频比对系统 也可以进行卫星与AM/FM间进行比对,监测在转发卫星信号时节目内 容是否发生变化,实时发现设备故障或非法内容的攻击;同样,该系 统可以在光纤与AM/FM间进行比对,光纤信号是可靠的,因此可以以 光纤信号为基准来监测其它信号源的合法性。附图说明图1为音频帧、音频序列划分方法的示意图2为本专利技术音频比对系统与中波台信号源间的链路图。具体实施例方式本专利技术的音频比对系统,包括包括音频序列确定单元、音频序列 处理单元和音频相似性判定单元;音频帧、音频序列确定单元用于确定需要比对的音频序列的长度, 以及其中音频帧的个数;音频序列处理单元用于处理需要比对的音频序列的各个音频帧的 比值,根据比值的大小确定为正常音频帧或者异常音频帧,并根据正 常音频帧进行平均值处理,得到待比对音频帧能量的平均比值k值, 根据音频能量平均比值的区间,得到待比对音频中音频帧的比值在区 间内的个数;音频相似性判定单元用于根据音频序列处理单元得到的待比对音频间能量比值在区间内的个数与音频帧总数的比值范围来确定待比对 音频的相似性。该系统的具体工作步骤及原理如下1)音频序列是比对的最小单位,音频帧是计算音频序列能量值的 最小单位。先选取N个取样点集合成一个观测单位,称为音频帧,通 常N的值是512或1024,涵盖的时间约为50 100ms左右。为了避 免相邻两个音频帧的变化过大,所以两个相邻音频帧之间有一段重迭 区域,此重迭区域包含了 M个取样点,通常M的值约是N的一半。 语音识别所用的音频的取样频率为8 KHz或16 KHz,以8 KHz来 说,若音频帧长度为512个取样点,则对应的时间长度是 512/8000*1000 = 64 mso才艮据音频帧确定音频序列,通常音频序列取> 100-200个音频帧,若每个音频序列包含100个音频帧,则对应的音 频序列长度为64*100 = 6400ms,具体划分方法如图1所示;2)计算 音频帧的能量值根据音频能量对称的特性,计算两路音频能量值时 只需计算能量值为正值的采样点,将音频帧包含的采样点的能量值累加就得到音频帧的能量值;3)计算待比对音频帧能量平均比值K值 首先对音频帧分类,计算两路音频序列的各个音频帧的比值,分析音 频帧的能量比值,若小于10,表明是正常音频帧,否则表明该帧为异 常音频帧,计算平均能量比值时不再对该帧的能量值进行计算,这样 可以消除大的比值对K值的影响;其次计算K值,通过对正常音频帧 能量值求和平均计算得到两路音频的K值,先将正常音频值的能量值 进行累加,再做平均值,得到两路音频的平均比值-K值;4)计算超 过音频能量K值的音频帧个数,设定K值的取值范围,通常取为2, 即音频能量比值的区间为(K-2,K+2),计算两路音频比值在区间内的 个数,得出的个数包括在步骤3)中得出的异常音频帧;5)判定待比 对音频的相似性,根据步骤4)中得出个数与总音频帧总数的比值来判 定二路音频的相似性,比值通常取为0.15,若小于0.1本文档来自技高网...
【技术保护点】
一种音频比对系统,其特征在于,包括音频序列确定单元、音频序列处理单元和音频相似性判定单元; 音频帧、音频序列确定单元用于确定需要比对的音频序列的长度,以及其中音频帧的个数; 音频序列处理单元用于处理需要比对的音频序列的各个音频帧 的比值,根据比值的大小确定为正常音频帧或者异常音频帧,并根据正常音频帧进行平均值处理,得到待比对音频帧能量的平均比值k值,根据音频能量平均比值的区间,得到待比对音频中音频帧的比值在区间内的个数; 音频相似性判定单元用于根据音频序列处理 单元得到的待比对音频间能量比值在区间内的个数与音频帧总数的比值范围来确定待比对音频的相似性。
【技术特征摘要】
【专利技术属性】
技术研发人员:何永飞,陶元顺,
申请(专利权)人:北京市博汇科技有限公司,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。