本发明专利技术公开了一种基于时域掩蔽的瞬态判决方法及设备,涉及语音频编解码领域。本发明专利技术公开的瞬态判决方法包括:将当前帧时域信号分块处理后,根据时域前掩蔽衰减系数、时域后掩蔽衰减系数、各分块时域滤波信号的能量以及前一帧的帧总能量计算各分块的短时分块时域掩蔽能量,根据短时分块时域掩蔽能量和历史的短时分块时域掩蔽能量计算各分块的长时分块时域掩蔽能量,当所述分块中一个或多个分块的短时和长时分块时域掩蔽能量比值达到第一设定值,且所述分块中一个或多个分块的短时分块时域掩蔽能量达到第二设定值时,则判断当前帧为瞬态信号。本发明专利技术使得通过简单运算进行的瞬态判决也具有较高的准确性。
【技术实现步骤摘要】
本专利技术涉及语音频编解码领域,特别涉及一种基于时域掩蔽的瞬态判决方法及设 备。
技术介绍
前回声失真是音频编解码领域一个突出问题,特别在低码率的语音频感知编码器 中,前回声失真更为严重,产生前回声最重要的原因是由于时域分辨率的不足造成量化噪 声在时域的扩散,如果该时域的量化噪声无法被信号掩蔽,就产生恼人的前回声效应。目前 已经有相关方法解决前回声问题,如比特池方法、时域噪声整形(TNS)、混合滤波器组、增益 控制、长短窗切换等方法,而这些方法多数都是基于准确的瞬态判决这一前提,这就使得瞬 态判决变得十分重要。目前瞬态判决方法主要有时域能量方法和频域能量方法,时域能量方法主要计算 了信号能量的时域幅值包络,根据幅值包络的瞬态特性判别瞬态信号;频域能量方法之一 是通过计算频域的能量谱包络判别瞬态信号,另外AAC的感知熵(PE)方法也可属于一种频 域能量方法,该方法通过分析由于音频出现瞬态信号后将产生大量高频信号,从而使得信 号感知熵明显增大,所以可以通过比较判断感知熵和某个阈值(例如是否大于1800)来确 定是否出现瞬态信号。但是,这些方法都存在一定的不足,例如,时域能量方法虽然运算简 单,但瞬态判决的准确性不够高;而频域能量方法,例如感知熵方法则存在运算复杂度高、 瞬态判决时间分辨率低等问题,则不适用于低延迟低复杂度的语音频编解码器。
技术实现思路
本专利技术所要解决的技术问题是,提供一种基于时域掩蔽的瞬态判决方法及设备, 从而使瞬态判决方法即简单,又具有较高的准确性。为了解决上述问题,本专利技术公开了一种基于时域掩蔽的瞬态判决方法,包括将当前帧时域信号分块处理后,根据时域前掩蔽衰减系数、时域后掩蔽衰减系数、 各分块时域滤波信号的能量以及前一帧的帧总能量计算各分块的短时分块时域掩蔽能量, 根据所述短时分块时域掩蔽能量和历史的短时分块时域掩蔽能量计算各分块的长时分块 时域掩蔽能量,当所述分块中一个或多个分块的短时和长时分块时域掩蔽能量比值达到第 一设定值,且所述分块中一个或多个分块的短时分块时域掩蔽能量达到第二设定值时,则 判断当前帧为瞬态信号。进一步地,上述方法中,按照如下公式计算分块的短时分块时域掩蔽能量 Tmaski (m)<formula>formula see original document page 4</formula>mEi (k) ^posMaskRate{z -m + k)A=I其中,I^preMaski (m)为分块时域前掩蔽能量,^posMaski (m)为分块时域后掩蔽 能量,Ei(Hi)为分块时域滤波信号的能量,m为整数,表示帧信号分块序号,i为整数,表示帧 序号,ζ为整数,表示帧时域信号分块处理中分块总数目,Emg(i-1)为前一帧的帧总能量, preMaskRate (k-m)为时域前掩蔽衰减系数,posMaskRate (z_m+k)为时域后掩蔽衰减系数。所述时域前掩蔽衰减系数preMaskRate (j)由时域前掩蔽衰减曲线及时域信号分 块处理中的分块数目ζ确定。所述时域后掩蔽衰减系数posMaskRate (j)由时域后掩蔽衰减曲线及时域信号分 块处理中的分块数目ζ确定。进一步地,上述方法中,当满足如下一个或两个条件时,进一步判断若前一帧的瞬 态判断附加标志有效,则设置当前帧的瞬态标志有效,设置当前帧的瞬态判断附加标志无 效,前述条件如下所述各分块的短时和长时分块时域掩蔽能量的比值均未达到所述第一设定值,所 述各分块的短时分块时域掩蔽能量均未达到第二设定值。本专利技术还公开了一种基于时域掩蔽的瞬态判决设备,包括彼此连接的计算模块及 判断模块,其中所述计算模块,用于在帧时域信号分块处理后,根据时域前掩蔽衰减系数、时域后 掩蔽衰减系数、各分块时域滤波信号的能量以及前一帧的帧总能量计算各分块的短时分块 时域掩蔽能量值,根据所述短时分块时域掩蔽能量和历史的短时分块时域掩蔽能量计算各 分块的长时分块时域掩蔽能量值,并计算各分块的短时和长时分块时域掩蔽能量比值,将 计算得到的各分块的短时分块时域掩蔽能量值和短时和长时分块时域掩蔽能量比值分别 发送到所述判断模块;所述判断模块,用于判断所接收的各分块的短时和长时分块时域掩蔽能量比值中 是否有一个或多个比值达到第一设定值,以及所接收的各分块的短时分块时域掩蔽能量值 中是否有一个或多个能量值达到第二设定值,如果判断结果均为是,则当前帧为瞬态信号。进一步地,上述设备中,所述计算模块按照如下公式计算分块的短时分块时域掩 蔽能量 Tmaski (m) Tmaski (m) = LpreMaski (m) +LposMaski (m) -Ei (m)ZT _ PreMaski (m) = ^ Ej (k) * preMaskRate(k - m)k-mT — PosMaski (m) ----- Eeng (i 一 1) * posMaskRate{z - m)m+ ^ Ei (k) ^posMaskRateiz -m + k)k=l其中,I^preMaski (m)为分块时域前掩蔽能量,^posMaski (m)为分块时域后掩蔽 能量,Ei(Hi)为分块时域滤波信号的能量,m为整数,表示帧信号分块序号,i为整数,表示帧 序号,ζ为整数,表示帧时域信号分块处理中分块总数目,Emg(i-1)为前一帧的帧总能量, preMaskRate (k-m)为时域前掩蔽衰减系数,posMaskRate (z_m+k)为时域后掩蔽衰减系数。所述时域前掩蔽衰减系数preMaskRate (j)由时域前掩蔽衰减曲线及时域信号分块处理中的分块数目Z确定。所述时域后掩蔽衰减系数posMaskRateG)由时域后掩蔽衰减曲线及时域信号分 块处理中的分块数目ζ确定。进一步地,上述设备中,当满足如下一个或两个条件时,所述判断模块进一步判断 若前一帧的瞬态判断附加标志有效,则设置当前帧的瞬态标志有效,设置当前帧的瞬态判 断附加标志无效,前述条件如下所述各分块的短时和长时分块时域掩蔽能量的比值均未达到所述第一设定值,所 述各分块的短时分块时域掩蔽能量均未达到第二设定值。本专利技术技术方案使得通过简单运算进行的瞬态判决也具有较高的准确性,从而大 大减少了语音频编解码的前回声失真。本专利技术技术方案可以用于实时双向通信如无线、IP 会议电视和实时广播业务的IPTV、移动流媒体、手机电视等语音频编解码领域的瞬态信号 判决。附图说明图1是用于语音频编码器的时域掩蔽瞬态判决应用框图;图2是人耳的时域掩蔽效应示意图;图3是基于时域掩蔽的瞬态判决设备的结构框图;图4是本实施例中基于时域掩蔽的瞬态判决过程的流程图;图5是瞬态判决示意图(部分A);图6是瞬态判决示意图(部分B)。具体实施例方式本专利技术的主要构思是,对于低延迟低复杂度的语音频编解码器可以采用运算简单 的时域能量方法进行瞬态判决(如图1所示),而在此基础上考虑到人耳会产生时域掩蔽效 应(如图2所示),故可以在现有的根据时域能量进行瞬态判决的方法中,综合考虑时域信 号的时域前掩蔽和后掩蔽效应,以提高瞬态判决的准确性,具体过程如下步骤1、信号滤波,即将输入的时域信号先经过高通滤波,以滤除不必要的低频信 号,得到信号细节本文档来自技高网...
【技术保护点】
一种基于时域掩蔽的瞬态判决方法,其特征在于,包括:将当前帧时域信号分块处理后,根据时域前掩蔽衰减系数、时域后掩蔽衰减系数、各分块时域滤波信号的能量以及前一帧的帧总能量计算各分块的短时分块时域掩蔽能量,根据所述短时分块时域掩蔽能量和历史的短时分块时域掩蔽能量计算各分块的长时分块时域掩蔽能量,当所述分块中一个或多个分块的短时和长时分块时域掩蔽能量比值达到第一设定值,且所述分块中一个或多个分块的短时分块时域掩蔽能量达到第二设定值时,则判断当前帧为瞬态信号。
【技术特征摘要】
【专利技术属性】
技术研发人员:林志斌,邓峥,彭科,卢晶,邱小军,黎家力,陈国明,袁浩,刘开文,
申请(专利权)人:中兴通讯股份有限公司,
类型:发明
国别省市:94[中国|深圳]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。