本发明专利技术涉及用于对有效帧进行宽带编码和解码的系统、方法和设备。本发明专利技术描述将模糊和突发技术应用于宽带语音信号的编码。本发明专利技术还描述使用来自先前帧的信息重构宽带语音信号的帧的高带部分。
【技术实现步骤摘要】
本专利技术涉及对语音信号的处理。
技术介绍
通过数字技术进行的话音传输已变得较为普遍,尤其是在长距离电话、例如IP话音(还称为VoIP,其中IP表示因特网协议)等包交换电话和例如蜂窝式电话等数字无线电电话中。此迅速扩散已使得产生了对减少用以经由传输信道传送话音通信的信息量且同时维持重构语音的感知质量的关注。经配置以通过提取与人类语音产生模型相关的参数而压缩语音的装置被称为“语音编码装置”。语音编码装置(还称为语音编解码器或声码器)通常包括语音编码器和语音解码器。语音编码器通常将传入的语音信号(表示音频信息的数字信号)划分为称为“帧” 的时间片段,分析每一帧以提取某些相关参数且将所述参数量化为经编码帧。经由传输信道(即,有线或无线网络连接)将经编码帧传输到包括语音解码器的接收器。语音解码器接收并处理经编码帧,对其进行解量化以产生参数,且使用经解量化的参数来重建语音帧。语音编码器通常经配置以区分语音信号的含有语音的帧(“有效帧”)与语音信号的仅含有静默或背景噪声的帧(“无效帧”)。语音编码器可经配置以使用不同编码模式和 /或速率来对有效和无效帧进行编码。举例来说,语音编码器通常经配置以使用比对有效帧进行编码所使用的位少的位来对无效帧进行编码。语音编码装置可对于无效帧使用较低位速率且/或对于不同类型的有效帧使用不同位速率,以支持以较低平均位速率进行语音信号传送,其中存在极少或毫无质量的感知损失。传统上已在带宽方面将经由公众交换电话网络(PSTN)的话音通信限于300到 3400千赫(kHz)的频率范围。较新近的用于话音通信的网络(例如使用蜂窝式电话和/或 VoIP的网络)可能并无相同的带宽限制,且可能需要使用此类网络的设备具有传输和接收包括宽带频率范围的话音通信的能力。举例来说,可能需要此类设备支持向下延伸到50Hz 且/或向上延伸到7或8kHz的音频频率范围。还可能需要此类设备支持其它应用,例如高质量音频或音频/视频会议、对例如音乐和/或电视等多媒体服务的传递等等,所述应用可能具有在传统PSTN界限以外的范围内的音频语音内容。语音编码装置所支持的范围向较高频率中的延伸可改进清晰度。举例来说,语音信号中区别例如“S”和“f”等摩擦音的信息主要处于较高频率中。高带延伸还可改进经解码语音信号的其它质量,例如真实感。举例来说,甚至有声元音也可能具有远高于PSTN频率范围的频谱能量。
技术实现思路
根据一种配置的处理语音信号的方法包括基于所述语音信号的第一有效帧而产生第一语音包,所述第一语音包包括对语音信号的包括第一有效帧的部分在(A)第一频带和(B)在第一频带上方延伸的第二频带上的频谱包络的描述。此方法还包括基于所述语音信号的第二有效帧而产生第二语音包,所述第二语音包包括对语音信号的包括第二有效帧的部分在第一频带上的频谱包络的描述。在此方法中,第二语音包不包括对在第二频带上的频谱包络的描述。根据另一配置的语音编码器包括包编码器和帧格式化器。所述包编码器经配置以基于语音信号的第一有效帧且响应于速率控制信号的第一状态而产生第一语音包,所述第一语音包包括对在(1)第一频带和( 在第一频带上方延伸的第二频带上的频谱包络的描述。所述包编码器还经配置以基于语音信号的第二有效帧且响应于速率控制信号的不同于第一状态的第二状态而产生第二语音包,所述第二语音包包括对在第一频带上的频谱包络的描述。所述帧格式化器经布置以接收第一和第二语音包。帧格式化器经配置以响应于模糊化控制信号的第一状态而产生第一经编码帧,所述第一经编码帧含有第一语音包。帧格式化器还经配置以响应于模糊化控制信号的不同于第一状态的第二状态而产生第二经编码帧,所述第二经编码帧含有第二语音包和与语音信号分离的信息信号的突发。在此编码器中,第一和第二经编码帧具有相同长度,第一语音包占据所述第一经编码帧的至少百分之八十,第二语音包占据第二经编码帧的不超过一半,且第二有效帧在语音信号中紧随第一有效帧之后出现。根据另一配置的处理语音包的方法包括基于来自一来自经编码语音信号的第一语音包的信息而获得对语音信号的第一帧在(A)第一频带和(B)不同于第一频带的第二频带上的频谱包络的描述。此方法还包括基于来自一来自经编码语音信号的第二语音包的信息而获得对语音信号的第二帧在第一频带上的频谱包络的描述。此方法还包括基于来自第一语音包的信息而获得对第二帧在第二频带上的频谱包络的描述。此方法还包括基于来自第二语音包的信息而获得与第二帧的针对第一频带的音调分量相关的信息。根据另一配置的语音解码器经配置以基于经编码的语音信号而计算经解码的语音信号。此语音解码器包括控制逻辑和包解码器。所述控制逻辑经配置以产生包含值序列的控制信号,所述序列基于来自经编码语音信号的语音包的编码索引,所述序列中的每一值对应于经解码语音信号的帧周期。所述包解码器经配置以响应于所述控制信号的具有第一状态的值而基于对经解码帧在(1)第一频带和( 在第一频带上方延伸的第二频带上的频谱包络的描述来计算对应的经解码帧,所述描述基于来自一来自经编码语音信号的语音包的信息。包解码器还经配置以响应于所述控制信号的具有不同于所述第一状态的第二状态的值而基于以下描述来计算对应的经解码帧(1)对经解码帧在第一频带上的频谱包络的描述,所述描述基于来自一来自所述经编码语音信号的语音包的信息,以及( 对经解码帧在第二频带上的频谱包络的描述,所述描述基于来自在所述经编码的语音信号中出现于所述语音包之前的至少一个语音包的信息。附图说明图1展示与PSTN介接的无线电话系统的图。图2展示与因特网介接的无线电话系统的图。图3展示两个语音编码器/解码器对的框图。图4展示语音编码器或语音编码方法可用来选择位速率的决策树的一个实例。图5A展示可用以计算增益形状值的梯形开窗函数的曲线图。图5B展示将图6A的开窗函数应用于一帧的五个子帧中的每一者。图6A展示分带编码器可用来对宽带语音内容进行编码的非重叠频带方案的一个实例。图6B展示分带编码器可用来对宽带语音内容进行编码的重叠频带方案的一个实例。图7A到7C展示192位经编码帧的三种不同格式。图8A是根据通用配置的方法MlOO的流程图。图8B是方法MlOO的实施方案MllO的流程图。图9说明使用方法MlOO的实施方案而对语音信号的两个连续有效帧进行编码的操作。图10说明方法MlOO的任务TllO和T120的操作。图11说明方法MllO的任务T112和任务T120的实施方案的操作。图12是展示经配置以执行方法MlOO的实施方案的语音编码器可使用的一组四个不同编码方案的表。图13是描述171位宽带FCELP包的位分配的表。图14是描述80位窄带HCELP包的位分配的表。图15A展示根据通用配置的语音编码器100的框图。图15B展示包编码器120的实施方案122的框图。图15C展示频谱包络描述计算器140的实施方案142的框图。图16A展示包编码器122的实施方案124的框图。图16B展示时间信息描述计算器152的实施方案154的框图。图17A展示语音编码器100的实施方案102的框图,所述实施方案102经配置以根据分带编码方案而对宽带语音信号进行编码。图17B展示包编码器126的实施方案128的框图。图18A展示包编码器本文档来自技高网...
【技术保护点】
1.一种语音编码器,所述语音编码器包含:包编码器,其经配置以(A)基于语音信号的第一有效帧且响应于速率控制信号的第一状态而产生第一语音包,所述第一语音包包括对在(1)第一频带和(2)在所述第一频带上方延伸的第二频带上的频谱包络的描述,且(B)基于所述语音信号的第二有效帧且响应于所述速率控制信号的不同于所述第一状态的第二状态产生第二语音包,所述第二语音包包括对在所述第一频带上的频谱包络的描述;和帧格式化器,其经布置以接收所述第一和第二语音包,且经配置以(A)响应于模糊化控制信号的第一状态而产生含有所述第一语音包的第一经编码帧且(B)响应于所述模糊化控制信号的不同于所述第一状态的第二状态产生含有所述第二语音包和与所述语音信号分离的信息信号的突发的第二经编码帧,其中所述第一和第二经编码帧具有相同长度,所述第一语音包占据所述第一经编码帧的至少百分之八十,且所述第二语音包占据所述第二经编码帧的不超过一半,且其中所述第二有效帧在所述语音信号中紧随所述第一有效帧之后出现。
【技术特征摘要】
...
【专利技术属性】
技术研发人员:阿南塔帕德马那伯罕·A·坎达哈达伊,维韦克·拉金德朗,
申请(专利权)人:高通股份有限公司,
类型:发明
国别省市:US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。