移动电信网络中的方法和装置制造方法及图纸

技术编号:3466553 阅读:187 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及对于接收器优选的控制逻辑部件。所述接收器包括:抖动缓冲器部件,适合于接收并缓冲入局帧或数据包并且从所接收的数据包中提取数据帧;连接到抖动缓冲器部件的解码器,适合于对所提取的数据帧进行解码;连接到解码器的时间缩放部件,适合于自适应地播放经解码的语音帧。根据本发明专利技术的控制逻辑部件包括:关于状态恢复功能是否可用的知识,以及所述控制逻辑部件适合于从抖动缓冲器部件、时间缩放部件和解码器这三者中的至少一个检索至少一个参数,来执行以下操作中的至少一个:基于来自抖动缓冲器部件的至少一个参数和状态恢复功能的可用性的知识而自适应地控制所述抖动缓冲器部件的初始缓冲时间,以及基于来自时间缩放部件或解码器的至少一个所检索的参数和状态恢复功能的可用性的知识而自适应地控制所述时间缩放部件时间缩放量。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术 一般涉及适用于声音信号传输的基于数据包的通信系统, 特别是涉及用在这样的通信系统中的緩冲技术。
技术介绍
IP语音技术是在电信和数据通信世界之间的融合,其中通过数据 包(例如,网际协议(IP)数据包)来携带语音信号。已记录的语音通过语 音解码器逐帧解码。对各个语音帧产生数据帧。 一个或多个数据帧^皮打包成RTP数据包。RTP数据包纟皮进一步打包成UDP数据包,并且 UDP数据包纟皮打包成IP数据包。然后使用IP网络将IP数据包从发 送客户机传输到接收客户机。与基于数据包的网络相关联的问题是延迟抖动。延迟抖动意味着 即使以规则间隔来传输数据包,例如,每20ms—帧,数据包仍会不 规则地到达接收器。数据包甚至会乱顺地到达。乱顺序地接收数据包 最常见的原因是因为数据包在不同的路径上行进,至少对于固定的网 络来所是这样。对于无线网络,另一个原因可能是使用重传。例如 当在上行链路上(即,从移动终端到基站)发送数据包N时,可能有不 能一皮修正的位错误而不得不执行重传。然而,用于重传的信令可能很 慢以至于在重传数据包N之前,队列中的下一个数据包(数据包N+l) 坤皮发送。如果在正确接收重传的数据包N之前正确地接收到数据包 N+l,则这可能导致乱序地接收数据包。在VoIP客户机中,抖动緩沖器部件用于补偿在传输中的延迟抖 动,使得可按恒定的采样速率来播放语音样本,例如,每20 ms —帧(本说明书中的"播放"用于表示语音到声卡的传输)。抖动緩冲器部件的 丰满度水平是与数据包流中的延迟抖动的量成比例的,目的是将最新 损失的量保持在可接受的水平同时保持延迟尽可能地低。以下的例子 解释了保持延迟尽可能地低的重要性抖动緩冲器部件中的长緩沖时 间增加了端到端的延迟。这降低了感知的对话质量,因为系统将^皮感 知为"慢,,。长延迟增加了用户在同一时间讲话的风险并且还可能产 生其他的用户"慢"(緩慢地思考)这样的印象。另外,最新的损失是 适当地接收但是到达太晚而不能对解码器有用的数据包。抖动緩沖器部件存储某个时间的数据包或帧。对这种情况进行定 义的通常方式是抖动緩冲器部件被填充到一定的"水平",表示为丰 满度水平。这个水平通常以毫秒测量,而不是以帧的数量来测量,因 为帧的大小可能变化。因此,抖动緩冲器部件水平以时间来测量。抖 动缓冲器部件的水平可按许多不同的方式来设置。固定大小固定大小意味着抖动緩冲器丰满度水平是固定且预 定。在DTX阶段之后,在语音播放恢复前,抖动緩冲器部件最初以 固定时间、如固定数量的帧(如5帧)来填充。这个初始储备用于提供 保护以避免延迟抖动和最新损失。自适应抖动緩冲器部件大小抖动緩冲器的丰满度水平随延迟抖 动而变化。与固定大小的抖动缓冲器充满水平的情况类似,初始数量 的帧在DTX阶段后语音播放恢复之前被緩冲。然而,在主动语音(非 -DTX)阶段中,基于对入局数据包的分析,抖动緩冲器部件的丰满度 水平可能变化。有可能收集对若干话音突峰的统计数据。然而,通常 在每个语音开始时,将抖动緩冲器的丰满度水平重新设置为"缺省水 平,,。具有改进的交互性的自适应抖动緩沖器部件的大小为了降低感知到的延迟,有可能以比自适应抖动緩冲器部件的大小的情况更短的 时间来初始化抖动緩沖器部件,并且在DTX后一接收到第一个语音 数据包就开始语音播放。为了达到抖动緩冲器丰满度水平,使用时间缩放来伸展初始解码的帧,使得以降低的速度从抖动緩冲器部件提取 数据包。时间缩放意味着自适应地播放语音帧,即,通常包含20兆 秒语音的语音帧可以^皮伸展并生成30兆秒的语音。第一个4矣收的数 据包后开始播放的备选方式的是等候一个或两个额外的数据包。WO-200118790 Al和US2004/0156397 Al描述了时间缩》丈。DTX是不连续的传输并且意味着当没有出现语音且输入信号仅 包含(背景)噪声时,在信道上传输特殊类型的信息。编码器评估背景 噪声并确定描述该噪声的一组参数—寂静描述,SID,参数)。SID参数 被传输给接收端使得可以生成类似的噪声,舒适的噪声。SID参数以 比常规的语音帧更低的频率传输以便节省功率和传输资源。现在来看图1,图1示出了根据具有改进的交互性的自适应抖动 緩冲器部件大小方法的初始抖动緩沖器部件操作的示例。上部的标绘 图示出了抖动緩冲器的丰满度水平,而下部的标绘图示出了帧的大 小。 一旦在大约0.5秒接收到第一个数据包,就开始播放。执行时间 缩放以增加生成帧的大小并由此以比常规的速度更慢的速度消耗来 自抖动緩冲器部件的帧。播放提早开始产生改进的交互性的感觉,这 可以增加感知到的对话质量。在话音突峰的结尾,在大约3秒,最后 一个语音帧被缩短并且以比常规的速度更快的速度播放。这提供了进 一步改进的交互性。注意,在非-DTX阶段中,目标抖动緩冲器部件水平(60ms)的自 适应没有显示在图1中,然而这个功能性将存在于具有改进的交互性 的自适应抖动緩冲器部件大小的典型实现中。然而上述的三个方法存在若干缺点。由于许多数据包在播放开始 之前总是被緩冲,因此固定的抖动緩冲器部件大小产生相当长的延 迟。这降低了感知到的交互性。自适应抖动緩冲器部件可以调节丰满度水平以便至少在信道正 緩慢地变化的情况下引入较小的平均延迟。由于长的初始ll冲时间, 交互性差的问题仍然存在,因为自适应的目的是在DTX阶段后当流发动时,在主动语音期间于正在进行的数据包流内进行适应。应当注意,如果在每个语音开始时(即,在从DTX转换到语音时)抖动緩冲器丰满度水平被重新设置到缺省水平,会出现这个问题。当使用具有改进的交互性自适应抖动緩沖器部件大小时,因为感 知到的初始延迟会更低,所以抖动緩冲器部件初始化会改进交互性。 然而一个问题是,在语音突发开始时抖动緩沖器部件水平非常低,因 此存在语音突发开始的延迟抖动导致最新损失这样的风险。与帧丢失 类似,由于错误隐藏对于丟失的或晚接收的帧而激活,因此最新损失 将降低语音质量。另外,具有改进的交互性的自适应抖动緩冲器部件大小的方法还 意味着时间缩放(用以将緩冲器水平上调到常规的丰满度水平)必须非 常快地进行,因为自适应阶段必须短到足以避免^t多个延迟尖峰击 中。延迟尖峰是当延迟从第 一个数椐包直接增加到后续数据包时的情况。这意味着时间缩放必须非常迅速(aggressive)。迅速的时间缩放增 加了时间缩放本身引起失真的风险。失真可以是不同种类的,滴答, 朴通,噪声突发,但还也可以是"滑稽的响亮声音",例如"不自然 的谈话量,,。对于大部分使用帧间预测以便能够在较低比特速率上但以被维 持的质量对信号进行编码的现代语音编解码器(GSM-EFR , GSM-AMR, ITU-T G.729, EVRC,等等),还存在另外的问题。帧丟 失和最新损失都将对当前帧以及还对后续帧产生失真,因为由于交互 -帧预测的一段时间的错误传播。错误传播时间取决于声音和编解码 器,但是可能有5-6帧(100-120ms)那么长。在语音突发开始时最新损 失尤其关键,因为这些部分通常包含有声的开始,有声的开始稍后由 自适应密本用来构建有声的波形。因此在语音突发开始时最新损失的 结果通常能听得到并且能够相当大地降低可识度。有几个方法补偿如果在本文档来自技高网...

【技术保护点】
一种控制逻辑部件,可连接到:适合于接收并缓冲入局帧或数据包并且从所接收的数据包中提取数据帧的抖动缓冲器部件,连接到所述抖动缓冲器部件适合于对所提取的数据帧进行解码的解码部件,以及适合于自适应地播放经解码的语音帧的时间缩放部件;所述控制逻辑部件其特征在于,它包括关于状态恢复功能是否可用的知识,以及所述控制逻辑部件适合于从所述抖动缓冲器部件、时间缩放部件、和解码部件这三者中的至少一个检索至少一个参数,以便执行以下操作中的至少一个:基于来自所述抖动缓冲器部件的至少一个参数和所述状态恢复功能的可用性的知识而自适应地控制所述抖动缓冲器部件的初始缓冲时间,以及基于来自所述时间缩放部件或解码器的至少一个所检索的参数和所述状态恢复功能的可用性的知识而自适应地控制所述时间缩放部件时间缩放量。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:T弗兰基拉I约翰逊
申请(专利权)人:艾利森电话股份有限公司
类型:发明
国别省市:SE[瑞典]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利