System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
【国外来华专利技术】
本专利技术公开了用于对具有方向性的音频信号进行编码和解码的装置和方法。
技术介绍
1、方向性是声源的重要声学特性,例如在沉浸式再现环境中。方向性与频率有关,并且可以在八度或第三八度频率网格上的离散频率上测量。对于给定频率,方向性是在单位球体上定义的标量值。估计可以使用均匀分布在球体上的多个麦克风来完成。然后对测量结果进行后处理,然后精确地插值到精细或非常精细的球形网格上。这些值被保存到一种可用的互操作性文件格式中,诸如sofa文件[1]。这些文件可能相当大,可达几兆字节。
2、然而,为了包括到比特流中进行传输,需要更紧凑的表示,其中大小从几百字节减少到最多几千字节的维度,这取决于频带的数量和重建所需的精度(例如,移动设备上降低的精度)。
3、有几种文件格式支持方向性数据,如sofa[1]和opendaff[2],但是它们的主要目标是非常灵活的交换格式,同时保留大量的额外元数据,如数据是如何生成的,以及测量使用了什么设备。此额外的元数据使得在研究应用中更容易自动解释和加载数据,因为一些文件格式允许大量异构数据类型。此外,通常定义的球面网格是精细或非常精细的,因此可以使用使用最近邻搜索的更简单方法来代替二维插值。
4、寻求一种用于获得更紧凑表示的方法。
5、参考文献
6、[1]piotr majdak et al.,"spatially oriented format for acoustics:adata exchange format representing head
7、[2]frank wefers,"opendaff:a free,open-source software package fordirectional audio data",daga 2010,march 2010.
技术实现思路
1、提出了用于解码比特流中编码的音频信号的装置,音频信号具有根据不同方向的不同音频值,方向与单位球体中的离散位置相关联,单位球体中的离散位置根据平行线从赤道线向第一极、从赤道线向第二极移位,装置包括:
2、比特流读取器,被配置为从比特流读取编码音频信号的预测残差值;
3、预测部分,被配置为通过预测和从编码音频信号的预测残差值获得音频信号,预测部分使用多个预测序列,多个预测序列包括:
4、至少一个初始预测序列,沿着相邻离散位置的线,基于相同初始预测序列中的紧接在前面的音频值的音频值预测音频值;以及
5、至少一个后续预测序列,分为多个子序列,每个子序列沿着平行线移动并与先前预测的平行线相邻,并且使得沿着正在被处理的平行线的音频值至少基于以下被预测:
6、同一子序列中相邻离散位置的音频值;以及
7、先前预测的相邻平行线的音频值的插值版本,相邻先前预测的平行线的每个插值版本具有与正在处理的平行线相同数量的离散位置。
8、还提出了用于编码音频信号的装置,音频信号根据不同的方向具有不同的音频值,方向与单位球体中的离散位置相关联,单位球体中的离散位置根据从赤道线向两极的平行线位移,装置包括:
9、预测块,被配置为执行多个预测序列,多个预测序列包括:
10、至少一个初始预测序列,沿着相邻离散位置(10)的线,通过基于同一初始预测序列中的紧接在前面的音频值的音频值来预测音频值;以及
11、至少一个后续预测序列,分为多个子序列,每个子序列沿着平行线移动并与先前预测的平行线相邻,并且使得音频值至少基于以下被预测:
12、同一子序列中相邻离散位置的音频值;以及
13、先前预测的相邻平行线的音频值的插值版本,每个插值版本具有与平行线的相同数量的离散位置,
14、预测残差生成器(120),被配置为将音频信号(102)的预测值与实际值进行比较以产生预测残差值(122);
15、比特流写入器(130),被配置为在比特流(104)中写入预测残差值(122)或其处理版本。
本文档来自技高网...【技术保护点】
1.一种用于解码比特流(104)中编码的音频信号的装置(200,200a),音频信号具有根据不同方向的不同音频值,方向与单位球体(1)中的离散位置相关联,单位球体(1)中的离散位置根据平行线从赤道线向第一极(2)、从赤道线向第二极(4)移位,所述装置包括:
2.如权利要求1所述的装置,其中至少一个初始预测序列包括沿单位球体(1)的子午线的子午线初始预测序列(10),
3.如权利要求2所述的装置,其中至少一个初始预测序列包括沿单位球体(1)的赤道线的在子午线初始预测序列(10)之后执行的赤道初始预测序列(20),赤道初始预测序列(20)从已经预测的至少一个子午线初始预测序列(10)的离散位置(20a)开始。
4.如权利要求3所述的装置,其中多个子序列中的第一子序列(31)沿着与赤道线相邻的平行线执行,并且多个子序列中的另外子序列(32,33)朝向极(4)依次执行。
5.如上述权利要求中任何一个所述的装置,其中预测部分(220')被配置为,在至少一个初始预测序列(10,20)中,通过线性预测从相邻离散位置(602,702)中的一个已经预
6.如权利要求5所述的装置,其中线性预测在至少一个预测序列中或在至少一个子序列中是同一预测,使得预测音频值与相邻离散位置中的单个音频值相同。
7.如上述权利要求中任何一个所述的装置,其中预测部分(120)被配置为,在至少一个初始预测序列(10、20)中,通过仅从第一相邻离散位置(602、702)中的一个已经预测的音频值和与第一相邻离散位置相邻的第二离散位置(605、705)中的一个已经预测的音频值进行预测,来预测至少一个音频值(601、701)。
8.如权利要求7所述的装置,其中所述预测是线性的。
9.如权利要求7或8所述的装置,其中预测使得第一相邻离散位置(601、701)中的已经预测的音频值的权重为与第一相邻离散位置(601、701)相邻的第二离散位置(605、705)中的已经预测的音频值的权重的至少两倍。
10.如上述权利要求中任何一个所述的装置,其中预测部分(210’)被配置为,在至少一个子序列(31、32、33)中,基于以下来预测至少一个音频值(501):
11.如权利要求10所述的装置,其中预测部分(210’)被配置为,在至少一个子序列(31、32、33)中,还基于以下来预测至少一个音频值:
12.如权利要求11所述的装置,其中,在插值中,相同的权重被给予:
13.如上述权利要求中任何一个所述的装置,其中预测部分(210')被配置为,在至少一个子序列(31-33)中,通过线性预测来预测至少一个音频值。
14.如上述权利要求中任何一个所述的装置,其中通过减少先前预测的平行线(31)的离散位置的数量以匹配待预测的平行线(32)中的离散位置的数量的处理来检索紧接在前预测的平行线(31)的插值版本(31')。
15.如上述权利要求中任何一个所述的装置,其中通过圆形插值检索紧接在前预测的平行线的插值版本(31')。
16.如上述权利要求中任何一个所述的装置,被配置为基于比特流(104)中的信令,选择通过沿着平行线移动并与先前预测的平行线相邻来执行至少一个后续预测序列(30,40),使得仅基于相同子序列(31,32,33)中的相邻离散位置的音频值来预测沿着正在被处理的平行线的音频值。
17.如上述权利要求中任何一个所述的装置,其中预测部分包括用于将预测值(212)和预测残差值(222)相加的加法器(220)。
18.如上述权利要求中任何一个所述的装置,被配置为根据不同的频带分离音频信号的频率,并对每个频带执行预测。
19.如权利要求18所述的装置,其中单位球体(1)的空间分辨率对于高频带和低频带是相同的。
20.如上述权利要求中任何一个所述的装置,被配置为基于比特流中所选择的空间分辨率的信令,在多个预定义空间分辨率中选择单位球体的空间分辨率。
21.如上述权利要求中任何一个所述的装置,被配置为在对数域中转换预测的音频值(202)。
22.如上述权利要求中任何一个所述的装置,其中预测的音频值为分贝值。
23.如上述权利要求中任何一个所述的装置,包括后处理器(205),后处理器(205)被配置为通过将每个差分音频信号递归地添加到相邻的非差分音频信号,将音频信号从差分音频信号重新定义为非差分音频信号。
24.如权利要求23所述的装置,其中通过根据预定义阶数从相邻离散位置的音...
【技术特征摘要】
【国外来华专利技术】
1.一种用于解码比特流(104)中编码的音频信号的装置(200,200a),音频信号具有根据不同方向的不同音频值,方向与单位球体(1)中的离散位置相关联,单位球体(1)中的离散位置根据平行线从赤道线向第一极(2)、从赤道线向第二极(4)移位,所述装置包括:
2.如权利要求1所述的装置,其中至少一个初始预测序列包括沿单位球体(1)的子午线的子午线初始预测序列(10),
3.如权利要求2所述的装置,其中至少一个初始预测序列包括沿单位球体(1)的赤道线的在子午线初始预测序列(10)之后执行的赤道初始预测序列(20),赤道初始预测序列(20)从已经预测的至少一个子午线初始预测序列(10)的离散位置(20a)开始。
4.如权利要求3所述的装置,其中多个子序列中的第一子序列(31)沿着与赤道线相邻的平行线执行,并且多个子序列中的另外子序列(32,33)朝向极(4)依次执行。
5.如上述权利要求中任何一个所述的装置,其中预测部分(220')被配置为,在至少一个初始预测序列(10,20)中,通过线性预测从相邻离散位置(602,702)中的一个已经预测的单个音频值来预测至少一个音频值(601,701)。
6.如权利要求5所述的装置,其中线性预测在至少一个预测序列中或在至少一个子序列中是同一预测,使得预测音频值与相邻离散位置中的单个音频值相同。
7.如上述权利要求中任何一个所述的装置,其中预测部分(120)被配置为,在至少一个初始预测序列(10、20)中,通过仅从第一相邻离散位置(602、702)中的一个已经预测的音频值和与第一相邻离散位置相邻的第二离散位置(605、705)中的一个已经预测的音频值进行预测,来预测至少一个音频值(601、701)。
8.如权利要求7所述的装置,其中所述预测是线性的。
9.如权利要求7或8所述的装置,其中预测使得第一相邻离散位置(601、701)中的已经预测的音频值的权重为与第一相邻离散位置(601、701)相邻的第二离散位置(605、705)中的已经预测的音频值的权重的至少两倍。
10.如上述权利要求中任何一个所述的装置,其中预测部分(210’)被配置为,在至少一个子序列(31、32、33)中,基于以下来预测至少一个音频值(501):
11.如权利要求10所述的装置,其中预测部分(210’)被配置为,在至少一个子序列(31、32、33)中,还基于以下来预测至少一个音频值:
12.如权利要求11所述的装置,其中,在插值中,相同的权重被给予:
13.如上述权利要求中任何一个所述的装置,其中预测部分(210')被配置为,在至少一个子序列(31-33)中,通过线性预测来预测至少一个音频值。
14.如上述权利要求中任何一个所述的装置,其中通过减少先前预测的平行线(31)的离散位置的数量以匹配待预测的平行线(32)中的离散位置的数量的处理来检索紧接在前预测的平行线(31)的插值版本(31')。
15.如上述权利要求中任何一个所述的装置,其中通过圆形插值检索紧接在前预测的平行线的插值版本(31')。
16.如上述权利要求中任何一个所述的装置,被配置为基于比特流(104)中的信令,选择通过沿着平行线移动并与先前预测的平行线相邻来执行至少一个后续预测序列(30,40),使得仅基于相同子序列(31,32,33)中的相邻离散位置的音频值来预测沿着正在被处理的平行线的音频值。
17.如上述权利要求中任何一个所述的装置,其中预测部分包括用于将预测值(212)和预测残差值(222)相加的加法器(220)。
18.如上述权利要求中任何一个所述的装置,被配置为根据不同的频带分离音频信号的频率,并对每个频带执行预测。
19.如权利要求18所述的装置,其中单位球体(1)的空间分辨率对于高频带和低频带是相同的。
20.如上述权利要求中任何一个所述的装置,被配置为基于比特流中所选择的空间分辨率的信令,在多个预定义空间分辨率中选择单位球体的空间分辨率。
21.如上述权利要求中任何一个所述的装置,被配置为在对数域中转换预测的音频值(202)。
22.如上述权利要求中任何一个所述的装置,其中预测的音频值为分贝值。
23.如上述权利要求中任何一个所述的装置,包括后处理器(205),后处理器(205)被配置为通过将每个差分音频信号递归地添加到相邻的非差分音频信号,将音频信号从差分音频信号重新定义为非差分音频信号。
24.如权利要求23所述的装置,其中通过根据预定义阶数从相邻离散位置的音频值减去特定离散位置处的音频值而获得特定离散位置处的非差分音频值(201)。
25.如权利要求23或24所述的装置,
26.如上述权利要求中任何一个所述的装置,其中比特流读取器(230)被配置为使用单阶段解码读取比特流(104),根据单阶段解码:
27.一种用于对音频信号(102)进行编码的装置(100),音频信号具有根据不同方向的不同音频值,方向与单位球体(1)中的离散位置相关联,单位球体中的离散位置根据平行线从赤道线到两极(2,4)移位,所述装置包括:
28.如权利要求27所述的装置,其中...
【专利技术属性】
技术研发人员:于尔根·赫勒,弗洛林·基多,
申请(专利权)人:弗劳恩霍夫应用研究促进协会,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。