System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 场景音频编码方法及电子设备技术_技高网

场景音频编码方法及电子设备技术

技术编号:43053009 阅读:9 留言:0更新日期:2024-10-22 14:35
本申请实施例提供了一种场景音频编码方法及电子设备。该方法包括:首先,获取场景音频信号;接着,从编码方式集合中,确定与场景音频信号对应的编码方式组合,其中,编码方式集合包括多个编码方式组合;之后,基于与场景音频信号对应的编码方式组合,对场景音频信号进行编码。这样,可以节省整个编码过程所消耗的时间,提高编码效率;且适用于针对不同场景的场景音频信号的编码;此外,由于建立编码方式集合通常选用编码性能较优的编码方式组合,因此本申请能够一定程度保证对各场景的场景音频信号的编码性能,灵活度高。

【技术实现步骤摘要】

本申请实施例涉及音频编解码领域,尤其涉及一种场景音频编码方法及电子设备


技术介绍

1、三维音频技术是通过计算机、信号处理等方式对真实世界中声音事件和三维声场信息进行获取、处理,传输和渲染回放的音频技术。三维音频使声音具有强烈的空间感、包围感及沉浸感,给人以“声临其境”的非凡听觉体验。其中,hoa(higherorder ambisonics,高阶立体混响)技术具有在录制、编码与回放阶段与扬声器布局无关的性质以及hoa格式数据的可旋转回放特性,在进行三维音频回放时具有更高的灵活性,因而也得到了更为广泛的关注和研究。

2、对于n阶hoa信号来说,其对应的通道数为(n+1)2。随着hoa阶数的增加,hoa信号中用于记录更详细的声音场景的信息也会随之增加;但hoa信号的数据量也会随之增多,大量的数据造成传输和存储的困难,因此需要对hoa信号进行编解码。然而,现有技术对hoa信号的编码性能低。


技术实现思路

1、鉴于此,本申请提供一种场景音频编码方法及电子设备。

2、第一方面,本申请实施例提供一种场景音频编码方法,该方法包括:首先,获取场景音频信号;接着,从编码方式集合中,确定与场景音频信号对应的编码方式组合,其中,编码方式集合包括多个编码方式组合;之后,基于与场景音频信号对应的编码方式组合,对场景音频信号进行编码。

3、这样,通过查询预先建立的编码方式集合,能够快速地确定用于编码的编码方式组合;进而,可以节省整个编码过程所消耗的时间,提高编码效率。p>

4、其次,针对不同场景的场景音频信号,可以从预先建立的编码方式集合中,选取适用于不同场景的编码方式组合进行编码;由于建立编码方式集合通常选用编码性能较优的编码方式组合,因此本申请能够一定程度保证对各场景的场景音频信号的编码性能,灵活度高。

5、其中,与场景音频信号对应的编码方式组合包括了多个通道对应的编码方式,当多个通道对应的编码方式中至少两个通道对应的编码方式不同时,相对于采用单一编码方式编码而言,采用编码方式组合进行编码,能够采用编码方式组合中一种编码方式的优点,对另一种编码方式的缺点进行一定程度弥补,从而能够一定程度提高编码性能。

6、此外,即使与场景音频信号对应的编码方式组合包括的多个通道对应的编码方式相同,均为直接编码方式(即对信号本身进行编码,例如,可以对信号进行时频变换、预处理、比特分配、量化和熵编码等操作);相对于现有技术而言,本申请编码的音频信号的通道数更少;因此在达到同等质量的前提下,本申请编码码率更低。

7、示例性的,本申请实施例涉及的场景音频信号,可以是指用于描述声场的信号;其中,场景音频信号可以包括:hoa信号(其中,hoa信号可以包括三维hoa信号和二维hoa信号(也可以称为平面hoa信号))和三维音频信号;三维音频信号可以是指场景音频信号中除hoa信号之外的其他音频信号。

8、示例性的,场景音频信号可以包括c个通道的音频信号,其中,c为正整数。

9、示例性的,当场景音频信号为hoa信号时,该hoa信号可以为n阶hoa信号,也就是当m截断到第n项时,上述公式(3)中的

10、示例性的,n阶hoa信号可以包括c个通道的音频信号,c=(n+1)2。例如,n=3时,n阶hoa信号包括16个通道的音频信号;n=4时,n阶hoa信号包括25个通道的音频信号。

11、示例性的,场景音频信号可以为一帧或多帧。

12、示例性的,编码方式集合中每个编码方式组合可以包括多个通道对应的编码方式。

13、根据第一方面,编码方式集合中的一个编码方式组合与一种场景信息对应。其中,场景信息可以包括与编码场景音频信号相关的信息。

14、根据第一方面,或者以上第一方面的任意一种实现方式,场景信息包括编码速率和/或通道信息。

15、其中,通道信息可以包括通道数和通道标识(例如,通道号)。

16、根据第一方面,或者以上第一方面的任意一种实现方式,编码方式集合的一个编码方式组合包括k个通道对应的编码方式,k为正整数;一个通道对应的编码方式包括以下至少一种:第一编码方式、第二编码方式和第三编码方式;其中,第一编码方式为编码信号本身;第二编码方式为空间编码方式;第三编码方式为除第一编码方式和第二编码方式之外的编码方式。

17、示例性的,第一编码方式可以为编码信号本身,即对信号进行时频变换、预处理、比特分配、量化和熵编码等操作;其中,第一编码方式也可以称为直接编码方式。

18、示例性的,第二编码方式可以为空间编码方式,空间编码方式即编码基于场景音频信号确定的目标虚拟扬声器的属性信息的编码方式。

19、示例性的,第三编码方式可以包括除第一编码方式和第二编码方式之外的一种或多种编码方式。

20、一种可能的方式中,第三编码方式为通道拷贝(或hoa拷贝)编码。可选地,第三编码方式为解相关编码方式。

21、一种可能的方式中,每个编码方式组合可以包括第一编码方式和第三编码方式。

22、一种可能的方式中,每个编码方式组合可以包括第一编码方式、第二编码方式和第三编码方式。

23、一种可能的方式中,每个编码方式组合可以包括第一编码方式和第二编码方式。

24、一种可能的方式中,每个编码方式组合可以包括第一编码方式。

25、由于采用第一编码方式编码,能够提高编码质量,但所需的码率开销高;采用其他编码方式(第二编码方式、第三编码方式)编码,能够降低码率开销,但是会降低编码质量;进而,本申请采用第一编码方式和其他编码方式组合编码,在保证一定程度的编码质量的前提下,降低码率开销以及编码复杂度。

26、根据第一方面,或者以上第一方面的任意一种实现方式,k个通道对应的编码方式中至少两个通道对应的编码方式不同。

27、应该理解的是,一种可能的情况中,编码方式集合的一个编码方式组合中每个通道对应的编码方式相同。

28、根据第一方面,或者以上第一方面的任意一种实现方式,场景音频信号包括c个通道的音频信号,与场景音频信号对应的编码方式组合包括c个通道对应的编码方式,基于与场景音频信号对应的编码方式组合,对场景音频信号进行编码,包括:采用c个通道对应的编码方式,对场景音频信号的c个通道进行编码,c为正整数。

29、根据第一方面,或者以上第一方面的任意一种实现方式,从编码方式集合中,确定与场景音频信号对应的编码方式组合,包括:基于当前场景信息,从编码方式集合中查找与场景音频信号对应的编码方式组合。

30、根据第一方面,或者以上第一方面的任意一种实现方式,当编码方式集合的一个编码方式组合与一种编码速率对应时,基于当前场景信息,从编码方式集合中查找与场景音频信号对应的编码方式组合,包括:基于当前编码速率,从编码方式集合中查找与场景音频信号对应的编码方式组合。

31、这样本文档来自技高网...

【技术保护点】

1.一种场景音频编码方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求2所述的方法,其特征在于,

4.根据权利要求1至3任一项所述的方法,其特征在于,

5.根据权利要求4所述的方法,其特征在于,所述K个通道对应的编码方式中至少两个通道对应的编码方式不同。

6.根据权利要求1至5任一项所述的方法,其特征在于,所述场景音频信号包括C个通道的音频信号,所述与所述场景音频信号对应的编码方式组合包括C个通道对应的编码方式,所述基于与所述场景音频信号对应的编码方式组合,对所述场景音频信号进行编码,包括:

7.根据权利要求1至6任一项所述的方法,其特征在于,所述从编码方式集合中,确定与所述场景音频信号对应的编码方式组合,包括:

8.根据权利要求7所述的方法,其特征在于,当所述编码方式集合的一个编码方式组合与一种编码速率对应时,所述基于当前场景信息,从所述编码方式集合中查找与所述场景音频信号对应的编码方式组合,包括:

9.根据权利要求8所述的方法,其特征在于,所述场景音频信号包括C个通道的音频信号,所述基于当前编码速率,从所述编码方式集合中查找与所述场景音频信号对应的编码方式组合,包括:

10.根据权利要求8所述的方法,其特征在于,所述场景音频信号包括C个通道的音频信号,所述基于当前编码速率,从所述编码方式集合中查找与所述场景音频信号对应的编码方式组合,包括:

11.根据权利要求7所述的方法,其特征在于,所述场景音频信号包括C个通道的音频信号,当所述编码方式集合的一个编码方式组合与一个通道数对应时,所述基于当前场景信息,从所述编码方式集合中查找与所述场景音频信号对应的编码方式组合,包括:

12.根据权利要求4所述的方法,其特征在于,所述空间编码方式为编码目标虚拟扬声器的属性信息的编码方式,所述目标虚拟扬声器信息是基于所述场景音频信号确定的。

13.根据权利要求4或12任一项所述的方法,其特征在于,所述第三编码方式包括通道拷贝编码。

14.根据权利要求13所述的方法,其特征在于,所述通道拷贝编码为解相关编码方式。

15.根据权利要求2或3或7或8或9或10或11所述的方法,其特征在于,所述方法还包括:

16.一种码流生成方法,其特征在于,根据如上述权利要求1至权利要求15任一项所述的场景音频编码方法生成码流。

17.一种场景音频编码装置,其特征在于,所述装置包括:

18.一种电子设备,其特征在于,包括:

19.一种芯片,其特征在于,包括一个或多个接口电路和一个或多个处理器;所述接口电路用于从电子设备的存储器接收信号,并向所述处理器发送所述信号,所述信号包括存储器中存储的计算机指令;当所述处理器执行所述计算机指令时,使得所述电子设备执行权利要求1至权利要求15中任一项所述的场景音频编码方法。

20.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,当所述计算机程序运行在计算机或处理器上时,使得所述计算机或所述处理器执行如权利要求1至权利要求15任一项所述的场景音频编码方法。

21.一种计算机程序产品,其特征在于,所述计算机程序产品包含软件程序,当所述软件程序被计算机或处理器执行时,使得权利要求1至权利要求15任一项所述的方法的步骤被执行。

22.一种存储码流的装置,其特征在于,所述装置包括:接收器和至少一个存储介质,

23.一种传输码流的装置,其特征在于,所述装置包括:发送器和至少一个存储介质,

24.一种分发码流的系统,其特征在于,所述系统包括:

...

【技术特征摘要】

1.一种场景音频编码方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求2所述的方法,其特征在于,

4.根据权利要求1至3任一项所述的方法,其特征在于,

5.根据权利要求4所述的方法,其特征在于,所述k个通道对应的编码方式中至少两个通道对应的编码方式不同。

6.根据权利要求1至5任一项所述的方法,其特征在于,所述场景音频信号包括c个通道的音频信号,所述与所述场景音频信号对应的编码方式组合包括c个通道对应的编码方式,所述基于与所述场景音频信号对应的编码方式组合,对所述场景音频信号进行编码,包括:

7.根据权利要求1至6任一项所述的方法,其特征在于,所述从编码方式集合中,确定与所述场景音频信号对应的编码方式组合,包括:

8.根据权利要求7所述的方法,其特征在于,当所述编码方式集合的一个编码方式组合与一种编码速率对应时,所述基于当前场景信息,从所述编码方式集合中查找与所述场景音频信号对应的编码方式组合,包括:

9.根据权利要求8所述的方法,其特征在于,所述场景音频信号包括c个通道的音频信号,所述基于当前编码速率,从所述编码方式集合中查找与所述场景音频信号对应的编码方式组合,包括:

10.根据权利要求8所述的方法,其特征在于,所述场景音频信号包括c个通道的音频信号,所述基于当前编码速率,从所述编码方式集合中查找与所述场景音频信号对应的编码方式组合,包括:

11.根据权利要求7所述的方法,其特征在于,所述场景音频信号包括c个通道的音频信号,当所述编码方式集合的一个编码方式组合与一个通道数对应时,所述基于当前场景信息,从所述编码方式集合中查找与所述场景音频信号对应的编码方式组合,包括:

12.根据权利要求4所述的方法,其特征在于...

【专利技术属性】
技术研发人员:高原刘帅夏丙寅王喆
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1