一种全景声编码方法技术

技术编号：13587418 阅读：142 留言：0更新日期：2016-08-25 10:53

本发明专利技术公开了一种全景声编码方法，获取声场空间的声音对象；以声场空间水平切面中心与录音师双耳连线中心等高的位置为原点建立三维坐标系，确定声音对象的三维坐标值；声音对象的位置轨迹以帧为单位，每帧包括若干个块，每帧的第一个块为参考块、后续块为预测块，确定声音对象第i块的位置坐标为（xi，yi，zi)；对参考块的三维坐标值进行直接编码，对预测块的三维坐标值进行差分编码。本发明专利技术提供的全景声编码方法，在录音制作、编码、解码和渲染回放时的坐标定义、运动轨迹和作用区域表示方法，编码效率高、声音表现力好且声音制作方便。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及声音编码
，具体涉及一种全景声编码方法。
技术介绍
随着计算能力和网络的快速发展，在电影、电视、音乐、游戏、虚拟现实和网络视频等应用领域，能表现真实三维声场的音频录制、缩混编辑、编码、解码、渲染和回放技术，有着重要的应用价值。“全景声”是对三维声场的形象描述。目前，MPEG推出了MPEG H的三维声编码技术，Dolby公司推出了Atmos全景声编码技术，都在传统多声道信号编码的基础上，提出了声音对象编码的概念。其中，Dolby Atmos采用直接记录声音对象的三维运动轨迹的方式，对声音对象的三维坐标(x、y、z)进行编码，并且对声音对象的渲染和回放方式，划分为9个矩形区域。MPEG H则不直接对声音对象编码，而是采用参数立体声的编码技术，将多个声音混合成一个单声道信号，并对每个声音对象的空间感知信息(相位、强度和相关性)编码；在解码时，先解码单声道和信号，再利用声音对象的空间感知信息，恢复出每个声音对象。在高质量应用场合，如电影等领域，Dolby Atmos能够获得比MPEG H更高的声音质量。但是Dolby Atmos的空间坐标体系、坐标表示方法、声音对象坐标编码方法、声音对象分区表示方法都存在编码效率低、声音表现力差和声音制作不方便等局限。Dolby Atmos在描述声场时，将坐标原点定于前方左侧屏幕扬声器高度位置，从原点到右墙为X轴，从原点到后墙为Y轴，从原点到房顶为Z轴；同时，将房间划分为左侧屏幕扬声器区域、中间屏幕扬声器区域、右侧屏幕扬声器区域、左墙扬声器区域、右墙扬声器区域、后墙左侧扬声器区域、后墙右侧扬声器区域、左房顶扬...

【技术保护点】
一种全景声编码方法，其特征在于，包括：获取声场空间的声音对象；以声场空间水平切面中心、与录音师双耳连线中心等高的位置为原点建立三维坐标系，确定声音对象的三维坐标值；声音对象的位置轨迹以帧为单位，每帧包括若干个块，每帧的第一个块为参考块、后续块为预测块，确定声音对象第i块的位置坐标为（xi，yi，zi)；对参考块的三维坐标值进行直接编码，对预测块的三维坐标值进行差分编码。

【技术特征摘要】
1.一种全景声编码方法，其特征在于，包括：获取声场空间的声音对象；以声场空间水平切面中心、与录音师双耳连线中心等高的位置为原点建立三维坐标系，确定声音对象的三维坐标值；声音对象的位置轨迹以帧为单位，每帧包括若干个块，每帧的第一个块为参考块、后续块为预测块，确定声音对象第i块的位置坐标为（xi，yi，zi)；对参考块的三维坐标值进行直接编码，对预测块的三维坐标值进行差分编码。2.根据权利要求1所述的全景声编码方法，其特征在于：所述声音对象第i块的三维坐标值（xi，yi，zi）映射为（pIDi，Axi，Ayi，Azi），pIDi为象限标识符，Axi、Ayi、Azi为位置坐标的绝对值。3.根据权利要求2所述的全景声编码方法，其特征在于：所述参考块的三维坐标值（pIDi，Axi，Ayi，Azi）直接编码成（pIDj，Dxj，Dyj，Dzi），pIDj采用3比特，Axi、Ayi、Azi在范围[0，1]内编码为N（4 <=N<=16）比特的无符号数Dxj、Dyj、Dzi，映射关系为：Axi = Dxj /(2^N-1)，0 <=Dxj<=（2^N-1）；Ayi = Dyj /(2^N -1)，0 <= Dyj<=（2^N-1）；Azi = Dzi /(2^N-1)，0 <=Dzi<=（2^N-1）。4.根据权利要求3所述的全景声编码方法，其特征在于：所述预测块对当前块与前一块的坐标值差值(▵xk，▵yk，▵zk)进行编码，其中，▵xk是当前块与前一块x轴坐标的差分值，▵yk是当前块与前一块y轴坐标的差分值，▵zk是当前块与前一块z轴坐标的差分值，且差值(▵...

【专利技术属性】
技术研发人员：潘兴德，吴超刚，
申请(专利权)人：南京青衿信息科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人