当前位置: 首页 > 专利查询>索尼公司专利>正文

信号处理装置和方法以及程序制造方法及图纸

技术编号:24950560 阅读:48 留言:0更新日期:2020-07-18 00:17
本技术涉及信号处理装置和方法以及程序,能够以少量的计算提高声音图像的再现性。信号处理装置设置有:渲染手法选择单元,从多个不同手法中选择用于在收听空间中定位音频信号的声音图像的渲染处理的一个或多个手法;以及渲染处理单元,通过由渲染手法选择单元选择的手法,对音频信号执行渲染处理。本技术可应用于信号处理装置。

【技术实现步骤摘要】
【国外来华专利技术】信号处理装置和方法以及程序
本技术涉及信号处理装置和方法以及程序,并且更具体地涉及用于通过少量计算来改善声音图像的再现性的信号处理装置和方法以及程序。
技术介绍
传统上,对象音频技术已经被用于电影、游戏等,并且已经开发可以处理对象音频的编码方法。具体地,例如,作为国际标准的活动图像专家组(MPEG)-H部分3:3D音频标准等是已知的(例如,参见非专利文献1)。在这种编码方法中,将运动的声源等看作独立的音频对象,并且对象的位置信息可以与音频对象的信号数据一起被编码为元数据,如传统的两声道立体声方法或诸如5.1声道的多声道立体声方法。通过这样做,可以在扬声器的数量或扬声器的布局不同的各种收听环境中执行再现。此外,可以在再现时容易地处理特定声源的声音,诸如调节特定声源的声音的音量或将效果添加到特定声源的声音,这些通过传统编码方法是难以实现的。例如,在非专利文献1的标准中,称为基于三维向量的幅度摇摄(VBAP)(以下简称为VBAP)的方法被用于执行渲染处理。该方法是通常称为摇摄的渲染手法之一,并且是通过将增益分配给存在于球面上的扬声器当中的最接近存在于球面上的音频对象的三个扬声器来执行渲染的方法,该球面上的音频对象具有位于收听位置处的原点。此外,除了VBAP之外,还已知通过称为扬声器锚定坐标摇摄器的摇摄方法进行的渲染处理,该摇摄方法将增益分配给x轴、y轴和z轴(例如,参见非专利文献2)。同时,作为渲染音频对象的方法,除了摇摄处理之外,还提出了使用头相关传递函数滤波器的方法(例如,参见专利文献1)。在使用头相关传递函数来渲染移动音频对象的情况下,通常如下得头相关传递函数滤波器。即,例如,通常对移动空间范围进行采样,并且预先准备与空间中的各个点相对应的大量头相关传递函数滤波器。此外,例如,有时在空间中以固定距离间隔测量的位置处,使用头相关传递函数,通过三维合成方法进行距离校正,来获得期望位置的头相关传递函数滤波器。专利文献1描述了一种使用为头相关传递函数生成滤波器所需的参数,来生成任意距离的头相关传递函数滤波器的方法,该参数是通过以一定距离对球面进行采样而获得的。引用列表非专利文献:非专利文献1:国际标准ISO/IEC23008-3第一版2015-10-15“InformationtechnologyHighefficiencycodingandmediadeliveryinheterogeneousenvironmentsPart3:3Daudio”;非专利文献2:ETSITS103448v1.1.1(2016-09)。专利文献:专利文献1:日本专利第5752414号。
技术实现思路
本专利技术要解决的问题然而,通过上述技术,在通过渲染定位音频对象的声音图像的情况下,难以获得具有高声音图像定位和少量计算的再现性。即,难以通过少量计算实现被感知为好像位于原始预期位置的声音图像的定位。例如,假定收听位置是一个点,通过摇摄处理对音频对象进行渲染。在这种情况下,例如,当音频对象接近收听位置时,声波到达收听者左耳与声波到达收听者右耳之间的到达时间差不能被忽略。然而,在执行VBAP作为摇摄处理的情况下,即使音频对象位于其上布置有扬声器的球面的内部或外部,也基于音频对象在球面上的假设来执行渲染。然后,在音频对象接近收听位置的情况下,再现时的音频对象的声音图像远超出预期。同时,在使用头相关传递函数渲染时,即使在音频对象在收听者附近的情况下,也可以实现高声音图像定位的再现性。此外,存在多个高速计算处理,诸如快速傅立叶变换(FFT)和正交镜像滤波器(QMF)作为使用头相关传递函数的有限脉冲响应(FIR)滤波器处理。然而,使用头相关传递函数的FIR滤波器处理的量比摇摄处理的量大得多。因此,当存在许多音频对象时,可能不适合使用头相关传递函数来渲染所有音频对象。本技术是鉴于这样的情况而提出的,其旨在通过小的计算量提高声音图像的再现性。解决问题的方法根据本技术的一个方面的信号处理装置包括:渲染手法选择单元,其被配置为从多种方法中,选择用于在收听空间中定位音频信号的声音图像的渲染处理的一种或多种方法;以及渲染处理单元,其被配置为通过由渲染手法选择单元选择的方法,来执行对音频信号的渲染处理。根据本技术的一个方面的信号处理方法或程序包括以下步骤:从彼此不同的多种方法中,选择用于在收听空间中定位音频信号的声音图像的渲染处理的一种或多种方法,以及通过选定方法对音频信号执行渲染处理。在本技术的一个方面中,从彼此不同的多种方法中,选择定位收听空间中的音频信号的声音图像的渲染处理的一种或多种方法,并且通过选定方法来执行音频信号的渲染处理。本专利技术的效果根据本技术的一个方面,可以通过少量的计算来提高声音图像的再现性。注意,本文描述的效果不一定是限制性的,并且可以渲染本公开中描述的任何效果。附图说明图1是用于说明VBAP的示图。图2是示出信号处理装置的配置示例的示图。图3是示出渲染处理单元的配置示例的示图。图4是示出元数据的示例的示图。图5是用于描述音频对象位置信息的示图。图6是用于描述渲染手法的选择的示图。图7是用于描述头相关传递函数处理的示图。图8是用于描述渲染手法的选择的示图。图9是用于描述音频输出处理的流程图。图10是示出元数据的示例的示图。图11是示出元数据的示例的示图。图12是示出计算机的配置示例的示图。具体实施方式在下文中,将参考附图描述应用本技术的实施例。<第一实施例><本技术>在渲染音频对象的情况下,通过根据音频对象在收听空间中的位置,从彼此不同的多个渲染手法中为每个音频对象选择一种或多种方法,即使使用少量的计算,也提高了声音图像的再现性。即,本技术即使通过少量计算,也实现被感知为好像处于原始预期位置的声音图像的定位。具体地,在本技术中,从具有彼此不同的计算量(计算负荷)和不同的声音图像定位性能的多个渲染手法中选择一种或多种渲染手法,作为在收听空间中定位音频信号的声音图像的渲染处理的方法,即渲染手法。注意,在此将作为示例来描述要为其选择渲染手法的音频信号是音频对象的音频信号(音频对象信号)的情况。然而,示例不限于这种情况,并且要为其选择渲染手法的音频信号可以是任何音频信号,只要该音频信号用于在收听空间中定位声音图像。如上所述,在VBAP中,将增益分配给存在于球面上的扬声器中最接近存在于球面上的音频对象的三个扬声器,该音频对象具有位于收听空间中的收听位置处的原点。例如,如图1所示,假设收听者U11存在于三维空间的收听空间中,并且三个扬声器SP1至SP3被布置在收听者U11的前方。此外,假定收听者U11的头部位置被设置为原点O,并且扬声器SP1至SP3位于以原点本文档来自技高网
...

【技术保护点】
1.一种信号处理装置,包含:/n渲染手法选择单元,被配置为从多种不同手法中选择用于在收听空间中定位音频信号的声音图像的渲染处理的一种或多种手法;以及/n渲染处理单元,被配置为通过由所述渲染手法选择单元选择的手法对所述音频信号执行所述渲染处理。/n

【技术特征摘要】
【国外来华专利技术】20171212 JP 2017-2374021.一种信号处理装置,包含:
渲染手法选择单元,被配置为从多种不同手法中选择用于在收听空间中定位音频信号的声音图像的渲染处理的一种或多种手法;以及
渲染处理单元,被配置为通过由所述渲染手法选择单元选择的手法对所述音频信号执行所述渲染处理。


2.根据权利要求1所述的信号处理装置,其中
所述音频信号为音频对象的音频信号。


3.根据权利要求1所述的信号处理装置,其中
所述多种不同手法包括摇摄处理。


4.根据权利要求1所述的信号处理装置,其中
所述多种不同手法包括使用头相关传递函数的渲染处理。


5.根据权利要求4所述的信号处理装置,其中
使用所述头相关传递函数的渲染处理是跨耳处理或双耳处理。


6.根据权利要求2所述的信号处理装置,其中
所述渲染手法选择单元基于所述音频对象在所述收听空间中的位置,来选择所述渲染处理的手法。


7.根据权利要求6所述的信号处理装置,其中
在从收听位置到所述音频对象的距离等于或大于预定的第一距离的情况下,所述渲染手法选择单元选择摇摄处理作为所述渲染处理的手法。


8.根据权利要求7所述的信号处理装置,其中
在所述距离小于所述第一距离的情况下,所述渲染手法选择单元选择使用头相关传递函数的渲染处理作为所述渲染处理的手法。


9.根据权利要求8所述的信号处理装置,其中
在所述距离小于所述第一距离的情况下,所述渲染处理单元根据从所述收听位置到所述音频对象的所述距离,执行使...

【专利技术属性】
技术研发人员:本间弘幸知念徹
申请(专利权)人:索尼公司
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1