发送装置、发送方法、处理装置以及处理方法制造方法及图纸

技术编号：25697082 阅读：93 留言：0更新日期：2020-09-18 21:09

本发明专利技术使得能够容易地获取对应于宽视角图像的固定位置的音频输出。发送装置设置有用于发送空间音频数据和给定数量的登记视点的信息的发送器。例如，空间音频数据是基于场景的音频数据。另外，基于场景的音频数据可以表示HoA格式的每个分量。此外，视点信息可以包括表示视点位置的方位角(方位角信息)和仰角(仰角信息)。例如，发送器在对象音频的包中发送基于场景的音频数据和给定数量的登记视点的信息。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】发送装置、发送方法、处理装置以及处理方法
本技术涉及发送装置、发送方法、处理装置以及处理方法，并且更具体地，涉及发送基于场景的音频等的数据的发送装置。
技术介绍
使用为宽视角提供的反射镜、透镜等捕获宽视角图像。在发送宽视角图像的运动图像数据的情况下，在接收侧，当在宽视角图像的固定位置处的图像被截取并显示时，还考虑使用立体声再现方法将语音输出互锁。作为立体声再现方法，基于场景的方法是已知的。非专利文献1描述了高保真度立体声响复制(基于场景的音频)。引用列表非专利文献非专利文献1：RyuichiNishimura，“高保真度立体声响复制”，图像信息和电视工程师协会杂志，第68卷，第8期，第616至620页(2014年)
技术实现思路
本专利技术要解决的问题本技术的目的是使得能够容易地获取对应于宽视角图像的固定位置的语音输出。问题的解决方案根据本技术的一方面，一种发送装置包括发送单元，被配置为发送空间语音数据和关于预定数量的登记视点的信息。在本技术中，处理单元发送空间语音数据和关于预定数量的登记视点的信息。例如，关于视点的信息可以包括关于指示该视点的位置的方位角(方位角信息)和仰角(仰角信息)的信息。例如，空间语音数据可以是基于场景的音频数据。在这种情况下，例如，基于场景的音频的数据可以是HoA格式的每个分量。例如，发送单元可以将基于场景的音频的数据和关于预定数量的登记视点的信息包括在对象音频的包中以进行发送。在这种情况下，例如，对象音频的...

【技术保护点】
1.一种发送装置，包括：/n发送单元，被配置为发送空间语音数据和关于预定数量的登记视点的信息。/n

【技术特征摘要】
【国外来华专利技术】20180207 JP 2018-0205641.一种发送装置，包括：
发送单元，被配置为发送空间语音数据和关于预定数量的登记视点的信息。

2.根据权利要求1所述的发送装置，
其中，关于所述视点的所述信息包括关于指示所述视点的位置的方位角和仰角的信息。

3.根据权利要求1所述的发送装置，
其中，对所述预定数量的登记视点信息进行分组。

4.根据权利要求1所述的发送装置，
其中，所述空间语音数据是基于场景的音频的数据。

5.根据权利要求4所述的发送装置，
其中，所述基于场景的音频的所述数据是HoA格式的每个分量。

6.根据权利要求4所述的发送装置，
其中，所述发送单元将所述基于场景的音频的所述数据和关于所述预定数量的登记视点的所述信息包括在对象音频的包中以进行发送。

7.根据权利要求6所述的发送装置，
其中，所述对象音频的所述包是MPEG-H音频流包。

8.根据权利要求6所述的发送装置，
其中，所述发送单元将所述对象音频的所述包包括在ISOBMFF的容器中以进行发送。

9.一种发送方法，包括：
由发送单元发送空间语音数据和关于预定数量的登记视点的信息的步骤。

10.一种处理装置，包括：
获取单元，被配置为获取空间语音数据和关于预定数量的登记视点的信息；以及
处理单元，被配置为通过基于关于所述登记视点的所述信息处理所述空间语音数据来获取输出语音数据。

11.根据权利要求10所述的处理装置，
其中，关于所述视点的所述信息包括关于指示所述视点的位置的方位角和仰角的信息。

【专利技术属性】
技术研发人员：塚越郁夫，
申请(专利权)人：索尼公司，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人