多视图视频流式传输制造技术

技术编号：39047978 阅读：10 留言：0更新日期：2023-10-10 12:00

描述了一种由客户端装置处理多视图视频的方法，该多视图视频包括视频流集合，该视频流集合由一组相机以一组视角和一个或多个视频分辨率同时捕获场景中的对象来创建，每个视频流定义与相机相对于该对象的视角相关联的视图。该方法可以包括：接收定义用于该多视图视频的多个窗口的清单文件，该多个窗口中的第一窗口定义从该视频流集合中选择的第一视频流子集，该第一视频流子集与该组视角的第一视角子集相关联；确定与观看者相对于多视图显示装置的角度位置相关联的位置信息，该多视图显示装置被配置为呈现该清单文件中标识的多视图视频；基于该位置信息和该第一视角子集从该多个窗口中选择该第一窗口，并且请求由服务器系统发送该第一视频流子集；以及接收与该第一视频流子集相关联的多视图视频数据；以及将该多视图视频数据提供到解码器装置以进行解码。多视图视频数据提供到解码器装置以进行解码。多视图视频数据提供到解码器装置以进行解码。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】over the Internet[互联网上的动态自适应多视图视频流式传输],ImmersiveMe
’
13:proceedings of the 2013ACM international workshop on Immersive media experiences[2013年关于ACM沉浸式媒体体验的国际研讨会论文集]，2013年10月，第51至56页中描述了用于将3D自由视点视频流式传输到客户端的基于HTTP的自适应流式传输过程。作者描述了用于3D自由视点类型多视图视频的MPEG
‑
DASH方案，该方案包括针对在常规自动立体显示器上的呈现的进行动态视图适应。在3D自由视点方案中，用户能够基于用户控制浏览场景。为此，多个视图和深度信息被发送到客户端。对于特定视点，常规立体图像是基于两个视图来构建的。
[0007]为限制流式传输期间网络上的总负载，作者建议可以基于可用带宽来自适应发送到客户端的视图数量，同时可以在客户端侧使用基于深度图像的渲染(DIBR)来构建附加视图。为此目的，开发了MPEG参考视图合成方案，其被称为视图合成参考软件(VSRS)。因此，DIBR允许减少发送的视图数量。所提出的方法是选择性地请求视图子集的处于最高可能质量的片段，并且使用DIBR基于深度信息来估计接收器未分发的视图，使得立体显示器可以产生立体效果。
[0008]然而，上文描述的基于动态视图适应的流式传输方案不适用于现代3D多视图全息显示器，这些显示器要求预定的最小数量的视图在不考虑带宽波动的情况下实现全息效果。另外地，依赖...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种由客户端装置处理多视图视频的方法，该多视图视频基于视频流集合来创建，该视频流集合由一组相机以一组视角同时捕获场景中的对象来生成，视角定义聚焦到该对象上的相机的光轴与该对象的参考轴线之间的角度，该方法包括：接收元数据、优选地清单文件，其定义用于该多视图视频的多个窗口，窗口定义与从该视频流集合中选择的视频流子集相关联的多视图视频数据，该视频流子集与视角子集相关联，优选地该视角子集中的视角定义有序视角序列；确定或接收与观看者的角度位置相关联的位置信息，优选地该角度位置与该观看者的眼睛的位置相关联，该角度位置定义由该多视图显示装置显示的该对象的参考轴线与该观看者看向该对象的光轴之间的角度；从该多个窗口中选择第一窗口，该第一窗口与第一视角子集相关联，该选择基于该位置信息和该第一视角子集；请求从服务器系统发送与该第一视频流子集相关联的第一多视图视频数据；接收该第一多视图视频数据，并且将该第一多视图视频数据提供到至少一个解码器实例以进行解码。2.根据权利要求1所述的方法，其中，该第一多视图视频数据包括经编码多视图图片的序列，每个多视图图片包括与该第一视角子集的所有视角相关联的图片。3.根据权利要求1所述的方法，其中，该第一多视图视频数据包括多组图片，一组图片包括针对某一时间实例的该第一视角子集的所有视角的图片。4.根据权利要求2或3所述的方法，其中，每个多视图图片与打包格式相关联，该打包格式定义与该第一视角子集相关联的这些图片在该多视图图片中的空间布置方式。5.根据权利要求1至4中任一项所述的方法，其中，该方法进一步包括：将该第一多视图视频数据解码成与该第一视角子集相关联的第一经解码图片；以及向该多视图显示装置提供这些第一经解码图片，以同时呈现这些第一经解码图片的至少一部分，从而在该观看者的位置处提供全息效果。6.根据权利要求1至5中任一项所述的方法，其中，该位置信息由位置传感器确定或提供，该位置传感器被配置为计算或预测该观看者的角度位置，优选地，该位置传感器包括成像系统，该成像系统被配置为在由该成像系统捕获的图像中跟踪该观看者的位置。7.根据权利要求1至6中任一项所述的方法，其中，从该多个窗口中选择该第一窗口包括：确定该观看者的角度位置是否位于由该第一视角子集的最小和最大视角定义的范围内。8.根据权利要求1至7中任一项所述的方法，其中，该有序视角序列定义增加或减少的视角序列，其中，两个后续视角之间的差异定义视图间距，优选地这些不同视图的视图间距被选择为使得在这些多视图图片的呈现期间与从该显示装置的屏幕点发出的不同的多个视角相关联的不同视觉信息进入该观看者的左眼和右眼。9.根据权利要求1至8中任一项所述的方法，其中，该元数据进一步包括用于定位该服务器系统的第一资源定位器，该服务器系统被配置为将该第一视频流子集的一个或多个分辨率版本发送到该客户端装置。10.根据权利要求1至9中任一项所述的方法，其中，该多个窗口中的一个窗口定义第二
窗口，该第二窗口定义从该视频流集合中选择的第二视频流子集，该第二视频流子集与第二视角子集相关联，其中：该第一子集的视角与该第二子集的视角部分重叠；或者该第一子集的视角与该第二子集的视角不重叠；或者该第一子集的视角与该第二子集的视角相同，并且该第一子集的视频流数量大于该第二子集的视频流数量。11.根据权利要求1至10中任一项所述的方法，其中，该元数据包括以下各项中的至少一项：定义该第一视角子集限定以下项的元数据：用于水平多视图视频呈现的水平视角；用于竖直多视图视频呈现的竖直视角；或者用于水平和竖直多视图视频呈现二者的水平和竖直视角；定义这些多视图图片的数据格式的元数据；定义不同视角的图片在该多视图图片中的空间布置顺序的元数据；定义用于创建该视频流集合的该组相机的一个或多个属性的元数据；定义该第一子集的第一角度和/或该第一子集的最后角度的元数据；定义该第一子集中的视角数量的元数据。12.根据权利要求1至11中任一项所述的方法，其中，该客户端装置被实施为HTTP适应流式传输客户端装置，比如MPEG
‑
DASH客户端装置，并且其中，该清单文件定义媒体呈现描述MPD，其中，该MPD包括定义该第一窗口的第一窗口描述符，优选地，该第一窗口描述符是EssentialProperty，更优选地，该第一窗口映射到第一AdaptationSet，该第一AdaptationSet的EssentialProperty包括该第一窗口描述符，该第一AdaptationSet包括Representation，其中，每个Representation定义该第一视频流子集中的视频流的一个质量版本。13.一种由多视图视频创作系统处理多视图视频的方法，该方法包括：接收定义多视图视频的视频流集合，其中，该多视频由一组相机以一组视角同时捕获场景中的对象来生成，视角定义聚焦到该对象上的相机的光轴与该对象的参考轴线之间的角度；从该视频流集合中选择第一视频流子集和第二视频流子集，该第一视频流子集和该第二视频流子集分别与第一视角子集和第二视角子集相关联；确定与该第一视频流子集相关联的第一多视图视频数据和与该第二视频...

【专利技术属性】
技术研发人员：E，
申请(专利权)人：荷兰应用自然科学研究组织，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人