多视角音频和视频交互式回放制造技术

技术编号：13297562 阅读：76 留言：0更新日期：2016-07-09 15:42

一种交互式多视角模块识别与真实世界事件相关联的多个媒体项，所述多个媒体项中的每一个包括视频部分和音频部分。该交互式多视角模块根据公共参考时间线同步所述多个媒体项中的每一个的音频部分，确定与所述多个媒体项中的每一个相关联的相对地理位置并且至少基于同步的音频部分和相对地理位置将所述多个媒体项呈现在交互式多视角播放器界面中。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本公开涉及媒体观看服务领域，并且具体地，涉及多视角音频和视频交互式回放。
技术介绍
在互联网上，内容共享平台或者其它应用允许用户上传、观看和共享诸如媒体项的数字内容。这种媒体项可包括音频剪辑、电影剪辑、TV剪辑和音乐视频，以及诸如视频博客、简短原创视频、图片、照片、其它多媒体内容等的业余爱好内容。用户可使用计算装置(诸如，智能电话、蜂窝电话、膝上型计算机、台式计算机、上网本、平板计算机)来使用、播放和/或消费媒体项(例如，观看数字视频，收听数字音乐)。随着视频共享和社交网络平台的普及，由用户生成的视频量不断增加。对于具有多个参与者的事件，诸如体育赛事或音乐会，许多视频被上传，涵盖了不同的视点和不同的时刻。当前视频共享站点尝试对这些视频进行推荐和排名，以便给予用户事件的所有可用视频。然而，所有视频内容通常呈现在搜索查询结果的无组织的列表中，而视频相对于事件的精确时间和视点却被丢失。因此，用户将往往仅观看到事件的单个视频，从而使得他们看到由单个内容创建者可见的通向事件的较小门户。
技术实现思路
以下是本公开的简要
技术实现思路
，以便提供本公开的一些方面的基本理解。此
技术实现思路
不是本公开的详尽概述。它既不旨在识别本公开的关键或决定性元素，也没有勾画本公开的特定实现方式的任何范围或者权利要求的任何范围。其唯一目的是作为稍后呈现的具体实施方式的前序，以简化形式呈现本公开的一些构思。在一个实现方式中，一种交互式多视角模块...

【技术保护点】
一种方法，包括：由处理装置识别与真实世界事件相关联的多个媒体项，所述多个媒体项中的每一个包括视频部分和音频部分；根据公共参考时间线来同步所述多个媒体项中的每一个的所述音频部分；确定与所述多个媒体项中的每一个相关联的相对地理位置；以及至少基于所同步的音频部分和所述相对地理位置将所述多个媒体项呈现在交互式多视角播放器界面中。

【技术特征摘要】
【国外来华专利技术】2013.11.20 US 61/906,588;2014.07.03 US 14/323,8071.一种方法，包括：
由处理装置识别与真实世界事件相关联的多个媒体项，所述多个媒体项中的每一个包
括视频部分和音频部分；
根据公共参考时间线来同步所述多个媒体项中的每一个的所述音频部分；
确定与所述多个媒体项中的每一个相关联的相对地理位置；以及
至少基于所同步的音频部分和所述相对地理位置将所述多个媒体项呈现在交互式多
视角播放器界面中。
2.根据权利要求1所述的方法，进一步包括：
通过基于所同步的音频部分组合所述多个媒体项来生成与所述真实世界事件相关联
的单个编辑的媒体项。
3.根据权利要求1所述的方法，其中，识别所述多个媒体项包括：确定具有识别所述真
实世界事件的元数据的媒体项。
4.根据权利要求1所述的方法，其中，同步所述多个媒体项中的每一个的所述音频部分
包括：对所述多个媒体项中的每一个确定时间偏移，所述时间偏移增加每个音频部分的基
于频率的音频谱图的相关性，其中，所述时间偏移表示所述公共参考时间线上的位置。
5.根据权利要求1所述的方法，其中，确定与所述多个媒体项中的每一个相关联的所述
相对地理位置包括：基于所述多个媒体项中的每一个中可见的多个点，确定在所述真实世
界事件的时间用于捕获所述多个媒体项中的每一个的分立的相机的相对位置。
6.根据权利要求1所述的方法，其中，在所述交互式多视角播放器界面中呈现所述多个
媒体项包括：
显示表示所述多个媒体项中的每一个的图标，其中，每个图标被显示在基于相对应的
相对地理位置的位置中；
接收对表示所述多个媒体项中的第一媒体项的图标的用户选择并且开始回放所述第
一媒体项；以及
在所述第一媒体项的回放期间与所述公共参考时间线上的第一点相对应的时间处接
收对表示所述多个媒体项中的第二媒体项的图标的用户选择，并且在所述第二媒体项中与
所述公共参考时间线上的所述第一点相对应的时间处开始回放所述第二媒体项。
7.根据权利要求6所述的方法，进一步包括：
预测所述用户将选择的后续媒体项；以及
在用户选择所述后续媒体项之前缓冲所述后续媒体项。
8.一种存储指令的非暂时性机器可读存储介质，所述指令在被执行时使得处理装置执
行操作，所述操作包括：
由所述处理装置识别与真实世界事件相关联的多个媒体项，所述多个媒体项中的每一
个包括视频部分和音频部分；
根据公共参考时间线来同步所述多个媒体项中的每一个的所述音频部分；
确定与所述多个媒体项中的每一个相关联的相对地理位置；以及
至少基于所同步的音频部分和所述相对地理位置将所述多个媒体项呈现在交互式多
视角播放器界面中。
9.根据权利要求8所述的非暂时性机器可读存储介质，其中，所述操作进一步包括：
通过基于所同步的音频部分组合所述多个媒体项来生成与所述真实世界事件相关联
的单个编辑的媒体项。
10.根据权利要求8所述的非暂时性机器可读存储介质，其中，识别所述多个媒体项包
括：确定具有识别所述真实世界事件的元数据的媒体项。
11.根据权利要求8所述的非暂时性机器可读存储介质，其中，同步所述多个媒体项中
的每一个的所述音频部分包括：对所述多个媒体项中的每一个确定时间偏移，所述时间偏
移增加每个音频部分的基于频率的音频谱图的相关性，其中，所述时间偏移表示所述公共
参考时间线...

【专利技术属性】
技术研发人员：尼尔·比克贝克，伊萨西·因古瓦，达米安·凯利，安德鲁·克劳福德，休·登曼，佩里·托宾，史蒂文·本汀，阿纳尔·科卡拉姆，杰里米·多伊格，
申请(专利权)人：谷歌公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人