将媒体数据封装到媒体文件中的方法、装置和计算机程序制造方法及图纸

技术编号:33518762 阅读:16 留言:0更新日期:2022-05-19 01:27
本发明专利技术涉及提供在提取器轨的提取器中通过引用而使用的默认构造器,以在不同的提取器中使用相同的构造器时减小提取器轨的大小。中使用相同的构造器时减小提取器轨的大小。中使用相同的构造器时减小提取器轨的大小。

【技术实现步骤摘要】
【国外来华专利技术】将媒体数据封装到媒体文件中的方法、装置和计算机程序


[0001]本专利技术涉及用于封装和发送媒体数据的方法和装置。

技术介绍

[0002]国际标准化组织基本媒体文件格式(ISO BMFF、ISO/IEC 14496

12)是众所周知的灵活且可扩展的文件格式,其封装和描述经编码的定时或非定时媒体数据以用于本地存储或用于经由网络或经由另一位流递送机制的传输。扩展的示例为ISO/IEC 14496

15,其描述用于各种基于NAL(Network Abstraction Layer(网络抽象层))单元的视频编码格式的封装工具。这种编码格式的示例是AVC(Advanced Video Coding(高级视频编码))、SVC(Scalable Video Coding(可缩放视频编码))、HEVC(High Efficiency Video Coding(高效视频编码))和L

HEVC(Layered HEVC(分层HEVC))。文件格式扩展的另一示例是ISO/IEC 23008

12,其描述用于静止图像或静止图像序列(诸如HEVC静止图像等)的封装工具。文件格式扩展的另一示例是定义全向媒体应用格式(OMAF)的ISO/IEC 23090

2。ISO基本媒体文件格式是面向对象的。其由称为框的构建块(或以唯一类型标识符表征的数据结构,通常是四字符码,也称为FourCC或4CC)组成。完整框是类似于附加包括版本和标志值属性的框的数据结构。在下文中,术语“框(box)”可以指定完整框或框两者。这些框或完整框在ISOBMFF文件中分层级地或顺序地组织,并且定义描述经编码的定时或非定时媒体数据、其结构和定时(如果有)的参数。封装媒体文件中的所有数据(媒体数据和描述媒体数据的元数据)包含在框中。文件内没有其他数据。文件级框是不包含在其它框中的框。
[0003]在文件格式中,整个媒体呈现被称为动画。动画由文件顶层的动画框(具有四字符码“moov”)描述。该动画框表示包含描述媒体呈现的各种框集合的初始化信息容器。其在逻辑上被分割成由轨框(具有四字符码“trak”)表示的轨。各个轨(由轨标识符(track_id)唯一地标识)表示属于呈现的媒体数据的定时序列(例如,视频或音频样本的帧)。在各个轨内,各个定时数据单元被称为样本;这可以是视频、音频或定时元数据的帧。样本在解码顺序序列中被隐式地编号。各个轨框包含描述轨的样本的框的层级,例如,样本表框(“stbl”)包含轨中的媒体样本的所有时间和数据索引。实际样本数据存储在与动画框相同级别的称为媒体数据框(具有四字符码“mdat”)或标识的媒体数据框(具有四字符码“imda”,类似于媒体数据框但包含附加标识符)的框中。动画可以在时间上被组织为包含用于整个呈现的信息的动画框,随后是媒体分片(fragment)列表,即,耦合动画分片和媒体数据框(“mdat”或“imda”)的列表。在动画分片(具有四字符码“moof”的框)内,存在描述媒体分片内的轨的轨分片集合(具有四字符码“traf”的框),每个动画分片为零个或更多个。轨分片继而包含零个或多个轨运行框(“trun”),各个轨运行框记录该轨分片的样本的连续运行。
[0004]ISOBMFF文件可以包含形成多个轨的多个经编码定时媒体数据或经编码定时媒体数据的子部分。当子部分对应于随时间拍摄的视频源的一个或连续的空间部分(例如,随时间拍摄的至少一个矩形区域,有时称为“区块(tile)”或“子图片”)时,相应的多个轨可以称为区块轨或子图片轨。ISOBMFF及其扩展包括若干分组机制以将轨、静态项或样本分组在一
起。组通常共享共同的语义和/或特征。
[0005]专利技术人已经注意到在描述和用信号通知关于要发送的媒体数据的信息时的若干问题,特别是对于在一个轨引用另一个轨时的多个轨。
[0006]示例涉及降低用信号通知在另一轨中引用的数据实体的成本,特别是当用信号通知在所有轨上包括大部分重复的值时。
[0007]另一示例涉及对用信号通知通过提取器获得的数据实体的NAL单元长度进行优化。
[0008]现有的解决方案是复杂的或没有很好地定义。

技术实现思路

[0009]本专利技术旨在解决上述问题中的一个或多于一个。
[0010]在该上下文中,提供了一种用于例如通过诸如使用HTTP协议的互联网等的IP网络来流式传输媒体内容(例如全向媒体内容)的解决方案。
[0011]根据本专利技术的第一方面,提出一种用于将媒体数据封装到媒体文件中的方法,所述方法包括:在所述媒体文件中包括第一轨,所述第一轨包括媒体样本;在所述媒体文件中包括第二轨,所述第二轨包括提取器,所述提取器是引用在所述第一轨中包括的媒体样本中的数据的结构,所述提取器包括至少一个构造器,以及其中,所述方法还包括:在所述第二轨中包括默认构造器;其中,所述构造器是引用所述默认构造器的引用构造器。
[0012]在实施例中,默认构造器被包括在第二轨的元数据部分中。
[0013]在实施例中,第二轨中的默认构造器被包括作为默认构造器的列表,引用构造器包括该列表中的索引。
[0014]在实施例中,默认构造器被包括在第二轨的元数据部分的样本条目中。
[0015]在实施例中,默认构造器被包括在描述第二轨的样本组的样本组条目中,提取器被包括在所述样本组的样本中。
[0016]根据本专利技术的另一方面,提出一种用于将媒体数据封装到媒体文件中的方法,所述方法包括:在所述媒体文件中包括第一轨,所述第一轨包括媒体样本;在所述媒体文件中包括第二轨,所述第二轨包括提取器,所述提取器是引用在所述第一轨中包括的媒体样本中的数据的结构,以及其中,所述方法还包括:在所述第二轨中包括默认提取器;在所述第二轨中包括的所述提取器是引用所述默认提取器的引用提取器。
[0017]根据本专利技术的另一方面,提出一种用于将媒体数据封装到媒体文件中的方法,所述方法包括:在所述媒体文件中包括第一轨,所述第一轨包括媒体样本,各个媒体样本包含一个或多于一个NAL单元的集合;在所述媒体文件中包括第二轨,所述第二轨包括提取器,所述提取器是引用在所述第一轨中包括的媒体样本中的数据的结构,所述提取器包括至少一个构造器,以及其中,所述构造器包括内联数据和指示所述内联数据不包括任何NAL单元长度字段的信息。
[0018]根据本专利技术的另一方面,提出一种用于将媒体数据解析成媒体文件的方法,所述方法包括:在所述媒体文件中获得包括媒体样本的第一轨;在所述媒体文件中获得包括提取器的第二轨,所述提取器是引用在所述第一轨中包括的媒体样本中的数据的结构,所述提取器包括至少一个构造器,以及其中,所述方法还包括:在所述第二轨中获得默认构造
器;其中,所述构造器是引用所述默认构造器的引用构造器;基于所述默认构造器从所述第一轨获得所述提取器所引用的数据。
[0019]根据本专利技术的另一方面,提出一种用于将媒体数据解析成媒体文本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于将媒体数据封装到媒体文件中的方法,所述方法包括:在所述媒体文件中包括第一轨,所述第一轨包括媒体样本;在所述媒体文件中包括第二轨,所述第二轨包括提取器,所述提取器是引用在所述第一轨中包括的媒体样本中的数据的结构,所述提取器包括至少一个构造器,以及其中,所述方法还包括:在所述第二轨中包括默认构造器;其中,所述构造器是引用所述默认构造器的引用构造器;其中,所述默认构造器被包括在所述第二轨的元数据部分中;以及其中,所述第二轨中的所述默认构造器被包括作为默认构造器的列表,所述引用构造器包括该列表中的索引。2.根据权利要求1所述的方法,其中,所述默认构造器被包括在所述第二轨的所述元数据部分的样本条目中。3.根据权利要求1所述的方法,其中,所述默认构造器被包括在描述所述第二轨的样本组的样本组条目中,所述提取器被包括在所述样本组的样本中。4.一种用于将媒体数据封装到媒体文件中的方法,所述方法包括:在所述媒体文件中包括第一轨,所述第一轨包括媒体样本;在所述媒体文件中包括第二轨,所述第二轨包括提取器,所述提取器是引用在所述第一轨中包括的媒体样本中的数据的结构,以及其中,所述方法还包括:在所述第二轨中包括默认提取器;在所述第二轨中包括的所述提取器是引用所述默认提取器的引用提取器。5.一种用于将媒体数据封装到媒体文件中的方法,所述方法包括:在所述媒体文件中包括第一轨,所述第一轨包括媒体样本,各个媒体样本包含一个或多于一个NAL单元的集合;在所述媒体文件中包括第二轨,所述第二轨包括提取器,所述提取器是引用在所述第一轨中包括的媒体样本中的数据的结构,所述提取器包括至少一个构造器,以及其中,所述构造器包括内联数据和指示所述内联数据不包括任何NAL单元长度字段的信息。6.一种用于将媒体数据解析成媒体文件的方法,所述方法包括:在所述媒体文件中获得包括媒体样本的第一轨;在所述媒体文件中获得包括提取器的第二轨,所述提取器是引用在所述第一轨中包括的媒体样本中的数据的结构,所述提取器包括至少一个构造器,以及其中,所述方法还包括:在所述第二轨中获得默认构造器;其中,所述构造器是引用所述默认构造器的引用构造器;基于所述默认构造器从所述第一轨获得所述提取器所引用的数据。7.一种用于将媒体数据解析成媒体文件的方法,所述方法包括:在所述媒体文件中获得包括媒体样本的第一轨;在所述媒体文件中获得包括提取器的第二轨,所述提取器是引用在所述第一轨中包括
的媒体样本中的数据的结构,以及其中,所述方法还包括:在所述第二轨中获得默认提取器;在所述第二轨中包括的所述提取器是引用所述默认提取器的引用提取器;基于所述默认提取器从所述第一轨获得所述提取器所引用的数据。8.一种用于将媒体数据解析成媒体文件的方法,所述方法包括:在所述媒体文件中获得包括媒体样本的第一轨,各个媒体样本包含一个或多于一个NAL单元的集合;在所述媒体文件中获得包括提取器的第二轨,所述提取器是引用在所述第一轨中包括的媒体样本中的数据的结构,所述提取器包括至少一个构造器;以及其中,所述构造器包括内联数据和指示所述内联数据不包括任何NAL单元长度字段的信息。9.一种用于可编程设备的计算机程序产品,所述计算机程序产品包括指令序列,所述指令序列用于在被加载到所述可编程设备中并且被所述可编程设备执行时实现根据权利要求1至8中任一项所述的方法。10.一...

【专利技术属性】
技术研发人员:弗雷德里克
申请(专利权)人:佳能株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1