本发明专利技术涉及信息处理装置和信息处理方法,其中,能够从多个种类的音频数据中容易地再现预定种类的音频数据。文件生成设备生成音频文件,其中多个组的音频流被布置为针对各组或者各多于一个组的集合被分割到轨道中,且布置有与多个组相关的信息。本发明专利技术能够适用于由例如用于生成文件的文件生成设备、用于记录由文件生成设备生成的文件的网络服务器和用于再现文件的视频再现终端构成的信息处理系统等。
【技术实现步骤摘要】
【国外来华专利技术】
本公开涉及信息处理装置和信息处理方法,且尤其涉及使得能够容易再现多个种类的音频数据中的预定种类的音频数据的信息处理装置和信息处理方法。
技术介绍
近年来,互联网上的流服务的主流已经超过热门视频(OTT-V)。作为基本技术而日益流行的技术是运动图像专家组-基于HTTP的动态自适应流(MPEG-DASH)(例如,参见非专利文献1)。在MPEG-DASH中,分配服务器针对一条运动图像内容准备具有不同屏幕尺寸和编码速度的运动图像数据组,且再现终端根据发送路径的状况,要求具有最佳屏幕尺寸和最佳编码速度的运动图像数据组,使得实现自适应流分配。引用列表非专利文献非专利文献1:MPEG-DASH(基于HTTP的动态自适应流)(URL:http://mpeg.chiariglione.org/standards/mpeg-dash/media-presentation-description-and-segment-formats/text-isoiec-23009-12012-dam-1)
技术实现思路
本专利技术待解决的问题然而,还未考虑到多组的音频数据中的预定组的音频数据的容易再现(再生,reproduction)。鉴于上述问题而作出本公开,且本公开支持多组的音频数据中的所期望组的音频数据的容易再现。问题的解决方案本公开的第一方面的信息处理装置为包括文件生成单元的信息处理装置,该文件生成单元生成以下文件,其中多个种类的音频数据针对种类中的每一种或多种而被分割到轨道中并被布置,且布置有与所述多个种类相关的信息。本公开的第一方面的信息处理方法对应于本公开的第一方面的信息处理装置。在本公开的第一方面中,生成了一种文件,在该文件中多个种类的音频数据针对所述种类的每一种或多种而被分割到轨道中并被布置,且布置有与多个种类相关的信息。本公开的第二方面的信息处理装置为包括再现单元的信息处理装置,该再现单元从文件中再现预定轨道的音频数据,在该文件中多个种类的音频数据针对所述种类的每一种或多种而被分割到轨道中并被布置,且与多个种类相关的信息被布置。本公开的第二方面的信息处理方法对应于本公开的第二方面的信息处理装置。在本公开的第二方面中,预定轨道的音频数据从文件中再现,在该文件中多个种类的音频数据针对所述种类的每一种或多种而被分割到轨道中并被布置且与多个种类相关的信息被布置。需注意,可以通过使计算机执行程序来实现第一方面的信息处理装置和第二方面的信息处理装置。另外,为了实现第一方面和第二方面的信息处理装置,可以通过传输介质传输由计算机执行的程序或可将其记录在记录介质上提供由计算机执行的程序。本专利技术的效果根据本公开的第一方面,可以生成文件。另外,根据本公开的第一方面,可以生成使得可容易再现多个种类的频数据中的预定种类的音频数据的文件。根据本公开的第二方面,可以再现音频数据。另外,根据本公开的第二方面,可以容易地再现多个种类的音频数据中的预定种类的音频数据。附图说明图1为示出MPD文件的结构的示图。图2为示出“Period(时期)”、“Representation(表示)”和“Segment(片段)”之间的关系的示图。图3为示出MPD文件的层级结构的示图。图4为示出MPD文件的结构与时间轴之间的关系的示图。图5为用于说明MP4的3D音频文件格式的轨道(track)的概要的示图。图6为示出moovbox(moov盒子)的结构的示图。图7为示出3D音频的层级结构的示图。图8为用于说明本公开应用于的第一实施例中的信息处理系统的概要的示图。图9为用于说明本公开应用于的第一实施例中的轨道的第一示例的概要的示图。图10为示出基本轨道的样本条目的语法的示例的示图。图11为示出形成switchGroup的组的轨道的样本条目的语法的示例的示图。图12为示出片段结构的第一示例的示图。图13为示出片段结构的第二示例的示图。图14为示出levelassignment(级别分配)盒子的描述示例的示图。图15为示出本公开应用于的在第一实施例中的MPD文件的第一描述示例的示图。图16为示出图8的文件生成设备的配置示例的框图。图17为流程图,其用于描述图16的文件生成设备的文件生成处理。图18为框图,其示出利用图8的运动图像再现终端实现的流再现单元的配置示例。图19为流程图,其用于描述图18的流再现单元的再现处理。图20为用于描述本公开应用于的第一实施例中的轨道的第二示例的概要的示图。图21为示出switchGroup的组的轨道的示例组条目的语法的示例的示图。图22为示出各个组的轨道的样本条目(sampleentry,样本条目)的语法的示例的示图。图23为用于说明音频文件的轨道的第三示例的概要的示图。图24为示出MPD文件的第二描述示例的示图。图25为示出MPD文件的第二描述示例的另一个示例的示图。图26为用于描述音频文件的轨道的第四示例的概要的示图。图27为示出MPD文件的第三描述示例的示图。图28为用于描述音频文件的轨道的第五示例的概要的示图。图29为示出其中4cc为“mha3”的样本条目的语法的示例的示图。图30为示出其中4cc为“mha3”的样本条目的语法的另一个示例的示图。图31为示出MPD文件的第四描述示例的示图。图32为用于描述音频文件的轨道的第三示例的另一个示例的概要的示图。图33为用于描述音频文件的轨道的第四示例的另一个示例的概要的示图。图34为用于描述音频文件的轨道的第五示例的另一个示例的概要的示图。图35为用于描述音频文件的轨道的第六示例的概要的示图。图36为示出图35的基本轨道和组轨道的样本条目的语法的示例的示图。图37为示出其中4cc为“mha3”的样本条目的语法的又一个示例的示图。图38为用于说明本公开应用至的第二实施例中的轨道的概要的示图。图39为描述本公开应用至的第二实施例中的MPD文件的第一描述示例的示图。图40为用于描述本公开应用至的第三实施例中的信息处理系统的概要的示图。图41为示出图40的文件生成设备的配置示例的框图。图42为流程图,其用于描述图41的文件生成设备的文件生成处理。图43为框图,其示出由图40的运动图像再现终端实现的流再现单元的配置示例。图44为流程图,其用于描述图43的流再现单元的再现处理的示例。图45为描述本公开应用至的第二实施例中的MPD文件的第二描述示例的示图。图46为描述本公开应用至的第二实施例中的MPD文件的第三描述示例的示图。图47为描述本公开应用至的第二实施例中的MPD文件的第四描述示例的示图。图48为描述本公开应用至的第二实施例中的MPD文件的第五描述示例的示图。图49为描述本公开应用至的第二实施例中的MPD文件的第六描述示例的示图。图50为描述本公开应用至的第二实施例中的MPD文件的第七描述示例的示图。图51为示出包括多个基本轨道的音频文件的轨道结构的示例的示图。图52为示出包括多个基本轨道的音频文件的轨道结构的另一个示例的示图。图53为示出计算机的硬件的配置示例的框图。具体实施方式在下文中,将描述本公开的预设和用于实施本公开的实施例(以下称为实施例)。需注意,描述将按以下顺序给出。0.本公开的预设(图1至图7)1.第一实施例(图8至图37)2.第二实施例(图38至图50)3.本文档来自技高网...
【技术保护点】
一种信息处理装置,包括:文件生成单元,被配置为生成文件,在所述文件中多个种类的音频数据按所述多个种类中的各自一种或多种被分割到轨道中并且被布置,并且在所述文件中布置有与所述多个种类相关的信息。
【技术特征摘要】
【国外来华专利技术】2014.06.30 JP 2014-134878;2015.05.27 JP 2015-107971.一种信息处理装置,包括:文件生成单元,被配置为生成文件,在所述文件中多个种类的音频数据按所述多个种类中的各自一种或多种被分割到轨道中并且被布置,并且在所述文件中布置有与所述多个种类相关的信息。2.根据权利要求1所述的信息处理装置,其中与所述多个种类相关的信息布置在预定轨道的样本条目中。3.根据权利要求2所述的信息处理装置,其中所述预定轨道是所述多个种类的音频数据被分割和被布置的所述轨道中的一个轨道。4.根据权利要求1所述的信息处理装置,其中对于各个所述轨道,与所述轨道对应的种类相关的信息布置在所述文件中。5.根据权利要求4所述的信息处理装置,其中对于各个所述轨道,与排他再现种类相关的信息被布置在所述文件中,所述排他再现种类由与所述轨道对应的种类以及对应于从与所述轨道对应的种类的音频数据排他地再现的音频数据的种类构成。6.根据权利要求5所述的信息处理装置,其中与对应于所述轨道的种类相关的信息和与排他再现种类相关的信息布置在对应轨道的样本条目中。7.根据权利要求5所述的信息处理装置,其中所述文件生成单元生成管理文件,所述管理文件管理包括指示与排他再现种类相关的信息是否针对所述轨道中的每个存在的信息的所述文件。8.根据权利要求1所述的信息处理装置,其中与...
【专利技术属性】
技术研发人员:平林光浩,山本优树,知念徹,史润宇,
申请(专利权)人:索尼公司,
类型:发明
国别省市:日本;JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。