自适应音频代码转换制造技术

技术编号：8456900 阅读：169 留言：0更新日期：2013-03-22 09:44

一种系统和方法，提供用于基于音频流的内容特性而自适应地代码转换音频流的音频/视频编码系统。系统的音频流元数据提取模块被配置成提取源音频流的元数据。系统的音频流分类模块被配置成基于源音频流的元数据将源音频流分类成若干音频内容类别之一。系统的自适应音频编码器被配置成基于源音频流的元数据和分类来确定包括目标比特率和采样速率的一个或者多个代码转换参数。系统的自适应音频代码转换器被配置成使用代码转换参数将源音频流代码转换成输出音频流。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总体上涉及音频/视频托管系统，并且更具体地涉及一种用于基于音频流内容特性的音频流的自适应代码转换的音频代码转换系统。
技术介绍
多媒体内容托管服务诸如YOUTUBE允许用户将视频与它们的对应音频流一起发布。音频流可以是压缩或者未压缩的、包括FLAC、WAV、MP3、AAC、OGG等的许多音频文件格式之一。大多数媒体内容托管服务将源音频流从它的固有格式(例如，FLAC)代码转换成客户端回放(playback)设备请求的文件格式(例如，WAV)。音频流的音频代码转换也可以包括减少音频流的比特率、减少音频流的采样速率、压缩音频流、减少由音频数据代表的音频通道的数目或者这些过程的组合。代码转换可以用来减少存储要求并且也减少用于向客户端供应音频流的带宽要求。在为具有数以百万计音频的多媒体托管服务设计音频代码转换系统时的一个挑战是在可接受的声音质量与减少的比特率之间的平衡折衷下代码转换并且存储音频。常规音频代码转换系统无论音频流的内容特性如何改变都使用固定目标比特率和/或固定采样速率以代码转换多个音频流。然而，考虑大型音频全集的情况，音频流在比特率、采样速率、通道的数目和内容复杂性(例如，音乐或者话音)方面而有所不同。用相同目标比特率和采样速率对每个音频流编码未必在每个情况下产生可接受的声音质量。向具有不同内容特性的两个音频流应用的相同目标比特率造成不同声音质量。使用固定目标比特率对具有变化的内容特性的音频流编码劣化了用于多媒体托管服务的常规音频代码转换系统所处理的声音质量。
技术实现思路
一种方法、系统和计算机程序产品，提供音频流的自适应代码转换，该代码转换...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：易小泉，王会胜，V·沙斯特里，
申请(专利权)人：谷歌公司，
类型：
国别省市：

全部详细技术资料下载我是这个专利的主人