内容可适性的多媒体处理系统与处理方法技术方案

技术编号：5969179 阅读：284 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供一种内容可适性的多媒体处理系统与处理方法，整合视频分析、音频分析及文字分析等结果进行决策处理，将包含视频、音频及字幕的多媒体内容，在兼顾视频、音频及文字内容的处理方式下，转换为可在不同播放装置上取得较佳观看效果的多媒体内容。通过本系统，原始多媒体内容经处理后，在不同的播放装置，如不同显示尺寸的行动装置，或不同显示比例的计算机程序窗口上播放时，仍可将使用者感兴趣的视频内容作最大程度的保留，使画面不因屏幕缩小或比例改变而丧失重要细节，同时突显音频中重要内容，调整字幕的显示位置及显示方式。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术关于一种，特别是关于一种可根据内容分析结果，将包含视频、音频及字幕的多媒体内容作一内容编辑、格式转换及多媒体压缩编码，使产生的多媒体内容，在不同播放装置上可取得较佳观看效果的方法。
技术介绍
随着科技进步，在行动装置上观看影片或电视的多媒体应用越来越多，由于多媒体来源多具有高分辨率、多声道的特色，而行动装置种类繁多，屏幕显示尺寸及显示比例也不尽相同，如需于行动装置上的屏幕播放，在屏幕播放尺寸、装置播放能力、网络传输频宽及多媒体储存空间的考虑下，多媒体串流或多媒体档案需经过一番转换，以符合行动装置的屏幕尺寸及维持播放的流畅度。在视频部分，目前传统作法将多媒体的视频内容等比例缩小至符合行动装置屏幕的尺寸。然而由于受限于行动装置的屏幕大小，使用者于行动装置的小屏幕上，常无法取得等同于电视屏幕或计算机屏幕等其它显示装置上的观看效果及体验。例如视频画面上的关键物体，经过与整个画面等比例一起缩放后，将无法于行动装置的屏幕保留该关键物体的细节、无法呈现原来的重要性。在音频部分，受限于行动装置的音效播放装置，因此原始多媒体的音频内容，也须作适度转换以符合于行动装置上播放。目前传统作法是直接采用降混(downmix)的方式，将多声道音频内容降为立体声或单声道的音频内容。由于行动装置移动性佳的特性，音频容易受到所在环境噪音的干扰，使重要的音频内容，不容易收听清楚。且行动装置因喇叭大小与功率的限制有较差的频率响应，会造成如爆炸音等背景音效明显的失真、或背景音效太大声造成前景音效如对白相对太小声，使用者时常需要调整音量。而受限于行动装置的...

【技术保护点】
１．一种内容可适性的多媒体处理系统，其特征在于，所述系统包括：一内容分析单元，接收多媒体数据，并分析该多媒体数据的内容，该内容分析单元包括：一视频分析子单元，用以分析该多媒体数据的视频内容；一文字分析子单元，用以分析该多媒体数据的文字内容；一音频分析子单元，用以分析该多媒体数据的音频内容；一决策单元，根据该内容分析单元针对该多媒体数据的分析结果决定一处理方式；以及一多媒体处理单元，根据该处理方式将原始的多媒体数据内容编辑、格式转换及多媒体压缩编码成适于特定播放环境的多媒体数据；其中，该内容分析单元传递视频分析结果、音频分析结果与文字分析结果至该决策单元，该决策单元整合视频分析结果、音频分析结果与文字分析结果，决定该处理方式。

【技术特征摘要】

【专利技术属性】
技术研发人员：寇世斌，倪嗣尧，蓝元宗，林仲毅，陈翊玮，
申请(专利权)人：大猩猩科技股份有限公司，
类型：发明
国别省市：71[中国|台湾]

全部详细技术资料下载我是这个专利的主人