The invention relates to a digital television program translation output method and system, separating the TV program data cache stream of video, audio and subtitles of the three, then the section, tone recognition and translation processing of audio data, and stamp correction and synchronization using caption data and time to complete the original audio data and simultaneous translation into audio data required by the user of language, and then broadcast to the user, allowing the user to have to understand TV programs without watching the subtitle of the audio, brought great convenience to the user to watch TV, the picture content users do not miss the TV program, greatly improving user viewing experience.
【技术实现步骤摘要】
数字电视节目同声翻译输出方法及系统
本专利技术涉及数字电视领域,尤其涉及一种数字电视节目同声翻译输出方法及系统。
技术介绍
目前,数字电视机顶盒(或电视机)播放的数字电视节目声音,都是节目中对应的原始声音,使得用户能够原汁原味的观看电视节目。但是,节目的原始声音有可能是外语发声,例如英语电视节目。外语发声的电视节目为使听不懂外语的观众能够正常观看,往往会提供双语字幕,观众如果听不懂外语,就只能依赖于看屏幕下方的中文字幕才能看懂电视节目内容,而观看下方的中文字幕,往往会顾及不到电视节目中的内容画面,这将会很大程度的影响观众的观看效果,使得观众不能很好的观看电视节目,给观众带来不便。
技术实现思路
有鉴于此,有必要针对上述外语发声电视节目,观众观看中文字幕影响观众观看电视节目,带来不便的问题,提供一种数字电视节目同声翻译输出方法及系统。本专利技术提供的一种数字电视节目同声翻译输出方法,包括如下步骤:S10:控制音视频终端缓冲存储电视节目数据流;S20:由缓冲存储的电视节目数据流中分别解析分离出视频数据、音频数据以及字幕数据,并在分离时标记时间戳,为三者标记上同步标签;S30:对音频数据进行分段,并将分段后的音频数据进行解码处理,生成分段的原始PCM数据;S40:将分段的原始PCM数据发送到云端服务器通过预设的音色数据库进行音色学习,匹配识别出音频数据的音色;S50:将原始的PCM数据在云端服务器进行用户所需语言的文字翻译,并将翻译结果与字幕数据进行比对,采用字幕数据对翻译结果进行内容和时间的同步修正;S60:根据识别出的音色,将修正后的翻译结果转换成相同音色的语音 ...
【技术保护点】
一种数字电视节目同声翻译输出方法,其特征在于,包括如下步骤:S10:控制音视频终端缓冲存储电视节目数据流;S20:由缓冲存储的电视节目数据流中分别解析分离出视频数据、音频数据以及字幕数据,并在分离时标记时间戳,为三者标记上同步标签;S30:对音频数据进行分段,并将分段后的音频数据进行解码处理,生成分段的原始PCM数据;S40:将分段的原始PCM数据发送到云端服务器通过预设的音色数据库进行音色学习,匹配识别出音频数据的音色;S50:将原始的PCM数据在云端服务器进行用户所需语言的文字翻译,并将翻译结果与字幕数据进行比对,采用字幕数据对翻译结果进行内容和时间的同步修正;S60:根据识别出的音色,将修正后的翻译结果转换成相同音色的语音数据,并将语音数据按照时间戳与视频数据、字幕数据进行同步合成,合成新的节目数据流进行播放。
【技术特征摘要】
1.一种数字电视节目同声翻译输出方法,其特征在于,包括如下步骤:S10:控制音视频终端缓冲存储电视节目数据流;S20:由缓冲存储的电视节目数据流中分别解析分离出视频数据、音频数据以及字幕数据,并在分离时标记时间戳,为三者标记上同步标签;S30:对音频数据进行分段,并将分段后的音频数据进行解码处理,生成分段的原始PCM数据;S40:将分段的原始PCM数据发送到云端服务器通过预设的音色数据库进行音色学习,匹配识别出音频数据的音色;S50:将原始的PCM数据在云端服务器进行用户所需语言的文字翻译,并将翻译结果与字幕数据进行比对,采用字幕数据对翻译结果进行内容和时间的同步修正;S60:根据识别出的音色,将修正后的翻译结果转换成相同音色的语音数据,并将语音数据按照时间戳与视频数据、字幕数据进行同步合成,合成新的节目数据流进行播放。2.根据权利要求1所述的数字电视节目同声翻译输出方法,其特征在于,所述步骤S20还包括:在获取到音频数据后,对除人声之外的环境声音进行过滤。3.根据权利要求2所述的数字电视节目同声翻译输出方法,其特征在于,所述步骤S30还包括:解析字幕数据中的标点符号,获取每一个句号处的时间位置,按照句号处的时间位置对音频数据进行分段。4.根据权利要求3所述的数字电视节目同声翻译输出方法,其特征在于,所述步骤S60还包括:将转换后的语音数据的振幅与原音频数据的振幅进行比对调整,使转换后语音数据的振幅与原音频数据的振幅保持一致。5.一...
【专利技术属性】
技术研发人员:何加军,
申请(专利权)人:深圳市九洲电器有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。