字幕校正方法和装置制造方法及图纸

技术编号：10512014 阅读：203 留言：0更新日期：2014-10-08 13:25

本发明专利技术公开了一种字幕校正方法和装置，属于多媒体技术领域。所述方法包括：获取多媒体文件的反馈数据，所述反馈数据是针对所述多媒体文件的字幕文件的错误所反馈的数据；根据所述反馈数据识别所述多媒体文件的字幕文件的错误类型；根据所述错误类型对所述多媒体文件的字幕文件进行校正。所述装置包括：第一获取模块、第一识别模块和字幕校正模块。本发明专利技术通过获取字幕文件的反馈数据，识别该反馈数据中的错误类型，根据该错误类型对字幕文件进行校正，提高了字幕文件的正确性。

全部详细技术资料下载

【技术实现步骤摘要】
字幕校正方法和装置
本专利技术涉及多媒体
，特别涉及一种字幕校正方法和装置。
技术介绍
在播放多媒体文件时，字幕可以帮助人们获得更高的使用体验。由于多媒体文件包括音频文件和视频文件两种，在音频文件为歌曲时，字幕也可以称之为歌词。以多媒体文件是歌曲为例，歌词是一首歌曲中的文词部分，常见的歌词有 TXT(Text，文本）歌词、LRC(lyric，歌词）歌词和QRC(QQ lyric，QQ歌词）歌词三种。其中，TXT歌词是纯文本类型的歌词；LRC歌词为一种在歌曲播放时能够同步显示且显示定位到逐行的歌词；QRC歌词为一种在歌曲播放时能够同步显示且显示定位到逐字的歌词，显然QRC歌词的同步显示更精确。LRC歌词和QRC歌词的实现方法均是基于时间轴同步歌词和歌曲，该方法要求每段歌词的内容沿着播放时间轴对齐，而由于歌词是人工编辑的，其内容和播放时间轴可能出现不对齐的现象，另外还可能存在部分歌曲无词或歌词内容错误的问题，因此需要对歌词进行校正。现有技术中，一般采用人工校正的方式来实现对歌词的校正。人工校正的方式包括人工判断歌词的错误类型，以及在出现无词问题时，采用人工的方式对歌词进行填充以实现对歌词的校正。在实现本专利技术的过程中，专利技术人发现现有技术至少存在以下问题：人工判断歌词的错误类型时识别错误的命中率较低且工作量大。
技术实现思路
为了解决现有技术的问题，本专利技术实施例提供了一种字幕校正方法和装置。该技术方案如下： -方面，提供了一种字幕校正方法，该方法包括：获取...

【技术保护点】
一种字幕校正方法，其特征在于，所述方法包括：获取多媒体文件的反馈数据，所述反馈数据是针对所述多媒体文件的字幕文件的错误所反馈的数据；根据所述反馈数据识别所述多媒体文件的字幕文件的错误类型；根据所述错误类型对所述多媒体文件的字幕文件进行校正。

【技术特征摘要】
1. 一种字幕校正方法，其特征在于，所述方法包括：获取多媒体文件的反馈数据，所述反馈数据是针对所述多媒体文件的字幕文件的错误所反馈的数据；根据所述反馈数据识别所述多媒体文件的字幕文件的错误类型；根据所述错误类型对所述多媒体文件的字幕文件进行校正。2. 根据权利要求1所述的方法，其特征在于，所述根据所述反馈数据识别所述多媒体文件的字幕文件的错误类型，包括：若所述反馈数据为按钮反馈数据，则提取所述按钮反馈数据中携带的错误类型，作为所述字幕文件的错误类型，所述按钮反馈数据是通过按压错误类型按钮上报的反馈数据，每个错误类型按钮对应无词、时序问题、内容问题和无错误共四种错误类型中的任意一种。3. 根据权利要求1所述的方法，其特征在于，所述根据所述反馈数据识别所述多媒体文件的字幕文件的错误类型，包括：若所述反馈数据为文本反馈数据，则提取所述文本反馈数据中的至少一个关键词，所述文本反馈数据是通过文本上报的反馈数据；将所述至少一个关键词输入错误类型分类器中，识别出对应的错误类型；所述错误类型分类器是预先通过文本反馈数据样本集训练得到的，所述错误类型包括无词、时序问题、内容问题和无错误中的至少一种。4. 根据权利要求3所述的方法，其特征在于，所述将所述至少一个关键词输入错误类型分类器中，识别出对应的错误类型之前，还包括：获取至少一个文本反馈数据以及每个文本反馈数据所对应的错误类型，生成所述文本反馈数据样本集；提取所述文本反馈数据样本集中文本反馈数据的关键词，得到至少一个关键词；计算每个关键词在不同错误类型中出现的概率，筛选出每个错误类型所对应的特征关键词；根据每个错误类型所对应的特征关键词以及每个特征关键词在所述错误类型中出现的概率，训练得到所述错误类型分类器。5. 根据权利要求1至4任一所述的方法，其特征在于，所述根据所述错误类型对所述多媒体文件的字幕文件进行校正，包括：若识别出的所述错误类型为无词，则搜索与所述多媒体文件匹配的字幕文件；若识别出的所述错误类型为时序问题和/或内容问题，则向目标终端发送所述多媒体文件的标识和错误类型，所述目标终端为校正人员所使用的终端；若识别出的所述错误类型为无错误，不做处理或继续下一个多媒体文件的字幕文件的校正。6. 根据权利要求1至4任一所述的方法，其特征在于，所述方法还包括：在获取所述多媒体文件的反馈数据失败时，分析所述多媒体文件的音频波形特征；根据所述多媒体文件的音频波形特征确定所述多媒体文件中语音信号的开始时刻和结束时刻；根据所述多媒体文件中语音信号的开始时刻和结束时刻以及所述字幕文件中的播放时间轴确定所述字幕文件是否存在时序问题。7. 根据权利要求1至4任一所述的方法，其特征在于，所述获取多媒体文件的反馈数据，包括：获取至少一个用户针对所述多媒体文件上报的至少一个反馈数据；根据预设条件对所述至少一个反馈数据进行过滤，得到有效的反馈数据；所述预设条件包括：当前反馈数据所对应的用户所对应的等级高于预定等级；和/或，当前反馈数据所对应的用户在指定时间段内播放多媒体文件的频率高于预定频率；和 /或，当前反馈数据所对应的用户历史反馈的反馈数据的有效性高于预定阈值。8. 根据权利要求1至4任一所述的方法，其特征在于，所述根据所述错误类型对所述多媒体文件的字幕文件进行校正之前，还包括：若针对所述多媒体文件的字幕文件所对应的反馈数据不止1个，则计算识别出的各个错误类型的出现概率，选择出现概率达到预定概率的错误类型作为所述多媒体文件的字幕文件所对应的错误类型。9. 一种字幕校正装置，其特征在于，所述装置...

【专利技术属性】
技术研发人员：傅鸿城，赵伟，曹海峰，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人