字幕校正方法和装置制造方法及图纸

技术编号:10512014 阅读:193 留言:0更新日期:2014-10-08 13:25
本发明专利技术公开了一种字幕校正方法和装置,属于多媒体技术领域。所述方法包括:获取多媒体文件的反馈数据,所述反馈数据是针对所述多媒体文件的字幕文件的错误所反馈的数据;根据所述反馈数据识别所述多媒体文件的字幕文件的错误类型;根据所述错误类型对所述多媒体文件的字幕文件进行校正。所述装置包括:第一获取模块、第一识别模块和字幕校正模块。本发明专利技术通过获取字幕文件的反馈数据,识别该反馈数据中的错误类型,根据该错误类型对字幕文件进行校正,提高了字幕文件的正确性。

【技术实现步骤摘要】
字幕校正方法和装置
本专利技术涉及多媒体
,特别涉及一种字幕校正方法和装置。
技术介绍
在播放多媒体文件时,字幕可以帮助人们获得更高的使用体验。由于多媒体文件 包括音频文件和视频文件两种,在音频文件为歌曲时,字幕也可以称之为歌词。 以多媒体文件是歌曲为例,歌词是一首歌曲中的文词部分,常见的歌词有 TXT(Text,文本)歌词、LRC(lyric,歌词)歌词和QRC(QQ lyric,QQ歌词)歌词三种。其 中,TXT歌词是纯文本类型的歌词;LRC歌词为一种在歌曲播放时能够同步显示且显示定位 到逐行的歌词;QRC歌词为一种在歌曲播放时能够同步显示且显示定位到逐字的歌词,显 然QRC歌词的同步显示更精确。LRC歌词和QRC歌词的实现方法均是基于时间轴同步歌词 和歌曲,该方法要求每段歌词的内容沿着播放时间轴对齐,而由于歌词是人工编辑的,其内 容和播放时间轴可能出现不对齐的现象,另外还可能存在部分歌曲无词或歌词内容错误的 问题,因此需要对歌词进行校正。 现有技术中,一般采用人工校正的方式来实现对歌词的校正。人工校正的方式包 括人工判断歌词的错误类型,以及在出现无词问题时,采用人工的方式对歌词进行填充以 实现对歌词的校正。 在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下问题:人工判断歌词 的错误类型时识别错误的命中率较低且工作量大。
技术实现思路
为了解决现有技术的问题,本专利技术实施例提供了一种字幕校正方法和装置。该技 术方案如下: -方面,提供了一种字幕校正方法,该方法包括: 获取多媒体文件的反馈数据,该反馈数据是针对该多媒体文件的字幕文件的错误 所反馈的数据; 根据该反馈数据识别该多媒体文件的字幕文件的错误类型; 根据该错误类型对该多媒体文件的字幕文件进行校正。 另一方面,提供了一种字幕校正装置,该装置包括: 第一获取模块,用于获取多媒体文件的反馈数据,该反馈数据是针对该多媒体文 件的字幕文件的错误所反馈的数据; 第一识别模块,用于根据该反馈数据识别该多媒体文件的字幕文件的错误类型; 字幕校正模块,用于根据该错误类型对该多媒体文件的字幕文件进行校正。 本专利技术实施例提供的技术方案带来的有益效果是: 本专利技术实施例提供的字幕校正方法和装置,通过获取多媒体文件的反馈数据,该 反馈数据是针对该多媒体文件的字幕文件的错误所反馈的数据;根据该反馈数据识别该多 媒体文件的字幕文件的错误类型;根据该错误类型对该多媒体文件的字幕文件进行校正。 采用本专利技术实施例提供的方案,通过识别反馈数据中的错误类型,根据该错误类型对字幕 文件进行校正,提高了字幕文件的正确性。 【附图说明】 为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使 用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于 本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他 的附图。 图1是本专利技术实施例提供的一种字幕校正方法所涉及的实施环境; 图2是本专利技术实施例提供的一种字幕校正方法的方法流程图; 图3a是本专利技术实施例提供的一种字幕校正方法的方法流程图; 图3b是本专利技术实施例提供的一种数据反馈界面图; 图3c是本专利技术实施例提供的一种根据音频波形特征确定语音信号的开始时刻和 结束时刻方法的方法流程图; 图4是本专利技术实施例提供的一种错误类型分类器训练方法的方法流程图; 图5是本专利技术实施例提供的一种字幕校正装置的结构示意图。 【具体实施方式】 为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方 式作进一步地详细描述。 图1是本专利技术实施例提供的一种字幕校正方法所涉及的实施环境。参见图1,该实 施环境包括至少一个终端120和至少一个服务器140。 终端120,可以是具备多媒体文件播放功能的电子设备,该电子设备可以是智能手 机、平板电脑、智能电视等等。 终端120与服务器140之间可以通过无线网络相连。 服务器140,可以是一台服务器,或者由若干台服务器组成的服务器集群,或者是 一个云计算服务中心。该服务器140是可以向终端120提供字幕校正服务的服务器。 图2是本专利技术实施例提供的一种字幕校正方法流程图。参见图2,本实施例以该字 幕校正方法应用于图1所示服务器140中来举例说明。该方法流程具体包括: 201、获取多媒体文件的反馈数据,该反馈数据是针对该多媒体文件的字幕文件的 错误所反馈的数据。 202、根据该反馈数据识别该多媒体文件的字幕文件的错误类型。 203、根据该错误类型对该多媒体文件的字幕文件进行校正。 采用本专利技术实施例提供的方案,通过识别反馈数据中的错误类型,根据该错误类 型对字幕文件进行校正,提高了字幕文件的正确性。 可选地,根据该反馈数据识别该多媒体文件的字幕文件的错误类型,包括: 若该反馈数据为按钮反馈数据,则提取该按钮反馈数据中携带的错误类型,作为 该字幕文件的错误类型;该按钮反馈数据是通过按压错误类型按钮上报的反馈数据,每个 错误类型按钮对应无词、时序问题、内容问题和无错误共四种错误类型中的任意一种。 可选地,该根据该反馈数据识别该多媒体文件的字幕文件的错误类型,包括: 若该反馈数据为文本反馈数据,则提取该文本反馈数据中的至少一个关键词,该 文本反馈数据是通过文本上报的反馈数据; 将该至少一个关键词输入错误类型分类器中,识别出对应的错误类型;该错误类 型分类器是预先通过文本反馈数据样本集训练得到的,该错误类型包括无词、时序问题、内 容问题和无错误中的至少一种。 可选地,该将该至少一个关键词输入错误类型分类器中,识别出对应的错误类型 之前,还包括: 获取至少一个文本反馈数据以及每个文本反馈数据所对应的错误类型,生成该文 本反馈数据样本集; 提取该文本反馈数据样本集中文本反馈数据的关键词,得到至少一个关键词; 计算每个关键词在不同错误类型中出现的概率,筛选出每个错误类型所对应的特 征关键词; 根据每个错误类型所对应的特征关键词以及每个特征关键词在该错误类型中出 现的概率,训练得到该错误类型分类器。 可选地,该根据该错误类型对该多媒体文件的字幕文件进行校正,包括: 若识别出的该错误类型为无词,则搜索与该多媒体文件匹配的字幕文件; 若识别出的该错误类型为时序问题和/或内容问题,则向目标终端发送该多媒体 文件的标识和错误类型,该目标终端为校正人员所使用的终端; 若识别出的该错误类型为无错误,不做处理或继续下一个多媒体文件的字幕文件 的校正。 可选地,该方法还包括: 在获取该多媒体文件的反馈数据失败时,分析该多媒体文件的音频波形特征; 根据该多媒体文件的音频波形特征确定该多媒体文件中语音信号的开始时刻和 结束时刻; 根据该多媒体文件中语音信号的开始时刻和结束时刻以及该字幕文件中的播放 时间轴确定该字幕文件是否存在时序问题。 可选地,该获取多媒体文件的反馈数据,包括: 获取至少一个用户针对该多媒体文件上报的至少一个反馈本文档来自技高网...

【技术保护点】
一种字幕校正方法,其特征在于,所述方法包括:获取多媒体文件的反馈数据,所述反馈数据是针对所述多媒体文件的字幕文件的错误所反馈的数据;根据所述反馈数据识别所述多媒体文件的字幕文件的错误类型;根据所述错误类型对所述多媒体文件的字幕文件进行校正。

【技术特征摘要】
1. 一种字幕校正方法,其特征在于,所述方法包括: 获取多媒体文件的反馈数据,所述反馈数据是针对所述多媒体文件的字幕文件的错误 所反馈的数据; 根据所述反馈数据识别所述多媒体文件的字幕文件的错误类型; 根据所述错误类型对所述多媒体文件的字幕文件进行校正。2. 根据权利要求1所述的方法,其特征在于,所述根据所述反馈数据识别所述多媒体 文件的字幕文件的错误类型,包括: 若所述反馈数据为按钮反馈数据,则提取所述按钮反馈数据中携带的错误类型,作为 所述字幕文件的错误类型,所述按钮反馈数据是通过按压错误类型按钮上报的反馈数据, 每个错误类型按钮对应无词、时序问题、内容问题和无错误共四种错误类型中的任意一种。3. 根据权利要求1所述的方法,其特征在于,所述根据所述反馈数据识别所述多媒体 文件的字幕文件的错误类型,包括: 若所述反馈数据为文本反馈数据,则提取所述文本反馈数据中的至少一个关键词,所 述文本反馈数据是通过文本上报的反馈数据; 将所述至少一个关键词输入错误类型分类器中,识别出对应的错误类型;所述错误类 型分类器是预先通过文本反馈数据样本集训练得到的,所述错误类型包括无词、时序问题、 内容问题和无错误中的至少一种。4. 根据权利要求3所述的方法,其特征在于,所述将所述至少一个关键词输入错误类 型分类器中,识别出对应的错误类型之前,还包括: 获取至少一个文本反馈数据以及每个文本反馈数据所对应的错误类型,生成所述文本 反馈数据样本集; 提取所述文本反馈数据样本集中文本反馈数据的关键词,得到至少一个关键词; 计算每个关键词在不同错误类型中出现的概率,筛选出每个错误类型所对应的特征关 键词; 根据每个错误类型所对应的特征关键词以及每个特征关键词在所述错误类型中出现 的概率,训练得到所述错误类型分类器。5. 根据权利要求1至4任一所述的方法,其特征在于,所述根据所述错误类型对所述多 媒体文件的字幕文件进行校正,包括: 若识别出的所述错误类型为无词,则搜索与所述多媒体文件匹配的字幕文件; 若识别出的所述错误类型为时序问题和/或内容问题,则向目标终端发送所述多媒体 文件的标识和错误类型,所述目标终端为校正人员所使用的终端; 若识别出的所述错误类型为无错误,不做处理或继续下一个多媒体文件的字幕文件的 校正。6. 根据权利要求1至4任一所述的方法,其特征在于,所述方法还包括: 在获取所述多媒体文件的反馈数据失败时,分析所述多媒体文件的音频波形特征; 根据所述多媒体文件的音频波形特征确定所述多媒体文件中语音信号的开始时刻和 结束时刻; 根据所述多媒体文件中语音信号的开始时刻和结束时刻以及所述字幕文件中的播放 时间轴确定所述字幕文件是否存在时序问题。7. 根据权利要求1至4任一所述的方法,其特征在于,所述获取多媒体文件的反馈数 据,包括: 获取至少一个用户针对所述多媒体文件上报的至少一个反馈数据; 根据预设条件对所述至少一个反馈数据进行过滤,得到有效的反馈数据;所述预设条 件包括: 当前反馈数据所对应的用户所对应的等级高于预定等级;和/或, 当前反馈数据所对应的用户在指定时间段内播放多媒体文件的频率高于预定频率;和 /或, 当前反馈数据所对应的用户历史反馈的反馈数据的有效性高于预定阈值。8. 根据权利要求1至4任一所述的方法,其特征在于,所述根据所述错误类型对所述多 媒体文件的字幕文件进行校正之前,还包括: 若针对所述多媒体文件的字幕文件所对应的反馈数据不止1个,则计算识别出的各个 错误类型的出现概率,选择出现概率达到预定概率的错误类型作为所述多媒体文件的字幕 文件所对应的错误类型。9. 一种字幕校正装置,其特征在于,所述装置...

【专利技术属性】
技术研发人员:傅鸿城赵伟曹海峰
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1