为视频添加音频标注的方法、装置、设备和存储介质制造方法及图纸

技术编号：37353994 阅读：10 留言：0更新日期：2023-04-27 07:04

根据本公开的实施例，提供了为视频添加音频标注的方法、装置、设备和存储介质。该方法包括：呈现视频的一个或多个时间段的指示，该一个或多个时间段被确定为能够用于添加音频的候选时间段；响应于接收到对该一个或多个时间段中的第一时间段的选择，呈现视频中与第一时间段相关联的视频片段的可视化信息；以及接收针对视频片段的输入，输入将被用于生成针对视频片段的音频标注。由此，根据本公开的实施例，能够针对视频快速地添加音频标注，提高音频标注效率。注效率。注效率。

全部详细技术资料下载

【技术实现步骤摘要】
为视频添加音频标注的方法、装置、设备和存储介质

[0001]本公开的示例实施例总体涉及计算机领域，特别地涉及为视频添加音频标注的方法、装置、设备和计算机可读存储介质。

技术介绍

[0002]各种各样的视频已经成为人们日常生产和生活中的重要组成部分。在一些情况下，为了使观看视频的用户，尤其是视力受到损伤的用户，更加清楚、便捷地了解视频中的非语音(例如，非对白、非旁白)情节，需要为视频添加音频标注。音频标注以语音的方式描述视频中的非语音情节。例如，在为视障人群生产无障碍影视作品时，需要在影视作品中添加这种的音频标注。利用音频标注，用户能够更好的理解视频的内容。

技术实现思路

[0003]在本公开的第一方面，提供了一种为视频添加音频标注的方法。该方法包括：呈现视频的一个或多个时间段的指示，一个或多个时间段被确定为能够用于添加音频的候选时间段；响应于接收到对一个或多个时间段中的第一时间段的选择，呈现视频中与第一时间段相关联的视频片段的可视化信息；以及接收针对视频片段的输入，输入将被用于生成针对视频片段的音频标注。
[0004]在本公开的第二方面，提供了一种用于为视频添加音频标注的装置。该装置包括：时间段确定模块，被配置为呈现视频的一个或多个时间段的指示，一个或多个时间段被确定为能够用于添加音频的候选时间段；可视化信息呈现模块，被配置为响应于接收到对一个或多个时间段中的第一时间段的选择，呈现视频中与第一时间段相关联的视频片段的可视化信息；以及接收模块，被配置为接收针对视频片段的输入，输入将被用于生成针对...

【技术保护点】

【技术特征摘要】
1.一种为视频添加音频标注的方法，包括：呈现视频的一个或多个时间段的指示，所述一个或多个时间段被确定为能够用于添加音频标注的候选时间段；响应于接收到对所述一个或多个时间段中的第一时间段的选择，呈现所述视频中与所述第一时间段相关联的视频片段的可视化信息；以及接收针对所述视频片段的输入，所述输入将被用于生成针对所述视频片段的音频标注。2.根据权利要求1所述的方法，还包括：将所述输入中的文本信息转换为语音信息；以及至少部分地基于所述语音信息来生成针对所述视频片段的所述音频标注。3.根据权利要求1所述的方法，还包括：呈现多个候选听觉效果的指示，所述多个候选听觉效果用于生成针对所述视频片段的所述音频标注；接收对所述多个候选听觉效果之一的选择；以及呈现基于所述输入生成的具有所选择的听觉效果的音频片段，所述音频片段作为针对所述视频片段的所述音频标注的候选。4.根据权利要求1所述的方法，还包括：检测所述视频中的一个或多个非语音片段，所述非语音片段中包含的语音的量低于预定阈值；以及基于所述一个或多个非语音片段，来确定所述一个或多个时间段。5.根据权利要求1所述的方法，其中所述视频片段起始于所述第一时间段的开始，并且终止于第二时间段的开始，所述第二时间段在所述一个或多个时间段中紧邻在所述第一时间段之后。6.根据权利要求1所述的方法，其中呈现视频的一...

【专利技术属性】
技术研发人员：王聪，陈天峰，林义圣，马泽君，
申请(专利权)人：脸萌有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人