一种视频文案信息的生成方法及装置制造方法及图纸

技术编号：21629532 阅读：46 留言：0更新日期：2019-07-17 11:17

本申请实施方式公开了一种视频文案信息的生成方法及装置，其中，所述方法包括：获取目标视频的音频信息，所述音频信息包括所述目标视频中的背景音乐、环境音、语音信息中的至少一种；对所述音频信息进行识别，以从所述音频信息中提取所述目标视频的特征信息；其中，所述特征信息用于表征所述目标视频对应的情绪类型、发声者、发声内容中的至少一种；基于所述特征信息，生成所述目标视频的视频文案信息。本申请提供的技术方案，能够提高视频文案信息的生成效率。

A Method and Device for Generating Video Text Information

全部详细技术资料下载

【技术实现步骤摘要】
一种视频文案信息的生成方法及装置
本申请涉及互联网
，特别涉及一种视频文案信息的生成方法及装置。
技术介绍
随着互联网技术的不断发展，涌现出越来越多的视频播放平台。由于视频播放平台中的视频数量通常较大，为了方便用户查找感兴趣的视频，目前的视频播放平台通常会对热门视频制作“视频看点”。该“视频看点”可以是原视频中节选或者剪辑的一小段视频内容，这一小段视频内容中可以体现原视频中具有代表性的视频画面。目前，视频播放平台通常会对视频看点附加一个视频文案信息，该视频文案信息可以用简短的语句概括视频看点的主要内容，从而可以让用户更加直观地对视频内容进行判断。视频文案信息通常会由视频的上传者或者视频播放网站的管理人员进行人工设置。视频文案信息的设置人员可以快速浏览视频看点的具体内容，然后根据浏览的内容构思出相对应的文案。然而，这种通过人工设置视频文案信息的方式，不仅会浪费较多的人力资源，还会使得视频文案信息生成的效率较低。
技术实现思路
本申请实施方式的目的是提供一种视频文案信息的生成方法及装置，能够提高视频文案信息的生成效率。为实现上述目的，本申请实施方式提供一种视频文案信息的生成方法，所述方法包括：获取目标视频的音频信息，所述音频信息包括所述目标视频中的背景音乐、环境音、语音信息中的至少一种；对所述音频信息进行识别，以从所述音频信息中提取所述目标视频的特征信息；其中，所述特征信息用于表征所述目标视频对应的情绪类型、发声者、发声内容中的至少一种；基于所述特征信息，生成所述目标视频的视频文案信息。为实现上述目的，本申请实施方式还提供一种视频文案信息的生成装置，所述装置...

【技术保护点】
1.一种视频文案信息的生成方法，其特征在于，所述方法包括：获取目标视频的音频信息，所述音频信息包括所述目标视频中的背景音乐、环境音、语音信息中的至少一种；对所述音频信息进行识别，以从所述音频信息中提取所述目标视频的特征信息；其中，所述特征信息用于表征所述目标视频对应的情绪类型、发声者、发声内容中的至少一种；基于所述特征信息，生成所述目标视频的视频文案信息。

【技术特征摘要】
1.一种视频文案信息的生成方法，其特征在于，所述方法包括：获取目标视频的音频信息，所述音频信息包括所述目标视频中的背景音乐、环境音、语音信息中的至少一种；对所述音频信息进行识别，以从所述音频信息中提取所述目标视频的特征信息；其中，所述特征信息用于表征所述目标视频对应的情绪类型、发声者、发声内容中的至少一种；基于所述特征信息，生成所述目标视频的视频文案信息。2.根据权利要求1所述的方法，其特征在于，所述目标视频包括至少两条音轨，所述至少两条音轨各自表征的音频信息互不相同；相应地，获取目标视频的音频信息包括：从所述目标视频的音轨中提取相应的音频信息。3.根据权利要求1所述的方法，其特征在于，当所述音频信息包括所述目标视频中的背景音乐和/或环境音时，从所述音频信息中提取所述目标视频的特征信息包括：从所述音频信息中识别指定特征，并根据识别出的所述指定特征，构建所述音频信息的特征向量；其中，所述指定特征包括响度、音调、音色、节奏、速度中的至少一种；将所述特征向量输入指定情感模型，得到所述特征向量对应的情绪类型，并将得到的所述情绪类型作为所述目标视频的特征信息。4.根据权利要求3所述的方法，其特征在于，根据识别出的所述指定特征，构建所述音频信息的特征向量包括：确定识别出的所述指定特征的特征值，并将所述特征值作为特征向量中的元素，构建所述音频信息的特征向量。5.根据权利要求4所述的方法，其特征在于，在确定识别出的所述指定特征的特征值之后，所述方法还包括：将所述特征值转换至指定度量域中，得到所述特征值在所述指定度量域中的程度值；相应地，构建所述音频信息的特征向量包括：将所述特征值在所述指定度量域中的程度值作为特征向量中的元素，构建所述音频信息的特征向量。6.根据权利要求4所述的方法，其特征在于，在确定识别出的所述指定特征的特征值之后，所述方法还包括：根据所述指定特征的类型，为所述指定特征的特征值设置权重系数；相应地，在将所述特征向量输入指定情感模型时，所述方法还包括：将所述特征向量以及所述特征向量中特征值的权重系数共同输入所述指定情感模型。7.根据权利要求1所述的方法，其特征在于，当所述音频信息包括所述目标视频中的语音信息时，从所述音频信息中提取所述目标视频的特征信息包括：从当前发声者的语音信息中识别具备指定句式的语句，其中，识别出的所述语句中包括用于表征人员称谓的词汇；将所述词汇表征的人员称谓作为下一个发声者的称谓，并将所述下一个发声者的称谓作为所述目标视频的特征信息。8.根据权利要求7所述的方法，其特征在于，在将所述词汇表征的人员称谓作为下一个发...

【专利技术属性】
技术研发人员：王往，
申请(专利权)人：优酷网络技术北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人