一种视频弹幕生成方法技术

技术编号：35641202 阅读：22 留言：0更新日期：2022-11-19 16:32

本发明专利技术属于计算机视觉领域与自然语言处理的交叉领域，具体涉及一种视频弹幕生成方法，包括：首先对原始的视频及弹幕进行分段处理来降低输入到模型中的信息量，并通过预训练模型进行特征提取，由此来获得视频及弹幕的特征表示；使用堆叠的注意力层来对视频与弹幕的特征进行融合并使用记忆单元来捕获每段之间的上下文信息；通过解码器结构对融合的特征表示进行解码，最终生成新的弹幕评论。本发明专利技术通过引入分段机制与记忆单元，解决了使用Transformer结构只能处理固定长度上下文、自注意力机制计算量大、使用静态位置编码造成长距离信息丢失的问题，有效提高了所生成的弹幕评论的质量，还可以对不同长度的视频进行自适应化处理，分段生成多个视频弹幕。分段生成多个视频弹幕。分段生成多个视频弹幕。

全部详细技术资料下载

【技术实现步骤摘要】
一种视频弹幕生成方法

[0001]本专利技术属于计算机视觉领域与自然语言处理的交叉领域，更具体地，涉及一种视频弹幕生成方法。

技术介绍

[0002]随着互联网技术的不断发展和创新，观看网络视频已经成为现代人主流的娱乐活动，人们的观看要求也不断地增高。现如今人们往往不满足于观看视频，而是追求情感表达以及与他人互动。很多学者的研究表明，当今传统的视频网站的互动性较弱，评论区是与他人交流观点的唯一途径，然而这一做法将视频与评论分割，无法做到实时性，同步性等特点。因此，用户日益增长的互动需求成为了视频网站运营人员考虑的重要因素。因此，弹幕网站应运而生。现在，国内主流的在线视频网站也引入了弹幕功能，如爱奇艺，腾讯视频等。弹幕视频网站与传统视频网站不同的是，用户可以在观看期间发送弹幕评论，同时也可以看到其他用户发送的评论，这种方式让用户之间的互动性更强，为用户营造出一种陪伴感，归属感的体验氛围，给用户一个可以自由发声的机会。对用户而言发送弹幕成为了一个寻求信息以及宣泄情绪的渠道。随着弹幕的发展，弹幕的应用已经不止局限于视频场景，越来越多的应用都引入了该功能如在线书籍，在线教育平台，直播平台等。可见弹幕与人们的生活越来越紧密相关。
[0003]弹幕评论也产生了实际的经济价值。有学者通过研究直播平台主播与用户的互动以及用户与用户之间的互动是否会影响用户的打赏行为，研究表明直播过程中用户发送的弹幕互动越强烈，用户的兴奋水平越高，进而提高用户所向主播发送礼物的数量。还有学者研究了弹幕与营销行为的关系，得出通过视频弹幕的聚群效应形...

【技术保护点】

【技术特征摘要】
1.一种视频弹幕生成方法，其特征在于，包括：采用已训练的视频弹幕生成模型生成视频弹幕，所述视频弹幕生成模型的视频弹幕生成方式为：利用分段匹配映射机制，对视频进行分段，并组合每段视频及其相同时间段内的各个弹幕；使用预训练模型对视频和弹幕进行特征提取，最终得到每个视频弹幕组合的特征信息；通过外部存储单元获取历史视频弹幕组合信息，使用堆叠的注意力层，对当前视频弹幕组合的特征信息和所述历史视频弹幕组合信息进行特征融合，得到融合的模态特征；对历史视频弹幕组合信息更新，将更新的历史视频弹幕组合信息更新到所述外部存储单元中；同时，根据每个时间段对应的所述融合的模态特征，通过解码器以及概率生成器生成该时间段的视频弹幕评论。2.根据权利要求1所述的一种视频弹幕生成方法，其特征在于，在所述使用堆叠的注意力层之前，所述方法还包括：对每个视频弹幕组合中的弹幕特征进行文本过滤。3.根据权利要求2所述的一种视频弹幕生成方法，其特征在于，所述文本过滤的实现方式为：对每个视频弹幕组合中的弹幕特征、视频特征以及所述视频弹幕生成模型的多重相似度矩阵进行运算，得到权重值H
s
；所述权重值Hs表示每个视频弹幕组合中弹幕特征与视频特征的相关度系数；将所述权重值Hs与Aw
′
做乘积运算，得到初步过滤后的弹幕特征，再将得到的结果与所述Aw
′
相加，得到最终过滤后的弹幕特征，其中，Aw
′
为该视频弹幕组合中的视频特征和弹幕特征经维度统一后的弹幕特征。4.根据权利要求1所述的一种视频弹幕生成方法，其特征在于，所述特征融合的实现方式为：采用堆叠的注意力层中的一层注意力层，对历史视频弹幕组合信息和当前视频弹幕组合中的弹幕特征进行融合，得到融合历史信息的弹幕特征；采用所述堆叠的注意力层中另一层注意力层，对历史视频弹幕组合信息和当前视频弹幕组合中的视频特征进行融合，得到融合历史信息的视频特征；基于融合门结构，使用其两个独立的多层感知机分别对融合历史...

【专利技术属性】
技术研发人员：李玉华，董铁夫，李瑞轩，辜希武，
申请(专利权)人：华中科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人