一种视频调音方法、装置、电子设备及存储介质制造方法及图纸

技术编号：37678911 阅读：24 留言：0更新日期：2023-05-26 04:45

本申请提供一种视频调音方法、装置、电子设备及存储介质，该方法包括：获得包含人体的待处理视频；通过待处理视频，获得人体的关键点特征、表情特征、语音特征以及文本特征；通过第一融合模块，将语音特征以及文本特征进行融合，获得交叉融合特征；通过第二融合模块，将关键点特征、表情特征以及交叉融合特征进行融合，获得最终特征；根据最终特征，对待处理视频进行调音处理。通过第一融合模块和第二融合模块，能够有效提取、融合各通道信号的信息，建模多通道图像与语音、文本的相关性，自动提取与目标任务强相关的高层语义特征，实现准确调音操作。利用表情识别技术，读取用户的情绪状态，并自动匹配相应的调音命令，提高调音准确率。提高调音准确率。提高调音准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种视频调音方法、装置、电子设备及存储介质

[0001]本申请涉及数字音频处理
，具体而言，涉及一种视频调音方法、装置、电子设备及存储介质。

技术介绍

[0002]调音技术被广泛应用于各类演播室、音视频制作以及现场演出等场景。调音效果的好坏直接关系到观众的听觉愉悦程度。目前的调音处理主要靠专业调音师靠听力来判断和调试，通过在调音台操作界面上手动操作，下发调音命令实现调音。这种方法调音的质量受硬件设备的影响以及调音师个人的影响，容易出现较大误差。

技术实现思路

[0003]本专利技术实施例的目的在于一种视频调音方法、装置、电子设备及存储介质，通过使用基于深度学习的表情识别技术，对视频中的关键点特征、表情特征、语音特征以及文本特征进行处理，获得最终特征，根据最终特征对待处理视频进行调音处理。改善硬件设备以及调音师个人对调音的影响的情况，提高调音的准确率以及效率。
[0004]第一方面，本申请实施例提供了一种视频调音方法，包括：获得包含人体的待处理视频；通过待处理视频，获得人体的关键点特征、表情特征、语音特征以及文本特征；通过第一融合模块，将语音特征以及文本特征进行融合，获得交叉融合特征；通过第二融合模块，将关键点特征、表情特征以及交叉融合特征进行融合，获得最终特征；根据最终特征，对待处理视频进行调音处理。
[0005]在上述的实现过程中，根据待处理视频中获取到待处理视频对应的关键点特征、表情特征、语音特征以及文本特征，对这些特征分别进行融合处理，从不同的维度进行相关信息的获取，融合各...

【技术保护点】

【技术特征摘要】
1.一种视频调音方法，其特征在于，包括：获得包含人体的待处理视频；通过所述待处理视频，获得所述人体的关键点特征、表情特征、语音特征以及文本特征；通过第一融合模块，将所述语音特征以及文本特征进行融合，获得交叉融合特征；通过第二融合模块，将所述关键点特征、所述表情特征以及所述交叉融合特征进行融合，获得最终特征；根据所述最终特征，对所述待处理视频进行调音处理。2.根据权利要求1所述的方法，其特征在于，所述第一融合模块包括多个依次连接的第一单元，其中，每一所述第一单元包括第一交叉注意力模块和第二交叉注意力模块；所述通过第一融合模块，将所述语音特征以及文本特征进行融合，获得交叉融合特征，包括：根据所述语音特征获得语音查询向量、语音键向量和语音值向量；以及根据所述文本特征获得文本查询向量、文本键向量和文本值向量；将所述语音查询向量、所述文本键向量和文本值向量，输入第一个第一单元中的第一交叉注意力模块，获得第一注意力值；将所述文本查询向量、语音键向量和语音值向量，输入第一个第一单元中的第二交叉注意力模块，获得第二注意力值；根据所述第一注意力值和所述第二注意力值，获得所述交叉融合特征。3.根据权利要求2所述的方法，其特征在于，每一所述第一单元还包括第一前馈层和第二前馈层；所述根据所述第一注意力值和所述第二注意力值，获得所述交叉融合特征，包括：将所述第一注意力值输入所述第一前馈层，获得第一中间信息；将所述第二注意力值输入所述第二前馈层，获得第二中间信息；根据所述第一中间信息和第二中间信息，获得所述交叉融合特征。4.根据权利要求1所述的方法，其特征在于，所述交叉融合特征包括多个依次连接的第二单元，每一所述第二单元包括第一多头注意力模块和第二多头注意力模块；所述通过第二融合模块，将所述关键点特征、所述表情特征以及所述交叉融合特征进行融合，获得最终特征，包括：将所述关键点特征和所述表情特征输入第一个第二单元中的第一多头注意力模块，获得图像融合特征；将所述关键点特征和所述交叉融合特征输入第一个第二单元中的第二多头注意力模块，获得多头融合特征；通过所述关键点特征、所述图像融合特征以及所述多头融合特征，获得所述...

【专利技术属性】
技术研发人员：宋丹，彭程，
申请(专利权)人：电子科技大学中山学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人