本公开实施例提供了一种生成特效视频的方法、装置、电子设备及存储介质,该方法包括:当检测到满足混音条件时,确定待处理视频帧中至少一个目标对象所对应的至少一个混音音频;基于至少一个混音音频以及至少一个目标对象的音频信息,确定待处理视频帧的目标音频;基于目标音频和至少一个目标对象,确定与待处理视频帧相对应的特效视频帧,提高了特效展示效果的丰富性,进而提高了用户的使用体验。进而提高了用户的使用体验。进而提高了用户的使用体验。
【技术实现步骤摘要】
一种生成特效视频的方法、装置、电子设备及存储介质
[0001]本公开实施例涉及图像处理技术,尤其涉及一种生成特效视频的方法、装置、电子设备及存储介质。
技术介绍
[0002]随着网络技术的发展,越来越多的应用程序进入了用户的生活,尤其是一系列可以拍摄短视频的软件,深受用户的喜爱。
[0003]现有技术中,软件开发商可以在应用中添加各种各样的特效道具,以供用户在拍摄视频的过程中使用,然而,这些特效道具的丰富度不足,无法完全匹配用户的需求。
技术实现思路
[0004]本公开提供一种生成特效视频的方法、装置、电子设备及存储介质,以实现对音频进行特效处理,从而丰富特效展示效果,进而提高了用户体验的技术效果。
[0005]第一方面,本公开实施例提供了一种生成特效视频的方法,该方法包括:
[0006]当检测到满足混音条件时,确定待处理视频帧中至少一个目标对象所对应的至少一个混音音频;其中,待处理视频帧为实时采集的视频帧或录制视频中的视频帧;
[0007]基于至少一个混音音频以及至少一个目标对象的音频信息,确定待处理视频帧的目标音频;
[0008]基于目标音频和至少一个目标对象,确定与待处理视频帧相对应的特效视频帧。
[0009]第二方面,本公开实施例还提供了一种生成特效视频的装置,该装置包括:
[0010]混音音频确定模块,用于当检测到满足混音条件时,确定待处理视频帧中至少一个目标对象所对应的至少一个混音音频;其中,待处理视频帧为实时采集的视频帧或录制视频中的视频帧;
[0011]目标音频确定模块,用于基于至少一个混音音频以及至少一个目标对象的音频信息,确定待处理视频帧的目标音频;
[0012]特效视频帧确定模块,用于基于目标音频和至少一个目标对象,确定与待处理视频帧相对应的特效视频帧。
[0013]第三方面,本公开实施例还提供了一种电子设备,电子设备包括:
[0014]一个或多个处理器;
[0015]存储装置,用于存储一个或多个程序,
[0016]当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如本公开实施例任一的生成特效视频的方法。
[0017]第四方面,本公开实施例还提供了一种包含计算机可执行指令的存储介质,计算机可执行指令在由计算机处理器执行时用于执行如本公开实施例任一的生成特效视频的方法。
[0018]本公开实施例的技术方案,当检测到满足混音条件时,可以确定待处理视频帧中
至少一个目标对象所对应的至少一个混音音频,进而基于所确定的混音音频以及至少一个目标对象的音频信息,可以确定多个音轨所对应的目标音频,通过对目标音频和目标对象进行融合处理,可以得到最终的特效视频帧。实现了不仅可以对画面内容进行处理,还可以对音频内容进行处理的技术效果,提升了特效展示效果的丰富性、趣味性,还进一步提升了用户使用体验的技术效果。
附图说明
[0019]结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
[0020]图1是本公开实施例所提供的一种生成特效视频的方法流程示意图;
[0021]图2是本公开实施例所提供的生成特效视频应用程序的用户显示界面;
[0022]图3是本公开实施例所提供的生成特效视频的界面示意图;
[0023]图4是本公开实施例所提供的一种生成特效视频的方法流程示意图;
[0024]图5为本公开实施例所提供的一种生成特效视频的方法流程示意图;
[0025]图6是本公开实施例所提供的一种至少一个目标对象显示位置的示意图;
[0026]图7是本公开实施例所提供的另一种至少一个目标对象显示位置的示意图;
[0027]图8是本公开实施例所提供的另一种至少一个目标对象显示位置的示意图;
[0028]图9是本公开实施例所提供的一种分割图像显示位置的示意图;
[0029]图10是本公开实施例所提供的另一种分割图像显示位置的示意图;
[0030]图11是本公开实施例所提供的另一种分割图像显示位置的示意图;
[0031]图12为本公开实施例所提供的一种生成特效视频的方法流程示意图;
[0032]图13是本公开实施例所提供的一种3D话筒的显示位置的示意图;
[0033]图14是本公开实施例所提供的一种生成特效视频的装置结构示意图;
[0034]图15是本公开实施例所提供的一种电子设备的结构示意图。
具体实施方式
[0035]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0036]应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
[0037]本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
[0038]需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单
元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
[0039]需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
[0040]本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
[0041]可以理解的是,在使用本公开各实施例公开的技术方案之前,均应当依据相关法律法规通过恰当的方式对本公开所涉及个人信息的类型、使用范围、使用场景等告知用户并获得用户的授权。
[0042]例如,在响应于接收到用户的主动请求时,向用户发送提示信息,以明确地提示用户,其请求执行的操作将需要获取和使用到用户的个人信息。从而,使得用户可以根据提示信息来自主地选择是否向执行本公开技术方案的操作的电子设备、应用程序、服务器或存储介质等软件或硬件提供个人信息。
[0043]作为一种可选的但非限定性的实现方式,响应于接收到用户的主动请求,向用户发送提示信息的方式例如可以是弹窗的方式,弹窗中可以以文字的方式呈现提示信息。此外,本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种生成特效视频的方法,其特征在于,包括:当检测到满足混音条件时,确定待处理视频帧中至少一个目标对象所对应的至少一个混音音频;其中,待处理视频帧为实时采集的视频帧或录制视频中的视频帧;基于至少一个混音音频以及至少一个目标对象的音频信息,确定待处理视频帧的目标音频;基于目标音频和至少一个目标对象,确定与待处理视频帧相对应的特效视频帧。2.根据权利要求1的方法,其特征在于,确定至少一个混音音频包括下述至少一种方式:基于对显示界面上至少一个混音控件的触发操作,确定至少一个混音音频;其中,混音控件对应于相应的待选择混音音频;根据至少一个目标对象的对象属性,确定至少一个混音音频;根据待处理视频帧中的音频信息,确定至少一个混音音频。3.根据权利要求2的方法,其特征在于,根据至少一个目标对象的对象属性,确定至少一个混音音频,包括:基于面部检测算法识别至少一个目标对象的对象属性;基于对象属性的属性类别数量和所述对象属性,从预先制作的至少一个待选择混音音频中,确定出至少一个混音音频。4.根据权利要求2的方法,其特征在于,根据待处理视频帧中的音频信息,确定至少一个混音音频,包括:根据待处理视频帧中音频信息的伴奏信息和和声中的目标声部,确定和声旋律;基于和声旋律中的音调信息和音频信息中的音调信息,确定至少一个混音音频。5.根据权利要求4的方法,其特征在于,基于和声旋律中的音调信息和音频信息中的音调信息,确定至少一个混音音频,包括:基于和声旋律中的音调信息、音频信息中的音调信息和至少一个目标对象的对象属性,确定至少一个混音音频。6.根据权利要求1
‑
5中任一项的方法,其特征在于,混音音频包括至少一个声部的和声伴奏或和声伴奏中包括主唱音轨的音频。7.根据权利要求1的方法,其特征在于,基于至少一个混音音频以及至少一个目标对象的音频信息,确定待处理视频帧中目标音频,包括:根据音频信息所对应的音量信息,确定待展示音频;将至少一个混音音频和待展示音频均作为待处理视频帧的目标音频。8.根据权利要求1的方法,其特征在于,基于目标音频和至少一个目标对象,确定与待处理视频帧相对应的特...
【专利技术属性】
技术研发人员:马佳欣,温思敬,梁冰雁,王晓婵,
申请(专利权)人:北京字跳网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。