视频剪辑方法、装置、电子设备和可读存储介质制造方法及图纸

技术编号:30961663 阅读:16 留言:0更新日期:2021-11-25 20:25
本公开提供了一种视频剪辑方法、装置、电子设备和可读存储介质,涉及图像处理、深度学习等人工智能技术领域。视频剪辑方法包括:获取待剪辑视频,确定所述待剪辑视频中的至少一个目标帧;从所述待剪辑视频中提取每个目标帧的初始视频;根据每个初始视频所包含图像帧的图像与音频数据,确定每个初始视频中与目标帧对应的开始帧与结束帧;根据每个目标帧及其对应的开始帧与结束帧,生成每个目标帧的剪辑视频。本公开实现了视频的自动剪辑,能够提升视频剪辑的准确性与效率。频剪辑的准确性与效率。频剪辑的准确性与效率。

【技术实现步骤摘要】
视频剪辑方法、装置、电子设备和可读存储介质


[0001]本公开涉及计算机
,尤其涉及图像处理、深度学习等人工智能
提供了一种视频剪辑方法、装置、电子设备和可读存储介质。

技术介绍

[0002]作为信息媒介的一种,视频,尤其是短视频,受到越来越多人的关注。目前,长视频已经存在很长一段时间了,如电视剧、电影、娱乐直播视频等,目前这些视频资源的时长较长,完整看下来比较耗时。相反,短视频时间较短,由于可以利用碎片化时间、信息高度集中等受到追捧。
[0003]现有技术中一般是依据输入的剪辑操作,对视频资源进行剪辑,但由于剪辑时间、剪辑片段时长等难以把控,因此导致视频剪辑的准确性与效率较低。

技术实现思路

[0004]根据本公开的第一方面,提供了一种视频剪辑方法,包括:获取待剪辑视频,确定所述待剪辑视频中的至少一个目标帧;从所述待剪辑视频中提取每个目标帧的初始视频;根据每个初始视频所包含图像帧的图像与音频数据,确定每个初始视频中与目标帧对应的开始帧与结束帧;根据每个目标帧及其对应的开始帧与结束帧,生成每个目标帧的剪辑视频。
[0005]根据本公开的第二方面,提供了一种视频剪辑装置,包括:获取单元,用于获取待剪辑视频,确定所述待剪辑视频中的至少一个目标帧;提取单元,用于从所述待剪辑视频中提取每个目标帧的初始视频;处理单元,用于根据每个初始视频所包含图像帧的图像与音频数据,确定每个初始视频中与目标帧对应的开始帧与结束帧;生成单元,用于根据每个目标帧及其对应的开始帧与结束帧,生成每个目标帧的剪辑视频。
[0006]根据本公开的第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方法。
[0007]根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行如上所述的方法。
[0008]根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的方法。
[0009]由以上技术方案可以看出,本实施例在确定待剪辑视频中的至少一个目标帧之后,首先从待剪辑视频中提取对应每个目标帧的初始视频,然后再根据初始视频确定待剪辑视频中对应每个目标帧的开始帧与结束帧,最后根据每个目标帧及其对应的开始帧与结束帧,生成每个目标帧的剪辑视频,从而实现了视频的自动剪辑,能够提升视频剪辑的准确性与效率。
[0010]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0011]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0012]图1是根据本公开第一实施例的示意图;
[0013]图2是根据本公开第二实施例的示意图;
[0014]图3是根据本公开第三实施例的示意图;
[0015]图4是用来实现本公开实施例的视频剪辑方法的电子设备的框图。
具体实施方式
[0016]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和机构的描述。
[0017]图1是根据本公开第一实施例的示意图。如图1所示,本实施例的视频剪辑方法,具体可以包括如下步骤:
[0018]S101、获取待剪辑视频,确定所述待剪辑视频中的至少一个目标帧;
[0019]S102、从所述待剪辑视频中提取每个目标帧的初始视频;
[0020]S103、根据每个初始视频所包含图像帧的图像与音频数据,确定每个初始视频中与目标帧对应的开始帧与结束帧;
[0021]S104、根据每个目标帧及其对应的开始帧与结束帧,生成每个目标帧的剪辑视频。
[0022]本实施例的视频剪辑方法,在确定待剪辑视频中的至少一个目标帧之后,首先从待剪辑视频中提取对应每个目标帧的初始视频,然后再根据所提取的初始视频,确定待剪辑视频中对应每个目标帧的开始帧与结束帧,最后根据每个目标帧及其对应的开始帧与结束帧,生成每个目标帧的剪辑视频,实现了视频的自动剪辑,能够提升视频剪辑的准确性与效率。
[0023]本实施例执行S101所获取的待剪辑视频可以为游戏视频,例如获取游戏直播视频作为待剪辑视频;其中,游戏视频的游戏种类可以为角色扮演游戏、体育游戏、多人在线竞技游戏等,本实施例对此不进行限定。
[0024]本实施例在执行S101获取了待剪辑视频之后,确定待剪辑视频中的至少一个目标帧,所确定的目标帧为对应待剪辑视频中高光时刻的图像帧。
[0025]具体地,本实施例在执行S101确定待剪辑视频中的至少一个目标帧时,可以采用的可选实现方式为:根据所获取的待剪辑视频中每个图像帧的图像得到图像帧的第一文字信息,根据每个图像帧的音频数据得到图像帧的第二文字信息,例如对图像帧的图像进行光学字符识别(Optical Character Recognition,OCR)得到第一文字信息,对图像帧的音频数据进行自动语音识别(Automatic Speech Recognition,ASR)得到第二文字信息;根据每个图像帧的第一文字信息与第二文字信息,确定所获取的待剪辑视频中的至少一个目标帧。
[0026]本实施例在执行S101确定待剪辑视频中的至少一个目标帧时,还可以对待剪辑视频进行分割,得到多个等长的视频片段之后,再分别确定各视频片段中的目标帧。
[0027]也就是说,本实施例能够根据图像帧及其音频数据所得到的两部分文字信息来确定待剪辑视频中的目标帧,从而提升所确定的目标帧的准确性。
[0028]本实施例在执行S101根据根据每个图像帧的第一文字信息与第二文字信息,确定待剪辑视频中的至少一个目标帧时,可以采用的可选实现方式为:将每个图像帧的第一文字信息与第二文字信息输入预先训练得到的第一分类模型,得到该第一分类模型针对每个图像帧输出的分类结果;将分类结果满足预设要求的图像帧作为目标帧,例如将分类结果为1的图像帧作为目标帧。
[0029]其中,本实施例执行S101所使用的第一分类模型,能够根据所输入的文字信息来输出该图像帧是否为目标帧的分类结果,分类结果为1表示该图像帧属于目标帧,分类结果为0表示该图像帧不属于目标帧。
[0030]本实施例在执行S101根据每个图像帧的第一文字信息与第二文字信息,确定待剪辑视频中的至少一个目标帧时,还可以将各图像帧的第一文字信息与第二文字信息进行拼接之后,计算拼接结果与预设信息之间的相似度,进而将相似度计算结果超本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频剪辑方法,包括:获取待剪辑视频,确定所述待剪辑视频中的至少一个目标帧;从所述待剪辑视频中提取每个目标帧的初始视频;根据每个初始视频所包含图像帧的图像与音频数据,确定每个初始视频中与目标帧对应的开始帧与结束帧;根据每个目标帧及其对应的开始帧与结束帧,生成每个目标帧的剪辑视频。2.根据权利要求1所述的方法,其中,所述确定所述待剪辑视频中的至少一个目标帧包括:根据所述待剪辑视频中每个图像帧的图像得到图像帧的第一文字信息,根据每个图像帧的音频数据得到图像帧的第二文字信息;根据每个图像帧的第一文字信息与第二文字信息,确定所述待剪辑视频中的至少一个目标帧。3.根据权利要求2所述的方法,其中,所述根据每个图像帧的第一文字信息与第二文字信息,确定所述待剪辑视频中的至少一个目标帧包括:将每个图像帧的第一文字信息与第二文字信息输入预先训练得到的第一分类模型,得到所述第一分类模型针对每个图像帧输出的分类结果;将分类结果满足预设要求的图像帧作为目标帧。4.根据权利要求1所述的方法,其中,所述从所述待剪辑视频中提取每个目标帧的初始视频包括:针对每个目标帧,将从所述待剪辑视频中提取的包含该目标帧、且时长为预设时长的视频,作为该目标帧的初始视频。5.根据权利要求1所述的方法,其中,所述根据每个初始视频所包含图像帧的图像与音频数据,确定每个初始视频中与目标帧对应的开始帧与结束帧包括:针对每个初始视频,根据该初始视频所包含图像帧的图像与音频数据,得到该初始视频中每个图像帧的多模态特征;将各图像帧的多模态特征进行拼接,将拼接结果输入预先训练得到的第二分类模型;根据所述第二分类模型的输出结果,确定该初始视频中与目标帧所对应的开始帧与结束帧。6.根据权利要求1所述的方法,其中,所述根据每个目标帧及其对应的开始帧与结束帧,生成每个目标帧的剪辑视频包括:针对每个目标帧,从所述待剪辑视频中提取开始帧到目标帧的前一帧之间的第一视频与目标帧的后一帧到结束帧之间的第二视频;生成目标帧的定格视频;依次将所述第一视频、所述目标帧的定格视频与所述第二视频进行拼接,生成目标帧的剪辑视频。7.根据权利要求1所述的方法,还包括,在生成每个目标帧的剪辑视频之后,根据每个目标帧的剪辑视频中包含的图像帧,确定图像帧存在重合的多个剪辑视频;将所确定的多个剪辑视频进行合并,保留最后一个目标帧的定格视频,生成合并剪辑
视频。8.一种视频剪辑装置,包括:获取单元,用于获取待剪辑视频,确定所述待剪辑视频中的至少一个目标帧;提取单元,用于从所述待剪辑视频中提取每个目标帧的初始视频;处理单元,用于根据每个初始视频所包含图像帧的图像与音频数据,确定每个初始视频中与目标帧对应的开始帧与结束帧;生成单元,用于根据每个目标帧及其对应的开始帧与结束帧,生成每个目标帧的剪辑视频。9.根据权利要求8所述的装置,其中,所述...

【专利技术属性】
技术研发人员:陈妙廖玺举贠挺李远杭田颖
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1