本公开提供了一种视频标题生成方法、装置、电子设备及存储介质。本公开涉及视频技术领域,尤其涉及短视频技术领域。具体实现方式为:获取针对第一视频文件的多个可选文本信息;从所述多个可选文本信息中确定中心文本信息,所述中心文本信息为与所述第一视频文件的内容的相似度最高的可选文本信息;将所述中心文本信息确定为所述第一视频文件的标题。本公开能够根据用户对原始视频文件的互动行为数据确定原始视频文件中的兴趣点,并以兴趣点为基准对原始视频文件进行裁剪,得到多个裁剪后的视频文件,即短视频。本公开能够提高生成视频文件标题的效果和效率。频文件标题的效果和效率。频文件标题的效果和效率。
【技术实现步骤摘要】
视频标题生成方法、装置、电子设备及存储介质
[0001]本公开涉及视频
,尤其涉及短视频
,具体涉及一种视频标题生成方法、装置、电子设备及存储介质。
技术介绍
[0002]随着视频技术的发展和短视频平台的普及,大量的信息都通过的视频或短视频方式传播。如何确定视频或短视频文件的标题,成为需要解决的技术问题。
技术实现思路
[0003]本公开提供了一种视频标题生成方法、装置、电子设备及存储介质。
[0004]根据本公开的一方面,提供了一种视频标题生成方法,包括:
[0005]获取针对第一视频文件的多个可选文本信息;
[0006]从该多个可选文本信息中确定中心文本信息,该中心文本信息为与该第一视频文件的内容的相似度最高的可选文本信息;
[0007]将该中心文本信息确定为该第一视频文件的标题。
[0008]根据本公开的另一方面,提供了一种视频标题生成装置,包括:
[0009]获取模块,用于获取针对第一视频文件的多个可选文本信息;
[0010]确定模块,用于从该多个可选文本信息中确定中心文本信息,该中心文本信息为与该第一视频文件的内容的相似度最高的可选文本信息;
[0011]标题模块,用于将该中心文本信息确定为该第一视频文件的标题。
[0012]根据本公开的另一方面,提供了一种电子设备,包括:
[0013]至少一个处理器;以及
[0014]与所述至少一个处理器通信连接的存储器;其中,
[0015]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述任一项所述的方法。
[0016]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据上述任一项所述的方法。
[0017]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据上述任一项所述的方法。
[0018]采用本公开,能够根据用户对原始视频文件的互动行为数据确定原始视频文件中的兴趣点,并以兴趣点为基准对原始视频文件进行裁剪,得到多个裁剪后的视频文件,即短视频。由于裁剪后得到的短视频中包含了原始视频文件中用户最感兴趣的部分,因此这种方式得到的短视频质量较高,更能够符合用户的喜好,具有极高的应用价值。
[0019]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0020]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0021]图1是根据本公开一实施例的视频标题生成方法的示意性流程图;
[0022]图2是根据本公开一实施例的视频标题生成方案的流程框图;
[0023]图3是根据本公开一实施例的视频标题生成方案的应用场景示意图;
[0024]图4是根据本公开一实施例的视频标题生成方法的流程图;
[0025]图5是根据本公开一实施例的确定弹幕对应的文本向量中的中心向量的实现方式示意图;
[0026]图6是根据本公开一实施例的视频标题生成装置的结构示意图;
[0027]图7是根据本公开一实施例的视频标题生成装置的结构示意图;
[0028]图8是根据本公开一实施例的视频标题生成装置的结构示意图;
[0029]图9是用来实现本公开实施例的视频标题生成方法的电子设备的框图。
具体实施方式
[0030]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0031]本公开实施方式提出一种视频标题生成方法,可以用于生成视频文件的标题、或用于生成短视频的标题。短视频是近年来流行的一种视频形式,对于“短视频”这个术语,业界没有统一的定义。短视频一般是相对于长视频而言的,短视频和长视频主要是从视频时长的角度划分。例如,长度为数十秒、数分钟或近似视频长度的视频文件可以称为短视频,长度为数十分钟、数小时或近似长度的视频文件可以称为长视频(或传统意义上的视频)。
[0032]一般而言,时长较短的视频都可以视为短视频,不限拍摄设备、地点和后期处理。例如,内容高潮集中、时长不超十分钟的视频可以视为短视频。从传播性看,短视频因其短小、精悍的特征,相比传统的图文,短视频信息量大,表现力强、直观性好,人们可利用碎片时间浏览、分享,让短视频具备了病毒式传播潜力。
[0033]短视频的生成方式有多种,例如,可以直接拍摄时长较短的视频文件,作为短视频;或者,可以对长视频进行裁剪,将从长视频中选取的片段组成短视频。具体地,可以从长视频中裁剪出一个片段,并将该片段作为短视频;也可以从长视频中裁剪出两个或多个片段,并将裁剪出的片段拼接得到短视频。
[0034]以下以生成短视频的标题为例,介绍本公开实施方式提出的视频标题生成方法。需要强调的是,本公开实施方式提出的视频标题生成方法不限于生成短视频的标题,也可以应用于生成长视频(或传统意义上的视频文件)的标题。
[0035]短视频的标题一般需要将短视频的内容体现出来,并且有一定的修饰效果等。相关技术中,一般通过标注人员人工观看生成短视频,并人工创作标题。这种标题生成方式需要耗费大量的人力和时间成本,无法适应海量的短视频更新,并且对于标注人员的要求较高,人工标注的短视频标题也难以保证稳定的质量。另外一种常见的标题生成方法是,统计几个高频词汇,将统计的高频词汇拼凑成一个句子,将该句子作为视频文件的标题;这种方
式得到的视频文件的标题无法较好地体现视频文件的主题,并且标题的语法、修饰效果等均不佳。可见,相关的视频标题生成方法的效果和效率都不高。
[0036]本公开的实施例提出一种视频标题生成方法,图1是根据本公开一实施例的视频标题生成方法的示意性流程图,包括:
[0037]S110、获取针对第一视频文件的多个可选文本信息;
[0038]S120、从多个可选文本信息中确定中心文本信息,该中心文本信息为与该第一视频文件的内容的相似度最高的可选文本信息;
[0039]S130、将该中心文本信息确定为该第一视频文件的标题。
[0040]在一些实施方式中,上述可选文本信息包括所述第一视频文件的弹幕文本、评论、字幕和介绍文本中的至少一项。采用多种形式的文件作为可选文本信息,并从多种形式的文件中选择出中心文本信息作为第一视频文件的标题,能够丰富标题的文件来源,从而得到精确代表第一视频文件的主体内容的标题。
[0041]在一些实施方式中,上述第一视频文件为利用本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种视频标题生成方法,包括:获取针对第一视频文件的多个可选文本信息;从所述多个可选文本信息中确定中心文本信息,所述中心文本信息为与所述第一视频文件的内容的相似度最高的可选文本信息;将所述中心文本信息确定为所述第一视频文件的标题。2.根据权利要求1所述的方法,其中,所述可选文本信息包括所述第一视频文件的弹幕文本、评论、字幕和介绍文本中的至少一项。3.根据权利要求2所述的方法,其中,所述第一视频文件为利用从第二视频文件中选取的片段组成的视频文件;所述第一视频文件的弹幕文本包括:多个用户在所述第二视频文件播放过程中,在播放所述第一视频文件中的所述片段的时刻发送的弹幕文本。4.根据权利要求1至3中任一所述的方法,其中,所述从所述多个可选文本信息中确定中心文本信息,包括:将所述各个可选文本信息分别转换为对应的文本向量;针对各个所述文本向量,分别确定每个文本向量与其他各个文本向量之间的距离之和;将所述距离之和最小的文本向量对应的可选文本信息确定为所述中心文本信息。5.根据权利要求4所述的方法,其中,确定文本向量与其他文本向量之间的距离的方式包括:计算所述文本向量与所述其他文本向量之间的夹角余弦,将所述夹角余弦作为所述文本向量与所述其他文本向量之间的距离;或者,计算所述文本向量与所述其他文本向量之间的欧氏距离,将所述欧氏距离作为所述文本向量与所述其他文本向量之间的距离。6.根据权利要求4或5所述的方法,其中,将所述可选文本信息转换为对应的文本向量,包括:采用基于转换器的双向编码器表示BERT模型和使用信息实体的增强语言表示ERNIE模型中的至少一种,将所述可选文本信息转换为对应的文本向量。7.根据权利要求1至3中任一所述的方法,其中,所述从所述多个可选文本信息中确定中心文本信息,包括:将所述各个可选文本信息分别进行分词处理,得到多个分词,并统计各个分词在所有所述可选文本信息中出现的次数;从所述多个分词中选取出现次数最多的L个分词,作为重要分词,并根据所述重要分词出现的次数为所述重要分词设定分词分值;所述L为正整数;针对所述多个可选文本信息中的各个可选文本信息,确定所述可选文本信息中包含的重要分词,并根据重要分词的分词分值确定所述可选文本信息的文本分值;将所述文本分值最高的可选文本信息作为所述中心文本信息。8.一种视频标题生成装置,包括:获取模块,用于获取针对第一视频文件的多个可选文本信息;确定模块,用于从所述多个可选文本信息中确定中心文本信息,所述中心文本信息为
与所述第一视频文件的内容的相似度最高的可选文本信息;标题模块,用于将所述中心文本信息确定为所述第一视频文件的标题。9.根据权利要求8所述的装置,其中,所述可选文本信息包括所述第一视...
【专利技术属性】
技术研发人员:魏承东,丁杰超,高睿,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。