视频匹配方法、视频处理方法、装置、电子设备及介质制造方法及图纸

技术编号:29673695 阅读:15 留言:0更新日期:2021-08-13 21:55
本公开公开了一种视频匹配方法、视频处理方法、装置、设备、介质和产品,涉及图像处理、语音识别、智能搜索等领域。视频匹配方法包括:接收针对参考视频的第一特征数据;将第一特征数据和至少一个候选视频各自的第二特征数据进行比较得到比较结果,其中,第二特征数据是基于针对候选视频的音频数据从候选视频中提取的;基于比较结果,从至少一个候选视频中确定与参考视频相匹配的目标视频,其中,目标视频的第二特征数据与第一特征数据相匹配。

【技术实现步骤摘要】
视频匹配方法、视频处理方法、装置、电子设备及介质
本公开涉及计算机
,尤其涉及图像处理、自然语言处理、智能搜索等领域,更具体地,涉及一种视频匹配方法、视频处理方法、装置、电子设备、介质和程序产品。
技术介绍
随着互联网的普及,越来越多的用户在互联网上搜索视频。在搜索视频的过程中,基于用户输入的搜索词匹配相关的视频,并将匹配得到的视频推荐给用户。但是,通过搜索词进行视频匹配的方式,存在匹配准确性较低的问题,并且匹配得到的视频难以满足用户的需求。
技术实现思路
本公开提供了一种视频匹配方法、视频处理方法、装置、电子设备、存储介质以及计算机程序产品。根据本公开的一方面,提供了一种视频匹配方法,包括:接收针对参考视频的第一特征数据;将所述第一特征数据和至少一个候选视频各自的第二特征数据进行比较得到比较结果,其中,所述第二特征数据是基于针对候选视频的音频数据从所述候选视频中提取的;基于所述比较结果,从所述至少一个候选视频中确定与所述参考视频相匹配的目标视频,其中,所述目标视频的第二特征数据与所述第一特征数据相匹配。根据本公开的另一方面,提供了一种视频处理方法,包括:针对参考视频的音频数据,对所述音频数据进行识别得到音频识别结果;基于所述音频识别结果,从所述参考视频中提取第一特征数据;发送所述第一特征数据。根据本公开的另一方面,提供了一种视频匹配装置,包括:接收模块、比较模块以及第一确定模块。其中,接收模块,用于接收针对参考视频的第一特征数据。比较模块,用于将所述第一特征数据和至少一个候选视频各自的第二特征数据进行比较得到比较结果,其中,所述第二特征数据是基于针对候选视频的音频数据从所述候选视频中提取的。第一确定模块,用于基于所述比较结果,从所述至少一个候选视频中确定与所述参考视频相匹配的目标视频,其中,所述目标视频的第二特征数据与所述第一特征数据相匹配。根据本公开的另一方面,提供了一种视频处理装置,包括:识别模块、第四提取模块以及发送模块。其中,识别模块,用于针对参考视频的音频数据,对所述音频数据进行识别得到音频识别结果。第四提取模块,用于基于所述音频识别结果,从所述参考视频中提取第一特征数据。发送模块,用于发送所述第一特征数据。根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器和与所述至少一个处理器通信连接的存储器。其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的视频匹配方法。根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器和与所述至少一个处理器通信连接的存储器。其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的视频处理方法。根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如上所述的视频匹配方法。根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如上所述的视频处理方法。根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的视频匹配方法。根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的视频处理方法。应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本公开的限定。其中:图1示意性示出了根据本公开实施例的视频匹配方法的应用场景;图2示意性示出了根据本公开一实施例的视频匹配方法的流程图;图3A示意性示出了根据本公开一实施例的视频匹配方法的示意图;图3B示意性示出了根据本公开一实施例的视频匹配方法的示意图;图3C示意性示出了根据本公开一实施例的视频匹配方法的示意图;图4示意性示出了根据本公开一实施例的视频处理方法的流程图;图5示意性示出了根据本公开一实施例的视频匹配方法和视频处理方法的示意图;图6示意性示出了根据本公开一实施例的视频匹配装置的框图;图7示意性示出了根据本公开一实施例的视频处理装置的框图;以及图8是用来实现本公开实施例的视频匹配方法的电子设备的框图。具体实施方式以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。图1示意性示出了根据本公开实施例的视频匹配方法的应用场景。如图1所示,本公开实施例的应用场景100例如包括候选视频和参考视频。例如,多个候选视频存储于服务器中,参考视频存储于客户端中。当用户需要搜索与参考视频相匹配的视频时,服务器可以从客户端接收参考视频,并将该参考视频与每个候选视频进行匹配,以从多个候选视频中确定出与参考视频相匹配的目标视频,该目标视频为用户所需的视频。本公开的实施例以一个候选视频110为例来说明候选视频和参考视频的匹配情况。示例性地,参考视频121、122是候选视频110的子集。当基于参考视频121、122匹配候选视频110时,候选视频110的至少部分内容与参考视频121、122的全部内容相匹配。示例性地,参考视频123、124的部分内容是候选视频110的子集。当基于参考视频123、124匹配候选视频110时,候选视频110的部分内容与参考视频123、124的部分内容相匹配。示例性地,候选视频110是参考视频125、126的子集。当基于参考视频125、126匹配候选视频110时,候选视频110的全部内容与参考视频125、126的部分内容相匹配。示例性地,候选本文档来自技高网...

【技术保护点】
1.一种视频匹配方法,包括:/n接收针对参考视频的第一特征数据;/n将所述第一特征数据和至少一个候选视频各自的第二特征数据进行比较得到比较结果,其中,所述第二特征数据是基于针对候选视频的音频数据从所述候选视频中提取的;以及/n基于所述比较结果,从所述至少一个候选视频中确定与所述参考视频相匹配的目标视频,其中,所述目标视频的第二特征数据与所述第一特征数据相匹配。/n

【技术特征摘要】
1.一种视频匹配方法,包括:
接收针对参考视频的第一特征数据;
将所述第一特征数据和至少一个候选视频各自的第二特征数据进行比较得到比较结果,其中,所述第二特征数据是基于针对候选视频的音频数据从所述候选视频中提取的;以及
基于所述比较结果,从所述至少一个候选视频中确定与所述参考视频相匹配的目标视频,其中,所述目标视频的第二特征数据与所述第一特征数据相匹配。


2.根据权利要求1所述的方法,还包括:
针对所述至少一个候选视频中的每个候选视频,从针对所述候选视频的音频数据中确定目标音频;
从所述候选视频中确定与所述目标音频对应的第一视频片段;以及
从所述第一视频片段中提取所述第二特征数据。


3.根据权利要求1所述的方法,还包括:
针对所述至少一个候选视频中的每个候选视频,从针对所述候选视频的音频数据中确定任意相邻的两个子音频数据之间的时间间隔;
响应于所述时间间隔大于或等于预设时间间隔,从所述候选视频中确定第二视频片段,其中,所述第二视频片段与所述任意相邻的两个子音频数据中的一个子音频数据对应;以及
从所述第二视频片段中提取所述第二特征数据。


4.根据权利要求1所述的方法,还包括:
针对所述至少一个候选视频中的每个候选视频,响应于确定针对所述候选视频的音频数据中由第一子音频数据切换到第二子音频数据,从所述候选视频中确定第三视频片段,其中,所述第三视频片段中包括与所述第一子音频数据对应的视频片段和/或与所述第二子音频数据对应的视频片段;以及
从所述第三视频片段中提取所述第二特征数据。


5.根据权利要求4所述的方法,还包括:
确定所述音频数据在预设时间段内的音量;以及
响应于确定所述音量大于或等于预设阈值,确定所述音频数据中由第一子音频数据切换到第二子音频数据。


6.根据权利要求2-5中任意一项所述的方法,其中,所述提取第二特征数据包括:
提取第一图像;以及
处理所述第一图像,得到针对所述候选视频的第二特征数据。


7.一种视频处理方法,包括:
针对参考视频的音频数据,对所述音频数据进行识别得到音频识别结果;
基于所述音频识别结果,从所述参考视频中提取第一特征数据;以及
发送所述第一特征数据。


8.根据权利要求7所述的方法,其中,所述基于所述音频识别结果,从所述参考视频中提取第一特征数据包括:
响应于所述音频识别结果包括目标音频,从所述参考视频中确定与所述目标音频对应的第四视频片段;
从所述第四视频片段中提取所述第一特征数据。


9.根据权利要求7所述的方法,其中,所述基于所述音频识别结果,从所述参考视频中提取第一特征数据包括:
响应于所述音频识别结果表征时间间隔大于或等于预设时间间隔,从所述参考视频中确定第五视频片段,其中,所述时间间隔为所述音频数据中任意相邻的两个子音频数据之间的时间间隔,所述第五视频片段与所述任意相邻的两个子音频数据中的一个子音频数据对应;以及
从所述第五视频片段中提取所述第一特征数据。


10.根据权利要求7所述的方法,其中,所述基于所述音频识别结果,从所述参考视频中提取第一特征数据包括:
基于所述音频识别结果,确定所述音频数据中是否由第三子音频数据切换到第四子音频数据;
响应于确定所述音频数据中由第三子音频数据切换到第四子音频数据,从所述参考视频中确定第六视频片段,其中,所述第六视频片段中包括与所述第三子音频数据对应的视频片段和/或与所述第四子音频数据对应的视频片段;以及
从所述第六视频片段中提取所述第一特征数据。


11.根据权利要求10所述的方法,其中,所述基于所述音频识别结果,确定所述音频数据中是否由第三子音频数据切换到第四子音频数据包括:
基于所述音频识别结果,确定所述音频数据在预设时间段内的音量;以及
响应于确定所述音量大于或等于预设阈值,确定所述音频数据中由第三子音频数据切换到第四子音频数据。


12.根据权利要求7-11中任意一项所述的方法,其中,所述提取第一特征数据包括:
提取第二图像;以及
处理所述第二图像,得到针对所述参考视频的第一特征数据。


13.一种视频匹配装置,包括:
接收模块,用于接收针对参考视频的第一特征数据;
比较模块,用于将所述第一特征数据和至少一个候选视频各自的第二特征数据进行比较得到比较结果,其中,所述第二特征数据是基于针对候选视频的音频数据从所述候选视频中提取的;以及
第一确定模块,用于基于所述比较结果,从所述至少一个候选视频中确定与所述参考视频相匹配的目标视频,其中,所述目标视频的第二特征数据与所述第一特征数据相匹配。


14.根据权利要求13所述的装置,还包括:
第二确定模块,用于针对所述至少一个候选视频中的每个候选视频,从针对所述候选视频的音频数据中确定目标音频;
第三确定模块,用于从所述候选视频中确定与所述目标音频对应的第一视频片段;以及
第一提取模块,用于从所述第一视频片段中提取所述第二特征数据...

【专利技术属性】
技术研发人员:刘俊启
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1