本发明专利技术实施例公开了一种视频搜索方法及装置。一种视频搜索方法包括:接收用户输入的视频搜索请求,视频搜索请求中携带用户期望的视频台词文本;使用预设的分词规则对台词文本进行分词处理,获得至少一个分词单元;根据预设的倒排索引信息,判断所获得的所有分词单元是否出现在相同视频中的相同时间位置,如果是,则将所述视频确定为包含所述台词文本的视频;利用所确定的视频响应该视频搜索请求。本发明专利技术可以充分地利用视频的字幕信息,将用户期望搜索的视频的台词文本与视频的字幕信息中的字幕文本进行内容匹配,在台词文本与字幕文本内容完全相同的情况下,将该字幕文本所属的视频确定为用户期望搜索的视频,从而实现了基于台词文本的视频搜索。
【技术实现步骤摘要】
本专利技术涉及搜索
,特别涉及一种视频搜索方法及装置。
技术介绍
随着互联网技术的快速发展,互联网的业务不断增加,互联网中的数据类型也不 断增加,互联网中的数据类型除文字之外还包括视频。 现有技术中,视频搜索是基于视频标题、导演名称或简介中的描述文字来进行搜 索的。多数用户可以通过输入视频标题、导演名称或简介的方式搜索到相应的视频,但是有 时候用户只记得一段视频台词,此时,现有技术不能够基于输入的视频台词搜索到相应的 视频。
技术实现思路
为了解决上述问题,本专利技术实施例公开了一种视频搜索方法及装置,具体技术方 案如下: 本专利技术提供的一种视频搜索方法,所述方法包括: 接收用户输入的视频搜索请求,所述视频搜索请求中,携带用户期望的视频台词 文本; 使用预设的分词规则,对所述台词文本进行分词处理,获得至少一个分词单元; 根据预设的倒排索引信息,判断所获得的所有分词单元是否出现在相同视频中的 相同时间位置,如果是,则将所述视频确定为包含所述台词文本的视频; 利用所确定的视频响应所述视频搜索请求; 其中,所述倒排索引信息中包括至少一条索引数据,每条索引数据i对应一个分 词单元i,且每条索引数据i中,至少包括以下信息: 包含该分词单元i的视频的标识、该分词单元i在视频中所处的时间位置信息,i =1,2,......No 根据本专利技术提供的一种【具体实施方式】,所述所确定的视频包含:多个视频; 所述利用所确定的视频响应所述视频搜索请求,包括: 针对所确定的视频生成多条搜索结果,每条搜索结果对应一个视频; 根据所述预设的倒排索引信息,确定所述台词文本在所确定的各个视频中出现的 次数; 按照出现次数由高到低的顺序,对所生成的搜索结果进行显示。 根据本专利技术提供的一种【具体实施方式】,所述所确定的视频包含:多个视频; 所述利用所确定的视频响应所述视频搜索请求,包括: 针对所确定的视频生成多条搜索结果,每条搜索结果对应一个视频; 获取所确定的各个视频的用户点击量; 按照用户点击量由高到低的顺序,对所生成的搜索结果进行显示。 根据本专利技术提供的一种【具体实施方式】,所述每条搜索结果中,包括:所述台词文本 出现在该条搜索结果所对应的视频中的时间位置信息。 根据本专利技术提供的一种【具体实施方式】,所述利用所确定的视频响应所述视频搜索 请求,包括: 针对所确定的视频生成至少一条搜索结果,并显示;其中,每条搜索结果对应一个 视频,每条搜索结果中,包括用于触发该搜索结果所对应的视频播放的操作标识; 所述方法还包括: 在接收到用户针对操作标识的选择操作后,确定出用户选择播放的视频; 根据所述预设的倒排索引信息,得到所述台词文本在所述用户选择播放的视频中 出现的时间位置信息; 根据所得到的时间位置信息及预设的定位规则,定位所述用户选择播放的视频的 播放时间点,从所定位的时间点开始播放该视频。 本专利技术提供的一种视频搜索装置,所述装置包括: 请求接收模块,用于接收用户输入的视频搜索请求,所述视频搜索请求中,携带用 户期望的视频台词文本; 分词模块,用于使用预设的分词规则,对所述请求接收模块接收到的视频搜索请 求中携带的用户期望的视频台词文本进行分词处理,获得至少一个分词单元; 第一视频确定模块,用于根据预设的倒排索引信息,判断所述分词模块分词处理 获得的所有分词单元是否出现在相同视频中的相同时间位置,如果是,则将所述视频确定 为包含所述台词文本的视频; 请求响应模块,用于利用所述第一视频确定模块确定出的视频响应所述视频搜索 请求; 其中,所述倒排索引信息中包括至少一条索引数据,每条索引数据i对应一个分 词单元i,且每条索引数据i中,至少包括以下信息: 包含该分词单元i的视频的标识、该分词单元i在视频中所处的时间位置信息,i =1,2,......No 根据本专利技术提供的一种【具体实施方式】,所述第一视频确定模块确定出的视频包 含:多个视频;所述请求响应模块,具体用于: 针对所述第一视频确定模块确定出的视频生成多条搜索结果,每条搜索结果对应 一个视频; 根据所述预设的倒排索引信息,确定所述台词文本在所述第一视频确定模块确定 出的各个视频中出现的次数; 按照出现次数由高到低的顺序,对所生成的搜索结果进行显示。 根据本专利技术提供的一种【具体实施方式】,所述第一视频确定模块确定出的视频包 含:多个视频;所述请求响应模块,具体用于: 针对所述第一视频确定模块确定出的视频生成多条搜索结果,每条搜索结果对应 一个视频; 获取所述第一视频确定模块确定出的各个视频的用户点击量; 按照用户点击量由高到低的顺序,对所生成的搜索结果进行显示。 根据本专利技术提供的一种【具体实施方式】,所述每条搜索结果中,包括:所述台词文本 出现在该条搜索结果所对应的视频中的时间位置信息。 根据本专利技术提供的一种【具体实施方式】,所述请求响应模块,具体用于: 针对所述第一视频确定模块确定出的视频生成至少一条搜索结果,并显示;其中, 每条搜索结果对应一个视频,每条搜索结果中,包括用于触发该搜索结果所对应的视频播 放的操作标识; 所述装置还包括: 第二视频确定模块,用于在接收到用户针对操作标识的选择操作后,确定出用户 选择播放的视频; 时间位置信息获得模块,用于根据所述预设的倒排索引信息,得到所述台词文本 在所述第二视频确定模块确定出的用户选择播放的视频中出现的时间位置信息; 视频播放模块,用于根据所得到的时间位置信息及预设的定位规则,定位所述第 二视频确定模块确定出的用户选择播放的视频的播放时间点,从所定位的时间点开始播放 该视频。 应用上述技术方案,本专利技术提供的视频搜索方法及装置,在接收用户输入的、携带 有用户期望的视频台词文本的视频搜索请求后,可以使用预设的分词规则,对所述台词文 本进行分词处理,获得至少一个分词单元;根据预设的倒排索引信息,判断所获得的所有分 词单元是否出现在相同视频中的相同时间位置,如果是,则将所述视频确定为包含所述台 词文本的视频;利用所确定的视频响应所述视频搜索请求。 与现有技术相比,本专利技术可以充分地利用视频的字幕信息,将用户期望搜索的视 频的台词文本与视频的字幕信息中的字幕文本进行内容匹配,在台词文本与字幕文本内容 完全相同的情况下,将该字幕文本所属的视频确定为用户期望搜索的视频,从而实现了基 于台词文本的视频搜索。【附图说明】 为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他的附图。 图1为本专利技术实施例提供的一种视频搜索方法的流程图; 图2为本专利技术实施提供的图1中S104的一种实施方式流程图; 图3为本专利技术实施提供的图1中S104的另一种实施方式流程图; 图4为本专利技术实施例提供的另一种视频搜索方法的流程图; 图5为本专利技术实施例提供的一种视频搜索装置的结构示意图; 图6为本专利技术实施例提供的另一种视频搜索装置的结构示意图。【具体实施方式】 为了使本领域技术人员更好地理解本专利技术中的技术方案,下面将结合本专利技术实施 例中的附图,对本专利技术实施例中的技本文档来自技高网...
【技术保护点】
一种视频搜索方法,其特征在于,所述方法包括:接收用户输入的视频搜索请求,所述视频搜索请求中,携带用户期望的视频台词文本;使用预设的分词规则,对所述台词文本进行分词处理,获得至少一个分词单元;根据预设的倒排索引信息,判断所获得的所有分词单元是否出现在相同视频中的相同时间位置,如果是,则将所述视频确定为包含所述台词文本的视频;利用所确定的视频响应所述视频搜索请求;其中,所述倒排索引信息中包括至少一条索引数据,每条索引数据i对应一个分词单元i,且每条索引数据i中,至少包括以下信息:包含该分词单元i的视频的标识、该分词单元i在视频中所处的时间位置信息,i=1,2,……N。
【技术特征摘要】
【专利技术属性】
技术研发人员:帅伟良,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。