一种视频搜索方法及装置制造方法及图纸

技术编号：11661545 阅读：73 留言：0更新日期：2015-06-29 15:48

本发明专利技术实施例公开了一种视频搜索方法及装置。一种视频搜索方法包括：接收用户输入的视频搜索请求，视频搜索请求中携带用户期望的视频台词文本；使用预设的分词规则对台词文本进行分词处理，获得至少一个分词单元；根据预设的倒排索引信息，判断所获得的所有分词单元是否出现在相同视频中的相同时间位置，如果是，则将所述视频确定为包含所述台词文本的视频；利用所确定的视频响应该视频搜索请求。本发明专利技术可以充分地利用视频的字幕信息，将用户期望搜索的视频的台词文本与视频的字幕信息中的字幕文本进行内容匹配，在台词文本与字幕文本内容完全相同的情况下，将该字幕文本所属的视频确定为用户期望搜索的视频，从而实现了基于台词文本的视频搜索。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及搜索
，特别涉及一种视频搜索方法及装置。
技术介绍
随着互联网技术的快速发展，互联网的业务不断增加，互联网中的数据类型也不断增加，互联网中的数据类型除文字之外还包括视频。现有技术中，视频搜索是基于视频标题、导演名称或简介中的描述文字来进行搜索的。多数用户可以通过输入视频标题、导演名称或简介的方式搜索到相应的视频，但是有时候用户只记得一段视频台词，此时，现有技术不能够基于输入的视频台词搜索到相应的视频。
技术实现思路
为了解决上述问题，本专利技术实施例公开了一种视频搜索方法及装置，具体技术方案如下：本专利技术提供的一种视频搜索方法，所述方法包括：接收用户输入的视频搜索请求，所述视频搜索请求中，携带用户期望的视频台词文本；使用预设的分词规则，对所述台词文本进行分词处理，获得至少一个分词单元；根据预设的倒排索引信息，判断所获得的所有分词单元是否出现在相同视频中的相同时间位置，如果是，则将所述视频确定为包含所述台词文本的视频；利用所确定的视频响应所述视频搜索请求；其中，所述倒排索引信息中包括至少一条索引数据，每条索引数据i对应一个分词单元i，且每条索引数据i中，至少包括以下信息：包含该分词单元i的视频的标识、该分词单元i在视频中所处的时间位置信息，i =1，2,......No 根据本专利技术提供的一种【具体实施方式】，所述所确定的视频包含：多个视频；所述利用所确定的视频响应所述视频搜索请求，包括：针对所确定的视频生成多条搜索结果，每条搜索结果对应一个视频；根据所述预设的倒排索引信息，确定所...

【技术保护点】
一种视频搜索方法，其特征在于，所述方法包括：接收用户输入的视频搜索请求，所述视频搜索请求中，携带用户期望的视频台词文本；使用预设的分词规则，对所述台词文本进行分词处理，获得至少一个分词单元；根据预设的倒排索引信息，判断所获得的所有分词单元是否出现在相同视频中的相同时间位置，如果是，则将所述视频确定为包含所述台词文本的视频；利用所确定的视频响应所述视频搜索请求；其中，所述倒排索引信息中包括至少一条索引数据，每条索引数据i对应一个分词单元i，且每条索引数据i中，至少包括以下信息：包含该分词单元i的视频的标识、该分词单元i在视频中所处的时间位置信息，i＝1,2,……N。

【技术特征摘要】

【专利技术属性】
技术研发人员：帅伟良，
申请(专利权)人：北京奇艺世纪科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人