用于内容发现的人工智能制造技术

技术编号:30885759 阅读:32 留言:0更新日期:2021-11-22 20:31
本公开涉及视频内容发现设备、系统、方法和计算机程序。在本公开的一个方面中提供了一种视频内容发现模块,其被配置为接收内容查询,从一个或多个信息源中检索与该内容查询有关的文本,至少部分地使用自然语言处理来处理检索到的文本,以将该内容查询转换为包括一个或多个视频内容描述符的集合,并使用一个或多个视频内容描述符来识别多个可用视频片段中的一个或多个视频片段。的一个或多个视频片段。的一个或多个视频片段。

【技术实现步骤摘要】
用于内容发现的人工智能


[0001]本公开涉及一种系统、方法、软件和设备,用于处理内容查询以检索相关的视频和视频剪辑,并且用于训练其系统和设备以实现改进的内容发现。

技术介绍

[0002]随着越来越大的视频库的出现,相关视频和视频剪辑的识别变得越来越困难和耗时。当前,基于内容描述符对库中的视频进行索引,可以对其进行搜索以识别相关结果。但是,大型数据库的迭代搜索非常耗时,并且通常会返回大量包含不相关内容的视频。
[0003]因此,需要一种识别视频库中保存的相关视频的改进方法。

技术实现思路

[0004]在本公开的第一方面,提供一种系统,包括:视频内容发现模块,其被配置为:接收内容查询;从一个或多个信息源中检索与内容查询的至少一部分有关的一段文本;使用自然语言处理来处理文本的传递,以将内容查询转换为包括与该内容查询有关的一个或多个视频内容描述符的集合;并使用一个或多个视频内容描述符来识别多个可用视频片段中的一个或多个视频片段,其中,所识别的一个或多个视频片段与一个或多个视频内容描述符中的至少一个相关联(例如,通过搜索包括多个可用视频片段的数据库来找到一个或多个视频片段,以找到在数据库中与一个或多个视频内容描述符中的至少一个相关联的视频片段)。
[0005]一个或多个视频内容描述符中的每一个可以是被自然语言处理识别为在所检索的文本中的内容查询的预定距离之内的词。
[0006]检索与内容查询有关的文本的步骤可以进一步包括:处理内容查询以识别与内容查询有关的一个或多个搜索项;以及从一个或多个信息源检索文本,该文本包括一个或多个已识别的搜索项中的至少一个。在这种情况下,一个或多个视频内容描述符中的每一个可以是由自然语言处理识别为在内容查询的预定距离之内的词或检索到的文本中的搜索项之一。
[0007]内容查询可以包括图像,并且其中系统可以进一步被配置为从接收到的图像中提取图像元数据和/或图像描述符。在内容查询被处理以识别一个或多个搜索项的实施方式中,内容查询以识别一个或多个搜索项的处理可以包括从接收到的图像中提取图像元数据和/或图像描述符。
[0008]所检索的信息可以包括所提取的图像元数据和/或图像描述符,并且其中,通过在所检索的信息上使用NLP来识别视频内容描述符,以变换所提取的图像元数据和/或图像描述符的至少一部分。
[0009]一个或多个信息源可以包括因特网,并且其中可选地,基于所识别的搜索项,通过网络数据抽取(Web Scraping)从因特网检索相关信息。附加地或可替代地,一个或多个信息源可以包括本地数据库,其中相关信息是基于所识别的搜索项从本地数据库中检索的。
[0010]视频内容描述符可以包括以下中的一个或多个:对象描述符;对象生存期描述符;面部描述符;上下文描述符;语义描述符;类别描述符;情绪描述符;语言环境描述符;人口统计描述符;动作描述符;每日时间描述符;年度季度描述词;和天气描述符。
[0011]一个或多个视频内容描述符中的每一个可以与相关性得分相关联,该相关性得分指示与内容查询有关的相关性。另外,可以基于视频内容描述符的相关性得分对所识别的视频片段进行排名。
[0012]该系统可以进一步包括内容数据库,该内容数据库包括可用视频片段库,其中可用视频片段库中的每个视频片段与一个或多个视频内容描述符相关联。
[0013]视频内容发现模块可以通过将至少一个识别的视频内容描述符与与可用视频片段库中的视频片段相关联的视频内容描述符进行匹配,来识别多个可用视频片段中的一个或多个视频片段。
[0014]该系统还可以包括映射数据库,该映射数据库包括将每个可用视频片段链接到一个或多个视频内容描述符的映射表。可选地,映射表可以包括神经网络,该神经网络定义了每个可用视频片段和多个视频内容描述符之间的链接。另外,视频内容发现模块可通过用至少一个识别出的视频内容描述符查询映射表来识别多个可用视频片段中的一个或多个视频片段。
[0015]内容发现模块还可以被配置为:识别或获得用于一个或多个识别出的视频片段中的每一个的代表图像;以及并输出一个或多个已识别视频片段中每个视频片段的代表图像。该代表性图像可以至少部分地基于与内容查询的相关性来选择。
[0016]可选地,内容发现模块还可以被配置为:基于相关性得分对一个或多个识别出的视频片段进行排名,该相关性得分指示每个识别出的视频片段与内容查询的相似度;并按照其各自视频片段的排名顺序输出代表图像。
[0017]该系统还可以包括映射模块,该映射模块被配置为:接收视频片段;运行第一过程以识别与接收到的视频片段有关的一个或多个视频片段描述符;至少部分地使用人工智能基于视频片段描述符运行第二过程以创建映射表,其中该映射表将接收到的视频片段链接到一个或多个视频内容描述符,其中一个或多个视频内容描述符从可搜索视频内容描述符的列表中选择。
[0018]该第一过程可以包括以下中的一个或多个:对象检测算法;面部检测算法;情绪检测算法;上下文检测算法;语义检测算法;类别检测算法;情绪检测算法;语言环境检测算法;人口统计检测算法;动作检测算法;每日时间检测算法;年度季度检测算法;以及天气检测算法。
[0019]第二过程可以包括自然语言处理算法。
[0020]内容查询可以包括一个或多个否定关联,其中一个或多个否定关联限制对多个可用视频片段中与一个或多个否定关联相关的任何视频片段的识别。
[0021]所检索的与内容查询有关的信息可以包括先前为相同或相似的内容查询确定的相关视频内容描述符的记录,并且处理所检索的信息还可以包括从所检索的记录中提取一个或多个视频内容描述符。
[0022]在本公开的第二方面,提供了一种系统,该系统包括映射模块,该映射模块被配置为:接收视频片段;运行第一过程以识别与接收到的视频片段有关的一个或多个视频片段
描述符;并且至少部分地使用人工智能基于视频片段描述符运行第二过程以创建映射表,其中该映射表将接收到的视频片段链接到一个或多个视频内容描述符,其中一个或
[0023]多个视频内容描述符从可搜索视频内容描述符的列表中选择。
[0024]在本公开的第三方面,提供了一种搜索视频内容的方法,该方法包括:接收内容查询;基于所述内容查询,从一个或多个信息源中检索与所述内容查询有关的信息;至少部分地使用人工智能处理检索到的信息,以识别与内容查询有关的一个或多个视频内容描述符;使用一个或多个视频内容描述符,识别多个可用视频片段中的一个或多个视频片段。
[0025]在本公开的第四方面,提供了一种计算机程序,当该计算机程序在电子设备的处理器上执行时,执行第三方面的方法。
[0026]在本公开的第五方面,提供了一种电子设备,其包括:用于存储第四方面的计算机程序的存储器;以及用于执行第四方面的计算机程序的处理器。
[0027]在本公开的第六方面,提供了一种计算机可读介质,其包括指令,当该指令由一个或多个硬件处理器执行时,执行第三方面的方法本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种系统,包括:视频内容发现模块,所述视频内容发现模块被配置为:接收内容查询;从一个或多个信息源检索与所述内容查询有关的文本;至少部分地使用自然语言处理来处理检索到的文本,以将所述内容查询转换为包括一个或多个视频内容描述符的集合;和使用所述一个或多个视频内容描述符来识别多个可用视频片段中的一个或多个视频片段。2.根据权利要求1所述的系统,其中,所述一个或多个视频内容描述符中的每一个是通过自然语言处理识别为在所述检索到的文本中的所述内容查询的预定距离之内的词。3.根据权利要求1所述的系统,其中,检索与所述内容查询有关的文本进一步包括:处理所述内容查询以识别与所述内容查询有关的一个或多个搜索项;和从一个或多个信息源检索文本,所述文本包括一个或多个所识别的搜索项中的至少一个。4.根据权利要求3所述的系统,其中,所述一个或多个视频内容描述符中的每一个是通过自然语言处理识别为在所述检索到的文本中的所述内容查询或搜索项之一的预定距离之内的词。5.根据权利要求1所述的系统,其中,所述内容查询包括图像,并且其中,所述系统进一步被配置为从所接收的图像中提取图像元数据和/或图像描述符。6.根据权利要求1所述的系统,其中,所述一个或多个信息源包括互联网,其中,基于所识别的搜索项,通过网络数据抓取从互联网检索相关信息。7.根据权利要求1所述的系统,其中,所述视频内容描述符包括以下中的一个或多个:对象描述符;对象生存期描述符;面部描述符;上下文描述符语义描述符类别描述符情绪描述符语言环境描述符人口统计描述符动作描述符;每日时间描述符;年度季节描述符;和天气描述符。8.根据权利要求1所述的系统,其中,所述一个或多个视频内容描述符中的每个与相关性得分相关联,所述相关性得分指示与所述内容查询有关的相关性。9.根据权利要求1所述的系统,进一步包括:内容数据库,所述内容数据库包括可用视频片段库,其中所述可用视频片段库中的每
个视频片段都与一个或多个视频内容描述符相关联。10.根据权利要求9所述的系统,其中,所述视频内容发现模块,通过将至少一个所识别的视频内容描述符与与所述可用视频片段中的视频片段相关联的视频内容描述符进行匹配,来识别所述多个可用视频片段中的所述一个或多个视频片段。11.根据权利要求1所述的系统,进一步包括:映射数据库,所述映射数据库包括将每个可用视频片段链接到一个或多个视频内容描述符的映射表。12.根据权利要求11所述的系统,其中,所述映射表包括神经网络,所述神经网络定...

【专利技术属性】
技术研发人员:菲利普
申请(专利权)人:米利雅得广告公开股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1