System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于AI智慧视频分析方法及系统技术方案_技高网

一种基于AI智慧视频分析方法及系统技术方案

技术编号:43730279 阅读:3 留言:0更新日期:2024-12-20 12:55
本发明专利技术涉及视频分析技术领域,具体公开了一种基于AI智慧视频分析方法及系统,所述方法包括对所述待识别视频进行切分,得到基于同一时间轴的音频信息和图像序列;对所述音频信息进行识别,对图像序列进行初次分组,对初次分组后的每一组图像进行组内比对,根据比对结果进行二次分组,得到最终的图像组;所述图像组是图像的集合,图像组中含有基于时间轴生成的时间标签;在每个图像组中抽取至少一张图像,对该图像进行识别,生成评价文本。本发明专利技术在视频文件中抽取部分图像,借助基于AI的固定识别方案和基于本地模型的动态识别方案对图像进行分析,可以极快地将视频转换为文本,便于用户快速了解视频内容。

【技术实现步骤摘要】

本专利技术涉及视频分析,具体是一种基于ai智慧视频分析方法及系统。


技术介绍

1、视频(video)泛指将一系列静态影像以电信号的方式加以捕捉、记录、处理、储存、传送与重现的各种技术。连续的图像变化每秒超过24帧(frame)画面以上时,根据视觉暂留原理,人眼无法辨别单幅的静态画面;看上去是平滑连续的视觉效果,这样连续的画面被称为视频。

2、现有的已普及的计算机设备的性能很高,这使得视频逐渐成为了主流媒体数据,但量,由于视频内容很大,阅读者很难提前初步了解视频内容,只能通过简介,对于一些没有简介或简介很简短的视频,阅读者只能自行查阅,在需要进行视频筛选的场合,筛选过程很困难,如果能够提供一种视频内容分析方案,使得阅读者能够提前了解视频内容,那么可以极大地简化筛选难度,提高筛选效率。


技术实现思路

1、本专利技术的目的在于提供一种基于ai智慧视频分析方法及系统,以解决上述
技术介绍
中提出的问题。

2、为实现上述目的,本专利技术提供如下技术方案:

3、一种基于ai智慧视频分析方法,所述方法包括:

4、开放视频接收端口,接收待识别视频;

5、对所述待识别视频进行切分,得到基于同一时间轴的音频信息和图像序列;

6、对所述音频信息进行识别,对图像序列进行初次分组,对初次分组后的每一组图像进行组内比对,根据比对结果进行二次分组,得到最终的图像组;所述图像组是图像的集合,图像组中含有基于时间轴生成的时间标签;

7、在每个图像组中抽取至少一张图像,对该图像进行识别,生成评价文本;

8、其中,对图像进行识别的过程包括固定识别方案和动态识别方案,所述动态识别方案是基于神经网络模型的识别方案。

9、作为本专利技术进一步的方案:所述对所述待识别视频进行切分,得到基于同一时间轴的音频信息和图像序列的步骤包括:

10、获取待识别视频的时间跨度,创建时间轴;

11、基于时间轴在待识别视频的音频轨道上提取音频信息;

12、获取视频的帧率,基于帧率在时间轴上选取图像点,在待识别视频的图像轨道上读取图像,建立与图像点的对应关系;

13、基于图像点的排序顺序统计对应的图像,得到图像序列。

14、作为本专利技术进一步的方案:所述对所述音频信息进行识别,对图像序列进行初次分组,对初次分组后的每一组图像进行组内比对,根据比对结果进行二次分组,得到最终的图像组的步骤包括:

15、根据时间顺序读取音频信息的幅值,基于所述幅值对音频信息进行分段;

16、读取每一段音频信息对应的所有图像,保留图像顺序,得到初次分组结果;

17、在初次分组后的每一组图像中依次图像,将图像与相邻的预设数量的图像进行比对,确定图像的普遍度;

18、根据所述普遍度对同一组图像进行二次分组,得到最终的图像组。

19、作为本专利技术进一步的方案:对音频信息进行分段的过程为:

20、根据时间顺序读取音频幅值,根据音频幅值生成分段点;

21、;表示第个分段点,表示的前一个分段点,表示时间差,,表示时长范围内的幅值标准差,为预设的阈值;表示符合条件的取值的最大值;

22、图像的普遍度的确定过程为:

23、;表示图像的普遍度,表示预设的图像选取半径,其值为正值;表示在图像选取半径范围内的第个图像与当前图像的相似度,相似度的取值为零到一;为预设的调节常数。

24、作为本专利技术进一步的方案:所述在每个图像组中抽取至少一张图像,对该图像进行识别,生成评价文本的步骤包括:

25、对于每个图像组,读取每张图像的普遍度,根据所述普遍度抽取至少一张图像;

26、对抽取到的图像进行主体识别,得到主体词组;

27、根据图像序列的图像顺序排列每张图像的主体词组,基于统计语言模型将主体词组转换为语句;

28、统计所有语句,得到评价文本。

29、作为本专利技术进一步的方案:所述在每个图像组中抽取至少一张图像,对该图像进行识别,生成评价文本的步骤还包括:

30、预先构建图像至描述语句的样本集,基于所述样本集训练神经网络模型;

31、在图像进行识别时,将图像及其对应的语句作为新的样本,更新样本集;

32、根据新的样本实时判断神经网络模型的误差率,根据所述误差率调节固定识别方案的应用频率;

33、定时将新的样本向验证端发送,接收验证端反馈的样本修正指令。

34、本专利技术技术方案还提供了一种基于ai智慧视频分析系统,所述系统包括:

35、视频接收模块,用于开放视频接收端口,接收待识别视频;

36、成分提取模块,用于对所述待识别视频进行切分,得到基于同一时间轴的音频信息和图像序列;

37、视频分组模块,用于对所述音频信息进行识别,对图像序列进行初次分组,对初次分组后的每一组图像进行组内比对,根据比对结果进行二次分组,得到最终的图像组;所述图像组是图像的集合,图像组中含有基于时间轴生成的时间标签;

38、图像识别模块,用于在每个图像组中抽取至少一张图像,对该图像进行识别,生成评价文本;

39、其中,对图像进行识别的过程包括固定识别方案和动态识别方案,所述动态识别方案是基于神经网络模型的识别方案。

40、作为本专利技术进一步的方案:所述成分提取模块包括:

41、时间轴创建单元,用于获取待识别视频的时间跨度,创建时间轴;

42、音频信息提取单元,用于基于时间轴在待识别视频的音频轨道上提取音频信息;

43、图像插入单元,用于获取视频的帧率,基于帧率在时间轴上选取图像点,在待识别视频的图像轨道上读取图像,建立与图像点的对应关系;

44、图像排列单元,用于基于图像点的排序顺序统计对应的图像,得到图像序列。

45、作为本专利技术进一步的方案:所述视频分组模块包括:

46、音频信息分析单元,用于根据时间顺序读取音频信息的幅值,基于所述幅值对音频信息进行分段;

47、图像读取单元,用于读取每一段音频信息对应的所有图像,保留图像顺序,得到初次分组结果;

48、普遍度计算单元,用于在初次分组后的每一组图像中依次图像,将图像与相邻的预设数量的图像进行比对,确定图像的普遍度;

49、二次分组单元,用于根据所述普遍度对同一组图像进行二次分组,得到最终的图像组。

50、作为本专利技术进一步的方案:所述图像识别模块包括:

51、抽取执行单元,用于对于每个图像组,读取每张图像的普遍度,根据所述普遍度抽取至少一张图像;

52、主体识别单元,用于对抽取到的图像进行主体识别,得到主体词组;

53、语句生成单元,用于根据图像序列的图像顺序排列每张图像的主体词组,基于统计语言模型将主体词组转换本文档来自技高网...

【技术保护点】

1.一种基于AI智慧视频分析方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于AI智慧视频分析方法,其特征在于,所述对所述待识别视频进行切分,得到基于同一时间轴的音频信息和图像序列的步骤包括:

3.根据权利要求1所述的基于AI智慧视频分析方法,其特征在于,所述对所述音频信息进行识别,对图像序列进行初次分组,对初次分组后的每一组图像进行组内比对,根据比对结果进行二次分组,得到最终的图像组的步骤包括:

4.根据权利要求3所述的基于AI智慧视频分析方法,其特征在于,对音频信息进行分段的过程为:

5.根据权利要求3所述的基于AI智慧视频分析方法,其特征在于,所述在每个图像组中抽取至少一张图像,对该图像进行识别,生成评价文本的步骤包括:

6.根据权利要求1所述的基于AI智慧视频分析方法,其特征在于,所述在每个图像组中抽取至少一张图像,对该图像进行识别,生成评价文本的步骤还包括:

7.一种基于AI智慧视频分析系统,其特征在于,所述系统包括:

8.根据权利要求7所述的基于AI智慧视频分析系统,其特征在于,所述成分提取模块包括:

9.根据权利要求8所述的基于AI智慧视频分析系统,其特征在于,所述视频分组模块包括:

10.根据权利要求8所述的基于AI智慧视频分析系统,其特征在于,所述图像识别模块包括:

...

【技术特征摘要】

1.一种基于ai智慧视频分析方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于ai智慧视频分析方法,其特征在于,所述对所述待识别视频进行切分,得到基于同一时间轴的音频信息和图像序列的步骤包括:

3.根据权利要求1所述的基于ai智慧视频分析方法,其特征在于,所述对所述音频信息进行识别,对图像序列进行初次分组,对初次分组后的每一组图像进行组内比对,根据比对结果进行二次分组,得到最终的图像组的步骤包括:

4.根据权利要求3所述的基于ai智慧视频分析方法,其特征在于,对音频信息进行分段的过程为:

5.根据权利要求3所述的基于ai智慧视频分析方法,其特征...

【专利技术属性】
技术研发人员:宁汝明周良臣王文伟王悦
申请(专利权)人:山东恒迈信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1