The invention provides a method for the depth mining of multimedia data, and the invention also relates to a storage medium and an electronic device. The retrieval method of distributed massive high dimensional video data based on the deep learning, and for the rapid mining of massive high-dimensional data, distributed load test data and the calculation of the deployment, and through the experimental data prove that the depth of distributed massive high dimensional video data retrieval framework based on effectiveness. The invention adopts the virtual node algorithm for distributed massive high dimensional video data retrieval load balancing optimization; for the load balancing problem of massive high-dimensional data distributed video retrieval, dynamic load balancing algorithm research of P2P network and the index structure of the data distribution features, design a dynamic scheduling algorithm based on virtual nodes to meet the needs of depth learn a lot of operation.
【技术实现步骤摘要】
多媒体数据深度挖掘方法、存储介质及电子设备
本专利技术涉及数据挖掘,尤其涉及一种多媒体数据深度挖掘方法、存储介质及电子设备。
技术介绍
(1)海量视频数据检索研究现状视频信息检索的研究与视频信息的富有程度息息相关,大致上可以分为两个阶段,即基于文本注记的视频检索和基于内容的视频检索(ContentBawdVideoRetrieval,简称CBVR)。在视频信息尚未极大丰富的第一阶段,视频检索系统利用与视频相关的文本信息采用基于文本检索方法实现。这些文本信息主要有两种:内容无关的元数据和对视频进行人工注记的关键词或自由文本。这种方法虽然简单,但随着视频数据爆炸式的增长,以下一些问题凸显,从而影响了对视频信息的有效使用。首先,一个小时的视频就包含约十万幅图像,人工注解需要大量劳动力,非常耗时,费用也很高。随着数据量的激增,对视频内容的所有属性进行标记存在很大困难,也不现实;其次,由于视频内容非常丰富,有限的关键词无法清楚的描述背景、人物、事件等信息;第三,视觉内容是客观的,但是语义内容却是主观的;不同的观察者或同一观察者在不同条件下对同一视频可能给出不同的描述,常会自相矛盾;第四,文字描述是一种特定的抽象,如果描述的标准改变,则注记也得重新制作才能适合新查询的要求。换句话说,特定的注记只适合于特定的查询要求;最后,由于文本注记一般描述的是整个视频的内容,而用户通常需要检索视频中的一个片段,因此传统的基于文本注记的检索方法无法快速找到所需片段,只能通过时序的视频浏览手段获得,因此非常繁琐、耗时。在意识到这些问题后,学者们开始研究基于视频内容如图像、声音等信息的检 ...
【技术保护点】
多媒体数据深度挖掘方法,其特征在于,包括:步骤1,获取多媒体视频数据库中的视频,利用各视频中相邻帧的色彩信息特征,将各视频分割为若干连续的子视频片段;步骤2,将所述的连续的子视频片段分配至独立的数据节点,并提取所述子视频片段的关键帧;步骤3,针对视频数据库中的视频,通过构建受限玻尔兹曼机模型,提取所述关键帧的视频特征;步骤4,将子视频片段、关键帧和视频特征作为输入,对AlexNet模型进行训练,得到多模态卷积神经网络;步骤5,针对待挖掘的视频,采用步骤1至步骤3的方法进行关键帧提取和视频特征提取,并将子视频片段,以及提取到的关键帧和视频特征作为输入,利用步骤4的多模态卷积神经网络进行相似性判断,得到挖掘结果。
【技术特征摘要】
1.多媒体数据深度挖掘方法,其特征在于,包括:步骤1,获取多媒体视频数据库中的视频,利用各视频中相邻帧的色彩信息特征,将各视频分割为若干连续的子视频片段;步骤2,将所述的连续的子视频片段分配至独立的数据节点,并提取所述子视频片段的关键帧;步骤3,针对视频数据库中的视频,通过构建受限玻尔兹曼机模型,提取所述关键帧的视频特征;步骤4,将子视频片段、关键帧和视频特征作为输入,对AlexNet模型进行训练,得到多模态卷积神经网络;步骤5,针对待挖掘的视频,采用步骤1至步骤3的方法进行关键帧提取和视频特征提取,并将子视频片段,以及提取到的关键帧和视频特征作为输入,利用步骤4的多模态卷积神经网络进行相似性判断,得到挖掘结果。2.如权利要求1所述的多媒体数据深度挖掘方法,其特征在于,步骤1的具体操作如下:步骤a,将视频的颜色空间转换为HIS颜色空间;步骤b,将视频中的任意一帧分割为若干大小相同的子区域;步骤c,计算每个子区域中,所有像素点的色调之和、亮度之和、以及饱和度之和;步骤d,计算每个子区域的色调平均值、亮度平均值、以及饱和度平均值;步骤e,计算每帧视频中,所有子区域的色调平均值、亮度平均值、以及饱和度平均值之和,记为CHSI;步骤f,计算相邻两帧的CHSI差值,若差值小于第一阈值,则将两帧划分至同一个子...
【专利技术属性】
技术研发人员:郭继舜,
申请(专利权)人:大圣科技股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。