本发明专利技术公开了一种基于LOF‑Co‑Forest算法的视频篡改检测方法,包括如下步骤:对视频数据库中的视频特征进行提取,并进行特征处理,将处理后的视频特征存放入视频特征数据库中;对查询视频中的视频特征进行提取,并进行特征的处理;将查询视频与视频特征数据库中的特征进行对比匹配,将是否匹配的标签信息重新划分,组成训练样本集;将训练样本集通过格式转换,形成算法代码能够处理的数据格式,输入到LOF‑Co‑Forest算法中,由算法进行样本集的划分,通过分类器对测试样本集的分类结果进行输出,从而判定视频是否被篡改。本发明专利技术检测方便快捷,有效的降低了分类器的错误率,有良好的实际应用价值。
【技术实现步骤摘要】
本专利技术涉及视频检测领域,具体涉及一种基于LOF-Co-Forest算法的视频篡改检 测方法。
技术介绍
随着三网融合工作的深入推进,电信网、互联网和广电网的交融性不断提高,社会 信息化水平迅速提升,但网络融合的平台会衍生出更严峻的信息安全问题,例如,不法分子 对媒体业务进行的恶意篡改,一些偏远地区的地方电视台通过游动字幕、叠加字幕等形式 在原有电视节目的基础上插播广告以获取商业利益。由于受众群体规模庞大,恶意操作会 带来恶劣的社会影响。因此,快速有效的检测出媒体业务的篡改和插播成为关系国家安全 的问题。
技术实现思路
为解决上述问题,本专利技术提供了一种基于LOF-C0-Forest算法的视频篡改检测方 法,检测方便快捷,有效的降低了分类器的错误率,有良好的实际应用价值。 为实现上述目的,本专利技术采取的技术方案为: ,包括如下步骤: S1、对视频数据库中的视频特征进行提取,,并进行特征处理,将处理后的视频特 征存放入视频特征数据库中; S2、对查询视频中的视频特征进行提取,并进行特征的处理; S3、将步骤S2得到的查询视频与步骤Sl所得的视频特征数据库中的特征进行对 比匹配,将是否匹配的标签信息重新划分,组成训练样本集; S4、将步骤S3所得的训练样本集通过格式转换,形成算法代码能够处理的数据格 式,输入到LOF-Co-Forest算法中,由算法进行样本集的划分,输入初始已标记样本开始对 未标记样本的相互标记来训练模型,分类器对测试样本集的分类结果进行输出,从而判定 视频是否被篡改。 其中,所述视频特征包括颜色,纹理,形状和动态特征。 其中,所述LOF-Co-Forest算法具体包括如下步骤: 步骤1 :定义已标记样本集L,未标记样本集U,用Hi表示除hi之外的所有分类器 的集合,用Li表示第i个分类器所对应的从未标记样本中获得的高置信度样本; 步骤2 :建立随机森林,包含N个随机树; 步骤3 :利用L训练进行N次训练,得出分类器hi; 步骤4 :Hi对未标记样本中的元素进行投票,从而进行判断该样本是否需要加入 到!^中; 步骤5 :用LOF算法对新标记的样本进行剪辑; 步骤6 :迭代,分类器比利用L U Li再次进行优化训练。 本专利技术具有以下有益效果: 检测方便快捷,有效的降低了分类器的错误率,有良好的实际应用价值。【附图说明】 图1为本专利技术实施例基于LOF-C0-Forest算法的视频篡改检测方法的流程图。【具体实施方式】 为了使本专利技术的目的及优点更加清楚明白,以下结合实施例对本专利技术进行进一步 详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本发 明。 如图1所示,本专利技术实施例提供了一种基于LOF-Co-Forest算法的视频篡改检测 方法,包括如下步骤: Sl、对视频数据库中的视频特征进行提取,并进行特征处理,将处理后的视频特征 存放入视频特征数据库中; S2、对查询视频中的视频特征进行提取,并进行特征的处理; S3、将步骤S2得到的查询视频与步骤Sl所得的视频特征数据库中的特征进行对 比匹配,将是否匹配的标签信息重新划分,组成训练样本集; S4、将步骤S3所得的训练样本集通过格式转换,形成算法代码能够处理的数据格 式,输入到LOF-Co-Forest算法中,由算法进行样本集的划分,输入初始已标记样本开始对 未标记样本的相互标记来训练模型,分类器对测试样本集的分类结果进行输出,从而判定 视频是否被篡改。 所述视频特征包括颜色,纹理,形状和动态特征。 LOF-Co-Forest算法是在Co-Forest算法基础上,用LOF算法剔除误标记的样本以 提高泛化性能,算法具体描述为: Stepl :定义已标记样本集L,未标记样本集U,Hi表示除h之外的所有分类器的 集合,Li表示第i个分类器所对应的从未标记样本中获得的高置信度样本。 St印2 :建立随机森林,包含N个随机树; St印3 :利用L训练进行N次训练,得出分类器hi; Step4 :Hi对未标记样本中的元素进行投票,从而进行判断该样本是否需要加入 到!^中; St印5 :用LOF算法对新标记的样本进行剪辑; St印6 :迭代,分类器h利用L U L i再次进行优化训练。 其中,Co-Forest算法是M. Li和Z. -H. Zhou对Tri-training的扩展。该算法采 用随机森林的集成以便更好地利用未标记样本的信息,从而可以容易获得标记样本分类的 置信度,形成最终的分类模型。Co-Forest算法有多个分类器,采用随机森林保证各分类器 之间的差异性。随机森林是一个包含多个决策树的分类器,它采用bagging方法产生不同 的训练集,并运用分类回归树作为原分类器。 设Co-Forest算法有η个分类器,每个分类器为1^,1^的协同分类集合定义为Hi, Hi包含了除比之外的所有分类器的集合,即Hi= Oiph2,通过Hi投 票决定要加入hi下次迭代训练过程中的新标记样本。Co-Forest算法比Tri-training算 法能够更好地发挥集成学习的作用。 在确定第t次迭代的噪声率时,引入样本权值Wi, t,从而有:【主权项】1. ,其特征在于,包括如下步骤: 51、 对视频数据库中的视频特征进行提取,,并进行特征处理,将处理后的视频特征存 放入视频特征数据库中; 52、 对查询视频中的视频特征进行提取,并进行特征的处理; 53、 将步骤S2得到的查询视频与步骤Sl所得的视频特征数据库中的特征进行对比匹 配,将是否匹配的标签信息重新划分,组成训练样本集; 54、 将步骤S3所得的训练样本集通过格式转换,形成算法代码能够处理的数据格式, 输入到LOF-Co-Forest算法中,由算法进行样本集的划分,输入初始已标记样本开始对未 标记样本的相互标记来训练模型,分类器对测试样本集的分类结果进行输出,从而判定视 频是否被篡改。2. 根据权利要求1所述的,其特征在于, 所述视频特征包括颜色,纹理,形状和动态特征。3. 根据权利要求1所述的,其特征在于, 所述LOF-Co-Forest算法具体包括如下步骤: 步骤1 :定义已标记样本集L,未标记样本集U,用Hi表示除匕之外的所有分类器的集 合,用Li表示第i个分类器所对应的从未标记样本中获得的高置信度样本; 步骤2 :建立随机森林,包含N个随机树; 步骤3 :利用L训练进行N次训练,得出分类器hi; 步骤4 :Hi对未标记样本中的元素进行投票,从而进行判断该样本是否需要加入到Li 中; 步骤5 :用LOF算法对新标记的样本进行剪辑; 步骤6 :迭代,分类器h利用LULi再次进行优化训练。【专利摘要】本专利技术公开了一种,包括如下步骤:对视频数据库中的视频特征进行提取,并进行特征处理,将处理后的视频特征存放入视频特征数据库中;对查询视频中的视频特征进行提取,并进行特征的处理;将查询视频与视频特征数据库中的特征进行对比匹配,将是否匹配的标签信息重新划分,组成训练样本集;将训练样本集通过格式转换,形成算法代码能够处理的数据格式,输入到LOF-Co-Forest算法中,由算法进行样本集的划分,通过分类器对测试样本集的分类结果进行输出,从而判定视频是否被本文档来自技高网...
【技术保护点】
基于LOF‑Co‑Forest算法的视频篡改检测方法,其特征在于,包括如下步骤:S1、对视频数据库中的视频特征进行提取,,并进行特征处理,将处理后的视频特征存放入视频特征数据库中;S2、对查询视频中的视频特征进行提取,并进行特征的处理;S3、将步骤S2得到的查询视频与步骤S1所得的视频特征数据库中的特征进行对比匹配,将是否匹配的标签信息重新划分,组成训练样本集;S4、将步骤S3所得的训练样本集通过格式转换,形成算法代码能够处理的数据格式,输入到LOF‑Co‑Forest算法中,由算法进行样本集的划分,输入初始已标记样本开始对未标记样本的相互标记来训练模型,分类器对测试样本集的分类结果进行输出,从而判定视频是否被篡改。
【技术特征摘要】
【专利技术属性】
技术研发人员:陈雪艳,吴晓强,乌兰,时黛,
申请(专利权)人:内蒙古民族大学,
类型:发明
国别省市:内蒙古;15
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。