训练优化的基于卷积神经网络的色情图像或视频检测方法技术

技术编号:10718979 阅读:313 留言:0更新日期:2014-12-03 20:13
本发明专利技术涉及一种训练优化的基于卷积神经网络的色情图像或视频检测方法,经过循环训练,得到最终的检测模型,能够最大程序地提高分类检测准确率,克服因环境光线的多样化、人种的多样性等使得很难建立完善的肤色模型及检测的准确率,以及人体姿态多样性、遮挡等外界因素使得检测的准确率一直不高等不足。本发明专利技术所述的方法用于图像数据或视频数据时,进行对图片的检测,或者对视频图像序列的检测,只要分类结果为色情,即可定义该图像集合或视频为色情数据,克服对于不同的色情视频难以建立比较通用的规则的不足。

【技术实现步骤摘要】
【专利摘要】本专利技术涉及一种,经过循环训练,得到最终的检测模型,能够最大程序地提高分类检测准确率,克服因环境光线的多样化、人种的多样性等使得很难建立完善的肤色模型及检测的准确率,以及人体姿态多样性、遮挡等外界因素使得检测的准确率一直不高等不足。本专利技术所述的方法用于图像数据或视频数据时,进行对图片的检测,或者对视频图像序列的检测,只要分类结果为色情,即可定义该图像集合或视频为色情数据,克服对于不同的色情视频难以建立比较通用的规则的不足。【专利说明】
本专利技术涉及一种色情图像检测方法,更具体地说,涉及一种。
技术介绍
随着互联网的广泛应用,用户在获取大量有用信息的同时也会遇到不良信息,尤其以色情图像和色情视频最严重。现有的色情图像或色情视频检测的方法主要是利用肤色进行识别,但是在实际应用中,现有的检测方法存在以下限制检测准确率的因素: I)环境光线的多样化、人种的多样性等使得很难建立完善的肤色模型及检测的准确率; 2)人体姿态多样性、遮挡等外界因素使得检测的准确率一直不高; 3)对于不同的色情视频难以建立比较通用的规则。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种不仅可以适应各种环境和姿态以及遮挡等外界因素的影响,而且能够建立比较通用的检测规则,提高检测的准确率的。 本专利技术的技术方案如下: 一种,预设图像数据或视频数据;并且利用已进行卷积神经网络训练得到的初步检测模型进行第一次分类检测;如果第一次分类检测结果存在错误的样本,对错误的样本,利用卷积神经网络进行第二次训练,得到第一次过渡检测模型;并利用第一次过渡检测模型进行第二次分类检测,如果第二次分类检测结果存在错误的样本,对错误的样本,利用卷积神经网络进行第三次训练,得到第二次过渡检测模型,循环以上步骤,直至检测结果中错误的样本少于预设的阀值或者不存在,得到最终检测模型;利用最终检测模型对待测的图像数据或视频数据进行分类检测。 作为优选,预设图像数据或视频数据包括预分类的色情数据和正常数据,将这两类数据作为两个场景,作为输入数据提供给卷积神经网络进行学习分类,得到判断图像数据或视频数据是否为色情和正常的检测模型。 作为优选,训练优化的过程为:将得到的过渡检测模型对预设的图像数据或视频数据进行分类测试,将分类检测结果与预分类的结果不同的图像数据或视频数据定为分类错误的样本。 作为优选,分类错误的样本具体为:将分类检测结果获取的环境分类标签与预分类的环境分类标签不一致的样本图像数据或视频数据进行收集,重新进行分类。 作为优选,卷积神经网络的网络结构的顺序为:输入层、若干小组层、全连接层、概率统计层。 作为优选,进一步地,小组层依次包括卷积层、激活层。 作为优选,卷积层中,核的大小必须是奇数,且不大于该层输入的宽或者高;中间表示通过卷积层时不改变宽和高,通道数不限制是否改变;激活层中,激活层不改变卷积层表示的宽、高、通道数;激活层设置在卷积层或者全连接层之后;通过全连接层后的中间表示为I维,而且经过全连接层后,无法再经过小组层进行处理;概率统计层将全连接层产生的实值变成之间的概率。 作为优选,概率统计层输出每一种标签的概率,并选择概率最大的标签作为当前图像的类型。 作为优选,进一步地,激活层后设置下采样层与归一化层的一层或两层。 作为优选,下采样层不改变中间表示的通道数,而且下采样层对图像的缩小比为核的大小;归一化层不改变中间表示的任何尺寸。 本专利技术的有益效果如下: 本专利技术所述的方法,经过循环训练,得到最终的检测模型,能够最大程序地提高分类检测准确率,克服因环境光线的多样化、人种的多样性等使得很难建立完善的肤色模型及检测的准确率,以及人体姿态多样性、遮挡等外界因素使得检测的准确率一直不高等不足。 本专利技术所述的方法用于图像数据或视频数据时,进行对图片的检测,或者对视频图像序列的检测,只要分类结果为色情,即可定义该图像集合或视频为色情数据,克服对于不同的色情视频难以建立比较通用的规则的不足。 【具体实施方式】 以下结合实施例对本专利技术进行进一步的详细说明。 本专利技术提供一种,预设图像数据或视频数据;并且利用已进行卷积神经网络训练得到的初步检测模型进行第一次分类检测;如果第一次分类检测结果存在错误的样本,对错误的样本,利用卷积神经网络进行第二次训练,得到第一次过渡检测模型;并利用第一次过渡检测模型进行第二次分类检测,如果第二次分类检测结果存在错误的样本,对错误的样本,利用卷积神经网络进行第三次训练,得到第二次过渡检测模型,循环以上步骤,直至检测结果中错误的样本少于预设的阀值或者不存在,即错误率达到可接受范围或不再变化,得到最终检测模型;利用最终检测模型对待测的图像数据或视频数据进行分类检测。 检测模型主要分为两类:色情数据和正常数据。预设图像数据或视频数据包括预分类的色情数据和正常数据,可由人工进行分类筛选。将这两类数据作为两个场景,作为输入数据提供给卷积神经网络进行学习分类,得到判断图像数据或视频数据是否为色情和正常的检测模型。 训练优化的过程为:将得到的过渡检测模型对预设的图像数据或视频数据进行分类测试,将分类检测结果与预分类的结果不同的图像数据或视频数据定为分类错误的样本,具体为:将分类检测结果获取的环境分类标签与预分类的环境分类标签不一致的样本图像数据或视频数据进行收集,重新进行分类,即调整网络结构。而优化的过程即为将重新分类后的样本图像再次进行训练学习,如此重复“训练——调整网络结构——测试——在训练”的过程直到分类检测结果的错误率在可接受范围内。 卷积神经网络的网络是多层的,本专利技术中,网络结构的顺序为:输入层、若干小组层(至少一组小组层)、全连接层、概率统计层。小组层依次包括卷积层、激活层。根据实施需要,进一步地,激活层后设置下采样层与归一化层的一层或两层。卷积层、激活层、下采样层、归一化层中每个层的核大小以及输出大小都是可以进行任意调节的,并且每个层都有一个输入且产生一个输出,每一层的输出作为下一层的输入。 本实施例中,输入层的输入大小为Height x Weight x Channel,其中Weight、Height为输入层图像的宽和高,Channel为输入层图像的通道数;由于本专利技术使用GPU硬件实现的原因,Weight = Height ;如果是输入数据为图像,则Channel取值只能为I或者3。如果是视频数据,则Channel数为图像的通道数与总输入帧数的乘积。 卷积层: I)核的大小必须是奇数,且不大于该层输入的宽或者高; 2)中间表示通过卷积层时不改变宽和高,通道数可变可不变;理论上可以为任意正整数,由于本专利技术使用GPU硬件实现的原因,这里为16的倍数。 激活层: I)激活层不改变卷积层表示的宽、高或者通道数; 2)激活层所使用的激活函数包括但不限于以下函数类型: f (x) = l/(l+e,; f (X) = a*tanh (b*x), a, b 为任意非零实数; f (X) = max (O, x); f (X) = min (a, max (0, x)); f (X) = log (l+ex); f (X) =本文档来自技高网...

【技术保护点】
一种训练优化的基于卷积神经网络的色情图像或视频检测方法,其特征在于,预设图像数据或视频数据;并且利用已进行卷积神经网络训练得到的初步检测模型进行第一次分类检测;如果第一次分类检测结果存在错误的样本,对错误的样本,利用卷积神经网络进行第二次训练,得到第一次过渡检测模型;并利用第一次过渡检测模型进行第二次分类检测,如果第二次分类检测结果存在错误的样本,对错误的样本,利用卷积神经网络进行第三次训练,得到第二次过渡检测模型,循环以上步骤,直至检测结果中错误的样本少于预设的阀值或者不存在,得到最终检测模型;利用最终检测模型对待测的图像数据或视频数据进行分类检测。

【技术特征摘要】

【专利技术属性】
技术研发人员:张伟傅松林许清泉张长定
申请(专利权)人:厦门美图之家科技有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1