一种基于光场相机和HOG、SVM的2D欺骗性行人识别方法技术

技术编号:23470985 阅读:18 留言:0更新日期:2020-03-06 12:56
一种基于光场相机和HOG、SVM的2D欺骗性行人识别方法,包括如下步骤:①利用光场相机去拍摄大量行人图像和非行人图像,作为实验的正样本和负样本;②利用Lytro Desktop软件得到所拍摄图像的原始2D图像和景深图;③利用HOG+SVM进行对原始2D图像进行ROI区域提取,判断是否包括行人;④再次利用HOG+SVM对步骤③中判断为行人的景深图进行识别,判断是否包括欺骗性行人。本发明专利技术利用光场相机可以获取图像景深图的特点来消除由于2D欺骗性打印人体图像或人物海报造成的误识别,以增强行人的识别能力。

A 2D deceptive pedestrian recognition method based on optical field camera, hog and SVM

【技术实现步骤摘要】
一种基于光场相机和HOG、SVM的2D欺骗性行人识别方法
本专利技术属于模式识别和人工智能领域,特别涉及一种基于光场相机和HOG、SVM的2D欺骗性行人识别方法。
技术介绍
随着科技的进步与社会的发展,许多需要大量人力完成的工作现在可以交给计算机完成,计算机视觉就是近期的研究热点,计算机视觉的目标就是利用计算机去代替人的视觉能力来处理问题。行人识别是计算机视觉研究领域的一个重要组成部分是物体识别的重要分支,在无人驾驶、辅助驾驶、智能机器人等领域都起到了十分重要的应用。并且近年来,随着拍照设备等硬件产品的进步,工业界对行人识别效率和准确度提出了更加苛刻的要求。行人识别首要就是识别出行人,然而在现实生活中行人在穿着、形态变化、所处背景、光照条件都不尽相同,会对行人识别产生挑战。并且在生活中广泛存在着2D欺骗性打印人体照片或者人物海报,这对行人识别是致命的影响,会极大的造成误识别,降低识别准确率。传统的行人识别中一个重要的特点是所应用的相机精度能达到要求,但都属于传统的二维相机,拍照只能得到相应图像的二维信息,不能获取场景深度信息,所以对2D欺骗性打印人体照片、人物海报就会造成误识别。例如在商场里存在的人物的宣传海报(包含整体人物图像)或者打印的人体图像,这些情况的存在都会对传统的行人识别提出挑战,尽管我们可以一眼就看出这不是真人,但计算机不会。最早的行人识别相关研究是在2005年CVPR会议上发表的SVM+HOG的算法,这是第一次提出梯度直方图(HOG)的概念,这是行人识别领域最为经典的算法。如果采用传统的二维相机,应用此方法也解决不了2D欺骗性打印人体图像造成的行人误识别问题。而对于这一问题,我们理论上可以采用结构光法、双目视觉等方法解决,但对于结构光法来说,这是一种主动式、侵入式照明,可能会对拍摄的行人造成身体伤害;而对于双目视觉方法增加了硬件设备,需要多个相机和传感器的配合处理,同时也增加了实验成本,经济型也待考虑。所以基于这些限制,我们选取光场相机作为实验设备。光场相机机身外形与普通传统相机差不多,但内部结构大有不同。传统相机的工作原理是主镜头捕捉光线,聚焦在镜头后的胶片或感光器上,其中所有的光线总和形成相片上的小点,以显示成像。而光场相机最大的结构特点是在主镜头与感光器之间,有一个布满9万个微型镜片的显微镜阵列,每一个微小透镜阵列接收由主镜而来的光线后,尽管只记录了光线的强度信息,但却因其相对于某个微透镜的位置而记录了光线的方向信息,同时将光线资料转换,以数码方式记下。相机内置软件操作已‘扩大光场’,追踪每条光线在不同距离的影像上的落点,经数码重新对焦后,便能拍出完美照片。并且,光场相机可以保持原有相机的大孔径所带来的增加光度、减少拍照时间及起粒的情况,不用牺牲景深及及影像清晰度。总体来说。光场相机有如下几个特点:(1)先拍照,再对焦。(2)体积小,速度快。(3)有广泛的应用前景。由于光场相机具有上述优点,其在计算机视觉领域中无人驾驶、自动驾驶可能有着巨大的发展潜力与广泛的应用前景,因其具有微透镜阵列的特点,可以记录不同方向的光线信息,从而可以记录场景深度信息。而且其结构并不复杂,仅仅具有一个传感器,同时后期对图像的处理也可以采用LYTRO公司推出的LytroDesktop软件方法进行处理,可以快速精准的输出不同格式的二维图像或者景深图,并且对场景图像的获取并不会对场景内的人或者物体造成不必要的伤害,是一种友好式的获取。截至到目前为止,还没有应用光场相机去做相关行人识别的研究。
技术实现思路
本专利技术目的在于提供了一种基于光场相机和HOG、SVM的2D欺骗性行人识别方法,该方法利用光场相机可以获取图像景深图的特点来消除由于2D欺骗性打印人体图像或人物海报造成的误识别,以增强行人的识别能力。如上构思,本专利技术的技术方案是:一种基于光场相机和HOG、SVM的2D欺骗性行人识别方法,其特征在于:包括如下步骤:①利用光场相机去拍摄大量行人图像和非行人图像,作为实验的正样本和负样本;②利用LytroDesktop软件得到所拍摄图像的原始2D图像和景深图;③利用HOG+SVM对原始2D图像进行ROI区域提取,判断是否包括行人;④再次利用HOG+SVM对步骤③中判断为行人的景深图进行识别,判断是否包括欺骗性行人。上述光场相机采用LYTRO公司生产的第二代Lytro-IIIum相机。上述原始2D图像进行ROI区域提取采用公用INRIA数据集,使用的正样本是经处理的64*128大小的人体图片,使用的负样本是经处理的64*128大小的非人体图片。上述原始2D图像进行ROI提取时,SVM分类器是OpenCV自带的CvSVM类。本专利技术具有如下的优点和积极效果:1、本专利技术基于光场相机和HOG、SVM的2D欺骗性行人识别,可进一步降低传统行人识别方法中对2D欺骗性打印人体图像、人物海报的误识别。2、本专利技术首先利用传统HOG+SVM方法对原始2D图像提取行人ROI区域,排除大量非行人样本的干扰,其次,再利用HOG+SVM方法对所提取的ROI区域的景深图进行再识别,可进一步排除打印人体图像、人物海报对行人识别的干扰。3、本专利技术行人识别所用到的行人数据集是2D图像和景深图相结合的数据集且是在不同的实验场景下,对不同的人的姿态、高矮、胖瘦,不同的光照下所获取的,具有很强的随机性与适应性,能够满足我们的实验条件。本专利技术运用传统的HOG+SVM方法对原始图像提取行人ROI区域,训练所采用正负样本来自公共的INRIA数据集,其数据集图像来自网络和GRAZ01数据集并且数据集中的图像具有不同的姿态,光照条件,具有广泛的代表性。使用的正负样本是经处理的64*128大小的人体图片。而进行行人再识别时,所应用的数据集是通过我们的LytroIIIum相机拍摄建立,正负样本为所拍摄图像所对应的景深图。其中通过对原始2D图像进行ROI提取后的正样本为571张,负样本为261张,通过归一化得到的图像大小为128*64(原始图像大小为2022*1404)。4、本专利技术在进行原始2D图像ROI提取时,SVM分类器是OpenCV自带的CvSVM类,核函数为线性核函数,其参数少速度快,对于线性可分数据,其分类效果很理想。而进行行人识别时,SVM分类器是Matlab封装实现的,而核函数分别为高斯(RBF)核函数、线性(Linear)核函数和多项式(Polynomial)核函数,其无论大样本还是小样本都有比较好的性能。5、本专利技术实验中采用的相机是LYTRO公司生产的第二代Lytro-IIIum相机,而对于原始2D图像和景深图的获取采用的是LytroDesktop软件,是LYTRO公司公布的一款软件方法。使用LytroDesktop软件能较快校准的对所拍摄图像进行处理,且可以同时输出原始2D图像和景深图。6、本专利技术只需要用到光场相机一个硬件设备,一个传感器就能进行行人识别,实验难度和实验成本低。附图本文档来自技高网
...

【技术保护点】
1.一种基于光场相机和HOG、SVM的2D欺骗性行人识别方法,其特征在于:包括如下步骤:/n①利用光场相机去拍摄大量行人图像和非行人图像,作为实验的正样本和负样本;/n②利用Lytro Desktop软件得到所拍摄图像的原始2D图像和景深图;/n③利用HOG+SVM对原始2D图像进行ROI区域提取,判断是否包括行人;/n④再次利用HOG+SVM对步骤③中判断为行人的景深图进行识别,判断是否包括欺骗性行人。/n

【技术特征摘要】
1.一种基于光场相机和HOG、SVM的2D欺骗性行人识别方法,其特征在于:包括如下步骤:
①利用光场相机去拍摄大量行人图像和非行人图像,作为实验的正样本和负样本;
②利用LytroDesktop软件得到所拍摄图像的原始2D图像和景深图;
③利用HOG+SVM对原始2D图像进行ROI区域提取,判断是否包括行人;
④再次利用HOG+SVM对步骤③中判断为行人的景深图进行识别,判断是否包括欺骗性行人。


2.根据权利要求1所述的一种基于光场相机和HOG、SVM的2D欺骗性行人识别方法,其特征在于:上述...

【专利技术属性】
技术研发人员:石凡贾晨赵萌赵宇峰闫静陈胜勇
申请(专利权)人:天津理工大学
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1