一种基于图像信息和深度信息的物体识别方法技术

技术编号:12478465 阅读:155 留言:0更新日期:2015-12-10 14:56
本发明专利技术提供了一种基于图像信息和深度信息的物体识别方法,该方法处理的数据是RGB信息和深度信息的结合,通过这种包含大量有效信息的数据提取全面的有效特征,从而精确识别目标物体。该方法包括,投影的三维坐标的变换的步骤,以及模板匹配的步骤。本发明专利技术直接用通用的模板来匹配识别物体,不用添加其它设备来确定物体的位置,模板匹配的过程中计算量小,实现了快速数据处理。

【技术实现步骤摘要】

本专利技术涉及利用视觉传感器识别物体的方法,特别是红外传感器扫描深度信息以 及计算机视觉技术在机器人识别物体的方面的应用。
技术介绍
物体识别技术涉及计算机视觉及图像处理,主要用于对图像或视频信息中的对象 (如人、车辆、货物等)进行检测。目前的物体识别与测量方法常用的包括三维激光非接触式扫描测量、坐标机接触 式测量、光学视觉测量等方法。这些方法或存在设备成本高、速度慢、环境条件要求高等不 足。 比如用RFID的改造,这种改造需要对每一个托盘添加一个RFID收发的器件,因为 一个库房有成千上万个托盘,不可能每一个托盘都安装这样的设备,那样做的成本过高;而 且稳定性不好,如果有一个接收器不能正常工作,整个流程就会无法运转。如果在每个托盘 上添加上二维码进行定位,那么首先安装二维码的工作量是巨大的,另外,安装的二维码有 可能从托盘上脱落,使得识别过程无法进行;第三,二维码的尺寸过大的情况下会影响叉头 叉货的空间,使插货的难度增大;第四,安装定位的二维码的精度必须得十分的高,因为这 个精度直接影响识别的精度,而其给在托盘上安装二维码的过程增加了十分大的难度。 由此,本领域需要一种改进的物体识别方法,以克服上述现有技术中的各项不足。
技术实现思路
本专利技术的目的在于提供一种基于深度信息的物体识别算法 本专利技术通过以下技术方案实现。 -种基于图像信息和深度信息的物体识别方法,包括: 点云平面分割的步骤,从多信息传感器读取点云数据,对点云进行分割,将传感器 传回的三维点云信息视野中较大的平面全部提取出来; 第一物体边缘检测的步骤,检测出第一物体边缘的位置; 第二物体匹配定位的步骤,在所述点云平面分割结果的基础上完成第二物体的检 测和定位。 优选地,所述点云平面分割的步骤进一步包括: 获得有序点云,所述有序点云指的是点云有类似图像的结构,各个点的相邻关系 与图像中像素间的相邻关系类似,是显式已知的; 按照点的相邻关系,划分为一系列的子窗口; 计算每个子窗口中包含点集的几何形状,包括平面的和非平面的; 用区域增长算法将相邻且在同一平面的子窗口聚类为一个大的平面。 优选地,所述第一物体边缘检测的步骤进一步包括: 在点云平面分割结果的基础上,提取出第一物体左右边缘的点,并用随机抽样一 致性(RANSAC)算法在三维空间中拟合左右边缘的直线,从而得到第一物体左右边缘的直 线方程。 优选地,所述第二物体匹配定位的步骤进一步包括: 在点云平面分割结果的基础上完成托盘的检测和定位,将第一物体和第二物体所 在的平面从三维空间投影到二维空间,投影方向为此平面的法线方向; 投影后将平面进行网格化,如果平面投影后占用了某个方格,则此方格赋值为1, 否则赋值为0,由此可以与所述第二物体的模板进行匹配。 优选地,所述从三维空间投影到二维空间的过程进一步包括坐标旋转变换、球面 坐标系转直角坐标系,以及透视投影。 优选地,所述模板进行匹配的过程中,已知投影后得到的图中有要找的目标,且该 目标同模板有相同的尺寸、方向和图像。 优选地,所述投影后得到的图为8位图像,尺寸为WXH个像素,所述模板T的尺寸 mXn个像素,叠放在投影后得到的图上平移,模板覆盖的区域叫子图S1],其中i,j为子图左 上角在投影后得到的图上的坐标,搜索范围是: I ^ i ^ W-M I ^ j ^ H-N 通过比较T和S1^相似性,完成模板匹配过程。 优选地,衡量模板T和子图S1'1的匹配程度使用测度为: (1) (2) 通过得到的D(i,j)的值来判断模板匹配是否成功,D(i,j)的值是表示模板和传 感器返回的图像的匹配的距离;若D(i,j)在一定的范围内,表示模板匹配成功。 优选地,所述第一物体是货物,所述第二物体是托盘。 通过以上技术方案,本专利技术与现有技术相比具有以下优点: 1、直接用通用的模板来匹配识别托盘:不用添加外来设备来确定货物和托盘的位 置,可以自动识别托盘的位置,因为很多的专利的方法都是添加了其他的辅助设备来定位 托盘的位置,比如RFID和定位二维码来确定要叉货的托盘的位置,这些仪器需要精准的添 加到目标托盘上,而且添加的位置直接影响了以后使用的识别精度 2、快速的处理过程:快速模式匹配算法,因为通过CMOS红外传感器返回的深度信 息的数据量是巨大的,每秒有30帧的图像,每张图片有2359296个8位的数值,所以计算机 每秒处理的数据量是巨大的,从而所需的处理的时间也是非常长的,所以必须通过优化算 法来实现快速的图像处理,本专利技术的算法通过红外传感器的三维坐标系原点到目标物体的 三维坐标系原点的反馈回来的数据,对扫描后的目标物体的三维数据进行了投影变换,把 目标物体的三维数据投影到一个固定的标准平面上,这个平面比原始数据的平面的尺寸小 了很多,从而在模板匹配的过程中计算量就会减小很多,这样数据处理速度就会加快 3、特征提取:只需从3D信息中提取货物与托盘的深度信息和模板的数据进行比 对,用对比出的模板距离来判断识别是否成功,同时更换新的目标模板的过程也非常简单, 只需修改目标模板的参数就可以识别红外传感器的三维坐标系原点到目标物体的三维坐 标系原点的6个自由度的信息 4、高精度:红外传感器的三维坐标系原点到目标物体的三维坐标系原点的X,Y,Z 距离测量精度可以达到厘米级别,红外传感器的三维坐标系原点到目标物体的三维坐标系 的X,Y,Z平面的夹角信息也可以达到分的级别 5、三维信息:可以识别红外传感器的三维坐标系原点到目标物体的三维坐标系原 点的X,Y,Z得距离的信息,也可以识别红外传感器的三维坐标系原点到目标物体的三维坐 标系X,Y,Z平面的夹角信息 6、通用性:因为使用的识别的目标托盘是有国家的标准的,所以通用性很好,到每 个库房都可以用 7、不用进行预先的改造工作,用托盘作模板,程序识别托盘的时候都是用托盘的 物理尺寸,这些尺寸都有国家标准,会给整个库房的每一个托盘识别带来了巨大的便利【附图说明】 图1是本专利技术的平面分割算法流程图。 图2是方差在三个维度上的大小对比对应点集的分布形状示意图。 图3是三维正态分布中三个维度方差不同造成其形状不同示意图。 图4是本专利技术的托盘定位算法流程图。 图5是球面坐标系转直角坐标系示意图。 图6是透视变换中屏幕位置示意图。 图7是本专利技术的模板匹配过程示意图。 图8是托盘的模板尺寸示意图。【具体实施方式】 本专利技术的物体识别方法流程包括以下步骤: 1.点云平面分割: 图1所示的是平面分割算法流程图,这一步骤对点云进行分割,将传感器传回的 三维点云信息视野中较大的平面全部提取出来,例如墙面、地面、货物表面等。核心思想 是获得的有序点云(有序点云指的是点云有类似图像的结构,各个点的相邻关系与图像 中像素间的相邻关系类似,是显式已知的)按照点的相邻关系,划分为一系列的子窗口 (sub-windows)。然后计算每个sub-window中包含点集的几何形状,包括平面的和非平面 的。然后用区域增长算法将相邻且在同一平面的sub-window聚类为一个大的平面。 其中具体流程说明如下。 (1)数据信息获取 从多信息传感器读取点云数据,其中多信息传感器是能够获取多种数据信息的传 感器。优选地,所述多信息传感器包括用于获本文档来自技高网...

【技术保护点】
一种基于图像信息和深度信息的物体识别方法,包括:点云平面分割的步骤,从多信息传感器读取点云数据,对点云进行分割,将传感器传回的三维点云信息视野中较大的平面全部提取出来;第一物体边缘检测的步骤,检测出第一物体边缘的位置;第二物体匹配定位的步骤,在所述点云平面分割结果的基础上完成第二物体的检测和定位。

【技术特征摘要】

【专利技术属性】
技术研发人员:黄志建刘天建韩飞
申请(专利权)人:北京微尘嘉业科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1