基于RGB特征与深度特征的原始图像层融合方法及系统技术方案

技术编号：15502240 阅读：186 留言：0更新日期：2017-06-03 23:13

本发明专利技术涉及一种基于RGB特征与深度特征的原始图像层融合方法及系统，其中所述方法包括如下步骤：第一步，分别采集同一物体同一时刻同一场景的RGB图像与深度图像；第二步，获取单独的基于RGB图像的物体识别准确率与基于深度图像的物体识别准确率；第三步：通过决策树算法为MMSAE算法初始化参数；第四步：MMSAE算法获取融合图像的识别准确率；第五步：判断所述融合图像的识别准确率是否高于系统设定阈值，若所述识别准确率不高于设定阈值，则返回第三步，若所述识别准确率高于设定阈值，则输出识别后的物体图像。本发明专利技术根据不同种类的特征对不同类别的物体的识别贡献差异性，完成了特征的有效融合，提高了物体识别的准确率，提高了运算效率。

Method and system for fusing original image layers based on RGB features and depth characteristics

The invention relates to a fusion method and system based on original image features and depth characteristics of the RGB layer, wherein the method comprises the following steps: the first step, RGB image and depth of the same scene the same object at the same time were collected; the second step, to obtain single object recognition based on RGB image and accuracy object recognition based on depth image accuracy; the third step: the decision tree algorithm MMSAE algorithm initialization parameters; the fourth step: MMSAE algorithm to obtain the fusion image recognition accuracy; the fifth step: identify the image fusion accuracy is higher than the threshold system, if the recognition accuracy is higher than the set threshold. To return to the third step, if the recognition rate is higher than the set threshold, the output after the object image recognition. According to different characteristics of the invention, the invention contributes to the discrimination of different classes of objects, achieves the effective fusion of features, improves the accuracy of object recognition and improves the calculation efficiency.

全部详细技术资料下载

【技术实现步骤摘要】
基于RGB特征与深度特征的原始图像层融合方法及系统
本专利技术涉及一种机器视觉及图像融合领域，具体的说，是涉及一种基于RGB特征与深度特征的原始图像层融合方法及系统。
技术介绍
图像融合是将两个或两个以上的传感器在同一时间或不同时间获取的关于某个具体场景的图像或者图像序列信息加以综合，以生成新的有关此场景解释的处理信息，而这种信息无法从单一的图像源中获取，融合后可以获取更可靠，更丰富，更准确的有用信息。深度学习是机器学习领域的一个新的研究热点，其目的是建立多层神经网络，能模仿人脑的机制来分析和解释图像、音频和文本等数据。深度学习通过组合浅层特征形成更加抽象的高层特征，以发现数据的更深层次的分布式特征表示。深度学习引起了计算机视觉领域的一场变革，许多研究者和现代科技公司都将目光投向了如何将深度学习应用到各种工业领域中，并已经取得了一定的效果。目前深度学习在图像识别、场景识别、物体追踪等方面都已经取得了显著的效果，表现出极大的应用价值。图像识别是计算机视觉领域最重要也是最困难的问题之一，在过去的研究工作中，基于RGB图像和灰度图像的图像识别工作取得了极大地进展。但是由于RGB图像和灰度图像自身的局限性，图像识别在计算机视觉领域的应用并不是很成功。例如在室内机器人应用方面，由于识别精度达不到指定的要求，图像识别在室内机器人的应用上一度陷入瓶颈。提高图像识别的准确率对于自主式机器人的普及具有决定性的意义。20世纪初，有学者提出手动特征提取方法，该方法主要借助于基于方向直方图的精心设计的特征，例如SIFT特征和HOG特征，而且这些特征也取得了很好的成果。然而这些手动...
基于RGB特征与深度特征的原始图像层融合方法及系统

【技术保护点】
一种基于RGB特征与深度特征的原始图像层融合方法，包括如下步骤：第一步，分别采集同一物体同一时刻同一场景的RGB图像与深度图像；第二步，获取单独的基于RGB图像的物体识别准确率与基于深度图像的物体识别准确率；第三步：通过决策树算法为MMSAE算法初始化参数；第四步：MMSAE算法有差异性地提取RGB图像和深度图像的有效特征并将所述有效特征融合，获取融合图像的识别准确率；第五步：判断所述融合图像的识别准确率是否高于系统设定阈值，若所述识别准确率不高于设定阈值，则返回第三步，若所述识别准确率高于设定阈值，则输出识别后的物体图像。

【技术特征摘要】
1.一种基于RGB特征与深度特征的原始图像层融合方法，包括如下步骤：第一步，分别采集同一物体同一时刻同一场景的RGB图像与深度图像；第二步，获取单独的基于RGB图像的物体识别准确率与基于深度图像的物体识别准确率；第三步：通过决策树算法为MMSAE算法初始化参数；第四步：MMSAE算法有差异性地提取RGB图像和深度图像的有效特征并将所述有效特征融合，获取融合图像的识别准确率；第五步：判断所述融合图像的识别准确率是否高于系统设定阈值，若所述识别准确率不高于设定阈值，则返回第三步，若所述识别准确率高于设定阈值，则输出识别后的物体图像。2.根据权利要求1所述的基于RGB特征与深度特征的原始图像层融合方法，其特征在于：所述第二步具体包括如下步骤：SAE算法提取浅层特征：分别输入深度图像与RGB图像,通过SAE算法分别提取深度图像的浅层特征与RGB图像的浅层特征；SPMP算法提取高层抽象特征：分别输入深度图像的浅层特征及RGB图像的浅层特征，通过SPMP算法分别提取深度图像的高层抽象特征与RGB图像的高层抽象特征；K交叉验证拆分训练集：将深度图像的高层抽象特征与RGB图像的高层抽象特征输入到softmax分类器，通过交叉验证获得单独的基于RGB图像的识别准确率以及基于深度图像的识别准确率。3.根据权利要求2所述的基于RGB特征与深度特征的原始图像层融合方法，其特征在于：所述RGB的浅层特征至少包括RGB彩色特征或/和边缘特征，所述深度图像的浅层特征至少包括三维空间形状。4.根据权利要求3所述的基于RGB特征与深度特征的原始图像层融合方法，其特征在于：所述通过SAE算法分别提取深度图像的浅层特征与RGB图像的浅层特征具体步骤为：将采集的图片大小缩放至r×r，从RGB图像和深度图像中分别随机提取h个图像块，每个图像块的长和宽均为s；分别使用RGB图像块和深度图像块作为输入，训练两个KSAE算法模型，其中一个用于提取RGB图像的浅层特征，另一个用于提取深度图像的浅层特征；训练完成后，分别使用两个所述KSAE作为映射函数，从每张RGB图像和深度图像中以卷积的方式按像素逐一提取颜色特征和形状特征；设KSAE的隐层节点个数为q，计算卷积后得到颜色特征和形状特征均为一个大小为t×t×q的三维矩阵，其中t＝r-s+1；对所述三维矩阵进行平均池化，降低所述颜色特征和形状特征的维度，获得所述深度图像的浅层特征与RGB图像的浅层特征。5.根据权利要求4所述的基于RGB特征与深度特征的原始图像层融合方法，其特征在于：所述通过SPMP算法分别提取深度图像的高层抽象特征与RGB图像的高层抽象特征具体步骤为：输入所述RGB图像的浅层特征及所述深度图像的浅层特征；通过空间金字塔最大池化算法将所述三维矩阵所有的点划分为C个块，其中C取不同的值；每个块C共包含p个点，则共有p个q维向量，将所述p个q维向量组合成一个大小为p×q维的矩阵：取矩阵每一行最大的值为所述深度图像的高层抽象特征与所述RGB图像的高层抽象特征。6.根据权利要求5所述的基于RGB特征与深度特征的原始图像层融合方法，其特征在于,所述交叉验证具体步骤为：将所述深度图像的高层抽象特征与RGB图像的高层抽象特征输入到softmax分类器；将所述深度图像的高层抽象特征与RGB图像的高层抽象特征作为原始训练集进行分组，一部分为真实训练集，用来训练分类器，另一部分为验证集，用来测试训练得到的分类器；将所述真实训练集随机分为K个子集，每次选取一个子集做测试集，其余的子集为训...

【专利技术属性】
技术研发人员：袁家政，刘宏哲，郭燕飞，
申请(专利权)人：北京联合大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人