一种针对室内场景RGB-D图像的语义分割方法技术

技术编号：25838727 阅读：108 留言：0更新日期：2020-10-02 14:18

本发明专利技术提供一种针对室内场景RGB‑D图像的语义分割方法，该方法以Resnet101作为特征提取网络，增加一个与RGB输入并行的深度的输入通道，通过池化运算保证深度图尺寸与RGB通道的特征图一致；并将Resnet101网络的第一个卷积层替换为局部像素预分组卷积模块。该方法改进了传统的RGB语义分割方法，使模型对深度信息敏感，进而提升语义分割效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种针对室内场景RGB-D图像的语义分割方法
本专利技术涉及计算机图像处理领域，尤其涉及一种针对室内场景RGB-D图像的语义分割方法。
技术介绍
语义分割是计算机视觉中非常重要的一个应用，被广泛运用在机器人、自动驾驶、安防监控等诸多领域。目前RGB-D传感器已经相当成熟，它不仅能提供色彩信息，还能提供深度信息。深度信息在色彩边界不明显、纹理特征较弱的场景中，对语义分割有很强的指导作用，而传统的语义分割方法并不能充分利用深度信息。
技术实现思路
针对现有的RGB图像分割算法无法利用图像深度信息的不足，本专利技术提出一种针对室内场景RGB-D图像的语义分割方法，以增强图像分割算法的性能，具体技术方案如下：一种针对室内场景RGB-D图像的语义分割方法，该方法具体包括如下步骤：S1：构建语义分割模型；（1）以开源Deeplabv3+模型为基础，对网络结构进行改造：以Resnet101作为特征提取网络，增加一个与RGB输入并行的深度的输入通道，通过池化运算保证深度图尺寸与RGB通道的特征图一致；（2）将Resnet101网络的第一个卷积层替换为局部像素预分组卷积模块；所述的局部像素预分组卷积模块的计算方式如下：（2.1）设该模块的卷积感受野为k×k，通过该模块对应的深度图获取卷积感受野内像素对应的深度值，并通过深度值转化出所述的k×k个点的点云坐标{pi}，i=1,2,…,k2；（2.2）计算所述的k×k个点的协方差矩阵A（2.3）计算

【技术保护点】
1.一种针对室内场景RGB-D图像的语义分割方法，其特征在于，该方法具体包括如下步骤：/nS1：构建语义分割模型；/n（1）以开源Deeplab v3+模型为基础，对网络结构进行改造：以Resnet101作为特征提取网络，增加一个与RGB输入并行的深度的输入通道，通过池化运算保证深度图尺寸与RGB通道的特征图一致；/n（2）将Resnet101网络的第一个卷积层替换为局部像素预分组卷积模块；/n所述的局部像素预分组卷积模块的计算方式如下：/n（2.1）设该模块的卷积感受野为k×k，通过该模块对应的深度图获取卷积感受野内像素对应的深度值，并通过深度值转化出所述的k×k个点的点云坐标{

【技术特征摘要】
1.一种针对室内场景RGB-D图像的语义分割方法，其特征在于，该方法具体包括如下步骤：
S1：构建语义分割模型；
（1）以开源Deeplabv3+模型为基础，对网络结构进行改造：以Resnet101作为特征提取网络，增加一个与RGB输入并行的深度的输入通道，通过池化运算保证深度图尺寸与RGB通道的特征图一致；
（2）将Resnet101网络的第一个卷积层替换为局部像素预分组卷积模块；
所述的局部像素预分组卷积模块的计算方式如下：
（2.1）设该模块的卷积感受野为k×k，通过该模块对应的深度图获取卷积感受野内像素对应的深度值，并通过深度值转化出所述的k×k个点的点云坐标{pi}，i=1,2,…,k2；
（2.2）计算所述的k×k个点的协方差矩阵A

（2.3）计算矩阵A的特征值，最小特征值对应的特征向量即是近似切平面的法向量；
（2.4）计算各个点在方向的投影

（2.5）以卷积核中心点的深度值为零点，计算其他各点与中心点的有向距离di，i=1,2,…,k2；
（2.6）以s为宽度，划分出k个深度区间[-(k+2)s/2+js,-(k+2)s/2+(j+1)s]jj=1,2,…,k；
（2.7）将各点与中心点的有向距离di落入同一个区间的点分到同一个组，共计k组；再将同组的点进行一个2D卷积操作，然后...

【专利技术属性】
技术研发人员：费哲遥，张健，谢天，李月华，朱世强，
申请(专利权)人：之江实验室，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人