一种基于光场的场景语义分割系统及方法技术方案

技术编号：28561556 阅读：36 留言：0更新日期：2021-05-25 17:56

本发明专利技术涉及一种基于光场的场景语义分割系统及方法，由光场图像预处理模块、图像特征提取模块、场景语义分割模块、数据存储模块、显示模块和系统管理模块组成。本发明专利技术利用光场图像在场景三维信息提取的优势，实现高准确性的场景语义分割。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于光场的场景语义分割系统及方法
本专利技术属于图像
，具体涉及一种基于光场的场景语义分割系统及方法。
技术介绍
场景语义分割技术在自动驾驶、人机交互、图像搜索等领域被广泛应用，准确的场景语义分割方法对场景理解及其应用有着重要意义。当前的语义分割方法大体上分为两类。一类是仅依靠单图像进行语义分割，例如Zhang等人提出的基于上下文编码模块的单图像语义分割方法[1]，采用扩张卷积策略，在结构简单的图像上可以实现比较好的语义分割效果，但这些基于单图像的语义分割算法普遍难以在存在遮挡、高光、透明物体等特殊情况的复杂场景中取得良好的语义分割效果；另一类则是基于单图像和准确深度信息的语义分割算法，例如Qian等人提出了一个统一而有效的跨模态引导的编码器[2]，并利用它来融合单图像的图像信息和深度信息，从而实现更加准确的语义分割，但实际应用中通常难以获得单图像准确的深度信息，因此这类方法具有较强的局限性。面对这一现状，基于光场实现图像特征引导的场景语义分割方法成为一个可能选项。本专利技术通过设计一种基于光场的场景语义分割系统，充分利用光场图像在场景三维信息提取的优势，实现高准确性的场景语义分割。[1]ZhangH,DanaK,ShiJ,etal.Contextencodingforsemanticsegmentation[C]//ProceedingsoftheIEEEconferenceonComputerVisionandPatternRecognition.2018:7151-7160.[2]Qi...

【技术保护点】
1.一种基于光场的场景语义分割系统，其特征在于，包括：光场图像采集模块、光场图像预处理模块、图像特征提取模块、场景语义分割模块、数据存储模块、显示模块和系统管理模块；/n光场图像采集模块，负责采集需要进行语义分割的光场图像；该模块由包含9×9个分布在规则网格上且镜头光轴平行排列的相机组成相机阵列，根据用户设置的目标场景位置，对9行9列的相机阵列进行同步曝光控制，获取某一时刻的角度分辨率为9×9的光场图像，用于语义分割；/n光场图像预处理模块，将不同格式的光场图像转换为图像特征提取模块和场景语义分割模块支持的图像格式；本系统支持外部输入的光场图像，这类图像格式不同于使用光场图像采集模块直接获取的图像，需要经光场图像预处理模块进行图像格式转换，转换为视角图像方式来表示光场图像；对于角度分辨率大于9×9的光场图像，只取其中心9×9个视角图像；对于角度分辨率小于9×9的光场图像，则无法通过本系统获得准确的光场图像语义分割结果；本系统通过光场图像采集模块直接获取的光场图像，则无需进行预处理；/n图像特征提取模块，采用一种独创的光场图像中心视角特征提取卷积神经网络，利用光场9×9个不同视角图像，获...

【技术特征摘要】
1.一种基于光场的场景语义分割系统，其特征在于，包括：光场图像采集模块、光场图像预处理模块、图像特征提取模块、场景语义分割模块、数据存储模块、显示模块和系统管理模块；
光场图像采集模块，负责采集需要进行语义分割的光场图像；该模块由包含9×9个分布在规则网格上且镜头光轴平行排列的相机组成相机阵列，根据用户设置的目标场景位置，对9行9列的相机阵列进行同步曝光控制，获取某一时刻的角度分辨率为9×9的光场图像，用于语义分割；
光场图像预处理模块，将不同格式的光场图像转换为图像特征提取模块和场景语义分割模块支持的图像格式；本系统支持外部输入的光场图像，这类图像格式不同于使用光场图像采集模块直接获取的图像，需要经光场图像预处理模块进行图像格式转换，转换为视角图像方式来表示光场图像；对于角度分辨率大于9×9的光场图像，只取其中心9×9个视角图像；对于角度分辨率小于9×9的光场图像，则无法通过本系统获得准确的光场图像语义分割结果；本系统通过光场图像采集模块直接获取的光场图像，则无需进行预处理；
图像特征提取模块，采用一种独创的光场图像中心视角特征提取卷积神经网络，利用光场9×9个不同视角图像，获取其中最中心的一个视角图像中的场景特征信息，用于语义分割；
场景语义分割模块，采用一种独创的特征信息辅助的图像语义分割卷积神经网络，借助于图像特征提取模块获取的中心视角图像中的场景特征信息完成光场中心视角图像语义分割；
数据存储模块，管理数据库并储存光场图像数据及其语义分割结果，提供光场图像及其语义分割结果数据的添加、删除和查询接口；
显示模块，连接数据存储模块，用于显示被用户查询的光场图像和该光场图像对应的场景语义分割结果；
系统管理模块，连接数据存储模块，支持对数据库中的光场图像及其语义分割数据进行查询、添加和删除；系统管理模块连接用户数据库，将用户分为系统管理员与普通用户，允许系统管理员查询、添加与删除任何光场图像及语义分割信息，普通用户仅允许添加光场图像或查询和删除本人添加的光场图像及语义分割信息；
所述独创的光场图像中心视角特征提取卷积神经网络实现如下：
(1)光场图像中心视角特征提取卷积神经网络，采用多路网络结构分别从每个输入视角提取图像信息；其中，中心视角为特征提取的基础视角，综合使用全局残差结构与局部残差结构，其余80个视角为辅助视角，均只使用局部残差结构；卷积神经网络的全局残差结构完整保留中心视角图像中频率低于w/2的信息，其中w表示图像的最大频率；而卷积神经网络的局部残差结构则由残差模块实现；81条分路的输出通过拼接形成一组特征图，经过另外的两层卷积，得到最终一张完整的中心视角特征图；
(2)残差模块中，输入经过两层卷积运算得到的结果再与输入相加得到输出；
(3)光场图像特征提取卷积神经网络的全部卷积层的卷积核大小均为3×3，步长为1，特征图边缘填充0以保证卷积过后特征图尺寸不会发生变化；网络的全部卷积层均搭配整流线性单位函数ReLU(RectifiedLi...

【专利技术属性】
技术研发人员：盛浩，杨达，赵昱欣，崔正龙，周建伟，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人