一种图像预测优化处理方法及装置制造方法及图纸

技术编号:32729617 阅读:48 留言:0更新日期:2022-03-20 08:35
本发明专利技术涉及一种图像预测优化处理方法及装置,属于图像处理领域,方法包括:对多个无人机影像进行预处理;将多个深度学习语义标签匹配至预处理的各个无人机影像上,得到多个训练样本,将各个训练样本进行扩充处理,得到扩充后的训练样本集合,在卷积神经网络中进行参数配置优化,通过扩充后的训练样本集合对优化后的卷积神经网络进行深度学习分类训练,得到训练后的卷积神经网络,并进行影像预测分类,得到多种分类结果,对多种分类结果进行融合处理,对融合的分类结果进行扩展裁剪处理,得到整幅遥感影像。能够对多种分类结果进行融合处理,融合的分类结果更为准确和全面,再对融合的分类结果进行扩展裁剪处理,能够消除明显的拼接痕迹。拼接痕迹。拼接痕迹。

【技术实现步骤摘要】
一种图像预测优化处理方法及装置


[0001]本专利技术主要涉及图像处理
,具体涉及一种图像预测优化处理方法及装置。

技术介绍

[0002]卷积神经网络是一种广泛使用的深度学习模型,是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,包含卷积层和池化层。卷积神经网络在计算机视觉领域的许多研究中都取得了出色的性能,例如图像分类、人脸识别和行人检测等。近年来,基于深度学习的方法已应用于高光谱图像分类、大规模土地覆盖分类、场景分类和遥感领域的目标检测等,其性能优于传统方法。
[0003]参考现有科学文献中利用深度学习的分类研究,卷积神经网络是将图像分割成一定尺寸进行逐像素图像分类预测,并进行分类结果的拼接,最终结果中会产生明显的拼接痕迹,导致分类结果有误。

技术实现思路

[0004]本专利技术所要解决的技术问题是针对现有技术的不足,提供一种图像预测优化处理方法及装置。
[0005]本专利技术解决上述技术问题的技术方案如下:一种图像预测优化处理方法,包括如下步骤:
[0006]导入预先制作的多个深度学习语义标签,所述深度学习语义标签为根据实测数据得到的标签;
[0007]导入多个无人机影像,并分别对多个所述无人机影像进行预处理;
[0008]将多个所述深度学习语义标签匹配至预处理的各个无人机影像上,得到多个训练样本,通过多个训练样本得到训练样本集合;
[0009]将所述训练样本集合中的各个训练样本进行扩充处理,得到扩充后的训练样本集合;r/>[0010]基于卷积神经网络,在所述卷积神经网络中进行参数配置优化,得到优化后的卷积神经网络,所述卷积神经网络包括多个深度学习模型;
[0011]通过扩充后的训练样本集合对优化后的卷积神经网络进行深度学习分类训练,得到训练后的卷积神经网络;
[0012]对训练后的卷积神经网络进行影像预测分类,得到多种分类结果;
[0013]对多种分类结果进行融合处理,得到融合的分类结果;
[0014]对融合的分类结果进行扩展裁剪处理,得到整幅遥感影像。
[0015]本专利技术的有益效果是:通过扩充的训练样本对卷积神经网络进行训练,通过训练后的卷积神经网络进行影像预测分类,并能够对多种分类结果进行融合处理,融合的分类结果更为准确和全面,再对融合的分类结果进行扩展裁剪处理,能够消除明显的拼接痕迹。
[0016]在上述技术方案的基础上,本专利技术还可以做如下改进。
[0017]进一步,所述卷积神经网络包括多个深度学习模型,所述多个深度学习模型为SegNet模型、PSPNet模型、RAUNet模型和DeepLabV3plus模型;
[0018]通过扩充后的训练样本集合对优化后的卷积神经网络进行深度学习分类训练,得到训练后的卷积神经网络,具体为:
[0019]通过扩充后的训练样本集合按照设置的迭代次数分别对SegNet模型、PSPNet模型、RAUNet模型和DeepLabV3plus模型进行多分类训练和单分类训练,得到训练后的卷积神经网络。
[0020]采用上述进一步方案的有益效果是:卷积神经网络由多个深度学习模型组合而成,解决了目前单个模型进行预测分类时存在局限性的问题,去除了部分区域分类结果存在差异的问题。
[0021]本专利技术解决上述技术问题的另一技术方案如下:一种图像预测优化处理装置,包括:
[0022]导入模块,用于导入预先制作的多个深度学习语义标签,所述深度学习语义标签为根据实测数据得到的标签;导入多个无人机影像,并分别对多个所述无人机影像进行预处理;
[0023]预处理模块,用于将多个所述深度学习语义标签匹配至预处理的各个无人机影像上,得到多个训练样本,通过多个训练样本得到训练样本集合;将所述训练样本集合中的各个训练样本进行扩充处理,得到扩充后的训练样本集合;
[0024]模型优化模块,用于基于卷积神经网络,在所述卷积神经网络中进行参数配置优化,得到优化后的卷积神经网络;
[0025]训练模块,用于通过扩充后的训练样本集合对优化后的卷积神经网络进行深度学习分类训练,得到训练后的卷积神经网络;对训练后的卷积神经网络进行影像预测分类,得到多种分类结果;
[0026]分类优化模块,用于对多种分类结果进行融合处理,得到融合的分类结果;对融合的分类结果进行扩展裁剪处理,得到整幅遥感影像。
[0027]本专利技术解决上述技术问题的另一技术方案如下:一种图像预测优化处理装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,当所述处理器执行所述计算机程序时,实现如上所述的图像预测优化处理方法。
附图说明
[0028]图1为本专利技术实施例提供的图像预测优化处理方法的流程示意图;
[0029]图2为本专利技术实施例提供的图像预测优化处理方法的另一流程示意图;
[0030]图3为本专利技术实施例提供的图像预测优化处理装置的功能模块框图。
具体实施方式
[0031]以下结合附图对本专利技术的原理和特征进行描述,所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。
[0032]实施例1:
[0033]如图1所示,一种图像预测优化处理方法,包括如下步骤:
[0034]导入预先制作的多个深度学习语义标签,所述深度学习语义标签为根据实测数据得到的标签;标签的制作依据无人机影像与实测数据来制作深度学习语义标签。
[0035]导入多个无人机影像,并分别对多个所述无人机影像进行预处理;选取Pix4D Mapper软件、ArcGIS10.5软件、ENVI 5.4软件对无人机影像进行预处理。
[0036]将多个所述深度学习语义标签匹配至预处理的各个无人机影像上,得到多个训练样本,通过多个训练样本得到训练样本集合。
[0037]将所述训练样本集合中的各个训练样本进行扩充处理,得到扩充后的训练样本集合;为增加样本数量,对影像与标签数据分割成256*256、128*128像素大小,并在分割过程中对影像及样本数据进行翻转、通道互换、随机旋转等增强处理。
[0038]基于卷积神经网络,在所述卷积神经网络中进行参数配置优化,得到优化后的卷积神经网络;在卷积神经网络的各个模型中添加条件随机场,将网络输出概率图作为一元势函数的输入,将原始的无人机影像作为二元势函数的输入,通过最小化散度距离的平均场近似估计方法,迭代产生分割结果;模型优化器算法设置为Adam,初始学习率设置为0.001,动量参数设置为0.8;损失函数设置为Categorical_crossentropy loss。
[0039]通过扩充后的训练样本集合对优化后的卷积神经网络进行深度学习分类训练,得到训练后的卷积神经网络;
[0040]对训练后的卷积神经网络进行影像预测分类,得到多种分类结果;
[0041]对多种分类结果进行融合处理,得到融合的分类结果;
[0042]对融合的分类本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图像预测优化处理方法,其特征在于,包括如下步骤:导入预先制作的多个深度学习语义标签,所述深度学习语义标签为根据实测数据得到的标签;导入多个无人机影像,并分别对多个所述无人机影像进行预处理;将多个所述深度学习语义标签匹配至预处理的各个无人机影像上,得到多个训练样本,通过多个训练样本得到训练样本集合;将所述训练样本集合中的各个训练样本进行扩充处理,得到扩充后的训练样本集合;基于卷积神经网络,在所述卷积神经网络中进行参数配置优化,得到优化后的卷积神经网络;通过扩充后的训练样本集合对优化后的卷积神经网络进行深度学习分类训练,得到训练后的卷积神经网络;对训练后的卷积神经网络进行影像预测分类,得到多种分类结果;对多种分类结果进行融合处理,得到融合的分类结果;对融合的分类结果进行扩展裁剪处理,得到整幅遥感影像。2.根据权利要求1所述的图像预测优化处理方法,其特征在于,所述卷积神经网络包括多个深度学习模型,所述多个深度学习模型为SegNet模型、PSPNet模型、RAUNet模型和DeepLabV3plus模型;通过扩充后的训练样本集合对优化后的卷积神经网络进行深度学习分类训练,得到训练后的卷积神经网络,具体为:通过扩充后的训练样本集合按照设置的迭代次数分别对SegNet模型、PSPNet模型、RAUNet模型和DeepLabV3plus模型进行多分类训练和单分类训练,得到训练后的卷积神经网络。3.根据权利要求2所述的图像预测优化处理方法,其特征在于,所述对多种分类结果进行融合处理,得到融合的分类结果的过程包括:根据软投票法预测各个深度学习模型输出分类结果对应的概率,从计算得到的各个概率中选择最大概率对应的分类结果;根据硬投票法预测各个深度学习模型输出类别最多对应的分类结果;根据最优结果融合法对最大概率对应的分类结果和类别最多对应的分类结果进行融合,得到融合的分类结果。4.根据权利要求3所述的图像预测优化处理方法,其特征在于,所述根据软投票法预测各个深度学习模型输出分类结果对应的概率,从计算得到的各个概率中选择最大概率对应的分类结果,具体为:通过式(1)预测各个深度学习模型输出分类结果对应的概率,所述式(1)为:其中,P
n1
为预测单分类的模型M
n
输出分类结果n的概率,Pi2为另外三个单分类的模型M
i
输出分类结果n的概率,为另外三个单分类的模型M
i
中每个像素的概率进行平均值计算;通过式(2)从计算得到的各个概率中选择最大概率对应的分类结果,所述式(2)为:
P=Max{P1,P2,P3……
P
n
},其中,P为最大概率对应的分类结果。5.根据权利要求3所述的图像预测优化处理方法,其特征在于,所述根据硬投票法预测各个深度学习模型输出类别最多对应的分类结果,具体为:通过式(3)预测各个深度学习模型输出类别最多对应的分类结果,所述式(3)为:Y=Majority{Y1,Y2,Y3……
Y
m
},其中,Y
m...

【专利技术属性】
技术研发人员:付波霖刘曼邓良超孙习东范冬林何宏昌
申请(专利权)人:桂林理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1