一种基于胶囊网络的空间目标识别算法制造技术

技术编号:38001945 阅读:13 留言:0更新日期:2023-06-30 10:15
本发明专利技术公开了一种基于胶囊网络的空间目标识别算法,涉及空间目标识别技术领域,提出一种基于迪利克雷过程混合模型的胶囊网络,本发明专利技术以神经网络的胶囊网络为基础,加入迪利克雷过程混合模型,对胶囊网络进行改进,通过这种方法可以实现对空间目标的识别,可提高模型对目标观察视角的泛化能力、抗攻击特性,有效提升了空间目标识别的准确率。提升了空间目标识别的准确率。提升了空间目标识别的准确率。

【技术实现步骤摘要】
一种基于胶囊网络的空间目标识别算法


[0001]本专利技术属于人工智能领域,具体涉及一种基于胶囊网络的空间目标识别算法。

技术介绍

[0002]随着航天技术的发展以及世界各国对太空资源的开发,太空中飞行器的数目急剧增加,因此对空间中的非合作目标进行观测识别甚至提供回收、碎片清理等在轨服务有着重要的意义。当前,针对空间目标的观测识别系统主要由地基、天基两部分组成。天基观测系统在观测时比地基观测平台在受到的干扰更小,且光学探测具有运行成本低、体积小的特点。因此,使用搭载于微小卫星上的光电系统对空间目标进行观测更具优势。光学探测获得的可见光图像中包含了空间目标的颜色、纹理、形状以及空间关系等特征,利用这些特征对空间目标进行分类识别,可为进一步的空间任务提供支撑。
[0003]为了减少空间目标识别过程中特征提取部分的运算量,Cao等人尝试将流形相关理论、压缩感知理论、小波变换结合奇异值分解融入识别过程;Zhu等人利用二值化图像结合K最近邻算法、支持向量机来减小计算量。但是,这些方法都无法获取图像深层语义的特征,识别效果有待提升。随着深度学习的普及,Yang等人提出了一种结合空间目标部件特征的识别网络。该模型将输入图片中提取出的特征与Mask R

CNN分割后的部件特征融合后输入ResNet网络对空间目标进行分类。该方法能够较为准确的提取出所需目标的特征,但是,由于深度学习的效果大多依赖于数据集的制作,导致模型的准确率和泛化性无法确定。此外,考虑到实际应用中传统神经网络容易受到攻击,即对于一个已经完成训练的深度神经网络,仅需按照特定的方法对测试图片进行微小的改动,就会导致模型的预测准确率大幅降低,从而在空间和其他安全性要求很高的应用场景无法使用该方法,所以有必要采取一定的对抗手段来加强方法的可靠性。

技术实现思路

[0004]为了解决上述
技术介绍
提到的技术问题,本专利技术提出了一种基于胶囊网络的空间目标识别算法。
[0005]为了实现上述技术目的,本专利技术的技术方案为:
[0006]一种基于胶囊网络的空间目标识别算法,包括以下步骤:
[0007]S1、建立卫星仿真模型,获取空间目标的图像数据;
[0008]S2、对步骤S1获取的空间目标的图像数据进行预处理并制作成数据集;
[0009]S3、搭建胶囊网络并将步骤S2构建的数据集输入到胶囊网络当中提取目标特征;
[0010]S4、建立初始化权值矩阵以及激活矩阵;并和S3中得到的特征进行卷积运算,输出分别记作姿态矩阵、激活值;将姿态矩阵与激活值组合为一个胶囊;
[0011]S5、初始化新的权值矩阵,将步骤S4中得到的姿态矩阵与权值矩阵相乘,构建迪利克雷过程混合模型;
[0012]S6、对最后的胶囊层中的激活值进行归一化,归一化后的激活值即为各类别对应
概率值获得空间目标的识别结果。
[0013]优选地,步骤S1中的空间目标图像通过Blender软件建模,仿照已公开卫星模型获得类似的仿真卫星图片,并建立图片数据库。
[0014]优选地,步骤S2中,图像需要提前通过标记软件对图片中的空间目标进行框选标记,(1)利用LabelME标记软件对图像进行标记,其中需要对图像中卫星部件用多边形进行框选和分类标记;标记结束后每一张图像会生成相应的.json格式的文件的标签,其中记录了所标记的种类和位置信息;
[0015](2)将得到的.json格式的文件整理成VOC的数据集格式,其中包括需要将这些图片按照需求和比例划分训练集和测试集,这里按照训练集和测试集9:1的比例划分并生成相应的.json文件以记录训练集和测试集的标记信息;从而获得空间目标图片集从而获得训练所需的VOC格式数据集。
[0016]优选地,步骤S3中,将处理好的VOC数据集输入到神经网络,在网络的卷积层也就是普通的卷积结构进行提取目标特征,用同一卷积核对整幅图像全图滤波,将图像中的目标部分初步滤波出来,得到目标的浅层特征,也就是不含位姿关系的图像特征。
[0017]优选地,步骤S4中胶囊网络包括卷积层、卷积胶囊、数字胶囊、第一全连接层、第二全连接层和第三全连接层,胶囊层间通过路由算法连接;将这些看做编码器和解码器两部分:
[0018]编码器:编码器部分包括卷积层、卷积胶囊层和数字胶囊层三部分,卷积层探测图像的基本特征;在胶囊网络中,采用的是256个9x9x1的卷积核且设定步幅为1;卷积胶囊的任务是将卷积层探测出的基本特征组合起来;数字胶囊是将前面得到的特征矩阵转换成为一个多维的向量;
[0019]解码器:解码部分包括第一全连接层、第二全连接层和第三全连接层;将编码器部分得到的多维向量输入进解码器,通过全连接层将这些多维的向量反解出图片;
[0020]各层间的路由算法具体如下:
[0021]使用迪利克雷过程混合模型对路由算法建模;对迪利克雷过程G进行截棍构造,无限序列π
k
公式表达为:
[0022][0023]式中,v
k
是随机变量,且v
k
~Beta(1,α
c
);v
i
为第i个随机变量
[0024]迪利克雷过程G公式表达为:
[0025][0026]式中,表示一个原子测度;
[0027]引入服从多项式分布的随机变量Z
n
,Z
n
由序列π
k
产生,表示观测数据的混合分量,记作Z
n
∣π~Mult(π);选择指数族分布中的正态逆威沙特分布作为基分布G0;
[0028]假设(m,S)服从正态逆威沙特分布,记作(m,S)~NIW(μ0,λ,Ψ,ν)其概率密度函数公式表达如下:
[0029][0030]式中,μ0是实数域上的d维向量,λ为正实数,Ψ是一个正定的对称矩阵,v是一个大于d

1的实数,表示逆威沙特分布;对k设置上限K,当k超过上限时,令π
k
为零,引入平均场假设,使用近似推断算法求解该混合模型,以W表示模型中的隐变量,从而概率密度函数q(W)近似模型的后验分布p(W∣X);
[0031]将隐变量W的近似概率密度函数q(W)拆分,公式表达如下:
[0032][0033]式中,f
n
(z
n
)表示类别分布,表示参数为的Beta分布,h
i
(m
i
,S
i
∣μ
i

i

i

i
)初始化参数(μ0,λ0,Ψ0,ν0,φ
n,i
);对上式求解得到迭代方程组式(5)和式(6),使用式(5)更新参数(μ
i

i

i

i
)并计算Beta分布的参数使用式(6)更新参数φ...

【技术保护点】

【技术特征摘要】
1.一种基于胶囊网络的空间目标识别算法,其特征在于,包括以下步骤:S1、建立卫星仿真模型,获取空间目标的图像数据;S2、对步骤S1获取的空间目标的图像数据进行预处理并制作成数据集;S3、搭建胶囊网络并将步骤S2构建的数据集输入到胶囊网络当中提取目标特征;S4、建立初始化权值矩阵以及激活矩阵;并和S3中得到的特征进行卷积运算,输出分别记作姿态矩阵、激活值;将姿态矩阵与激活值组合为一个胶囊;S5、初始化新的权值矩阵,将步骤S4中得到的姿态矩阵与权值矩阵相乘,构建迪利克雷过程混合模型;S6、对最后的胶囊层中的激活值进行归一化,归一化后的激活值即为各类别对应概率值获得空间目标的识别结果。2.根据权利要求1所述一种基于胶囊网络的空间目标识别算法,其特征在于,步骤S1中的空间目标图像通过Blender软件建模,仿照已公开卫星模型获得类似的仿真卫星图片,并建立图片数据库。3.根据权利要求1所述一种基于胶囊网络的空间目标识别算法,其特征在于,步骤S2中,图像需要提前通过标记软件对图片中的空间目标进行框选标记,(1)利用LabelME标记软件对图像进行标记,其中需要对图像中卫星部件用多边形进行框选和分类标记;标记结束后每一张图像会生成相应的.json格式的文件的标签,其中记录了所标记的种类和位置信息;(2)将得到的.json格式的文件整理成VOC的数据集格式,其中包括需要将这些图片按照需求和比例划分训练集和测试集,这里按照训练集和测试集9:1的比例划分并生成相应的.json文件以记录训练集和测试集的标记信息;从而获得空间目标图片集从而获得训练所需的VOC格式数据集。4.根据权利要求1所述一种基于胶囊网络的空间目标识别算法,其特征在于,步骤S3中,将处理好的VOC数据集输入到神经网络,在网络的卷积层也就是普通的卷积结构进行提取目标特征,用同一卷积核对整幅图像全图滤波,将图像中的目标部分初步滤波出来,得到目标的浅层特征,也就是不含位姿关系的图像特征。5.根据权利要求1所述一种基于胶囊网络的空间目标识别算法,其特征在于,步骤S4中胶囊网络包括卷积层、卷积胶囊、数字胶囊、第一全连接层、第二全连接层和第三全连接层,胶囊层间通过路由算法连接;将这些看做编码器和解码器两部分:(1)编码器:编码器部分包括卷积层、卷积胶囊层和数字胶囊层三部分,卷积层探测图像的基本特征;在胶囊网络中,采用的是256个9x9x1的卷积核且设定步幅为1;卷积胶囊的任务是将卷积层探测出的基本特征组合起来;数字胶囊是将前面得到的特征矩阵转换成为一个多维的向量;(2)解码器:解码部分包括第一全连接层、第二全连接层和第三全连接层;将编码器部分得到的多维向量输入进解码器,通过全连接层将这些多维的向量反解出图片;各层间的路由算法具体如下:使用迪利克雷过程混合模型对路由算法建模;对迪利克雷过程G进行截棍构造,无限序列π
k
公式表达为:
式中,v
k
是随机变量,且v
k
~Beta(1,α
c
);v
i
为第i个随机变量迪利克雷过程G公式表达为:式中,表示一个原子测度;引入服从多项式分布的随机变量Z
n
,Z
n
由序列π
k
产生,表示观测数据的混合分量,记作Z
n
∣π~Mult(π);选择指数族分布中的正态逆威沙特分布作为基分布G0;假设(m,S)服从正态逆威沙特分布,记作(m,S)~NI...

【专利技术属性】
技术研发人员:唐生勇汪玲姚雨晴吴斌郑淑娴
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1