一种基于数字全息技术的粒子场三维空间坐标定位方法技术

技术编号:39412444 阅读:9 留言:0更新日期:2023-11-19 16:04
发明专利技术公开了一种基于数字全息技术的粒子场三维空间坐标定位方法,包括以下步骤:S1,对粒子场全息图进行预处理,获得干净

【技术实现步骤摘要】
一种基于数字全息技术的粒子场三维空间坐标定位方法


[0001]本专利技术属于粒子场三维坐标测量
,具体涉及一种基于数字全息技术的粒子场三维空间坐标定位方法。
技术背景
[0002]随着科技的进步和高精尖技术的发展,如何准确获取微米级甚至纳米级尺度的物体信息,给科研工作者们提出了新的挑战。微米级粒子场包括环境、喷雾、化工、能源、生物医学、燃料燃烧等领域,测量其粒子的尺寸、位置、速度等参数对材料性能质量、工艺过程、能源消耗等科学研究有着重要的意义和价值。通过与数字全息技术相结合,粒子场测量不但可以覆盖多个应用领域,而且能够涉及三维形貌、空间分布、运动轨迹、测速跟踪等更多层面,从而为粒子场的测量提供了新的测量手段。
[0003]在实际的粒子场测量中,粒子目标存在以下几个特性:(1)散斑噪声干扰严重;(2)待识别粒子目标数量多,分布密集;(3)粒子粘连重叠;(4)粒子自身变化或相互粘连挤压,形态变化不规则,且部分图中存在杂质或污点。这些特征反应了粒子场分布的真实环境,会影响到粒子场空间坐标定位的准确性。作为全息光路的光源,激光器的强相干性引起光学元件缺陷或浑浊介质产生散斑噪声,传统的散斑噪声抑制方法包括全变差正则化、随机重采样掩模、三维块匹配算法、傅里叶滤波算法、小波阈值等。这些基于滤波器的图像处理方法在抑制散斑噪声的同时,都会不同程度模糊图像细节,出现大面积伪影,难以有效地抑制散斑噪声,进一步限制了粒子识别的准确率。此外,常用的粒子场目标检测多集中于分水岭分割、阈值分割和边缘检测等方法,这些依据算子的图像处理方法大多应用场景单一,只适用于稀疏的粒子分布场景,无法对密集分布的多个粒子进行准确地识别,进而也影响了所有粒子三维空间坐标信息的获取。
[0004]近年来,深度学习中的卷积神经网络在图像特征提取、复杂函数拟合等方面表现卓越,同时在数字全息应用中也显示出了巨大的潜力。通过深层神经网络提取更高语义的噪声和粒子特征,可以在粒子场图像中获取更多的有用信息,有效抑制散斑噪声,提高粒子识别准确率。因此,拥有强大特征提取能力的深度学习算法可以弥补传统粒子场去噪算法和目标识别算法的不足,有效提取出粒子场的重要特征,从而在浑浊介质环境中实现对密集分布型粒子场的三维空间坐标自动检测。

技术实现思路

[0005]本专利技术提供了一种基于数字全息技术的粒子场三维空间坐标定位方法。该方法首先对基于全息光路拍摄的粒子场全息图数据集进行预处理,以获得干净

噪声的图像数据对;为了更好地抑制散斑噪声并且保留条纹细节信息,该方法在FFDNet网络上引入了非对称融合非局部块(APNB)和边缘提取模块(VEM),构建了ANLVENet去噪网络,将得到的干净

噪声训练对,送入该网络进行训练,从而得到无噪声干扰的粒子场全息图;然后,对无噪声干扰的粒子场全息图进行数据样本标注,并输入到RBE_Faster R

CNN目标检测网络,该网
络是在Faster R

CNN基础上,结合残差网络ResNet50、平衡特征金字塔(BFP)、金字塔拆分注意力机制(EPSA)和感兴趣区域校准(ROI Align)结构改进而成,实现对单个粒子和粘连粒子的准确识别;接着,通过Hough变换圆检测处理,实现对识别粒子的计数和二维平面坐标(X,Y)定位;最后,利用角谱法对识别后的单个粒子进行数值再现,并通过自动聚焦算法光谱分析法(SPEC)获得粒子的纵轴坐标,实现三维空间坐标(X,Y,Z)的自动检测。该方法在获取三维空间坐标算法基础上,结合基于深度学习的去噪算法和目标识别算法,构建了一套粒子场三维空间坐标定位方法,有效抑制了粒子场的散斑噪声,提高了单个粒子和粘连粒子的识别准确率,为浑浊介质环境中密集分布型粒子场检测提供了有力的测量手段。
[0006]为实现上述目的,本专利技术提供如下技术方案:
[0007]一种基于数字全息技术的粒子场三维空间坐标定位方法,包括以下步骤:
[0008]S1,对拍摄到的粒子场全息图数据集,进行预处理操作,获得干净

噪声图像训练对;
[0009]S2,在FFDNet网络上引入APNB模块和VEM模块构建ANLVENet去噪网络,增强网络的去噪能力,并保留更多的细节信息;
[0010]S3,将步骤S1得到的干净

噪声图像训练对输入步骤S2所述的ANLVENet去噪网络中进行训练,得到无噪声干扰的粒子场全息图;
[0011]S4,对经过步骤S3处理的无噪声干扰的粒子场全息图数据样本进行标注;
[0012]S5,首先,使用ResNet50代替Faster R

CNN网络的Vgg16作为整个检测器的骨干网络;其次,引入BFP校正图像中空间差异大的目标;接着,搭建ESPA提取各通道特征图上的多尺度空间信息,生成区域候选框;然后,选择用ROI Align代替ROI Pooling得到RBE_Faster R

CNN网络,以增强网络的特征提取能力,提升网络识别的准确率;最后,将候选框送入RBE_Faster R

CNN网络,对候选区域中目标类别进行分类;
[0013]S6,将经过步骤S3处理的无噪声干扰的粒子场全息图输入S5所述的RBE_Faster R

CNN网络,进行训练后,输出粘连粒子和单个粒子的识别及分类结果;
[0014]S7,将经过步骤S6识别后的无噪声粒子场全息图进行Hough变换圆检测,实现粒子的计数和二维平面坐标定位;
[0015]S8,将经过步骤S6识别后的无噪声粒子场全息图利用角谱法在再现距离搜索范围[

d0,d0]内进行数值再现;
[0016]S9,利用自动聚焦算法SPEC将经过步骤S8处理得到的[

d0,d0]范围内的所有数值再现结果进行对比,获得粒子的纵轴坐标。
[0017]优选的,所述步骤S1具体包括:
[0018]步骤S101,利用3x3高斯滤波器对拍摄到的粒子场全息图进行卷积,抑制图像中的小噪声;
[0019]步骤S102,采用大津法对步骤S101的处理结果进行二值化处理;
[0020]步骤S103,将原始粒子场图像,无噪声干扰的背景图像和S102处理结果进行掩膜处理,获得无散斑噪声背景的粒子场全息图像,与原始图像组成噪声

干净图像训练对。
[0021]优选的,所述步骤S2具体包括:
[0022]步骤S201,在FFDNet网络前端引入APNB模块,用于统计全局信息,捕获输入图像上两个不同像素点间的联系,其每个像素点位置的响应计算为除该像素点外所有位置特征的
加权总和,并将该响应值传递给FFDNet,以增强网络的去噪效果;
[0023]步骤S202,FFDNet网络深度为15层,第一层由卷积层Conv和校正线性单元RELU构成;第二层本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于数字全息技术的粒子场三维空间坐标定位方法,其特征在于,包括以下步骤:S1,对拍摄到的粒子场全息图数据集,进行预处理操作,获得干净

噪声图像训练对;S2,在FFDNet网络上引入APNB模块和VEM模块构建ANLVENet去噪网络,增强网络的去噪能力,并保留更多的细节信息;S3,将步骤S1得到的干净

噪声图像训练对输入步骤S2所述的ANLVENet去噪网络中进行训练,得到无噪声干扰的粒子场全息图;S4,对经过步骤S3处理的无噪声干扰的粒子场全息图数据样本进行标注;S5,首先,使用ResNet50代替Faster R

CNN网络的Vgg16作为整个检测器的骨干网络;其次,引入BFP校正图像中空间差异大的目标;接着,搭建ESPA提取各通道特征图上的多尺度空间信息,生成区域候选框;然后,选择用ROIAlign代替ROIPooling得到RBE_Faster R

CNN网络,以增强网络的特征提取能力,提升网络识别的准确率;最后,将候选框送入RBE_Faster R

CNN网络,对候选区域中目标类别进行分类;S6,将经过步骤S3处理的无噪声干扰的粒子场全息图输入S5所述的RBE_Faster R

CNN网络,进行训练后,输出粘连粒子和单个粒子的识别及分类结果;S7,将经过步骤S6识别后的无噪声粒子场全息图进行Hough变换圆检测,实现粒子的计数和二维平面坐标定位;S8,将经过步骤S6识别后的无噪声粒子场全息图利用角谱法在再现距离搜索范围[

d0,d0]内进行数值再现;S9,利用自动聚焦算法SPEC将经过步骤S8处理得到的[

d0,d0]范围内的所有数值再现结果进行对比,获得粒子的纵轴坐标。2.根据权利要求1所述的一种基于数字全息技术的粒子场三维空间坐标定位方法,其特征在于,所述步骤S1具体包括:步骤S101,利用3x3高斯滤波器对拍摄到的粒子场全息图进行卷积,抑制图像中的小噪声;步骤S102,采用大津法对步骤S101的处理结果进行二值化处理;步骤S103,将原始粒子场图像,无噪声干扰的背景图像和S102处理结果进行掩膜处理,获得无散斑噪声背景的粒子场全息图像,与原始图像组成噪声

干净图像训练对。3.根据权利要求1所述的一种基于数字全息技术的粒子场三维空间坐标定位方法,其特征在于,所述步骤S2具体包括:步骤S201,在FFDNet网络前端引入APNB模块,用于统计全局信息,捕获输入图像上两个不同像素点间的联系,其每个像素点位置的响应计算为除该像素点外所有位置特征的加权总和,并将该响应值传递给FFDNet,以增强网络的去噪效果;步骤S202,FFDNet网络深度为15层,第一层由卷积层Conv和校正线性单元RELU构成;第二层到第十四层使用了Conv、RELU和批量归一化层BN的组合;第十五层仅使用Conv来重建输出层,卷积核大小为3
×
3像素;FFDNet网络的计算流程如下:首先,通过像素逆重组方法进行降采样操作,重构出4个降采样子图像,带噪声的全局信息图像的尺寸为C
×
W
×
H,降采样子图像的尺寸为4C
×
W/2
×
H/2;
其次,将降采样子图像与一幅噪声等级为可调的图像串联,作为FFDNet网络的输入,尺寸为(4C+1)
×
W/2
×
H/2;最后,通过像素重组方法进行上采样操作,将噪声残差图还原为原始尺寸大小,噪声残差图尺寸为(4C+1)
×
W/2
×
H/2,经过上采样操作的输出图像尺寸为C
×
W
×
H;步骤S203,在FFDNet网络末端引入VEM模块,VEM模块共有7个卷积层,卷积核大小为3
×
3像素,在第二层和第四层后面分别连接一个2
×
2像素的最大池化层,将第三层和第五层卷积的输入尺寸的宽和高变为上一层的一半,在第二层、第四层和第七层卷积后分别引出侧输出,并通过双线性插值进行上采样操作,使侧输出图像尺寸与输入图像尺寸大小一致,通过逐个像素相加的方式,将不同尺度的侧输出进行融合得到边缘图,并通过反向传播来引导网络的去噪过程。4.根据权利要求1所述的一种基于数字全息技术的粒子场三维空间坐标定位方法,其特征在于,所述步骤S3具体包括:步骤S301,设置ANLVENet去噪网络模型训练参数,模型优化方式为适应性矩估计;初始学习率为0.001,学习率调整方法为多步长衰减法,批大小为64;网络的代价函数是网络估计的噪声残差图与噪声图之间的平均绝对值误差:式(1)中,为第j个输入的噪声图像;m为训练图像总数;为对应的噪声残差图;M
j
为对应的噪声等级图;θ为网络参数;N
j
为对应的噪声图;j为1.....m;步骤S302,利用APNB模块统计无噪声图像和噪声图像的全局信息x和并串联噪声等级图M,共同作为FFDNet网络的输入;将噪声图像作为标签训练FFDNet网络,网络输出是经过残差学习得到的噪声残差图使用包含噪声的全局信息图像减去网络预测的噪声残差图得到去噪后的目标图像将去噪后的目标图像输入VEM模块,引导ANLVENet去噪网络生成具有更多边缘细节信息和纹理特征的无噪声干扰的粒子场全息图y。5.根据权利要求1所述的一种基于数字全息技术的粒子场三维空间坐标定位方法,其特征在于,所述步骤S4具体包括:对经过步骤S3处理得到的无噪声粒子场全息图像进行标注,从而构成训练RBE_Faster R

CNN神经网络模型所需的带有标注的数据集,标注训练图像中所有粒子目标的类别和位置坐标,得到样本目标。6.根据权利要求1所述的一种基于数字全息技术的粒子场三维空间坐标定位方法,其特征在于,所述步骤S5具体包括:S501,使用ResNet50代替Faster R

CNN网络的Vgg16作为整个检测器的骨干网络;S502,在步骤S501的基础上,针对粒子分布密集的特点,在ResNet50网络上加入特征金字塔FPN结构,能够充分利用提取的视觉特征,并融合非局部注意力机制non

local集成BFP;选择ResNet50...

【专利技术属性】
技术研发人员:刘芸吴晓强康琦刘雨萌焦明星邢俊红李鹤群薛浩星陈梦露高嘉豪薛锦锋
申请(专利权)人:西安理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1