基于Transformer模型的自由视场红外数字全息成像方法技术

技术编号:33918583 阅读:17 留言:0更新日期:2022-06-25 20:39
本发明专利技术公开了步骤一、构建真实样品数据集收集系统;步骤二、Transformer模型真实样品数据集收集;步骤三、训练集生成与Transformer模型构建;步骤四、基于Transformer模型的背景噪声消除与图像融合拼接;步骤五、对样品长时间轴的动态记录。本发明专利技术的优点是:可以有效提高聚焦距离判定精准度,消除最终合成的主视场振幅图像与主视场相位图像存在的明显折痕,拍摄出在一段连续时间内高分辨率的无明显折痕的主视场振幅图像与主视场相位图像。主视场振幅图像与主视场相位图像。主视场振幅图像与主视场相位图像。

【技术实现步骤摘要】
基于Transformer模型的自由视场红外数字全息成像方法


[0001]本专利技术涉及红外数字全息成像
,特别涉及一种基于Transformer模型纠差的自由视场红外数字全息成像方法。

技术介绍

[0002]红外波段处于可见光波段之外因其对于不同物质的穿透性不同,使之在成像领域有着很好的应用前景,而数字全息技术因其成像结构简单和灵活的数据处理方式,对特定目标样品的多个聚焦层面成像有着独特优势。Transformer模型是谷歌在2017年底发表的论文Attention Is All You Need中所提出seq2seq模型。而Transformer这个seq2seq模型的特别之处是模型当中大量用到了自注意力层。Transformer模型现如今在计算机视觉当中也表现出了非常令人满意的效果。在传统成像过程中,存在聚焦距离判定精准度低且最终合成的主视场振幅图像与主视场相位图像存在明显的折痕的问题,通过Transformer模型实现红外数字全息成像的训练与识别,结合三者的优势,可以实现一种基于Transformer模型纠差的自由视场红外数字全息成像技术。
[0003]现有的自由视场红外数字全息成像方法存在的不足为:聚焦距离判定精准度低,最终合成的主视场振幅图像与主视场相位图像存在明显的折痕,严重影响图像质量。

技术实现思路

[0004]本专利技术针对现有技术的缺陷,提供了一种基于Transformer模型的自由视场红外数字全息成像方法。解决聚焦距离判定精准度低且最终合成的主视场振幅图像与主视场相位图像存在明显的折痕的问题。
[0005]为了实现以上专利技术目的,本专利技术采取的技术方案如下:
[0006]一种基于Transformer模型的自由视场红外数字全息成像方法,包括以下步骤:
[0007]步骤一、构建真实样品数据集收集系统;
[0008]所述收集系统包括:可调谐激光光源1、保护银膜反射式准直器2、二维电动平移台3、样品旋转平移台4、红外热释电探测器5和探测器二维平移台6。
[0009]可调谐激光光源1用于发射红外激光通过光纤连接至保护银膜反射式准直器2;保护银膜反射式准直器2用于使红外激光最大效率的耦合通过样品,二维电动平移台3和样品旋转平移台4相互配合能够让样品能够平移和旋转;二维电动平移台3和样品旋转平移台4位于保护银膜反射式准直器2的正下方。红外热释电探测器5用于接收红外激光热信号,位于二维电动平移台3的正下方。探测器二维平移台6位于红外热释电探测器5下方能够让红外热释电探测器5平移。
[0010]步骤二、Transformer模型真实样品数据集收集过程,通过自由视场红外数字全息成像系统完成样品数据获取,覆有样品的载玻片放置于样品旋转平移台4上的二维电动平移台3上,设置二维电动平移台3水平扫描次数C次、纵向扫描次数Z次、扫描路径和步进距离,设置样品旋转平移台4旋转次数X次、旋转方向顺时针和步进度数360/(X+1)
°
。样品自由
视场全息图采集过程采用遍历的方式,通过C次水平移动,红外热释电探测器5采集C+1个子视场全息图。之后二维电动平移台3完成纵向移动Z次,每次纵向移动均平移至行初始位置,重复C次水平移动扫描。之后通过样品旋转平移台4完成旋转扫描X次,每次旋转位移均进行水平移动扫描和纵向移动扫描,共采集(X+1)*(Z+1)*(C+1)张子视场全息图。
[0011]步骤三、训练集生成与Transformer模型构建过程,通过计算机模拟全息图记录与重建过程获取对应的训练集,根据仿真样品模拟得到仿真子视场全息图进行预处理,预处理过程包括对仿真子视场全息图进行添加不同水平噪声,图像旋转,图像拉伸的操作。把子视场全息图预处理后的图像转换成数据集的形式,得到由仿真数据组成的用于子视场全息图重建的训练集,在Transformer模型中设置自注意力层与多头注意力层并将其打包成一个矩阵Q,键和值也被打包成矩阵K和V,矩阵计算公式如下:
[0012][0013]MultiHead(Q,K,V)=Concat(head1,...,head
n
)W
O
[0014]head
i
=Attention(QW
iQ
,KW
iK
,VW
iV
)
[0015]其中softmax函数的功能为按照一定权重取矩阵内的值,Concat函数功能为将内部所有矩阵相连,对进行预处理后的数据集进行训练获得分类后的结果,实现重建的子视场振幅图与子视场相位图的聚焦距离判定。最终把步骤一中的(X+1)*(Z+1)*(C+1)张子视场全息图作为输入层,在输出层得到(X+1)*(Z+1)*(C+1)张优化的子视场振幅图像与子视场相位图像。
[0016]步骤四、基于Transformer模型的背景噪声消除与图像融合拼接过程,通过基于Transformer模型的原理训练平滑算法,平滑算法消除二维电动平移台3和样品旋转平移台4位移时的微小误差,校准不同位置子视场全息图的背景噪声至同一水平。平滑算法对子视场图像进行归一化处理。使用步骤二中(X+1)*(Z+1)*(C+1)张处理后的子视场振幅图像和子视场相位图像进行图像分割,在分割过程中加入随机噪声干扰,并按照步骤二中的数据处理方法得到训练集,再按照步骤二中的方法设置Transformer模型的自注意力层与多头注意力层,实现对训练集中的子视场图像进行拼接还原,求得最佳背景噪声数值,消除样品二维电动平移台和样品旋转平移台产生的位移误差,得到归一化后的结果。最后把步骤二中(X+1)*(Z+1)*(C+1)张处理后的子视场振幅图像与子视场相位图像作为输入层,在输出层得到强度校准后平滑的主视场振幅图像与主视场相位图像。
[0017]步骤五、对样品长时间轴的动态记录过程,通过步骤二实现样品图像的全过程、记录,标定时间信息,并通过步骤四中得到的主视场全息图按时间顺序的堆叠,实现长时间内物体变化全息信息的完整展现。
[0018]作为优选,步骤五中在按照时间顺序堆叠的过程中,时间间隙可设置为每N1拍摄一张子视场振幅图与子视场相位图,并且记录N2小时,实现N2小时内长时间轴共计N3张主视场振幅图与主视场相位图。其中N1、N2和N3均为可设置的整数参数。
[0019]与现有技术相比,本专利技术的优点在于:
[0020]可以有效提高聚焦距离判定精准度,消除最终合成的主视场振幅图像与主视场相位图像存在的明显折痕,拍摄出在一段连续时间内高分辨率的无明显折痕的主视场振幅图像与主视场相位图像。
附图说明
[0021]图1是本专利技术实施例自由视场红外数字全息成像方法流程图;
[0022]图2是本专利技术实施例真实样品数据集收集系统结构示意图;
[0023]图3是本专利技术实施例真实样品数据集收集系统收集图像示意图。
具体实施方式
[0024]为使本专利技术的目的、技术方案及优点更加清楚明白,以下根据附图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于Transformer模型的自由视场红外数字全息成像方法,其特征在于,包括以下步骤:步骤一、构建真实样品数据集收集系统;所述收集系统包括:可调谐激光光源(1)、保护银膜反射式准直器(2)、二维电动平移台(3)、样品旋转平移台(4)、红外热释电探测器(5)和探测器二维平移台(6);可调谐激光光源(1)用于发射红外激光通过光纤连接至保护银膜反射式准直器(2);保护银膜反射式准直器(2)用于使红外激光最大效率的耦合通过样品,二维电动平移台(3)和样品旋转平移台(4)相互配合能够让样品能够平移和旋转;二维电动平移台(3)和样品旋转平移台(4)位于保护银膜反射式准直器(2)的正下方;红外热释电探测器(5)用于接收红外激光热信号,位于二维电动平移台(3)的正下方;探测器二维平移台(6)位于红外热释电探测器(5)下方能够让红外热释电探测器(5)平移;步骤二、Transformer模型真实样品数据集收集过程,通过自由视场红外数字全息成像系统完成样品数据获取,覆有样品的载玻片放置于样品旋转平移台(4)上的二维电动平移台(3)上,设置二维电动平移台(3)水平扫描次数C次、纵向扫描次数Z次、扫描路径和步进距离,设置样品旋转平移台(4)旋转次数X次、旋转方向顺时针和步进度数360/(X+1)
°
,样品自由视场全息图采集过程采用遍历的方式,通过C次水平移动,红外热释电探测器(5)采集C+1个子视场全息图;之后二维电动平移台(3)完成纵向移动Z次,每次纵向移动均平移至行初始位置,重复C次水平移动扫描,之后通过样品旋转平移台(4)完成旋转扫描X次,每次旋转位移均进行水平移动扫描和纵向移动扫描,共采集(X+1)*(Z+1)*(C+1)张子视场全息图;步骤三、训练集生成与Transformer模型构建过程,通过计算机模拟全息图记录与重建过程获取对应的训练集,根据仿真样品模拟得到仿真子视场全息图进行预处理,预处理过程包括对仿真子视场全息图进行添加不同水平噪声,图像旋转,图像拉伸的操作;把子视场全息图预处理后的图像转换成数据集的形式,得到由仿真数据组成的用于子视场全息图重建的训练集,在Transformer模型中设置自注意力层与多头注意力层并将其打包成一个矩阵Q,键和值也被打包成矩阵K和V,矩阵计算公式如下:MultiHead(Q,K,V)=Con...

【专利技术属性】
技术研发人员:黄昊翀李子健杨美慧郑志远
申请(专利权)人:中国地质大学北京
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1