基于改良ViT网络的高质量全息图生成方法技术

技术编号：38620869 阅读：27 留言：0更新日期：2023-08-31 18:25

一种基于改良ViT网络的高质量全息图生成方法，通过构建编码

全部详细技术资料下载

【技术实现步骤摘要】
基于改良ViT网络的高质量全息图生成方法

[0001]本专利技术涉及的是一种图像处理领域的技术，具体是一种基于改良ViT(Vision Transformer)网络的高质量全息图生成方法。

技术介绍

[0002]现有的基于深度神经网络(DNN)的计算机生成全息图(CGH)算法通过训练一个或者多个卷积神经网络(CNN)来计算全息图并应用于全息显示系统中，缩短了计算高质量全息图的时间，但在显示质量方面不如传统高时耗的迭代算法。一个重要的原因在于，光波的衍射是一个从空域到频域的跨域过程，具有全局特性，而CNN通常采用局部卷积运算，感受野有限，较难学习到从目标图(空域)到全息图(频域)的跨域映射。

技术实现思路

[0003]本专利技术针对现有基于CNN的计算全息术生成全息图显示质量相对较低的问题，提出一种基于改良ViT网络的高质量全息图生成方法，通过关注目标图像的全局信息，以一个改良的Vision Transformer网络生成更高质量的全息图并实现一个高质量的全息显示，解决了传统基于CNN的CGH算法感受野有限的问题，提高了全息显示中的显示像质。
[0004]本专利技术是通过以下技术方案实现的：
[0005]本专利技术涉及一种基于改良ViT网络的高质量全息图生成方法，通过构建编码
‑
解码架构，针对CGH任务，改良了Vision Transformer网络，并以改良的ViT作为编码部分，将目标图像编码成其对应的纯相位全息图；在解码部分通过角谱传播算法模拟光的自由空间传播，得到...

【技术保护点】

【技术特征摘要】
1.一种基于改良ViT网络的高质量全息图生成方法，其特征在于，通过构建编码
‑
解码架构，采用一个改良的ViT作为编码部分，将目标图像编码成其对应的全息图；在解码部分通过角谱传播算法模拟光的自由空间传播，得到全息图的重建图像，通过计算重建图像和目标图像之间损失函数对编码
‑
解码架构的编码部分进行迭代训练；在在线阶段采用训练后的编码
‑
解码架构生成的纯相位全息图通过全息显示系统重建出高质量的全息显示图像。2.根据权利要求1所述的基于改良ViT网络的高质量全息图生成方法，其特征是，所述的改良的Vision Transformer网络，包括：由四个下采样模块以及对应的上采样模块组成的U型架构，其中：每个下采样模块以及对应的上采样模块中均包含两个全局滤波块。3.根据权利要求2所述的基于改良ViT网络的高质量全息图生成方法，其特征是，所述的全局滤波块，包括：两个层归一化单元、全局滤波层和本地加强前馈网络(LeFF)，其中：全局滤波层将输入的空间特征首先通过二维快速傅里叶变换(2D FFT)转换到频域后，通过可学习的全局滤波器对频域特征进行滤波，再通过二...

【专利技术属性】
技术研发人员：李燕，凌玉烨，徐超，董振兴，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人