System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 光子能带预测透射谱模型的训练、预测方法、介质及设备技术_技高网

光子能带预测透射谱模型的训练、预测方法、介质及设备技术

技术编号:39963238 阅读:7 留言:0更新日期:2024-01-09 00:12
本发明专利技术提供了一种光子能带预测透射谱模型的训练、预测方法、介质及设备,包括如下步骤:构建透射谱自适应编码器‑解码器模型;对透射谱自适应编码器‑解码器模型进行训练;对能带图像编码器进行训练;对能带‑光谱解码器进行训练。本发明专利技术针对输入输出为光子结构复杂自由度的深度学习模型训练误差大和模型训练难以收敛的问题进行了改进,借鉴自适应编码器模型的思想,从而对数据进行学习和训练,使得最终编码器将输入的能带图像数据转换为低维数据特征,解码器则将低维数据特征转换为透射谱数据,通过间接训练的过程,解决了现有技术存在输入为二维光子能带图、输出为一维透射谱的深度学习模型训练误差大、难以收敛的问题。

【技术实现步骤摘要】

本专利技术属于光子器件,更具体地,涉及光子能带预测透射谱模型的训练、预测方法、介质及设备


技术介绍

1、随着5g通讯、高端芯片等信息技术的飞速发展,大容量大带宽的光学信息传输、处理和存储技术成为必然趋势,对高性能、微型化和集成化的微纳光子器件有着迫切的需求。

2、近年来随着各种深度学习的模型技术和开发,深度学习已经在计算机科学和工程相关领域广泛应用。光子学界也受益于深度学习技术快速发展,通过将深度学习模型与基础物理相结合,可以高效地求解描述物理系统的偏微分方程,帮助了解物理现象背后的支配规律。在给定的设计空间内,深度学习具有泛化能力,可以生成快速、准确的设计,而不需要逐个案例进行耗时的数值计算。经过良好训练的深度学习模型可以直接建立从设计到目标光子器件光学特性的映射,反之亦然。

3、通常,深度学习被认为是可以作为发现结构及其光学响应之间复杂关系的有力工具。目前的研究大多是以光谱和结构参数为输入输出,光谱可以方便地离散成向量,从而可以方便地纳入深度学习模型。为了解决复杂光子结构设计问题,需要立即做的一项任务是建立光子能带图、光场分布图等二维数据与透射谱、结构参数等一维数据的深度学习模型,然而这类二维数据不能直接离散化,且特征复杂不易学习,即使经过一些预处理步骤后,直接作为模型输入的效果也不太好,从而存在输入为二维光子能带图、输出为一维透射谱的深度学习模型训练误差大、难以收敛的问题。


技术实现思路

1、为了解决现有技术的不足,本专利技术提供光子能带预测透射谱模型的训练方法,所述光子能带预测透射谱模型包括能带图像编码器和能带-光谱解码器,所述能带图像编码器为一深度学习模型,用于将二维能带图像转换为具有固定长度的一维编码,所述能带-光谱解码器为一深度学习模型,用于将一维编码转化为对应的光谱;包括如下步骤:s1、构建透射谱自适应编码器-解码器模型,所述透射谱自适应编码器-解码器模型包括透射谱自适应编码器和透射谱自适应解码器,两者为相互独立的深度学习模型,所述透射谱自适应编码器的输出与所述透射谱自适应解码器的输入尺寸相同;s2、对所述透射谱自适应编码器-解码器模型进行训练,训练流程如下:使用透射谱数据作为输入和目标,将透射谱数据输入到透射谱自适应编码器中转化为一维编码,将一维编码输入到透射谱自适应解码器中输出为透射谱数据,计算预测误差并传递给adam优化器,adam优化器会根据预测误差的大小自动调整透射谱自适应编码器和透射谱自适应解码器的参数,使得输出的透射谱数据逐渐接近真实透射谱数据,多次迭代训练,直到输出的透射谱数据的预测误差达到收敛;s3、对所述能带图像编码器进行训练,训练流程如下:使用能带图像作为输入、步骤s2中训练结束得到的透射谱数据的一维编码作为目标,将能带图像输入到能带图像编码器中转化为一维编码,计算预测误差,将预测误差传递给adam优化器对能带图像编码器的参数进行优化,多次迭代训练,直到输出的一维编码的预测误差达到收敛;s4、对所述能带-光谱解码器进行训练,训练流程如下:使用步骤s3中训练结束得到的一位编码即伪透射谱编码作为输入、真实透射谱数据作为目标,将伪透射谱编码输入到所述能带-光谱解码器中转化为透射谱,计算预测误差,将预测误差传递给adam优化器对能带-光谱解码器的参数进行优化,多次迭代训练,直到输出的透射谱的预测误差达到收敛。

2、进一步地,所述透射谱自适应编码器的网络结构包括三个线性层和两个relu激活函数,透射谱自适应编码器的输入层的大小为321,经过第一个线性层后,输出大小变为500,然后通过relu激活函数进行非线性变换,接下来经过第二个线性层后,输出大小变为400,再次经过relu激活函数,最后经过第三个线性层后,输出大小变为300;所述透射谱自适应解码器的网络结构包括也包含三个线性层和两个relu激活函数,透射谱自适应解码器的输入层的大小为300,经过第一个线性层后,输出大小变为400,然后通过relu激活函数进行非线性变换,接下来经过第二个线性层后,输出大小变为500,再次经过relu激活函数,最后经过第三个线性层后,输出大小变为321,与透射谱自适应编码器的输入层的尺寸相同。

3、进一步地,所述能带图像编码器由卷积层和全连接层构建,用于将二维能带图像转化为一维编码;初始能带图的尺寸为267×200像素;首先,图像经过第一个卷积层,该卷积层使用三个滤波器堆图像进行特征提取;随后,经过池化层,将图像的尺寸减小为100×133,以减少参数数量并保留重要的特征信息;接下来,图像通过第二个卷积层和池化层进一步减小尺寸,变为50×66,这一步骤有助于提取更高级别的特征;然后,经过展平层,将50×66的图像转化为一维编码,大小为13200,展平层将图像中的像素按照一维顺序排列,以便后续的全连接层进行处理;接下来,一维编码通过5个线性层逐步减小维度,线性层是全连接层,每个神经元与上一层的所有神经元相连,通过这些线性层,模型逐步提取和压缩输入图像中的关键特征,最终得到大小为300的一维编码;所述能带-光谱解码器的网格结构包括三个线性层和两个relu激活函数,能带-光谱解码器的输入层的大小为300,经过第一个线性层后,输出大小变为800,然后通过relu激活函数进行非线性变换,接下来经过第二个线性层后,输出大小变为500,再次经过relu激活函数,最后经过第三个线性层后,输出大小变为321,与透射谱自适应编码器的输入层的的尺寸相同。

4、进一步地,训练完毕的所述能带图像编码器的结构、权重及偏置按模块的连接顺序构成如下:1)一个输入通道数为3,输出通道数为32的卷积层,卷积核大小为3,填充大小为1;2)使用relu激活函数对卷积层的输出进行非线性变换;3)一个大小为2×2的最大池化层,用于减小特征图的尺寸;4)一个输入通道数为32,输出通道数为32的卷积层,卷积核大小为3,填充大小为1;5)使用relu激活函数对卷积层的输出进行非线性变换;6)一个大小为2×2的最大池化层,用于进一步减小特征图的尺寸;7)一个输入通道数为32,输出通道数为16的卷积层,卷积核大小为3,填充大小为1;8)使用relu激活函数对卷积层的输出进行非线性变换;9)一个大小为2×2的最大池化层,用于进一步减小特征图的尺寸;10)将特征图展平成一维向量;11)一个输入大小为13200,输出大小为5000的线性层;12)使用relu激活函数对线性层的输出进行非线性变换;13)一个输入大小为5000,输出大小为2500的线性层;14)使用relu激活函数对线性层的输出进行非线性变换;15)一个输入大小为2500,输出大小为1000的线性层;16)使用relu激活函数对线性层的输出进行非线性变换;17)一个输入大小为1000,输出大小为500的线性层;18)使用relu激活函数对线性层的输出进行非线性变换;19)一个输入大小为500,输出大小为300的线性层;训练完毕的所述能带-光谱解码器的结构、权重及偏置按模块的连接顺序构成如下:1)一个输入大小为300,输出大小为800的线性层;2本文档来自技高网...

【技术保护点】

1.一种光子能带预测透射谱模型的训练方法,所述光子能带预测透射谱模型包括能带图像编码器和能带-光谱解码器,所述能带图像编码器为一深度学习模型,用于将二维能带图像转换为具有固定长度的一维编码,所述能带-光谱解码器为一深度学习模型,用于将一维编码转化为对应的光谱;其特征在于,包括如下步骤:S1、构建透射谱自适应编码器-解码器模型,所述透射谱自适应编码器-解码器模型包括透射谱自适应编码器和透射谱自适应解码器,两者为相互独立的深度学习模型,所述透射谱自适应编码器的输出与所述透射谱自适应解码器的输入尺寸相同;S2、对所述透射谱自适应编码器-解码器模型进行训练,训练流程如下:使用透射谱数据作为输入和目标,将透射谱数据输入到透射谱自适应编码器中转化为一维编码,将一维编码输入到透射谱自适应解码器中输出为透射谱数据,计算预测误差并传递给Adam优化器,Adam优化器会根据预测误差的大小自动调整透射谱自适应编码器和透射谱自适应解码器的参数,使得输出的透射谱数据逐渐接近真实透射谱数据,多次迭代训练,直到输出的透射谱数据的预测误差达到收敛;S3、对所述能带图像编码器进行训练,训练流程如下:使用能带图像作为输入、步骤S2中训练结束得到的透射谱数据的一维编码作为目标,将能带图像输入到能带图像编码器中转化为一维编码,计算预测误差,将预测误差传递给Adam优化器对能带图像编码器的参数进行优化,多次迭代训练,直到输出的一维编码的预测误差达到收敛;S4、对所述能带-光谱解码器进行训练,训练流程如下:使用步骤S3中训练结束得到的一位编码即伪透射谱编码作为输入、真实透射谱数据作为目标,将伪透射谱编码输入到所述能带-光谱解码器中转化为透射谱,计算预测误差,将预测误差传递给Adam优化器对能带-光谱解码器的参数进行优化,多次迭代训练,直到输出的透射谱的预测误差达到收敛。

2.根据权利要求1所述的训练方法,其特征在于,所述透射谱自适应编码器的网络结构包括三个线性层和两个ReLU激活函数,透射谱自适应编码器的输入层的大小为321,经过第一个线性层后,输出大小变为500,然后通过ReLU激活函数进行非线性变换,接下来经过第二个线性层后,输出大小变为400,再次经过ReLU激活函数,最后经过第三个线性层后,输出大小变为300;所述透射谱自适应解码器的网络结构也包括三个线性层和两个ReLU激活函数,透射谱自适应解码器的输入层的大小为300,经过第一个线性层后,输出大小变为400,然后通过ReLU激活函数进行非线性变换,接下来经过第二个线性层后,输出大小变为500,再次经过ReLU激活函数,最后经过第三个线性层后,输出大小变为321,与透射谱自适应编码器的输入层的尺寸相同。

3.根据权利要求2所述的训练方法,其特征在于,所述能带图像编码器由卷积层和全连接层构建,用于将二维能带图像转化为一维编码;初始能带图的尺寸为267×200像素;首先,图像经过第一个卷积层,该卷积层使用三个滤波器堆图像进行特征提取;随后,经过池化层,将图像的尺寸减小为100×133,以减少参数数量并保留重要的特征信息;接下来,图像通过第二个卷积层和池化层进一步减小尺寸,变为50×66,这一步骤有助于提取更高级别的特征;然后,经过展平层,将50×66的图像转化为一维编码,大小为13200,展平层将图像中的像素按照一维顺序排列,以便后续的全连接层进行处理;接下来,一维编码通过5个线性层逐步减小维度,线性层是全连接层,每个神经元与上一层的所有神经元相连,通过这些线性层,模型逐步提取和压缩输入图像中的关键特征,最终得到大小为300的一维编码;所述能带-光谱解码器的网格结构包括三个线性层和两个ReLU激活函数,能带-光谱解码器的输入层的大小为300,经过第一个线性层后,输出大小变为800,然后通过ReLU激活函数进行非线性变换,接下来经过第二个线性层后,输出大小变为500,再次经过ReLU激活函数,最后经过第三个线性层后,输出大小变为321,与透射谱自适应编码器的输入层的的尺寸相同。

4.根据权利要求3所述的训练方法,其特征在于,训练完毕的所述能带图像编码器的结构、权重及偏置按模块的连接顺序构成如下:1)一个输入通道数为3,输出通道数为32的卷积层,卷积核大小为3,填充大小为1;2)使用ReLU激活函数对卷积层的输出进行非线性变换;3)一个大小为2×2的最大池化层,用于减小特征图的尺寸;4)一个输入通道数为32,输出通道数为32的卷积层,卷积核大小为3,填充大小为1;5)使用ReLU激活函数对卷积层的输出进行非线性变换;6)一个大小为2×2的最大池化层,用于进一步减小特征图的尺寸;7)一个输入通道数为32,输出通道数为16的卷积层,卷积核大小为3,填充大小为1;8)使用ReLU激活...

【技术特征摘要】

1.一种光子能带预测透射谱模型的训练方法,所述光子能带预测透射谱模型包括能带图像编码器和能带-光谱解码器,所述能带图像编码器为一深度学习模型,用于将二维能带图像转换为具有固定长度的一维编码,所述能带-光谱解码器为一深度学习模型,用于将一维编码转化为对应的光谱;其特征在于,包括如下步骤:s1、构建透射谱自适应编码器-解码器模型,所述透射谱自适应编码器-解码器模型包括透射谱自适应编码器和透射谱自适应解码器,两者为相互独立的深度学习模型,所述透射谱自适应编码器的输出与所述透射谱自适应解码器的输入尺寸相同;s2、对所述透射谱自适应编码器-解码器模型进行训练,训练流程如下:使用透射谱数据作为输入和目标,将透射谱数据输入到透射谱自适应编码器中转化为一维编码,将一维编码输入到透射谱自适应解码器中输出为透射谱数据,计算预测误差并传递给adam优化器,adam优化器会根据预测误差的大小自动调整透射谱自适应编码器和透射谱自适应解码器的参数,使得输出的透射谱数据逐渐接近真实透射谱数据,多次迭代训练,直到输出的透射谱数据的预测误差达到收敛;s3、对所述能带图像编码器进行训练,训练流程如下:使用能带图像作为输入、步骤s2中训练结束得到的透射谱数据的一维编码作为目标,将能带图像输入到能带图像编码器中转化为一维编码,计算预测误差,将预测误差传递给adam优化器对能带图像编码器的参数进行优化,多次迭代训练,直到输出的一维编码的预测误差达到收敛;s4、对所述能带-光谱解码器进行训练,训练流程如下:使用步骤s3中训练结束得到的一位编码即伪透射谱编码作为输入、真实透射谱数据作为目标,将伪透射谱编码输入到所述能带-光谱解码器中转化为透射谱,计算预测误差,将预测误差传递给adam优化器对能带-光谱解码器的参数进行优化,多次迭代训练,直到输出的透射谱的预测误差达到收敛。

2.根据权利要求1所述的训练方法,其特征在于,所述透射谱自适应编码器的网络结构包括三个线性层和两个relu激活函数,透射谱自适应编码器的输入层的大小为321,经过第一个线性层后,输出大小变为500,然后通过relu激活函数进行非线性变换,接下来经过第二个线性层后,输出大小变为400,再次经过relu激活函数,最后经过第三个线性层后,输出大小变为300;所述透射谱自适应解码器的网络结构也包括三个线性层和两个relu激活函数,透射谱自适应解码器的输入层的大小为300,经过第一个线性层后,输出大小变为400,然后通过relu激活函数进行非线性变换,接下来经过第二个线性层后,输出大小变为500,再次经过relu激活函数,最后经过第三个线性层后,输出大小变为321,与透射谱自适应编码器的输入层的尺寸相同。

3.根据权利要求2所述的训练方法,其特征在于,所述能带图像编码器由卷积层和全连接层构建,用于将二维能带图像转化为一维编码;初始能带图的尺寸为267×200像素;首先,图像经过第一个卷积层,该卷积层使用三个滤波器堆图像进行特征提取;随后,经过池化层,将图像的尺寸减小为100×133,以减少参数数量并保留重要的特征信息;接下来,图像通过第二个卷积层和池化层进一步减小尺寸,变为50×66,这一步骤有助于提取更高级别的特征;然后,经过展平层,将50×66的图像转化为一维编码,大小为13200,展平层将图像中的像素按照一维顺序排列,以便后续的全连接层进行处理;接下来,一维编码通过5个线性层逐步减小维度,线性层是全连接层,每个神经元与上一层的所有神经元相连,通过这些线性层,模型逐步提取和压缩输入图像中的关键特征,最终得到大小为300的一维编码;所述能带-光谱解码器的网格结构包括三个线性层和两个relu激活函数,能带-光谱解码器的输入层的大小为300,经过第一个线性层后,输出大小变为8...

【专利技术属性】
技术研发人员:殷元星晋芳莫文琴董凯锋宋俊磊惠亚娟汪子尧
申请(专利权)人:中国地质大学武汉
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1