图像分类模型及其训练方法、图像分类方法技术

技术编号：43805436 阅读：24 留言：0更新日期：2024-12-27 13:23

本发明专利技术揭示了一种图像分类模型及其训练方法、图像分类方法，图像分类模型包括沿输入端至输出端方向依次设置的至少两个超表面，所述训练方法包括：获取训练信息集合，训练信息集合包括多组训练样本，每组训练样本包括样本图像和与超表面一一对应的至少两个样本标签，样本标签表征不同预设成像区域的光强分布图像，每个所述预设成像区域对应于一图像类别；基于训练信息集合，沿所述图像分类模型的输入端至输出端方向，依次对所述至少两个超表面进行训练，使得训练好的超表面对样本图像处理后得到的光强分布图像与对应的样本标签满足预设条件。本发明专利技术提供的方法，能够避免传统反向传播中梯度在传递过程中累积的梯度消失问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及光学设计，尤其涉及一种图像分类模型及其训练方法、图像分类方法。

技术介绍

1、光神经网络因其独特的并行处理能力、传输信息能力以及对图像直接处理的优势，成为本领域研究和关注的热点。

2、在基于超表面的光神经网络的训练过程中，现有的方法主要是通过反向传播方法模拟电子神经网络的训练步骤，将cmos(complementary metal-oxide-semiconductor，互补金属氧化物半导体)上获取的结果与预期结果进行对比，计算出损失函数，并通过损失函数反向更新超表面成像器件上的配置参数。

3、然而，由于光的物理特性，如衍射、散射等，使得光信号在传输过程中会逐渐衰减，导致反向传播时对于深层网络调控的精度和力度显著降低。这种衰减现象在光神经网络超过五层之后尤为明显，严重制约了光神经网络在深度学习领域的应用。尤其是在图像分类方面，反向传播算法在更新超表面成像器件的配置参数时，难以精确捕捉和传递深层网络中的梯度信息。这导致在图像分类任务中，随着网络层数的增加，分类精度和泛化能力往往会受到严重影响。

技术实现思路

1、本专利技术的目的之一在于提供一种图像分类模型训练方法，以解决现有技术中通过反向传播训练神经网络模型易产生梯度消失，导致模型训练速度缓慢的技术问题。

2、本专利技术的目的之一在于提供一种图像分类模型。

3、本专利技术的目的之一在于提供一种图像分类方法。

4、本专利技术的目的之一在于提供一种电子设备。>

5、本专利技术的目的之一在于提供一种计算机存储介质。

6、为实现上述专利技术目的之一，本专利技术一实施方式提供一种图像分类模型训练方法，所述图像分类模型包括沿输入端至输出端方向依次设置的至少两个超表面，所述训练方法包括：获取训练信息集合，所述训练信息集合包括多组训练样本，每组所述训练样本包括样本图像和与所述超表面一一对应的至少两个样本标签，其中，所述样本标签表征不同预设成像区域的光强分布图像，每个所述预设成像区域对应于一图像类别；基于所述训练信息集合，沿所述图像分类模型的输入端至输出端方向，依次对所述至少两个超表面进行训练，使得训练好的超表面对所述样本图像处理后得到的光强分布图像与对应的样本标签满足预设条件。

7、作为本专利技术一实施方式的进一步改进，所述基于所述训练信息集合，沿所述图像分类模型的输入端至输出端方向，依次对所述至少两个超表面进行训练，包括：基于所述训练信息集合，对第一待训练超表面进行训练，所述第一待训练超表面为靠近所述图像分类模型的输入端的首个超表面；和/或，基于第二待训练超表面的前一个超表面输出的第一光强分布图像，对所述第二待训练超表面进行训练，所述第二待训练超表面为除所述第一待训练超表面外的其他超表面。

8、作为本专利技术一实施方式的进一步改进，所述方法还包括：基于所述训练样本或当前超表面对应的第一光强分布图像，利用当前超表面处理得到第二光强分布图像；基于损失函数计算所述第二光强分布图像的损失值；基于所述损失值更新当前超表面的配置参数，直至满足预设条件。

9、作为本专利技术一实施方式的进一步改进，所述基于损失函数计算所述第二光强分布图像的损失值，包括：基于以下损失函数计算所述第二光强分布图像的损失值：g＝∑relu(hi-θ)2；其中，hi表示训练信息集合中第i个样本图像对应的第二光强分布图像，θ表示当前超表面对应的样本标签。

10、作为本专利技术一实施方式的进一步改进，对于同一图像类别，沿所述图像分类模型的输入端至输出端方向，所述至少两个超表面对应的样本标签的至少一个预设成像区域的面积依次变小。

11、作为本专利技术一实施方式的进一步改进，所述光强分布图像为超表面基于光学传播轨迹公式对所述训练信息集合中训练样本计算得到。

12、作为本专利技术一实施方式的进一步改进，所述光学传播轨迹公式为：

13、

14、其中，uout表示超表面输出的光强分布图像，f和f-1分别表示傅里叶变换和傅里叶逆变换，(x,y)表示超表面上点的位置坐标，amp(x,y)表示超表面在点(x,y)处的振幅，uin表示训练样本对应的初始光强分布图像，k为光波的波矢，λ为光波的波长，i为虚部。

15、为实现上述专利技术目的之一，本专利技术一实施方式提供一种图像分类模型，包括：所述图像分类模型包括沿输入端至输出端方向依次设置的至少两个超表面，所述图像分类模型根据任一项所述的训练方法训练确定。

16、为实现上述专利技术目的之一，本专利技术一实施方式提供一种图像分类方法，包括：获取待检测图像；利用所述的图像分类模型对待检测图像进行分类预测，得到光强分布图像，以确定所述待检测图像对应的图像类别。

17、为实现上述专利技术目的之一，本专利技术一实施方式提供一种电子设备，包括：至少一个处理器；存储器，所述存储器存储有可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种技术方案所述的训练方法的步骤，或实现如上述任一种技术方案所述的图像分类方法的步骤。

18、为实现上述专利技术目的之一，本专利技术一实施方式提供一种计算机存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如上述任一种技术方案所述的训练方法的步骤，或实现如上述任一种技术方案所述的图像分类方法的步骤。

19、与现有技术相比，本专利技术提供的图像分类模型训练方法，通过沿所述图像分类模型的输入端至输出端方向，依次对所述至少两个超表面进行训练，模型可以逐步优化每个超表面的参数，使得每个超表面都能更好地对输入图像的光信号进行调控，尽量保留对后续分类有用的信息同时抑制无关信息的干扰，这种逐层训练逐层优化的方式有助于在深层网络中保持足够的梯度信息，从而避免梯度消失的风险，提高计算精度和训练速度。

本文档来自技高网...

【技术保护点】

1.一种图像分类模型训练方法，其特征在于，所述图像分类模型包括沿输入端至输出端方向依次设置的至少两个超表面，所述训练方法包括：

2.根据权利要求1所述的训练方法，其特征在于，所述基于所述训练信息集合，沿所述图像分类模型的输入端至输出端方向，依次对所述至少两个超表面进行训练，包括：

3.根据权利要求2所述的训练方法，其特征在于，所述方法还包括：

4.根据权利要求3所述的训练方法，其特征在于，所述基于损失函数计算所述第二光强分布图像的损失值，包括：

5.根据权利要求1所述的训练方法，其特征在于，对于同一图像类别，沿所述图像分类模型的输入端至输出端方向，所述至少两个超表面对应的样本标签的至少一个预设成像区域的面积依次变小。

6.根据权利要求2所述的训练方法，其特征在于，所述光强分布图像为超表面基于光学传播轨迹公式对所述训练信息集合中训练样本计算得到。

7.根据权利要求6所述的训练方法，其特征在于，所述光学传播轨迹公式为：

8.一种图像分类模型，其特征在于，包括：

9.一种图像分类方法，其特征在于，包括：

10.一种电子设备，包括：

11.一种计算机存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-7任一项所述的训练方法的步骤，或实现如权利要求9所述的图像分类方法的步骤。

...

【技术特征摘要】

1.一种图像分类模型训练方法，其特征在于，所述图像分类模型包括沿输入端至输出端方向依次设置的至少两个超表面，所述训练方法包括：

3.根据权利要求2所述的训练方法，其特征在于，所述方法还包括：

4.根据权利要求3所述的训练方法，其特征在于，所述基于损失函数计算所述第二光强分布图像的损失值，包括：

5.根据权利要求1所述的训练方法，其特征在于，对于同一图像类别，沿所述图像分类模型的输入端至输出端方向，所述至少两个超表面对应的样本...

【专利技术属性】
技术研发人员：王敦，宋凯，邱兵，
申请(专利权)人：苏州山河光电科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人