一种基于光学片上超表面的光子衍射神经元及其实现方法技术

技术编号：34338903 阅读：29 留言：0更新日期：2022-07-31 03:31

本发明专利技术公开了一种基于光学片上超表面的光子衍射神经元及其实现方法。本发明专利技术在介质基板上紧贴靠近输入波导的位置设置多个优化区域，在优化区域内形成各个散射元，采用优化器以梯度下降的优化方式对神经元构成的神经网络在计算机上进行训练，采用拓扑优化的密度惩罚算法对优化区域内的材料的折射率分布进行计算，通过反向设计方法得到优化区域内的散射元的位置和形状，从而在介质基板上的优化区域内形成散射元构成光学片上超表面结构；本发明专利技术通过将片上波导与光学片上超表面结构相结合，实现了高度集成的多输入多输出新型光子衍射神经元结构，解决了光学神经网络中参数密度低的问题，扩展了光学神经网络的功能，为大规模光学神经网络提供了可能。光学神经网络提供了可能。光学神经网络提供了可能。

A photon diffraction neuron based on the super surface of optical sheet and its implementation method

全部详细技术资料下载

【技术实现步骤摘要】
一种基于光学片上超表面的光子衍射神经元及其实现方法

[0001]本专利技术涉及光学神经网络领域，具体涉及一种基于光学片上超表面的光子衍射神经元及其实现方法。

技术介绍

[0002]在大部分基于片上集成波导的光学神经网络设计中的主要结构单元为波导合束分束单元及马赫曾德尔干涉仪Mach
‑
Zehnder interferometers(MZI)单元，其输入局限于两个输入通道,输出局限于一个或两个输出通道。这样的单元结构设计难以满足神经网络的计算需求，例如，在有多个输入通道的全连接神经网络中，每个输出神经元都需要与所有输入通道相连。即使对于连接较为稀疏的卷积神经网络而言，大小为3
×
3的卷积核也至少需要将9个输入通道与一个输出通道直接相连。这些设计都无法通过单个MZI结构实现，需要使用多个级联的MZI复合结构。然而使用多个级联的MZI实现单一神经元功能不仅会导致器件尺寸上的浪费，还会由于MZI中不可避免的能量损耗造成输出强度低，计算精度下降。
[0003]另一方面，衡量神经网络性能的一个标志性指标为网络参数数量。一般来说，对于相同的结构框架设计，宽度大、层数多等具有更多网络参数的神经网络通常性能更好。但是对于以MZI作为结构单元的神经网络而言，由于每一个MZI结构都需要对应的热光调制器和配套的电极结构，包含成百上千参数量的神经网络在制造工艺方面会面临困难，难以与计算机中参数量为百万量级的主流模型相比拟。在基于集成波导的光学平台上难以实现实用规模的神经网络计算的主要原因在于级联的M...

【技术保护点】

【技术特征摘要】
1.一种基于光学片上超表面的光子衍射神经元，其特征在于，所述基于光学片上超表面的光子衍射神经元包括：介质基板、输入波导、输出波导、优化区域和散射元；其中，介质基板为平板状，采用在设定波长下对光的传输没有损耗的材料；介质基板的一侧为入射端，另一侧为出射端，入射端一侧的形状为圆弧形；输入波导连接至介质基板的输入端，介质基板的出射端连接至输出波导；输入波导包括N个输入通道，输出波导包括M个输出通道；对应每一个输入通道，在介质基板上紧贴靠近输入波导的位置设置多个优化区域，所有的优化区域围绕入射端的圆弧放置；每一个优化区域为矩形；在优化区域内形成各个散射元，散射元采用折射率与介质基板不同的材料，通过反向设计方法得到优化区域内的散射元的位置和形状，从而在介质基板上的优化区域内形成散射元构成光学片上超表面结构，M和N均为≥2的自然数；在计算机中建立单独的神经元的计算机模型，加入符合以光子作为信息载体的训练模型的约束条件，包括需要满足能量守恒定律以及采用复数编码；采用优化器以梯度下降的优化方式对神经元构成的神经网络在计算机上进行训练；当对神经元的各个输入通道输入相干光时，神经网络的参数信息编码在每个输入通道的光的输入复振幅和输出通道的光的目标复振幅中，光的输入和目标复振幅中包含了光的振幅和和相位信息；由于使用光的振幅和相位计算缓慢且不稳定，将光的振幅和相位通过欧拉公式转换为复数的实部和虚部，使每一个神经元的权重矩阵成为一个复数矩阵；在训练过程中，采用损失函数作为预测值和目标值之间误差的度量，损失函数用于在优化器中计算并更新神经网络的每一层权重矩阵的实部和虚部；得到训练之后的神经网络的权重矩阵，每个神经元的权重矩阵的维数为N
×
M，用反向设计方法优化的每一个光学片上超表面结构需要实现输入通道与输出通道之间的全连接，通过权重矩阵得到每一个输出通道的目标复振幅；对每个神经元，1
×
M维的输出复振幅A
output
写为N
×
M维的权重矩阵w与1
×
N维的输入复振幅A
input
进行矩阵向量乘法之后的结果，即A
output
＝wA
input
，并从输出通道的目标复振幅A
output
中提取出每个输出通道的目标平均相位和目标输出功率，其中，A
om
为第m输出通道的振幅，第m输出通道的目标平均相位为第m输出通道的目标输出功率T
om
＝|A
om
|2，m＝1,
…
,M；采用拓扑优化的密度惩罚算法对优化区域内的材料的折射率分布进行计算，将优化区域内的部分介质基板换成散射元，折射率的初始条件为散射元的折射率与介质基板的折射率的均值，简化各向同性材料惩罚指数为固定值；设定目标函数为：率的均值，简化各向同性材料惩罚指数为固定值；设定目标函数为：其中，神经元每个输出通道的平均相位和输出功率是无量纲且归一化的，和T
m
分别表示经算法优化得到的第m输出通道的平均相位和输出功率，和T
om
分别表示从神经网络的训练结果中获得的第m输出通道的目标平均相位和目标输出功率，M为输出通道的个数；在经过n次迭代，当误差小于设定阈值时目标函数已收敛，停止优化，将拓扑优化的结果二值化以匹配材料真实折射率，其中一个值为介质基板的折射率，一个值为散射元的折射率，从而在优化区域中得到散射元的位置和形状；将优化出的各个光子衍射神经元在纵向独立平行排列成阵列，将各个光子衍射神经元的输入波导局部连接至上一层的输出波导，将输出波导局部连接到下一层光子衍射神经元的输入波导，或者非线性层或探测器，得到完整的片上光学神经网络；光信号从输入波导的一个输入通道进入至优化之后的光学片上超表面结构，优化区域
内的散射元散射光信号；优化区域围绕圆弧放置，从而最大限度地减少散射损耗；经输入波导进入光学片上超表面结构的光信号在优化区域内发生设定的衍射，光学片上超表面结构对入射光信号的影响等同于权重矩阵与输入通道的光的输入复振幅进行矩阵向量乘法，继而在输出波导的每一个输出通道收集计算后的目标复振幅。2.如权利要求1所述的基于光学片上超表面的光子衍射神经元，其特征在于，对于光波长在通信波段，所述介质基板采用硅、氮化硅、铌酸铌和有机聚合物中的一种。3.如权利要求1所述的基于光学片上超表面的光子衍射神经元，其特征在于，所述优化区域的宽度与输入波导末端尺寸一致，长度为宽度的0.8～1倍。4.一种如权利要求1所述的基于光学片上超表面的光子衍射神经元的实现方法，其特征在于，...

【专利技术属性】
技术研发人员：胡小永，龚旗煌，廖琨，戴天翔，
申请(专利权)人：北京大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人