当前位置: 首页 > 专利查询>浙江大学专利>正文

实现数字识别的光学神经网络方法技术

技术编号:22022942 阅读:95 留言:0更新日期:2019-09-04 01:31
本发明专利技术提出了一种实现数字识别的光学神经网络方法,包括获取数字图像特征步骤和构造光学神经网络步骤。所述光学神经网络由光学干涉模块、光学非线性模块和探测器阵列构成。所述光学干涉模块包括马赫曾德干涉仪阵列与可变光衰减器,可实现任意矩阵乘法运算。所述光学非线性模块由可饱和吸收体等具有非线性效应的器件构成,可实现人工神经网络中激活函数的功能。该方法利用光学计算缩短了计算时间,降低了计算能耗。

Optical Neural Network Method for Digital Recognition

【技术实现步骤摘要】
实现数字识别的光学神经网络方法
本专利技术涉及光学神经网络
,具体为实现数字识别的光学神经网络方法。
技术介绍
人工神经网络(artificialneuralnetwork,ANN)受生物神经网络启发,是一种通过模仿动物神经网络的行为特征,实现分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。人工神经网络目前广泛应用在图像、语音、场景识别和决策问题等,同时在移动视觉、自动驾驶车辆和机器人以及无线智能传感器等嵌入式系统中也有所突破。但在嵌入式系统中由于模型的复杂性,需要更大深度的神经网络以及大量的能量和存储,因此计算时间和功率大大增加,使得某些算法实现起来的难度加深。为了降低复杂性并提高计算速度,在硬件方面,图形处理单元(GPU)、专用集成电路(ASIC)和现场可编程门阵列(FPGA)等,都提高了学习任务的能效和速度。针对嵌入式视觉应用也尝试将一部分图像处理结合到传感器上,消除或减少将全部图像数据传送到处理器的需要,但计算时间与效率仍受到系统功率和带宽的严格限制。
技术实现思路
本专利技术的目的在于克服现有技术的不足通过简单神经网络——数字识别在光学神经网络中的验证,提供一种可用于复杂度更高的神经网络可行性方法。本专利技术公开了一种实现数字识别的光学神经网络方法,包括如下步骤:1)将呈28*28矩阵形式的数字图像,分割处理为四个14*14二值子矩阵作为四维输入向量;2)将步骤1)得到的四维输入向量中的每一维作为一个输入,利用第一光学干涉模块接收四个输入,进行线性矩阵乘法运算,获得四个输出;所述第一光学干涉模块包括马赫曾德干涉仪阵列与可变光衰减器;3)利用第一光学非线性模块接收第一光学干涉模块的输出光信号,对所述输出光信号进行非线性转换,得到四个输出光信号;4)利用第二光学干涉模块接收第一光学非线性模块的输出光信号,再次进行线性矩阵乘法运算,获得四个输出;5)利用第二光学非线性模块接收第二光学干涉模块的输出光信号,对所述输出光信号进行非线性转换,得到四个输出光信号;6)利用四个探测器接收第二光学非线性模块的输出光信号,相同数字的光信号输入所对应的四个输出光信号比保持在一定范围内,通过四个输出光信号比的不同进行数字识别。优选的,所述的步骤1)中,将四个14*14子图像中每个像素值为1的像素点占总像素点的比值作为四维输入向量。优选的,所述的第一光学干涉模块对输入光信号进行线性变换,分为MZI-U阵列和MZI-V阵列,实现酉矩阵的光学计算,所述酉矩阵经奇异值分解获得。优选的,每个MZI包括:内移相器,所述内移相器可控制MZI两个输出光信号的分光比;外移相器,所述外移相器可调节MZI两个输出光信号的相位延迟。优选的,所述可变光衰减器控制MZI-U阵列输出光功率大小,可变光衰减器的输出与MZI-V阵列的输入进行光学通信;所述可变光衰减器,可实现奇异值分解中对角矩阵特征。优选的,所述第一光学非线性模块为饱和吸收体、光学双稳态器件或非线性折射材料。优选的,所述第二光学干涉模块与第一光学干涉模块相同;所述的第二光学非线性模块与第一光学非线性模块相同。与现有技术相比。本专利技术的数字图像特征获取,需将28*28图像二值化处理并分割为4个14*14子图像,计算每个子图像像素值为1的像素点占总像素点的比值,作为人工神经网络中一组四维输入向量,在计算机中对需要训练和测试的每张图像执行相同操作。四维向量归一化转换为光学干涉模块的输入光信号的振幅信息。MZI包括:内移相器,可控制MZI两个输出光信号的分光比;外移相器,可调节MZI两个输出光信号的相位延迟。所述光学干涉模块还包括可变光衰减器,与MZI-U阵列互连,可控制MZI-U阵列的输出光信号强度,实现对角矩阵的光学计算。光学非线性模块可饱和吸收体,光学干涉模块的输出光信号经过可饱和吸收体,得到四个经过非线性转换的输出光信号,以执行激活函数的作用。通过光学计算缩短了计算时间,降低了计算能耗。在嵌入式系统或交互式系统中,例如自动驾驶等场景中,快速的计算可以做出及时的反应,在未来存在很大的使用潜力。附图说明为了更清楚地说明本专利技术实例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示出了四维向量输入神经元实现数字识别的算法流程图实施例;图2示出了从优化后的权重矩阵获得MZI内相位的流程图实施例;图3示出了MZI结构示意图;图4示出了光学干涉模块示意图;图5示出了光学神经网络示意图;图6示出了仿真结果示意图。具体实施方式为透彻的理解本专利技术,在接下来的描述中陈述了很多特定细节。而在没有这些特定细节时,本专利技术则可能仍可实现。然而,应理解:不存在将本专利技术的各种实施例限于在此公开的特定实施例的意图,而是应将本专利技术理解为涵盖落入本专利技术的各种实施例的精神和范围内的所有调整、等同物和/或可选方案。此处所称的“实施例”是指可包含于本专利技术至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。此外,表示一个或多个实施例的方法、流程图或功能框图中的模块顺序并非固定的指代任何特定顺序,也不构成对本专利技术的限制。图1示出了四维向量输入神经元实现数字识别的算法100流程图。在MNIST官网中下载手写数字数据集如101,选取0,1,2,3四个数字各600张作为数据样本,样本中1600张为训练样本,800张为测试样本。在anaconda中导入数据集,将每个28*28二值化图像分割为4个14*14子图像如102,并计算每个子图像像素值为1的像素点占总像素点的比值,存储为XN=[x1,x2,x3,x4],N∈[1,1600]如103。编程使用Tensorflow框架,Python语言,该神经网络为两层全连接,在前向传播中,对数据集XN执行矩阵乘法运算,Y1=XNW1,再对其执行ReLU函数,实现非线性变换,获得第一层的四维输出向量a1=f(Y1),如104.a1作为第二层的输入继续执行矩阵乘法和ReLU函数得到第二层全连接的输出Y2,Y2=a1W2如105.在后向传播中使用交叉熵来定义计算输出与实际输出之间的差值,在最小化交叉熵的过程中使用随机梯度算法对权重矩阵进行优化,优化后的权重矩阵W1,W2如106.图2示出了从优化后的权重矩阵W1,W2获得MZI内相位的示例。201为权重矩阵W1,W2106,SVD作用于该矩阵,得到四维酉矩阵U如202,对角矩阵S如203,四维酉矩阵V,如204.对U矩阵和V矩阵分别作用Givens旋转矩阵如205,得到和如206,207。U1旋转矩阵的相位分别为θU21θU31θU32θU41θU42θU43,如208.V1T旋转矩阵的相位分别为θV21θV31θV32θV41θV42θV43如209.103数据集XN为1*4向量,左乘U1矩阵,X*U1*S′*V1T,即103还可以表示为4*1向量XN=[x1,x2,x3,x4]T,基于这本文档来自技高网...

【技术保护点】
1.一种实现数字识别的光学神经网络方法,其特征在于包括如下步骤:1)将呈28*28矩阵形式的数字图像,分割处理为四个14*14二值子矩阵作为四维输入向量;2)将步骤1)得到的四维输入向量中的每一维作为一个输入,利用第一光学干涉模块接收四个输入,进行线性矩阵乘法运算,获得四个输出;所述第一光学干涉模块包括马赫曾德干涉仪阵列与可变光衰减器;3)利用第一光学非线性模块接收第一光学干涉模块的输出光信号,对所述输出光信号进行非线性转换,得到四个输出光信号;4)利用第二光学干涉模块接收第一光学非线性模块的输出光信号,再次进行线性矩阵乘法运算,获得四个输出;5)利用第二光学非线性模块接收第二光学干涉模块的输出光信号,对所述输出光信号进行非线性转换,得到四个输出光信号;6)利用四个探测器接收第二光学非线性模块的输出光信号,相同数字的光信号输入所对应的四个输出光信号比保持在一定范围内,通过四个输出光信号比的不同进行数字识别。

【技术特征摘要】
1.一种实现数字识别的光学神经网络方法,其特征在于包括如下步骤:1)将呈28*28矩阵形式的数字图像,分割处理为四个14*14二值子矩阵作为四维输入向量;2)将步骤1)得到的四维输入向量中的每一维作为一个输入,利用第一光学干涉模块接收四个输入,进行线性矩阵乘法运算,获得四个输出;所述第一光学干涉模块包括马赫曾德干涉仪阵列与可变光衰减器;3)利用第一光学非线性模块接收第一光学干涉模块的输出光信号,对所述输出光信号进行非线性转换,得到四个输出光信号;4)利用第二光学干涉模块接收第一光学非线性模块的输出光信号,再次进行线性矩阵乘法运算,获得四个输出;5)利用第二光学非线性模块接收第二光学干涉模块的输出光信号,对所述输出光信号进行非线性转换,得到四个输出光信号;6)利用四个探测器接收第二光学非线性模块的输出光信号,相同数字的光信号输入所对应的四个输出光信号比保持在一定范围内,通过四个输出光信号比的不同进行数字识别。2.如权利要求1所述的实现数字识别的光学神经网络方法,其特征在于:所述的步骤1)中,将四个14*14子图像中每个像素值...

【专利技术属性】
技术研发人员:郑臻荣陈媛陶陈凝黄怡丁章浩张金雷秦振韬
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1