一种基于生物视觉与精确脉冲驱动神经网络的图像识别方法技术

技术编号:15640479 阅读:601 留言:0更新日期:2017-06-16 06:11
本发明专利技术提出了一种基于生物视觉与精确脉冲驱动神经网络的图像识别方法。本发明专利技术受到生物视觉分层系统的启发,在图像的特征提取部分,采用HMAX模型模拟感受野的细胞运行机制,先利用Gabor滤波强化图像的边缘信息,再对经过Gabor滤波后的各个方向的图像进行max pooling处理,达到提取最主要的特征及降维处理的目的。在特征图像数据处理方法,选用了相位编码技术,将图像的像素信息转换为脉冲现象,这样不仅考虑了图像的空间信息,还考虑了图像的时间信息。本发明专利技术有一定的生物性基础,具有良好的可行性与鲁棒性,并且其对于图像的识别与分类,尤其是在噪声图像中的准确性大大的提高了。

【技术实现步骤摘要】
一种基于生物视觉与精确脉冲驱动神经网络的图像识别方法
本专利技术涉及模式识别和类脑计算领域,具体涉及一种基于生物视觉与精确脉冲驱动神经网络的图像识别方法。
技术介绍
模式识别是人工智能领域的目前最热的话题之一,它的目标通过对采集的图像进行一定的处理以获得目标场景的相关信息。但中科院谭铁牛院士在2016中国人工智能大会(CCAI2016)上指出:通用的模式识别系统任重道远——其主要瓶颈在于鲁棒性、自适应性和可泛化性三个方面。这些技术难题使得模式识别的发展无法适应社会与当前市场的需求。而类脑计算不仅模拟人的大脑,而且综合了其他学科,其中包括信号处理科学、计算机技术、统计学、物理学、应用数学、认知科学神和经生理学等,引起了各国政府和研究机构的广泛关注,并在模式识别的三大瓶颈问题方面有了重大的突破。美国和欧盟对此也投入了巨资,先后推出了各自的人脑研究计划:美国的“人类大脑计划”(HumanBrainProject)致力于从神经元层面探索神经元、神经回路与大脑功能间的关系,欧盟的“大脑活动图谱计划”(BrainActivityMapProject,或称BrainInitiative)则致力于模拟整个人脑。脉冲神经网络是类脑计算领域的专家和学者提出的第三代神经网络,其与基于脉冲频率编码信息的传统人工神经网络相比,拥有更强大的计算能力,可以模拟各种神经信号和任意的连续函数,非常适合实现大脑神经信号的处理问题,是进行复杂时空信息处理的有效工具。虽然当前对应技术难题的基于脉冲神经网络的模式识别系统研究才刚刚起步,国内外的文献不是很多,但是学者们已经开始提出富有成效和创新十足的推荐方法。并且基于神经网络模式识别理论的研究一直被认为是神经网络应用最成功的一个方面,它的发展与神经网络理论可以说是相辅相成的,而且在几乎所有现有的脉冲神经网络物理模型都在模式识别领域得到了成功的应用。脉冲神经网络理论取得进步会给模式识别理论的发展带来鼓舞;相反,模式识别理论的进步又会大大推动脉冲神经网络理论的长期发展。
技术实现思路
本专利技术主要的目的在于针对现有模式识别系统鲁棒性、自适应性和可泛化性的三大瓶颈,构建一个基于生物视觉与精确脉冲驱动神经网络的图像识别方法。在对不同的图像进行预处理,包括图像特征提取,物体描述的过程中,模拟人类视觉分层系统,利用HMAX模型实现操作;之后根据得到的图像数据将其转换成脉冲的输入,从而便于后续的基于类脑计算的处理;最后通过脉冲神经网络学习算法进行分类决策。其具体内容如下:1生物视觉系统的特征提取为了提高物体识别的实用性,采用了一种视觉分层系统,用于图像特征的提取。HMAX模型和传统的SR(SparseRepesentaiton,稀疏表示)相比,能更好的描述数据的整体结构,从而在诸如图像特征提取之类的数据问题中,都有明显的优势。1.1S1层的Gabor滤波处理S1层代表的是视觉皮层感受野(ReceptiveField)中的简单细胞处理图像信号的方式。感受野的V1区简单细胞进行单元的匹配时,利用稀疏编码的高阶滤波器提取特征。许多研究人员使用二维Gabor滤波器函数建立了稀疏编码的计算模型。稀疏编码的一般形式是:SC=AH其中sci,ai,hj是单位稀疏块SC的元素,A为稀疏编码的基函数,H是稀疏稀疏。A的最常用的表达形式是:||·||f是Frobenius范式,μ是正常数。Gabor响应G(x,y)可以近似的转换成稀疏编码的形式:G(x,y)=S(x,y)·K(x,y),其中S(x,y)表示复杂的sine函数,它的取值范围是[-1,1],因此满足上述基函数A的形式。K(x,y)是二维离散高斯方程的包络函数,λ表示波长,它的值不能超过图像长宽的1/5。是相位偏移,取值在[-180°,180°],γ表示长宽比,决定了图像经过Gabor滤波后的形状。σ取决于带宽b:为了简便起见,利用Gabor滤波的实部部分对图像特征进行学习:x'=xcosθ+ysinθ,y'=-xsinθ+ycosθ在本专利技术中,分别设偏移相位波长λ和带宽b为0°,10与1,因此σ=0.56λ。在S1层中,选取(0°,45°,90°,135°)四个方向的Gabor滤波,并将其结果归一化至[-1,1]。1.2C1层的最大池处理图像经S1层后强化了其的边缘信息,在C1层利用最大池进行特征的提取与降维,其具体表达如下:其中m是最大池的滑动窗口的大小。2脉冲编码在本专利技术中,选择相位编码算法(一种时间编码方案)来产生脉冲序列。编码单元的结构由三部分组成:阳性神经元(POS),阴性神经元(NEG),输出神经元(EOUT)。在整个编码过程中,每一个传入的尖峰信号代表一个神经元活动,连接到一个感受野区域,即一个编码单元连接到一个像素。阈下膜电位振荡(SMOS)也与动作电位相关,在RF中每个像素的强度值被转换成一个精心处理的时间动作电位的周期振荡,这被描述为余弦函数:其中是第i个编码神经元的震荡函数,呈周期性;A是振幅,ω代表角速度,φ0是初始相位,第i个编码神经元的偏移相位φi的计算公式是:φi=φ0+(i-1)·Δφ其中Δφ是最小的偏移单位,其值为2π/n,n为神经元的个数。设置震荡周期tmax为200ms。图像各个像素点与时间的关系如下述公式表示:其中xi代表图像第i个像素的像素值。当像素传入编码层,便会引起向上或者向下的膜振荡,如果膜电位超过阈值,刺激产生。可以通过调节振幅和阈值来控制脉冲序列的产生。3脉冲神经网络学习脉冲神经网络主要对图像产生的脉冲序列进行学习,脉冲序列可表示为:其中,tf表示第f个脉冲发放时间,δ(x)表示Diracdelta函数,当时x=0,δ(x)=1,否则δ(x)=0。本专利技术采用脉冲神经网络的监督学习算法,其目的是:对于给定的多个输入脉冲序列Si(t)和多个目标脉冲序列Sd(t),寻找脉冲神经网络合适的突触权值矩阵w,使神经元的输出脉冲序列So(t)与对应的目标脉冲序列Sd(t)尽可能接近,即两者的误差评价函数值最小。Precise-spike-drivensynapticplasticity(PSD)利用精确时间脉冲编码信息对图像的脉冲序列进行学习,其基础是leakyintegrate-and-fire模型。当利用这个学习规则调整权重时,突触后电位(PSP)是所有输入脉冲的传入神经的权重的总和:其中ωi和ti分别是第i次输入的突触权重及点火时间,Vrest是重置电压。K是双指数形式的核函数:其中tf是第i个神经元产生的第f个脉冲;V0是归一化参数,它使K的取值不大于1;τs表示缓慢衰减常数,而τf指快速衰减常数,令τs/τf=4。突触后电流是PSD规则中一个重要的参数,它满足下面的公式:其中是第i次输入的突触电流;H(x)是Heaviside函数,当x<0时其值为0,当x=0时其值为0.5,当x>0时其值为1。Widrow-Hoff规则的突触权重变化规律是:而权重变化通常可表示为:PSD规则改变突触权重受到了Widrow-Hoff规则的启发,其形式为:在学习阶段,将脉冲神经网络的步长设为100次。4分类判别图像序列经过PSD规则学习后,会产生一组脉冲输出序列,采用vanRossummetric对结果进行分类判别。这个本文档来自技高网
...
一种基于生物视觉与精确脉冲驱动神经网络的图像识别方法

【技术保护点】
一种基于生物视觉与精确脉冲驱动神经网络的图像识别方法,其特征在于该方法包括以下步骤:步骤1.生物视觉系统的特征提取步骤1.1.S1层的Gabor滤波处理S1层代表的是视觉皮层感受野中的简单细胞处理图像信号的方式;感受野的V1区简单细胞进行单元的匹配时,利用稀疏编码的高阶滤波器提取特征;稀疏编码的形式是:

【技术特征摘要】
1.一种基于生物视觉与精确脉冲驱动神经网络的图像识别方法,其特征在于该方法包括以下步骤:步骤1.生物视觉系统的特征提取步骤1.1.S1层的Gabor滤波处理S1层代表的是视觉皮层感受野中的简单细胞处理图像信号的方式;感受野的V1区简单细胞进行单元的匹配时,利用稀疏编码的高阶滤波器提取特征;稀疏编码的形式是:SC=AH其中sci,ai,hj是单位稀疏块SC的元素,A为稀疏编码的基函数,H是稀疏稀疏;A的表达形式是:||·||f是Frobenius范式,μ是正常数;Gabor响应G(x,y)可以近似的转换成稀疏编码的形式:G(x,y)=S(x,y)·K(x,y),其中S(x,y)表示复杂的sine函数,它的取值范围是[-1,1],因此满足上述基函数A的形式;K(x,y)是二维离散高斯方程的包络函数,λ表示波长,它的值不能超过图像长宽的1/5;是相位偏移,取值在[-180°,180°],γ表示长宽比,它决定了图像经过Gabor滤波后的形状;σ取决于带宽b:利用Gabor滤波的实部部分对图像特征进行学习:x'=xcosθ+ysinθ,y'=-xsinθ+ycosθ并分别设偏移相位波长λ与带宽b为0°,10与1,因此σ=0.56λ;在S1层中,对一张大小为n×n的图片,选取0°,45°,90°,135°四个方向,窗口大小为mG×mG的Gabor滤波,得到四幅大小均为n×n的滤波图像:步骤1.2.C1层的maxpooling处理图像经S1层后强化了其的边缘信息,在C1层利用maxpooling进行特征的提取与降维,其具体表达如下:其中m是maxpooling的滑动窗口的大小;将得到的图像一次拼接,然后将新图像转换为一个向量:步骤2.脉冲编码选择相位编码来产生脉冲序列;编码单元的结构由三部分组成:阳性神经元,阴性神经元,输出神经元;在整个编码过程中,每一个传入的尖峰信号代表一个神经元活动,连接到一个感受野区域,即一个编码单元连接到一个像素;阈下膜电位振荡也与动作电位相关,在RF中每个像素的强度值被转换成一个精心处理的时间动作电位的周期振荡,描述为余弦函数:其中是第i个编码神经元的震荡函数,呈周期性;A是振幅,ω代表角速度,φ0是初始相位,第i个编码神经元的偏移相位φi的计算公式是:φi=φ0+(i-1)·Δφ其中Δφ是最小的偏移单位,其值为2π/n...

【专利技术属性】
技术研发人员:徐小良金昕卢文思
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1