当前位置: 首页 > 专利查询>复旦大学专利>正文

视网膜神经节细胞感受野尺度可变层次网络模型及其算法制造技术

技术编号:5589300 阅读:357 留言:1更新日期:2012-04-11 18:40
本发明专利技术为一种基于视网膜神经节细胞感受野特征的层次网络模型设计及其实现算法。其基本思想是:通过模拟生物视觉神经系统的早期视觉的信息加工流程与结构,设计效仿视网膜多层信号处理方式的层次网络结构,设计拟神经节计算单元在传感器层上的变尺度感受野分布,设计拟神经节计算单元、第三层运动方位检测计算单元局部性的、逐级的计算的机理,再设计用于运动事件探测的警觉算法。使得计算结构能够用来缓解计算效率、计算精度与计算资源间的矛盾,使机器视觉系统在将注意汇聚于首要信息的同时,还对周遭信息保持警觉。

【技术实现步骤摘要】

本专利技术属于模式识别、计算机视觉、人工神经元网络和认知模型
,具体涉及以生物视网膜的早期视觉神经机制为基础设计的一种对视图像信息进行等级处理的层次网络结构模型,它能有效缓解计算效率、计算精度与计算资源间的矛盾,使机器视觉系统在将计算能力汇聚于首要信息的同时,还对周遭信息保持警觉。
技术介绍
计算机视觉是人工智能的一个年轻的分支,80年代初Marr的计算机视觉理论的提出把计算机视觉的研究水平提高到了一个新的层次。视觉计算理论认为对于视觉系统这样复杂的信息加工系统,必须从三个不同的层次上加以研究和理解(1)计算理论,研究计算的目的是什么?为什么这一计算是合适的?执行这一计算的策略逻辑是什么样的?(2)表示和算法,研究如何实现这个计算理论?输入、输出表示是怎样的?为实现表示间的变换应当采用什么算法?(3)硬件实现,研究在物理上如何实现这种表示和算法?然而作为一个研究学科而言,计算机视觉似乎还不存在一个基本的理论框架。视觉过程的“广义图像表示、分割图像表示、几何表示、关系表示”信息表达方式的描述考虑了认知心理过程,但实现的难度非常大。机器视觉的难点在三维景物投影到二维图像,深度信息丢失;图像象素的亮度是许多因素混合作用的结果,在图像上很难区别开各种因素;理解需要先验知识;心理学、生理学基础知识的一度缺乏;计算量很大。在计算机视觉中有几种水平的信息处理低级视觉,从光强度阵列中抽取基本特征;分割,对线条、区域之类较高级的特征以及表面的方向和闭合形状等信息进行抽取;高级视觉,依据领域特定的知识构成对景物的描述。对比计算视觉和神经视觉的不同模型,虽然从将视觉信息的细节数据上升到抽象的表示这样一个转化和再组织过程来看,生物视觉过程在“从信号到符号”这样一个抽象高度上和经典的计算机视觉过程基本相似,但两者所使用的计算结构完全不同,前者具有极佳的实时性。我们认为通过对人视觉神经机制的借鉴,借助于神经生理和认知心理理论,完全可能找到一些新的突破点。视觉的产生经过了光学与神经处理这两个阶段,前一个阶段的结束与后一个阶段的开始会聚在视网膜(retina),它将光量子刺激转化为神经脉冲编码(neural impulse)。人类视网膜由三层细胞组成,从外到内分别为感受器细胞(receptor cell)层、双极细胞(bipolar cell)层和神经节细胞(ganglion cell)层。各层之间以及每一层之内的细胞有着广泛的联系,形成视觉信息初步加工的形态学基础。人的视网膜中约有1.25亿个视杆细胞(rod cell)和7百万个视锥细胞(cone cell)。在视网膜的不同区域内,各种细胞的分布情况是不同的。视杆基本上位于视网膜的周边区域,视锥更集中于中间区域。在中央凹(fovea)处只有视锥细胞,每平方毫米约15万个以上,中央凹的这种结构特点为高的视锐度创造了条件。中央凹以外的视网膜部分称为周边(或外周)。在由视网膜中心向外周放射排列区域中,视锥与视杆混合分布,但视锥密度迅速下降。视杆感受明暗刺激,更擅长于探测刺激的出现,视锥感受颜色刺激,更擅长于探测刺激的细节。神经节细胞具有大的视杆细胞感受野和小的甚至是一对一的视锥细胞感受野。从视神经束中包含的神经纤维数量与视网膜上光传感器总量对比来看(1.3亿个视锥与视杆细胞对1百万个神经节细胞),信息经过了初步的处理与压缩。感受野的多尺度特性直接导致了注意汇聚处的高视锐度,同时为保持足够的警觉又能对外周信息作粗略处理,保证对整个视野范围的完整覆盖。这种平衡具有重要的生物物理意义。神经节细胞感受野在反应敏感性的空间分布上呈同心圆拮抗形式,即感受野一般是由中心的兴奋区和周边的抑制区所组成的同心圆结构,它们在功能上是相互拮抗的。神经节细胞的反应可分为给光型(on-型)和撤光型(off-型)两大类给光型神经节细胞当给光或光强剧增时,动作电位(action potential)发放频率增加;撤光型神经节细胞在撤光或刺激光强突降时,动作电位发放频率增加,而当给光时无反应或动作电位发放频率下降。由于感受野中心区和周边区的相互拮抗作用,当神经节细胞感受野受到大面积的弥散光刺激时,两部分的反应倾向于相互抵消,给光型(on-型)和撤光型(off-型)神经节细胞都得到较弱的反应。从视觉系统信息处理的效率角度来看,视觉信息的重要部分往往是图像的边缘信息(漫画家用寥寥数笔的线条便可勾划出一些人物的鲜活特征),视觉信息处理系统抽提存在于图像边界处的最有意义的信息,神经节细胞这样的反应机制提高了对图像边缘处的反应,减小了对大面积灰度相似的区域的反应,从而大大提高的视觉系统处理信息的高效性,并经济地使用了有限的计算资源。基于生物视觉机制的人工视觉模型研究是个具有吸引力的方向,可以在视通路的不同阶段,以及综合心理学的方法展开。本项专利技术的主要贡献在于基于生物视网膜的生理物理学特性,选择对视觉信息处理具有重要意义的神经节细胞作为人工神经元功能设计的计算模型,设计了模拟视网膜视觉信息处理的多尺度感受野的层次网络结构,并实现了拟神经节计算单元感受野随位置变化的形态设计和对视野的交叉覆盖、局域化信息汇聚与处理、用于运动方位探测的警觉算法,以实现在对视焦点信息进行精细处理的同时保持对视野内外周信息的警觉。参考文献1.吴健康,肖锦云,计算机视觉,中国科技大学出版社,19932.Ballard D.H. & Brown C.M.,Computer vision,Prentice-Hall Inc.,19823.Cohen Paul R. & Feigenbaum Edward A.,The handbook of artificial intelligence volume III,William Kaufmann Inc.,1983,p129-1304.寿天德,视觉信息处理的脑机制,上海上海科技教育出版社,19975.Schneider A M,Trarshis B.,″Elements of physiological psychology″,McGraw-Hill Inc.,1995,209-255. 6.Kandel E R,Schwartz J H,Jessell T M.,″Principles of Neural Science″,McGraw-Hill Inc.,2000,507-522. 7.R.W.Rodieck,″The first steps in seeing″,Sinauer Associates,Inc.,1997,87-124. 8.Kuffler,S.W.,Nicholls,J.G.,″From Neuron to Brain″,Sinauer Associates,Inc.Publishers,Sunderland,Massachusetts,1976. 9.William R.Hendee,Peter N.T.Wells,″The perception of visual information″,Springer-Verlag New York,Inc.,1997. 10.Aapo Hyvrinen,Patrik O.Hoyer本文档来自技高网...

【技术保护点】
一种基于视网膜神经节细胞感受野尺度可变的层次网络模型,其特征在于为三层等级信息加工结构;第一层是图像输入层,由光传感器阵列组成。阵列大小对应生物视觉的视野范围,由人工视觉系统的要求而定;以视野范围内的图像作为外界作用于视网膜上的内像,图像的每个象素对应一个光传感器;第二层是拟神经节单元层,该层的每个节点对应视网膜神经节细胞,获取位于其感受野内的第一层光传感器的输出,对此范围内的第一层信息初步处理;第三层是变化探测层,接收第二层的输出为输入,判别是否有需要加以注意的信息以转移视焦点;第三层内有局部连接,构成竞争,以突出显著变化。

【技术特征摘要】

【专利技术属性】
技术研发人员:危辉孙慰迟杨显波
申请(专利权)人:复旦大学
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有1条评论
  • 来自[北京市百度蜘蛛] 2015年01月21日 13:01
    层次网络模型是概念结构理论的一种,除此之外较为公认的还有里伯的内隐学习理论,Bourne等人的特征表理论和Rosch的原型模型
    0
1