该模型是第三代神经模拟器。它表明多个的区域,其功能能用人脑视觉皮层的脊背和腹部路径区域的功能识别。在进行处理时,在不同区域之间设置反馈。此外,在不同特征和/或空间范围之间设置围÷绕注意力的竞争。该模型很灵活地适合于图象处理。它模拟自然的人的图象处理,并解释很多实验观察到的现象。(*该技术在2023年保护过期,可自由使用*)
【技术实现步骤摘要】
本专利技术涉及视觉信息处理,尤其涉及处理视觉信息的神经动态模型。对于传统的图象处理模型,比如数字图象处理,将一个摄取的图象在处理的逐渐出现的较高层面中去分析。在按照一个例如巴黎埃菲尔铁塔的图象中的一个特征寻找时,在传统的图象处理中要区分两个问题-第一个问题例如在图象的中央能看到哪个物体?即一个所谓的“什么what”-问题,问的是在预先规定的地点识别出一个物体(物体识别)。-第二个问题埃菲尔铁塔在何处?这是一个所谓的“哪里where”-问题。它在找图象中已知特征的地点(模板搜寻)。典型的方式是为此用一个预先规定的、适当的窗口去搜寻摄取的图象,窗口要与被找的图样一致。这个任务用按照独立的权利要求的本专利技术来解决。本专利技术有利的扩展在从属权利要求中表明。fMRI-Experimente(fMRI,functional magnetic resonanceimaging)und die Beobachtung derAktivitaet einzelner Zellen im Gehirn做了明确的说明,注意力影响视觉信息的处理。影响的方式是,体现所期待的特征(形状、颜色等)或所期待的地点的神经的活动被加强,而邻近的神经的活动被削弱,要不然对活跃的神经产生一个阻碍作用。对于图象处理的传统模型,比如数字图象处理,注意力不起任何作用。更确切地说,以所谓的倒置方法(Bottom-up-Approaches),将所摄取的图象在处理的逐渐出现的较高层面中分析。与这种图象处理的传统模型相反,表明一个所谓的自上而下的方法(Top-down-Approach)更好地反映视觉皮层的现实情况。在一个自上而下的方法时,将在一个较高的处理层面上的中间结果以反馈的方式为此使用,去合理地重新评估较低的处理层面。重要的是各个层面之间的反馈瞬间。模型大多数是被结构化的区域,它们的功能能用视觉皮层的脊背和腹部路径区域的功能识别。在后面具体阐述的模型中,通过各个区域的交替作用使反馈得到实现。反馈导致在各个神经元或神经元组(Pools,见下面)的注意力-竞争中有个平衡的推移。这样,围绕注意力就有一个越来越不平衡的竞争。图象的相关特征或空间范围因此出现在图象处理的过程中;它们在一些时间之后被其它潜在的特征衬托出来。只有提高针对某个空间范围或特征或物体的注意力并随之忽略其它特征或空间范围,才有可能降低图象的数据量和发觉各个物体中的所要找的目标。此时,所摄取的图象不是用一个窗口逐个搜索。而总是将整个图象平行处理。有优点的方式是,将一个第三代神经模拟器(Neurokognition)用于处理。作为第一代神经模拟器,或多或少基于静态的神经元网络,即传统神经元网络的模型。作为第二代神经模拟器,是神经元动态特性的模型,尤其是由它们产生脉冲的模型。最后,在神经元组中的神经元组织和区域中的神经元组组织分层模型,被称为第三代神经模拟器。此时,一个神经元组包括上千个神经元。一方面,这导致降低神经元网络的复杂性。另一方面,因此使神经元网络在它的结构上与脑结构相当。如果将神经元组的活动用一个平均场模型来说明,该模型比各个神经元活动的准确计算更好地适应快速更改的分析,则能使复杂性有个进一步的降低。围绕注意力的竞争主要是出现在神经元组的层面上。竞争能经过至少一个抑制神经元组传送,它对神经元组的活动有阻碍作用。合理的是,将神经元网络构造成能提高对某个要识别物体或对某个要定位物体的注意力。这样一个提高了的注意力或围绕注意力竞争中的平衡的推移(Bias)(围绕注意力的不平衡竞争,“biasedcompetition”),能通过源自视觉皮层之外区域的信号而产生或放大。这些(外部)信号能连接到视觉皮层中,它们在那里刺激某些特征或空间范围。它们影响围绕注意力的竞争的方式是,对于多数在视场中出现的要刺激的影响,赢得得那些围绕注意力竞争的、由外部信号刺激的细胞,它们代表所期待的特征或所期待的空间范围。其它细胞丧失注意力并受到抑制。这样一个外部的推移(Bias)能因此确定,是进行一个物体识别(“what”-问题)还是进行一个模板搜寻(“where”-问题)。两个过程能用同样的方法或模型进行。本专利技术的任务还通过一个计算机程序完成,所述计算机程序在计算机上运行时实施根据本专利技术的方法,以及通过一个带程序代码手段的计算机程序来完成任务,以便执行所有本专利技术方法的步骤。此外,所述任务通过处理视觉信息的一种能实施本专利技术方法的神经动态模型来完成。为此,模型包括大多数区域其功能能用人脑视觉皮层的脊背和腹部路径区域的功能识别。在不同的区域之间,在处理时设有反馈。此外,模型中在各种特征和/或各种空间范围之间设有围绕注意力的竞争。本专利技术的任务也通过一个设备来完成,它包括在视觉信息各种特征和/或各种空间范围之间,有进行围绕注意力竞争的装置。此外,大多数区域,其功能是能用人脑视觉皮层的脊背和腹部路径区域的功能识别的;以及在处理时各种区域之间进行反馈的装置。除此之外,如果程序运行在一台计算机,本专利技术的任务通过一个带程序代码手段的计算机程序来完成,以便执行所有根据本专利技术的方法步骤。图3 一个区域与一个所属的抑制神经元组之间的交替作用的示意。为了这个自上而下方法的模型化,应用一个所谓的第三代神经模拟器。如以下视觉皮层的例子中所说明的那样,神经元组中的神经元组织的分层模型和相当于脑区域中的神经元组,称作为第三代神经模拟器。这里,一个神经元组包含有上千个神经。附图说明图1示出的是简化了的脑10视觉皮层的主要区域。画出的是大脑16和小脑18。在大脑16中,视觉皮层里除了其它的还展示有后面要详述的区域V1,V4,PP和IT。在这些区域之间有多股的突触连接20。参照图2来详细说明数学模型的结构,它是脑中情况的一个抽象再现。区域IT(inferotemporal)用于一个图象内的图象识别或物体识别(“what”-问题)。图象图样存储于其中,这些图样可以对应可见世界的物体代表。以砖或蜂房两个图样为例。如果属于图样的一个所谓的“祖母-神经元”最活跃,则识别出一个图样。“祖母-神经元”识别出某个图样的能力,是通过训练获得的。下文将对训练进行阐述。在现有的模型中,不用“祖母-神经元”去进行图样识别,而是用模型的最小单元神经元组。如果相应的“祖母-神经元组”最活跃,则一个图样被一个“祖母-神经元组”识别出。与此相应,就像有要识别的图样或物体那样,区域IT在现有的模型中同样获得很多神经元组。区域PP(posterior parietal)用于已知图样的地点定位(“where”-问题)。如同在要识别的图象中存在像素的情况一样,区域PP在现有的模型中因此也包括很多神经元组24。在PP中小量相邻神经元组神经元活动的集中,对应物体定位。在一个或一些神经元组中神经元活动的集中,一般对应通过这些神经元组所代表特征的被提高的注意力,或对应这些特征的识别。区域V1和V4在现有的模型中被归纳为V1-V4,也用V4表示。这个区域一般负责提取特征。包括约1百万神经元组24,每个特征对应一个神经元组。神经元组24感应图象的各个特征。从图象的一个弱波-变换可得出图象的特征(见下面)。这样,一个特征通过一个一定的尺寸或空间频率、一个空间取向和在x-和y-方向的本文档来自技高网...
【技术保护点】
处理视觉信息的方法,其中a)在视觉信息的各种特征和/或各种空间范围之间进行一个围绕注意力的竞争;b)利用多个其功能能用人脑视觉皮层的脊背和腹部路径区域的功能进行识别的区域;和c)在处理时进行不同区域之间的反馈。
【技术特征摘要】
...
【专利技术属性】
技术研发人员:G德科,
申请(专利权)人:西门子公司,
类型:发明
国别省市:DE[德国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。