【技术实现步骤摘要】
一种受脑启发的全局
‑
局部双通道图像分类方法及系统
[0001]本专利技术涉及人工智能
,具体而言,涉及一种受脑启发的全局
‑
局部双通道图像分类方法及系统。
技术介绍
[0002]深度卷积神经网络已经在计算机视觉、自然语言处理、语音识别等领域广泛应用,是理解图像内容的最佳学习算法之一,在图像分类、语义分割、目标检测、检索等相关任务中表现出了出色的性能。
[0003]深度卷积神经网络强大的学习能力在于使用了多个特征提取阶段,其表征能力的显著提高主要通过体系结构的创新实现。随着使用层块作为结构单元的想法的流行,网络体系结构上的创新主要聚焦于处理单元的重组和新块的设计。谷歌提出拆分、转换、合并的创新概念后,第一次引出了层内分支的概念,允许在不同空间尺度上提取特征,使得多分支拓扑结构成为网络体系结构创新的重要思路。ResNet增加快捷连接构成双分支的残差模块,快捷分支帮助传播训练过程中的信息,大大减轻训练难度。ResNeXt使用组卷积在每个构建单元中聚合多个残差转换。输入特征映射在通道维数上转换为若干组,由多个分支分别处理。Inception网络通过堆叠Inception模块来构建架构,每个模块聚合多个卷积层的分支,允许灵活地组合各种操作来代表不同模式的特征。体系结构上的创新与硬件的支持,允许构建越来越深的网络,模型能够扩展到更大型、更复杂的问题上。
[0004]然而,当网络到达一定深度,识别性能会随着计算能力的显著增加而饱和,现有深度卷积神经网络性能的提升遇到了瓶颈 ...
【技术保护点】
【技术特征摘要】
1.一种受脑启发的全局
‑
局部双通道图像分类方法,其特征在于,包括以下步骤:获取并将待分类的图像集划分为训练集和测试集;选择一个CNN模型,以其构建单元作为双通道模型的局部通道基本模块,并对输入特征进行局部细节信息提取,得到具有局部信息的特征表示;选择Transformer模型,以其编码层组件作为双通道模型的全局通道基本模块,并对输入特征进行全局拓扑相关性信息提取,得到具有全局信息的特征表示;将双通道模型的局部通道基本模块与双通道模型的全局通道基本模块作为并行双通道,并分别连接到调制器,形成双通道构建单元,通过所述调制器融合所述双通道的输出特征,得到双通道模块的输出特征;将多个所述双通道构建单元,按照CNN模型的层次架构进行堆叠,得到全局
‑
局部双通道图像分类模型;采用所述训练集训练所述全局
‑
局部双通道图像分类模型,得到训练好的全局
‑
局部双通道图像分类模型;采用训练好的全局
‑
局部双通道图像分类模型,对所述测试集进行分类,得到图像分类结果。2.根据权利要求1所述的受脑启发的全局
‑
局部双通道图像分类方法,其特征在于,对输入特征进行全局拓扑相关性信息提取,得到具有全局信息的特征表示,包括以下步骤:将所述输入特征映射转换为N个一维Token;将所述N个一维Token生成K组全局拓扑表示;将所述K组全局拓扑表示的N个输出Token转换为多维输出特征映射,得到具有全局信息的特征表示。3.根据权利要求1所述的受脑启发的全局
‑
局部双通道图像分类方法,其特征在于,所述通过所述调制器融合所述双通道的输出特征,得到双通道模块的输出特征,包括以下步骤:所述调制器通过门控机制和以可学习的方式,将所述具有全局信息的特征表示与所述具有局部信息的特征表示融合,以生成双通道模块的输出特征。4.根据权利要求3所述的受脑启发的全局
‑
局部双通道图像分类方法,其特征在于,将所述具有全局信息的特征表示与所述具有局部信息的特征表示融合,以生成双通道模块的输出特征,包括以下步骤:所述调制器通过门控机制调制双通道的输出特征,得到双通道模块的输出特征,所述双通道模块的输出特征的表达式为:其中σ(
·
)为sigmoid激活函数,为第l层的具有全局信息的特征表示,表示为第l层的具有局部信息的特征表示,Y
l
为第l层的双通道模块的输出特征。5.根据权利要求3所述的受脑启发的全局
‑
局部双通道图像分类方法,其特征在于...
【专利技术属性】
技术研发人员:董松林,尚苗,王长鑫,龚怡宏,张玥,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。