【技术实现步骤摘要】
一种用于Affordance推理的深度网络构建方法
本专利技术涉及计算机视觉和模式识别的
,尤其涉及一种用于Affordance推理的深度网络构建方法。
技术介绍
Affordance描述在具体环境中允许代理(agent)与该环境中的物体进行的交互,或交互过程中体现出的物体在该环境中具有的功能。交互动作的发出者称为主体,动作的承接者称为客体,通常代理是主体,环境中的物体是客体。具体的Affordance推理包括两个角度:主体的角度,即代理的角度推理该环境允许代理进行哪些动作交互;客体的角度,即环境中物体的角度推理物体在该环境中能够完成哪些任务。从代理的角度研究具体的Affordance需要考虑场景上下文。例如考虑椅子的Affordance“是否允许坐”,即代理是否可以坐在环境中的某个椅子上?如果该椅子已经有人坐在上面或者椅子上放有物体(例如背包)时,则不能坐在该椅子上,即代理是否被允许与场景中的物体—椅子交互需要考虑场景中其他物体(例如人、背包等)与椅子的关系。其他物体与当前待交互物体的关系对当前的交互影响不同:当背包A放在椅子上时,因为椅子被背包A占用,所以背包A与椅子的关系对当前交互有影响,导致该椅子不能被坐;当背包B放在椅子旁边时,因为椅子没有被背包B占用,背包B与椅子的关系对当前交互没有影响,该椅子是否能被坐需要进一步考虑其他因素。从客体的角度研究Affordance时,同样需要考虑场景上下文。例如从场景中选择一个杯子盛酒,而这个场景中恰好只有茶杯而没有酒杯。由于当前场景中没有最恰当的可 ...
【技术保护点】
1.一种用于Affordance推理的深度网络构建方法,其特征在于:该方法包括两个部分:视觉特征提取部分和Affordance推理部分;Affordance推理部分采用门控图注意力网络结构,以图结构作为上下文的载体,基于对象级别的上下文信息构建双向图,对环境中物体提取视觉特征并与类别信息融合作为每个图节点的表示,图节点之间建立双向边,并引入图注意力机制更新边的权值以描述不同邻居节点间的差异性影响。/n
【技术特征摘要】
1.一种用于Affordance推理的深度网络构建方法,其特征在于:该方法包括两个部分:视觉特征提取部分和Affordance推理部分;Affordance推理部分采用门控图注意力网络结构,以图结构作为上下文的载体,基于对象级别的上下文信息构建双向图,对环境中物体提取视觉特征并与类别信息融合作为每个图节点的表示,图节点之间建立双向边,并引入图注意力机制更新边的权值以描述不同邻居节点间的差异性影响。
2.根据权利要求1所述的用于Affordance推理的深度网络构建方法,其特征在于:节点间通过双向边连接,且基于图注意力机制更新边的权值使得节点能够有偏重地获取邻居节点的信息。
3.根据权利要求2所述的用于Affordance推理的深度网络构建方法,其特征在于:视觉特征提取部分采用异构残差网络(HeterogeneousConvolutionResidualNetwork,HetConv-ResNet)结构,其中使用异构卷积核,以解决网络计算量和参数量大的问题。
4.根据权利要求3所述的用于Affordance推理的深度网络构建方法,其特征在于:在COCO-Tasks和ADE-Affordance数据集上对深度网络进行训练和测试。
5.根据权利要求4所述的用于Affordance推理的深度网络构建方法,其特征在于:对于给定一张包含Q个物体的图像,该构建方法包括以下步骤:
(1)物体特征提取,通过HetConv-ResNet对图像中标注的Q个包围框分别提取各个物体的视觉特征;
(2)上下文特征聚合,将针对第i个物体提取的视觉特征φ(oi)和该物体所属类别进行特征融合作为门控图注意力网络GGANN节点i的初始向量表示i∈S,其中S表示图节点的集合;GGANN用双向图对全局上下文信息进行建模,通过图注意力机制学习边的权重αij,其中i∈S,j∈S;经过T轮迭代获得节点i的向量表示
(3)Affordance分类,将和进行连接后输入两个连续的全连接层,预测第i个物体的Affordance。
6.根据权利要求5所述的用于Affordance推理的深度网络构建方法,其特征在于:所述步骤(1)中,利用异构卷积核代替残差网络中标准的3×3大小的卷积核,每个卷积层接受M个特征图作为输入,共输出N个特征图,其中每个卷积模板的大小为K×K;假设输入和输出的每个特征图的大小分别为Din×Din和Dout×Dout,则每个卷积层计算的次数为:Dout×Dout×M×N×K×K;设P表示异构卷积核的参数,则每个异构卷积核有个卷积模板的大小保持K×K,剩余的个卷积模板的大小为1×1,则使用异构卷积核时每个卷积层的计算量为:异构卷...
【专利技术属性】
技术研发人员:王立春,信建佳,王少帆,李敬华,孔德慧,尹宝才,
申请(专利权)人:北京工业大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。