基于深度森林的在线多视角分类方法、系统、装置制造方法及图纸

技术编号:22076990 阅读:48 留言:0更新日期:2019-09-12 14:34
本发明专利技术属于机器学习技术领域,具体涉及了一种基于深度森林的在线多视角分类方法、系统、装置,旨在解决深度学习模型不能在线更新,而浅层在线学习模型的分类精度低的问题。本发明专利技术方法包括:通过多视角深度森林网络获取多视角数据的分类结果图;将分类结果图的预测标签按列排成与多视角数据图片相同的尺寸;将排列后的分类结果图按标签大小着色为灰度分类结果图并输出。本发明专利技术通过在线的方式从数据流中学习,并对模型结构和权重更新,使得模型对不同的数据集有很强的适应性和扩展性,同时还充分利用了多视角数据本身及多视角之间的信息,有效开发深层的特征信息,从而得到更高的在线分类准确率,在线的方式无需存储全部数据,有效节约了资源。

On-line multi-view classification method, system and device based on deep forest

【技术实现步骤摘要】
基于深度森林的在线多视角分类方法、系统、装置
本专利技术属于机器学习
,具体涉及了一种基于深度森林的在线多视角分类方法、系统、装置。
技术介绍
目前,深度神经网络方法在很多领域得到了广泛的应用,并取得了巨大的成功,特别是在图像和语音领域。尽管深度神经网络非常强大,但却存在诸多缺陷,如训练过程要求大量的训练数据和具有强大计算能力的设备,模型非常复杂,超参数太多并且不同任务对参数敏感不同等。为此,Zhou等设计了一种具有级联结构的深度森林网络[1],具有更少的超参数,并且参数对不同任务比较鲁棒;训练花费是可控的,并且适用于小规模的数据集。然而该深度森林算法是离线学习方法,其要求所有训练数据在学习开始时都是可用的,不适用实际情形中数据以数据流的形式不断获取的情况。在线学习能够有效处理实时数据流问题,是机器学习领域的一个研究热点。在线学习可以从数据流中增量地学习分类模型并且不重复使用之前的样本,适用于动态增长的数据集。现有的方法包括感知器算法,在线被动攻击算法,基于凸包顶点选择的支持向量机方法和在线随机森林方法[2]等。现在从不同信息源、空间及模态获取到的数据越来越丰富,这些不同属性的数据构成多视角数据集。与单视角学习相比,多视角学习可发掘各视角有用特征来改善学习能力。基于多视角学习的极化SAR数据分类器实时更新方法,利用了视角间的一致性和互补性有效提升了分类精度然而,该模型是浅层的线性模型,其分类性能还不够好[3]。本专利技术以极化SAR数据的在线分类为背景,在分类前先对数据进行超像素分割,而自适应局部迭代聚类方法[4]是一种有效的极化SAR数据超像素分割方法,可提升后续分类的效率和鲁棒性。总的来说,现有的深度学习模型不能在线更新,而浅层在线学习模型的分类精度又不够高。以下文献是与本专利技术相关的技术背景资料:[1]ZhouZH,FengJ.Deepforest:towardsanalternativetodeepneuralnetworks.Proceedingsofthe26thInternationalJointConferenceonArtificialIntelligence.AAAIPress,2017:3553-3559.[2]B.Lakshminarayanan,D.M.Roy,andY.W.The.Mondrianforests:Efficientonlinerandomforests.Advancesinneuralinformationprocessingsystems,2014.[3]聂祥丽、黄夏渊、丁曙光、乔红、张波:基于多视角学习的极化SAR数据分类器实时更新方法,2017-12-29.[4]XiangD,BanY,WangW,etal.AdaptivesuperpixelgenerationforpolarimetricSARimageswithlocaliterativeclusteringandSIRVmodel[J].IEEETransactionsonGeoscienceandRemoteSensing,2017,55(6):3115-3131.
技术实现思路
为了解决现有技术中的上述问题,即深度学习模型不能在线更新,而浅层在线学习模型的分类精度低的问题,本专利技术提供了一种基于深度森林的在线多视角分类方法,包括:步骤S10,获取同一目标不同属性的特征或不同传感器的数据作为输入多视角数据;步骤S20,基于所述输入多视角数据,通过多视角深度森林网络,获取所述输入多视角数据的分类结果图;所述多视角深度森林网络包含第一预设数量的层,每一层包含第二预设数量的随机森林;步骤S30,将所述分类结果图的预测标签按列排成与所述输入多视角数据图片相同的尺寸;步骤S40,将排列后的分类结果图按照标签的大小着色成灰度分类结果图。在一些优选的实施例中,所述多视角深度森林网络,其训练方法为:步骤B10,初始化所述多视角深度森林网络的不同视角的权重,获得初始化后的多视角深度森林网络;步骤B20,基于t-1时刻的多视角深度森林网络和t时刻多视角数据以及对应的真实标签更新t时刻多视角深度森林网络结构,获取所述t时刻多视角数据的预测标签,并计算所述预测标签与真实标签对比的损失函数,更新不同视角的权重;步骤B30,令t=t+1,重复执行步骤B20,直至达到预设的训练次数或者所述预测标签的损失函数值低于设定阈值。在一些优选的实施例中,步骤B10“初始化所述多视角深度森林网络的不同视角间的权重”,其方法为:不同视角间的权重为βi,其中,I为视角数量;设定所述不同视角间的初始权重为:在一些优选的实施例中,步骤B20中“更新多视角深度森林网络的结构”,其方法为:步骤B211,当前层中当前树的结构为:T=(T,δ,ξ,τ)其中,T表示当前树,δ表示树的节点分裂发生的维度,ξ表示树的节点分裂发生的位置,τ表示树的节点分裂发生的时间;步骤B212,对于输入的第i个视角的样本D(i)=(x(i),y),在树的第j个节点处,设定:其中,分别为输入样本x(i)所在空间的逐元素计算的下界和上界;el、eu分别为输入样本x(i)落在给定区间外时与下界、上界的差,j为树的第j个节点;步骤B213,从参数为的指数分布中采样,获取树的节点分裂需要增加的分裂时间E,并进行以下更新:如果τparen(t)j+E<τj,那么采样得到分裂维度δ,δ=d的概率与成正比,选择设定采样区间采样得到分裂位置,并在当前节点之上插入一个新的父节点,在父节点下生成一个新的叶节点;如果τparent(j)+E≥τj,则对输入空间的上下界进行更新,判断当前节点j是否是叶节点,如果是,则停止更新当前层的随机森林,如果不是,继续向下迭代;其中,τj是内部节点j的分裂时间,parent(j)是节点j的父节点;步骤B214,当前层的随机森林更新完后,按步骤B201至步骤B204方式更新下一层的随机森林,直至完成整个深度森林的结构更新。在一些优选的实施例中,步骤B213中“选择设定采样区间”,其方法为:如果则设定采样区间为否则,设定采样区间为其中,为第i个视角的输入样本x(i)在维度δ处的取值,为样本空间的下界在维度δ处的取值。在一些优选的实施例中,步骤B20中“更新不同视角的权重”,其方法为:步骤B221,完成某一层随机森林结构的更新后,分别计算各视角随机森林对应的预测标签其中,fi为视角i的预测向量;步骤B222,分别将I个视角对应的预测标签和数据真实标签y进行对比,并更新各视角的输出权重:其中,βi为视角i的权重;r为衰减率0<r<1;为损失函数;步骤B223,归一化各视角权重:其中,I为视角数量。在一些优选的实施例中,所述损失函数为:其中,为视角i对应的预测标签,y为数据真实标签。本专利技术的另一方面,提出了一种基于深度森林的在线多视角分类系统,该分类系统包括输入模块、多视角分类模块、排列模块、着色模块、输出模块;所述输入模块,配置为获取同一目标不同属性的特征或不同传感器的数据作为输入多视角数据并输入;所述多视角分类模块,配置为基于所述输入多视角数据,通过多视角深度森林网络,获取所述输入多视角数据的分类结果图;所述排列模块,配置为将所述分类结果图的预测标签按列排成与本文档来自技高网
...

【技术保护点】
1.一种基于深度森林的在线多视角分类方法,其特征在于,该分类方法包括:步骤S10,获取同一目标不同属性的特征或不同传感器的数据作为输入多视角数据;步骤S20,基于所述输入多视角数据,通过多视角深度森林网络,获取所述输入多视角数据的分类结果图;所述多视角深度森林网络包含第一预设数量的层,每一层包含第二预设数量的随机森林;步骤S30,将所述分类结果图的预测标签按列排成与所述输入多视角数据图片相同的尺寸;步骤S40,将排列后的分类结果图按照标签的大小着色成灰度分类结果图。

【技术特征摘要】
1.一种基于深度森林的在线多视角分类方法,其特征在于,该分类方法包括:步骤S10,获取同一目标不同属性的特征或不同传感器的数据作为输入多视角数据;步骤S20,基于所述输入多视角数据,通过多视角深度森林网络,获取所述输入多视角数据的分类结果图;所述多视角深度森林网络包含第一预设数量的层,每一层包含第二预设数量的随机森林;步骤S30,将所述分类结果图的预测标签按列排成与所述输入多视角数据图片相同的尺寸;步骤S40,将排列后的分类结果图按照标签的大小着色成灰度分类结果图。2.根据权利要求1所述的基于深度森林的在线多视角分类方法,其特征在于,所述多视角深度森林网络,其训练方法为:步骤B10,初始化所述多视角深度森林网络的不同视角的权重,获得初始化后的多视角深度森林网络;步骤B20,基于t-1时刻的多视角深度森林网络和t时刻多视角数据以及对应的真实标签更新t时刻多视角深度森林网络结构,获取所述t时刻多视角数据的预测标签,并计算所述预测标签与真实标签对比的损失函数,更新不同视角的权重;步骤B30,令t=t+1,重复执行步骤B20,直至达到预设的训练次数或者所述预测标签的损失函数值低于设定阈值。3.根据权利要求2所述的基于深度森林的在线多视角分类方法,其特征在于,步骤B10“初始化所述多视角深度森林网络的不同视角间的权重”,其方法为:不同视角间的权重为其中,I为视角数量;设定所述不同视角间的初始权重为:4.根据权利要求2所述的基于深度森林的在线多视角分类方法,其特征在于,步骤B20中“更新多视角深度森林网络的结构”,其方法为:步骤B211,当前层中当前树的结构为:T=(T,δ,ξ,τ)其中,T表示当前树,δ表示树的节点分裂发生的维度,ξ表示树的节点分裂发生的位置,τ表示树的节点分裂发生的时间;步骤B212,对于输入的第i个视角的样本D(i)=(x(i),y),设定:其中,分别为输入样本x(i)所在空间的逐元素计算的下界和上界;el、eu分别为输入样本x(i)落在给定区间外时与下界、上界的差,j为树的第j个节点;步骤B213,从参数为的指数分布中采样,获取树的节点分裂需要增加的分裂时间E,并进行以下更新:如果那么采样得到分裂维度δ,δ=d的概率与成正比,选择设定采样区间采样得到分裂位置,并在当前节点之上插入一个新的父节点,在父节点下生成一个新的叶节点;如果τparent(j)+E≥...

【专利技术属性】
技术研发人员:聂祥丽高若飞项德良樊明宇乔红
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1