The present invention provides a depth migration learning method for a domain adaptive network, which determines the value of the loss function of a domain adaptive network by the distribution difference corresponding to the corresponding layer of each task, the classification error rate and mismatch degree, in which the distribution difference of the corresponding layer of any task is corresponding to the source domain and the target domain respectively. The distribution difference between the probability distribution of the characteristics in the related layer of any task; and based on the value of the loss function, the parameters of the adaptive network are updated to adapt the domain adaptive network to the target domain, and the distribution difference between the probability distribution of the characteristics of each task related to the source and target domains respectively. The component of the value of the loss function of the adaptive network as the adaptive network matches each task related layer of the depth network at the same time, better modifies the difference between the edge distribution and the condition distribution in different fields, ensures the reliability of the migration learning, and ultimately guarantees the adaptive network migration learning in the domain. Effect\u3002
【技术实现步骤摘要】
一种领域适应性网络的深度迁移学习方法
本专利技术涉及计算机数据分析
,更具体地,涉及一种领域适应性网络的深度迁移学习方法。
技术介绍
互联网技术已经在生活中各个领域得到了广泛的应用,由于文本、图像、视频等非结构化数据增长速度越来越快,因此需要提出针对这些数据的分析方法和处理算法。通过各种信息渠道可以收集到大规模非结构化数据,但大部分数据中缺少标记等信息,这也就意味着常规的监督学习难以在这些数据中得以应用。为了应对标记数据稀缺问题,推出了基于群体智慧的语义网络知识库,借助互联网用户这个近乎无限的知识资源,对一些重要领域的大规模数据进行标记和维护,如文本领域的维基百科、百度百科,图像领域的ImageNet、Flickr等。而另一方面有了新的思路:有效地挖掘富标记数据中有用的信息,迁移到弱标记甚至无标记的特定场景下,即迁移学习;迁移学习作为机器学习的重要前沿方向之一,目标是将源域的知识迁移到新的领域。由于不同领域的数据不再符合机器学习的常规假设:独立同分布条件,所以迁移学习对机器学习泛化性能提出的要求更高。领域适应性网络(DomainAdaptationNetwork)是一种深度神经网络,其从原始问题(领域)学习到的模型可以很好的适应一个与之不同的目标问题(领域),领域适应性网络往往包括多层结构,而特征的迁移能力在领域适应性网络的中间层显著弱化,在领域适应性网络的上层严重降低;近年来迁移学习主要面临主要挑战是迁移学习过程中的可靠性,即难以同时保证领域适应性网络中各层的特征的迁移效果,特别是上层的特征的迁移效果,从而影响领域适应性网络迁移学习的效果。专利技术 ...
【技术保护点】
一种领域适应性网络的深度迁移学习方法,其特征在于,包括:确定第一概率分布与第二概率分布之间的分布差异,所述第一概率分布为源域的样本在领域适应性网络的任一任务相关层中的特征的概率分布,所述第二概率分布为目标域的样本在所述任一任务相关层中的特征的概率分布,所述任务相关层为所述领域适应性网络的上层,将所述第一概率分布与所述第二概率分布之间的分布差异作为所述任一任务相关层对应的分布差异;确定对所述源域和所述目标域中已标记的样本的分类错误率;确定对所述目标域的数据结构的错配度;根据每一任务相关层对应的分布差异,所述分类错误率和所述错配度,确定所述领域适应性网络的损失函数的值;基于所述损失函数的值,更新所述领域适应性网络的参数,以使所述领域适应性网络适配所述目标域。
【技术特征摘要】
1.一种领域适应性网络的深度迁移学习方法,其特征在于,包括:确定第一概率分布与第二概率分布之间的分布差异,所述第一概率分布为源域的样本在领域适应性网络的任一任务相关层中的特征的概率分布,所述第二概率分布为目标域的样本在所述任一任务相关层中的特征的概率分布,所述任务相关层为所述领域适应性网络的上层,将所述第一概率分布与所述第二概率分布之间的分布差异作为所述任一任务相关层对应的分布差异;确定对所述源域和所述目标域中已标记的样本的分类错误率;确定对所述目标域的数据结构的错配度;根据每一任务相关层对应的分布差异,所述分类错误率和所述错配度,确定所述领域适应性网络的损失函数的值;基于所述损失函数的值,更新所述领域适应性网络的参数,以使所述领域适应性网络适配所述目标域。2.根据权利要求1所述的方法,其特征在于,所述确定第一概率分布与第二概率分布之间的分布差异,包括:将所述源域和所述目标域中的样本输入到所述领域适应性网络,作正向传播,获取所述源域和所述目标域中的样本在所述任一任务相关层中的特征;根据所述源域的样本在所述任一任务相关层中的特征确定所述第一概率分布,根据所述目标域的样本在所述任一任务相关层中的特征确定所述第二概率分布;计算所述第一概率分布与所述第二概率分布之间的多核分布距离,将所述多核分布距离作为所述第一概率分布与所述第二概率分布之间的分布差异。3.根据权利要求2所述的方法,其特征在于,所述计算所述第一概率分布与所述第二概率分布之间的多核分布距离,包括:选取含有优化参数的多个核函数作为所述源域和所述目标域的样本在所述任一任务相关层中的特征向可再生核希尔伯特空间映射的总核函数;基于所述总核函数构建所述第一概率分布与所述第二概率分布之间的分布距离函数;基于无偏估计法确定所述优化参数,以获得所述第一概率分布与所述第二概率分布之间的多核分布距离。4.根据权利要求1所述的方法,其特征在于,所述确定对所述源域和...
【专利技术属性】
技术研发人员:龙明盛,王建民,陈新阳,黄向东,
申请(专利权)人:清华大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。