基于注意力机制的机器学习模型的融合方法技术

技术编号：28038375 阅读：18 留言：0更新日期：2021-04-09 23:21

本发明专利技术涉及基于注意力机制的机器学习模型的融合方法，包括步骤：A.制定机器学习任务要学习的目标，并训练得到至少两个子模型，各子模型的输出结果组合成一个向量；B.构建注意力模块，包括多个具有注意力机制的全连接神经网络，先对所述向量升维和学习高维交互特征，再对向量降维后输出，向量长度为子模型个数，向量中各元素的值对应各子模型的权重；C.融合子模型：将预测样本的变量输入子模型得到向量，并输入到注意力模块得到各对应子模型的权重，对子模型的输出结果进行加权融合。本发明专利技术能够根据融合变量的变化来对子模型融合时的权重进行相应的输出，使融合后的输出更接近真实值，有效提高了融合后输出的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
基于注意力机制的机器学习模型的融合方法
本专利技术涉及机器学习模型的融合方法，具体讲是基于注意力机制的机器学习模型的融合方法。
技术介绍
注意力机制(AttentionMechanism)源于对人类视觉的研究。在认知科学中，由于信息处理的瓶颈，人类会选择性地关注所有信息的一部分，同时忽略其他可见的信息。上述机制被称为注意力机制。为了合理利用有限的视觉信息处理资源，人们需要选择视觉区域中的特定部分，然后集中关注它。例如，人们在阅读时，通常只有少量要被读取的词会被关注和处理。因此，注意力机制主要有两个方面：决定需要关注的是哪部分；分配有限的信息处理资源给重要的部分。注意力机制可以使得神经网络具备专注于其输入(或特征)子集的能力。在计算能力有限情况下，注意力机制是解决信息超载问题的主要手段的一种资源分配方案，将计算资源分配给更重要的任务。关于更详细的注意力机制的原理和实现，可以参考：https://baike.baidu.com/item/％E6％B3％A8％E6％84％8F％E5％8A％9B％E6％9C％BA％E5％88％B6/22768534；以及：https://blog.csdn.net/hpulfc/article/details/80448570。现有的机器学习模型常用的融合方法有：简单平均融合、线性加权融合、Stacking融合。其中，简单平均融合：将要融合的各个子模型的输出结果取算术平均得到融合结果；线性加权融合：根据专家经验或者根据模型的效果遍历搜索得到各子...

【技术保护点】
1.基于注意力机制的机器学习模型的融合方法，其特征包括：/n步骤A.根据相应的应用场景，制定机器学习任务要学习的目标，并使用收集到的数据集通过现有方法训练得到至少两个子模型，各子模型根据输入的变量得到各自对应的输出结果，并将各子模型的输出结果组合成一个向量，向量中的每个元素对应一个子模型，将该向量存储到磁盘的结构空间中；/n步骤B.构建注意力模块：在磁盘中划分出构建和保存注意力模块的结构空间，所述的注意力模块包括至少两个具有注意力机制的全连接神经网络，通过处理器从磁盘的结构空间中调取出所述的向量输入到注意力模块中，然后通过注意力模块对该向量进行升维，并学习向量中各元素之间的高维交互特征，然后对升维后的向量进行降维，再归一化后输出，降维后向量的长度即为子模型的个数，向量中每个元素按子模型输出结果的组合顺序分别对应一个子模型，元素的值即为注意力模块给该元素对应的子模型分配的注意力权重，由此完成注意力模块的构建；/n步骤C.使用注意力模块融合子模型：对于某个需要预测的样本，将该样本的变量输入通过步骤A训练好的各子模型得到所述的向量，再由处理器将该向量从磁盘的结构空间中调取出来，输入步骤B所述...

【技术特征摘要】
1.基于注意力机制的机器学习模型的融合方法，其特征包括：
步骤A.根据相应的应用场景，制定机器学习任务要学习的目标，并使用收集到的数据集通过现有方法训练得到至少两个子模型，各子模型根据输入的变量得到各自对应的输出结果，并将各子模型的输出结果组合成一个向量，向量中的每个元素对应一个子模型，将该向量存储到磁盘的结构空间中；
步骤B.构建注意力模块：在磁盘中划分出构建和保存注意力模块的结构空间，所述的注意力模块包括至少两个具有注意力机制的全连接神经网络，通过处理器从磁盘的结构空间中调取出所述的向量输入到注意力模块中，然后通过注意力模块对该向量进行升维，并学习向量中各元素之间的高维交互特征，然后对升维后的向量进行降维，再归一化后输出，降维后向量的长度即为子模型的个数，向量中每个元素按子模型输出结果的组合顺序分别对应一个子模型，元素的值即为注意力模块给该元素对应的子模型分配的注意力权重，由此完成注意力模块的构建；
步骤C.使用注意力模块融合子模型：对于某个需要预测的样本，将该样本的变量输入通过步骤A训练好的各子模型得到所述的向量，再由处理器将该向量从磁盘的结构空间中调取出来，输入步骤B所述的注意力模块中，然后将注意力模块的输出...

【专利技术属性】
技术研发人员：杨晓东，卫浩，
申请(专利权)人：四川新网银行股份有限公司，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人