利用全局自注意力神经网络对依赖性建模制造技术

技术编号：37102881 阅读：17 留言：0更新日期：2023-04-01 05:02

本公开提供了用于使用具有并行操作的内容注意力层和位置注意力层的全局自注意力模型来贯穿网络对依赖性进行建模的系统、方法和计算机程序产品。该模型接收包括内容值和上下文位置的输入数据。内容注意力层基于独立于上下文位置应用于内容值的全局注意力操作，针对每个上下文位置生成一个或多个输出特征。位置注意力层基于相应上下文位置的一个或多个内容值和相关联的相邻位置，针对上下文位置中的每个上下文位置生成注意力图。输出是基于由内容注意力层生成的输出特征和由位置注意力层针对每个上下文位置生成的注意力图来确定的。该模型提高了效率，并且可以贯穿深度网络使用。用。用。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】利用全局自注意力神经网络对依赖性建模

[0001]本公开总体上涉及机器学习架构。更具体地，本公开涉及使用全局自注意力神经网络对依赖性执行建模的系统、方法和计算机程序产品。

技术介绍

[0002]对交互的建模在机器学习中是重要的。注意力已经成为捕获交互的一种常见方法，并且比基于循环的方法更受欢迎。然而，由于与具体化注意力图相关联的大存储器占用和计算需求，注意力操作遭受每个示例的二次方存储器和计算复杂度。事实上，自注意力的大存储器需求已经妨碍了注意力在长序列和多维输入(诸如图像，通常包括数万个像素)中的使用。现有的方法通常将注意力限制到网络的后期阶段，或者将注意力的感受野限制到局部邻域。此外，现有的方法缺乏用于深度神经网络的主干处理所需的效率。

技术实现思路

[0003]本公开的实施例的方面和优点将在以下实施方式中部分阐述，或可从描述中了解，或可通过实施例的实践了解。
[0004]本公开的一个示例方面涉及一种利用全局自注意力对依赖性进行建模的系统。该系统包括一个或多个机器学习模型，每个机器学习模型被配置为接收模型输入并且处理该模型输入以生成模型输出，其中，机器学习模型中的每个机器学习模型包括被配置为彼此并行操作的内容注意力层和位置注意力层。此外，机器学习模型中的每个机器学习模型被配置为执行操作，该操作包括：接收包括输入数据的层输入，该输入数据包括多个内容值，每个内容值与一个或多个上下文位置相关联；由相应内容注意力层基于独立于上下文位置应用于内容值的全局注意力操作针对每个上下文位置生成一个或多个输出...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于使用全局自注意力对依赖性执行建模的计算系统，包括：一个或多个处理器；以及一个或多个非暂时性计算机可读介质，其共同存储：机器学习模型，被配置为接收模型输入并且处理所述模型输入以生成模型输出，其中，所述机器学习模型包括被配置为彼此并行操作的内容注意力层和位置注意力层，并且其中，所述机器学习模型被配置为执行操作，所述操作包括：接收包括输入数据的层输入，所述输入数据包括多个内容值，每个内容值与一个或多个上下文位置相关联；由所述内容注意力层基于独立于所述上下文位置应用于所述内容值的全局注意力操作，针对每个上下文位置生成一个或多个输出特征；由所述位置注意力层基于与相应上下文位置相关联的一个或多个内容值和相对于所述相应上下文位置的上下文位置的邻域，针对所述上下文位置中的每个上下文位置生成注意力图，所述位置注意力层至少包括注意沿着每个相应上下文位置的列的上下文位置的列关注注意力子层和注意沿着每个相应上下文位置的行的上下文位置的行关注注意力子层；以及至少部分地基于由所述内容注意力层生成的针对每个上下文位置的一个或多个输出特征和由所述位置注意力层针对每个上下文位置生成的注意力图来确定层输出。2.根据权利要求1所述的计算系统，其中，所述机器学习模型还包括输入处理层，所述输入处理层生成从所述输入数据导出的多个键、查询和值。3.根据任一前述权利要求所述的计算系统，其中，所述全局注意力操作包括将所述查询、对每行应用了softmax归一化的所述键的矩阵转置以及所述值相乘。4.根据任一前述权利要求所述的计算系统，其中，所述列关注注意力子层和所述行关注注意力子层被配置为彼此并行操作。5.根据任一前述权利要求所述的计算系统，其中，所述位置注意力层包括所述列关注注意力子层，之后是批归一化层，之后是所述行关注注意力子层。6.根据任一前述权利要求所述的计算机系统，其中，所述列关注注意力子层和所述行关注注意力子层各自被配置为针对每个相应上下文位置使用学习的相对位置嵌入。7.根据任一前述权利要求所述的计算系统，其中，所述位置注意力层包括列关注注意力子层，之后是批归一化层，之后是行关注注意力子层，之后是第二批归一化层，之后是时间或深度...

【专利技术属性】
技术研发人员：沈卓然，I贝洛，贾旭辉，陈敬晖，R韦穆拉帕利，
申请(专利权)人：谷歌有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人