结合元数据的基于变换器的编码制造技术

技术编号：35506688 阅读：30 留言：0更新日期：2022-11-09 14:19

本公开涉及结合元数据的基于变换器的编码。从自然语言文本文档的语料库的元数据构造相关性矩阵，所述相关性矩阵中的行列交叉点对应一种类型的元数据的两个实例之间的关系。一种编码器模型被训练，生成经训练的编码器模型，以计算对应于所述语料库内的自然语言文本文档的令牌和所述相关性矩阵内的嵌入，所述编码器模型包括第一编码器层，所述第一编码器层包括令牌嵌入部分、相关性嵌入部分、令牌自关注部分、元数据自关注部分以及融合部分，所述训练包括调整所述编码器模型的参数集。训练包括调整所述编码器模型的参数集。训练包括调整所述编码器模型的参数集。

全部详细技术资料下载

【技术实现步骤摘要】
结合元数据的基于变换器的编码

[0001]本专利技术总体上涉及用于自动编码自然语言文本或非文本数据的方法、系统和计算机程序产品。更具体地，本专利技术涉及用于结合元数据的基于变换器的编码的方法、系统和计算机程序产品。

技术介绍

[0002]基于变换器的自动编码器，也称为基于变换器的自动编码网络，或简称为变换器，具有编码器
‑
解码器架构。变换器的编码器部分包括一层接一层地迭代地处理输入序列的一组编码层。每个编码器层生成编码(多维数，也称为向量)，其包含关于输入的哪些部分彼此相关的信息。变换器的解码器部分包括一层接一层地迭代地处理编码器的输出的一组解码层。每个解码器层使用编码的结合的上下文信息来生成与输入序列相对应的输出序列。为了结合上下文，编码器和解码器层包括关注机制，对于每个输入，该关注机制包括序列中的用其他输入的相关性加权的其他输入。解码器层还具有附加的关注机制，其从先前解码器层的输出以及从编码汲取信息。
[0003]如本文所使用的变换器指具有编码器
‑
解码器架构的基于变换器的自动编码网络、包含所述组编码层但不包含该组解码器层的编码器、以及包含该组解码器层但不包含该组编码器层的解码器。例如，典型的文本分类实施例仅包含编码器层，随后是分类器层，且不包含解码器层。变换器可用于处理自然语言文本或非文本数据序列。
[0004]说明性实施例认识到，为了使用上下文对文本进行编码，关注机制通常将对应于令牌的嵌入(令牌嵌入)与位置嵌入(对文本的一部分或片段内的令牌的位置进行编码)和...

【技术保护点】

【技术特征摘要】
1.一种计算机实现方法，包括：从自然语言文本文档的语料库的元数据构建相关性矩阵，所述相关性矩阵中的行列交叉点对应于一种类型的元数据的两个实例之间的关系；以及训练、生成经训练的编码器模型，编码器模型用于计算与所述语料库内的自然语言文本文档的令牌和所述相关性矩阵对应的嵌入，所述编码器模型包括第一编码器层，所述第一编码器层包括令牌嵌入部分、相关性嵌入部分、令牌自关注部分、元数据自关注部分以及融合部分，所述训练包括调整所述编码器模型的参数集。2.根据权利要求1所述的计算机实现的方法，其中，所述令牌嵌入部分计算令牌嵌入集，所述令牌嵌入集中的令牌嵌入对应于所述语料库内的自然语言文本文档的令牌。3.根据权利要求2所述的计算机实现的方法，其中，所述令牌包括所述自然语言文本文档的词语的一部分。4.根据权利要求2所述的计算机实现的方法，其中，所述令牌嵌入包括所述令牌的多维数字表示。5.根据权利要求2所述的计算机实现的方法，其中，所述令牌嵌入包括所述令牌的多维数字表示、所述令牌在所述自然语言文本文档内的位置的多维数字表示以及所述自然语言文本文档中所述令牌所位于的片段的多维数字表示的组合。6.根据权利要求1所述的计算机实现的方法，其中，所述相关性嵌入部分计算相关性嵌入集，所述相关性嵌入集中的相关性嵌入包括所述行
‑
列交叉点的多维数字表示。7.根据权利要求1所述的计算机实现的方法，其中，所述令牌自关注部分根据令牌关注权重集来调整输入令牌嵌入，所述令牌关注权重集中的令牌关注权重对应于两个令牌之间的所述自然语言文本文档内的关系，所述令牌关注权重集在所述训练期间计算。8.根据权利要求1所述的计算机实现的方法，其中，所述元数据自关注部分根据元数据关注权重集调整输入相关性嵌入，所述元数据关注权重集在所述训练期间计算。9.根据权利要求1所述的计...

【专利技术属性】
技术研发人员：万晖，崔晓东，L，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人