一种信息处理的方法以及装置制造方法及图纸

技术编号：24939127 阅读：28 留言：0更新日期：2020-07-17 21:10

本发明专利技术实施例公开了一种信息处理的方法，包括：获取待处理文本信息所对应的目标文本序列，目标文本序列中包括多个元素；根据目标文本序列获取上下文向量，所述上下文向量用于体现所述元素间的依存关系；根据上下文向量对目标文本信息所对应的目标文本序列进行编码处理，得到文本编码结果。本发明专利技术实施例采用与离散序列相关的上下文向量对该离散序列进行编码，由此，强化离散序列中各个元素之间的依存关系，从而增强神经网络模型的性能，提升模型的学习能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种信息处理的方法以及装置本申请对申请号为201811376563.5，申请日为2018年11月19日，专利技术名称为“一种文本翻译的方法、信息处理的方法以及装置”的中国专利申请提出分案申请。
本专利技术涉及人工智能领域，尤其一种信息处理的方法以及装置。
技术介绍
注意力机制已经成为大多数深度学习模型中的一个基本模块，它可以动态地按照需求选择网络中的相关表示。研究表明，在机器翻译以及图像注释等任务中，注意力机制作用显著。目前，基于注意力机制现已提出一种自关注神经网络(self-attentionnetwork，SAN)模型，该SAN模型可以对离散序列中的每个元素计算一个注意力权重，为了便于理解，请参阅图1，图1为现有方案中SAN模型对离散序列建模的一个基本架构示意图，如图所示，SAN网络可以直接计算出神经网络中隐藏状态之间的依存关系，每个上层网络表示都会与下层网络表示建立直接连接。请参阅图2，图2为现有方案中SAN模型表示两个词语之间关系的一个示意图，如图所示，使用注意力机制的SAN模型在计算两个词语(如图2中的“talk”与“Sharon”)之间的依存度时，仅考虑到两个词之间的关系，因此，对于离散序列而言，元素在整个离散序列中的网络表示较弱，从而降低了神经网络模型的性能。
技术实现思路
本专利技术实施例提供了一种文本翻译的方法、信息处理的方法以及装置，采用与离散序列相关的上下文向量对该离散序列进行编码，由此，强化离散序列中各个元素之间的依存关系，从而增强神经网络模型的性能...

【技术保护点】
1.一种信息处理的方法，其特征在于，所述方法包括：/n获取待处理文本信息所对应的目标文本序列，其中，所述目标文本序列中包括多个元素；/n根据所述目标文本序列获取上下文向量，所述上下文向量用于体现所述元素间的依存关系；/n根据所述上下文向量，对所述目标文本信息所对应的所述目标文本序列进行编码处理，得到文本编码结果。/n

【技术特征摘要】
1.一种信息处理的方法，其特征在于，所述方法包括：
获取待处理文本信息所对应的目标文本序列，其中，所述目标文本序列中包括多个元素；
根据所述目标文本序列获取上下文向量，所述上下文向量用于体现所述元素间的依存关系；
根据所述上下文向量，对所述目标文本信息所对应的所述目标文本序列进行编码处理，得到文本编码结果。

2.根据权利要求1所述的方法，其特征在于，所述获取待处理文本信息所对应的目标文本序列，包括：
通过神经网络获取待处理文本信息所对应的目标文本序列；
相应的，所述上下文向量通过所述神经网络中的内部表示学习得到。

3.根据权利要求1所述的方法，其特征在于，所述根据所述目标文本序列获取上下文向量，包括：
获取所述目标文本序列中每个元素的向量；
根据所述目标文本序列中每个元素的向量确定所述目标文本序列的整体信息，其中，所述整体信息用于表示所述上下文向量。

4.根据权利要求3所述的方法，其特征在于，所述根据所述目标文本序列中每个元素的向量确定所述目标文本序列的整体信息，包括：
根据所述目标文本序列中每个元素的向量计算所述目标文本序列的平均值，将所述平均值作为所述整体信息。

5.根据权利要求1所述的方法，其特征在于，所述根据所述目标文本序列获取上下文向量，包括：
获取所述目标文本序列所对应的L层文本序列，其中，所述L层文本序列为在所述目标文本序列之前生成的网络层，所述L为大于或等于1的整数；
根据所述L层文本序列生成所述上下文向量。

6.根据权利要求1所述的方法，其特征在于，所述根据所述目标文本序列获取上下文向量，包括：
获取所述目标文本序列所对应的L层文本序列，其中，所述L层文本序列为在所述目标文本序列之前生成的网络层，所述L为大于或等于1的整数；
根据所述L层文本序列获取L层第一上下文向量，其中，每层第一上下文向量为每层文本序列中元素的平均值；
根据所述目标文本序列获取第二上下文向量，其中，所述第二上下文向量为所述目标文本序列中元素的平均值；
根据所述L层第一上下文向量以及所述第二上下文向量，计算得到所述上下文向量。

7.根据权利要求1-6任意一项所述的方法，其特征在于，所述根据所述上下文向量对所述...

【专利技术属性】
技术研发人员：涂兆鹏，杨宝嵩，王星，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人