信息处理模型训练方法、装置、设备及存储介质制造方法及图纸

技术编号：28839254 阅读：25 留言：0更新日期：2021-06-11 23:37

本申请实施例公开了一种信息处理模型训练方法、装置、设备及计算机存储介质，所述方法包括：获取训练样本；确定所述训练样本对应的以字向量为维度的第一样本特征和以词向量为维度的第二样本特征；基于所述第一样本特征和所述第二样本特征，及所述训练样本的情感属性训练目标信息处理模型。如此，通过使用文本的字特征和词组特征，准确判别出文本的情感属性。

全部详细技术资料下载

【技术实现步骤摘要】
信息处理模型训练方法、装置、设备及存储介质
本申请涉及计算机
，尤其涉及一种信息处理模型训练方法、装置、设备及计算机存储介质。
技术介绍
目前，文本中存在一词多义的现象，即同一个词用在不同的语义环境下可能会产生相反的情感属性，甚至于同样的一句话，可能语气不同都会产生相反的情感属性。因此，在文本具有词汇用法繁多，语境复杂，上下文关联极强等特点的情况下，如何准确判别出文本情感属性，已成为需要解决的问题。
技术实现思路
本申请实施例提供一种信息处理模型训练方法、装置、设备及计算机存储介质，能够准确判别出文本情感属性。为达到上述目的，本申请实施例的技术方案是这样实现的：第一方面，本申请实施例提供一种信息处理模型训练方法，所述方法包括：获取训练样本；确定所述训练样本对应的以字向量为维度的第一样本特征和以词向量为维度的第二样本特征；对所述第一样本特征和所述第二样本特征进行处理，得到第三样本特征；基于所述第一样本特征和所述第二样本特征，及所述训练样本的情感属性训练目标信息处理模型。在一些实施例中，所述确定所述训练样本对应的以字向量为维度的第一样本特征和以词向量为维度的第二样本特征，包括：基于所述训练样本，分别获取由单个字组成的字样本序列和由词组组成的词组样本序列；基于所述字样本序列，获取以字向量为维度的第一样本特征，以及基于所述词组样本序列，获取以词向量为维度的第二样本特征。在一些实施例中，所述目标信息处理模型包括双线性卷积神...

【技术保护点】
1.一种信息处理模型训练方法，其特征在于，所述方法包括：/n获取训练样本；/n确定所述训练样本对应的以字向量为维度的第一样本特征和以词向量为维度的第二样本特征；/n基于所述第一样本特征和所述第二样本特征，及所述训练样本的情感属性训练目标信息处理模型。/n

【技术特征摘要】
1.一种信息处理模型训练方法，其特征在于，所述方法包括：
获取训练样本；
确定所述训练样本对应的以字向量为维度的第一样本特征和以词向量为维度的第二样本特征；
基于所述第一样本特征和所述第二样本特征，及所述训练样本的情感属性训练目标信息处理模型。

2.根据权利要求1所述方法，其特征在于，所述确定所述训练样本对应的以字向量为维度的第一样本特征和以词向量为维度的第二样本特征，包括：
基于所述训练样本，分别获取由单个字组成的字样本序列和由词组组成的词组样本序列；
基于所述字样本序列，获取以字向量为维度的第一样本特征，以及基于所述词组样本序列，获取以词向量为维度的第二样本特征。

3.根据权利要求1所述方法，其特征在于，所述目标信息处理模型包括双线性卷积神经网络模型，所述基于所述第一样本特征和所述第二样本特征，及所述训练样本的情感属性训练目标信息处理模型，包括：
利用所述目标信息处理模型中第一卷积神经网络的卷积层，基于所述第一样本特征，获取各个卷积核对应的第一局部特征；
利用所述第一卷积神经网络的全连接层，将所述第一局部特征进行拼接，获取第一特征；
利用所述目标信息处理模型中第二卷积神经网络的卷积层，基于所述第二样本特征，获取各个卷积核对应的第二局部特征；
利用所述第二卷积神经网络的全连接层，将所述第二局部特征进行拼接，获取第二特征；
利用所述目标信息处理模型中线性混合层，基于所述第一特征和所述第二特征获取混合特征；
将所述混合特征输入到所述目标信息处理模型中输出层，获取所述训练样本的预测情感属性；
基于所述预测情感属性和所述训练样本的情感属性，训练所述目标信息处理模型。

4.根据权利要求1所述方法，其特征在于，在所述训练目标信息处理模型之后，所述方法还包括：
在所述训练样本中选择至少两个第一训练样本；
基于所述至少两个第一训练样本，训练至少两个候选信息处理模型；
利用所述至少两个候选信息处理模型，预测新的样本的预测情感属性。

5.根据权利要求4所述的方法，其特征在于，在所述利...

【专利技术属性】
技术研发人员：杨希，胡小克，
申请(专利权)人：中移苏州软件技术有限公司，中国移动通信集团有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人