【技术实现步骤摘要】
一种模型训练方法、装置及电子设备
[0001]本申请涉及人工智能(artificial intelligence,AI)
,尤其涉及一种模型训练方法、装置及电子设备。
技术介绍
[0002]目前,在进行模型训练时,往往是先对样本数据进行特征提取,然后将提取到的特征输入到待训练的模型(比如:用于进行推荐任务的神经网络模型等)中,以进行模型训练。一般地,样本数据可以被划分为连续特征和离散特征。其中,连续特征一般指的是数字型的特征,且该特征可取的值有无限多个,比如,点击率、下载率等;离散特征指的是具有有限个取值的特征,比如,性别、物品类型等。对于离散特征,一般可以使用独热编码(one
‑
hot encoding)的方式对该特征进行向量表示。对于连续特征,一般采用类别化、归一化和离散化等方式对该特征进行向量表示。但目前在对连续特征进行向量表示时,均难以保持连续特征独有的“连续且有差异”的特性,致使后续训练得到的模型的精度较差。
技术实现思路
[0003]本申请提供了一种模型训练方法、装置、电子设备、计算机存储介质及计算机程序产品,在利用连续特征对模型训练过程中,能够在对连续特征进行向量表示时,保持连续特征独有的“连续且有差异”的特性,提升模型训练的准确度。
[0004]第一方面,本申请提供一种模型训练方法,该方法包括:获取训练样本中的第一特征值,第一特征值为数字;通过n个不同的进制,对第一特征值进行编码,以得到n个编码序列,n≥1,其中,进制和编码序列一一对应;根据n个编码序列 ...
【技术保护点】
【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:获取训练样本中的第一特征值,所述第一特征值为数字;通过n个不同的进制,对所述第一特征值进行编码,以得到n个编码序列,n≥1,其中,所述进制和所述编码序列一一对应;根据所述n个编码序列,确定所述第一特征值的向量表示;根据所述向量表示,对用于进行推荐任务的神经网络模型进行训练。2.根据权利要求1所述的方法,其特征在于,当n=1时,所述根据所述n个编码序列,确定所述第一特征值的向量表示,具体包括:分别获取所述编码序列中各个编码对应的向量表示,以得到m个向量表示;对所述m个向量表示进行聚合,以得到所述第一特征值的向量表示。3.根据权利要求1所述的方法,其特征在于,当n≥2时,所述根据所述n个编码序列,确定所述第一特征值的向量表示,具体包括:分别获取所述n个编码序列中各个编码序列的向量表示,其中,针对所述n个编码序列中的任意一个编码序列,分别获取所述任意一个编码序列中各个编码对应的向量表示,以及,对所述任意一个编码序列中各个编码对应的向量表示进行聚合,以得到所述任意一个编码序列的向量表示;对所述n个编码序列中各个编码序列的向量表示进行聚合,以得到所述第一特征值的向量表示。4.根据权利要求2或3所述的方法,其特征在于,对所述n个编码序列中任意一个编码序列中各个编码对应的向量表示进行聚合,以得到所述任意一个编码序列的向量表示,具体包括:获取所述任意一个编码序列中各个编码所在位置的权重,其中,所述编码所在位置的权重用于表征所述编码所在位置的重要程度;利用所述任意一个编码序列中各个编码所在位置的权重,对所述任意一个编码序列中各个编码对应的向量表示进行加权求和,以得到所述任意一个编码序列的向量表示。5.根据权利要求4所述的方法,其特征在于,所述获取所述任意一个编码序列中各个编码所在的位置的权重,具体包括:分别为所述任意一个编码序列中各个编码所在位置分配一个参数,以得到一个参数矩阵,所述参数用于学习相应的位置的重要性;将所述任意一个编码序列与所述参数矩阵相乘,并对得到的结果进行归一化处理,以得到所述任意一个编码序列中各个编码所在的位置的权重。6.根据权利要求3
‑
5任一所述的方法,其特征在于,当n≥2时,所述对所述n个编码序列中各个编码序列的向量表示进行聚合,以得到所述第一特征值的向量表示,具体包括:获取所述n个编码序列中各个编码序列所占的权重,其中,所述编码序列所占的权重用于表征所述编码序列的重要程度;利用所述n个编码序列中各个编码序列所占的权重,对所述n个编码序列中各个编码序列的向量表示进行加权求和,以得到所述第一特征值的向量表示。7.根据权利要求6所述的方法,其特征在于,所述获取所述n个编码序列中各个编码序列所占的权重,具体包括:
分别获取所述n个编码序列中各个编码序列的重要性分数,以得到n个重要性分数,其中,针对所述n个编码序列中任意一个编码序列,基于所述第一特征值和所述第一特征值所属特征域对应的向量表示,得到第一向量,以及,基于所述任意一个编码序列的向量表示和所述第一向量,得到所述任意一个编码序列的重要性分数;基于所述n个重要性分数,确定所述n个编码序列中各个编码序列所占的权重。8.根据权利要求3
‑
7任一所述的方法,其特征在于,当n≥2时,所述方法还包括:获取正样本集合和负样本集合,所述正样本集合中包括至少一个正样本对,所述负样本集合中包括至少一个负样本对,每个所述正样本对中均包括同一个特征值在两个不同进制下的向量表示,每个所述负样本对中均包括不同特征值在两个进制下的向量表示,其中,所述正样本对所对应的特征值和所述负样本对所对应的特征值属于同一特征域,且所述负样本对所对应的特征值属于不同训练样本;通过对比学习,对所述正样本集合和所述负样本集合进行处理,以得到第一损失;根据所述第一损失和第二损失,对所述神经网络模型进行训练,其中,所述第二损失至少基于所述第一特征值的向量表示对所述神经网络模型进行训练得到。9.一种模型训练装置,其特征在于,所述装置包括:获取模块,用于获取训练样本中的第一特征值,所述第一特征值为数字;处理模块,用于通过n个不同的进制,对所述第一特征值进行编码,以得到n个编码序列,n≥1,其中,所述进制和所述编码序列一一对应;所述处理模块,还用于根据所述n个编码序列,确定所述第一特征值的向量表示;所述处理模块,还用于根据所述向量表示,对用于进行推荐任务的神经网络模型进行训练。10.根...
【专利技术属性】
技术研发人员:陈渤,郭慧丰,唐睿明,董振华,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。