【技术实现步骤摘要】
商品营销文本生成模型的训练方法及商品营销文本生成方法
[0001]本专利技术涉及互联网
,尤其涉及一种商品营销文本生成模型的训练方法及商品营销文本生成方法。
技术介绍
[0002]在电子商务行业中存在大量的文本应用场景,如商品的推荐语、详情页和广告词等等,随着电子商务行业的蓬勃发展,人工撰写的方式已经不能满足其海量的文本需求。
[0003]文本生成技术是自然语言处理研究领域的一种基础且重要的技术,在机器翻译、文档摘要和对话系统等场景中有着广泛且深入的应用。针对某一商品,现有的文本生成技术主要将该商品的描述序列(如商品的类别、材质、地理位置等)输入到预先训练完成的文本生成模型中,得到所需的文本信息。
[0004]在实现本专利技术的过程中,发现现有技术中至少存在以下技术问题:
[0005]现有的文本生成模型的模型效果较差,输出的文本信息存在多样性和个性化匮乏的问题,从而导致商品的点击率和转化率都较低。
技术实现思路
[0006]本专利技术实施例提供了一种商品营销文本生成模型的训练方法及商品营销文本生成方法,以解决现有的文本生成模型的模型效果差的问题,丰富文本生成模型输出的文本信息的多样性和个性化,提高商品的点击率和转化率。
[0007]根据本专利技术一个实施例提供了一种商品营销文本生成模型的训练方法,该方法包括:
[0008]获取训练数据集中的训练商品序列和训练用户画像序列;其中,所述训练数据集中包含至少一个商品对应的预设商品序列以及至少一个用户标识对应的预设 ...
【技术保护点】
【技术特征摘要】
1.一种商品营销文本生成模型的训练方法,其特征在于,包括:获取训练数据集中的训练商品序列和训练用户画像序列;其中,所述训练数据集中包含至少一个商品对应的预设商品序列以及至少一个用户标识对应的预设用户画像序列;将所述训练商品序列和所述训练用户画像序列输入到未训练完成的初始文本生成模型中,得到输出的预测商品营销文本结果;基于所述预测商品营销文本结果和标准商品营销文本结果,对所述初始文本生成模型的模型参数进行调整,直到得到训练完成的目标文本生成模型。2.根据权利要求1所述的方法,其特征在于,所述初始文本生成模型包括编码层、前馈网络层和解码层;所述将所述训练商品序列和所述训练用户画像序列输入到未训练完成的初始文本生成模型中,得到输出的预测商品营销文本结果,包括:通过所述初始文本生成模型中的编码层,基于输入的训练商品序列,确定训练商品特征,并基于输入的训练用户画像序列,确定训练用户画像特征;通过所述初始文本生成模型中的前馈网络层,基于所述编码层输出的训练用户画像特征,确定训练画像编码特征;通过所述初始文本生成模型中的解码层,基于所述编码层输出的训练商品特征以及所述前馈网络层输出的训练画像编码特征,输出预测商品营销文本结果。3.根据权利要求2所述的方法,其特征在于,所述编码层包括向量转换模块和编码模块,所述向量转换模块用于将输入的训练商品序列转化为训练商品向量,以及将输入的训练用户画像序列转换为训练用户画像向量;所述编码模块用于基于所述向量转换模块输出的训练商品向量,确定训练商品特征,以及基于所述向量转换模块输出的训练用户画像向量,确定训练用户画像特征。4.根据权利要求2所述的方法,其特征在于,所述预测商品营销文本结果包括由至少一个预测商品营销词语构成的预测商品营销文本;所述基于所述编码层输出的训练商品特征以及所述前馈网络层输出的训练画像编码特征,输出预测商品营销文本结果,包括:获取与当前时刻对应的上一时刻确定的上一预测商品营销词语;基于所述编码层输出的训练商品特征、所述前馈网络层输出的训练画像编码特征和所述上一预测商品营销词语,确定当前预测词语向量;基于所述当前预测词语向量,确定当前时刻的当前预测商品营销词语;基于至少一个时刻分别对应的预测商品营销词语,输出预测商品营销文本。5.根据权利要求4所述的方法,其特征在于,所述编码层是采用注意力机制的编码层,和/或,所述解码层是采用注意力机制的解码层。6.根据权利要求5所述的方法,其特征在于,所述解码层中当前时刻的当前查询矩阵是基于当前预测词语向量确定的,所述解码层中的键矩阵和值矩阵是基于训练商品特征与训练画像编码特征对应的训练融合特征确定的;其中,所述训练商品特征包括与所述训练商品序列中的至少一个训练商品属性词语分别对应的商品属性词语特征;所述训练融合特征包括至少一个商品融合特征,所述商品融合特征是通过对各所述商品属性词语特征和所述训练画像编码特征执行融合操作得到的。7.根据权利要求5所述的方法,其特征在于,所述预测商品营销文本结果还包括各所述预测商品营销词语分别对应的预测概率;所述基于所述编码层输出的训练商品特征以及所
述前馈网络层输出的训练用户向量,输出预测商品营销文本结果,还包括:基于所述当前预测词语向量和第一激活函数,确定生成概率;基于查询矩阵、键矩阵和第二激活函数,确定注意力权重,并基于所述注意力权重,确定拷贝概率;基于所述注意力权重和值矩阵,确定概率权重,并基于所述概率权重、所述生成概率和所述拷贝概率,...
【专利技术属性】
技术研发人员:李伟康,李浩然,徐松,袁鹏,
申请(专利权)人:京东科技信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。