商品营销文本生成模型的训练方法及商品营销文本生成方法技术

技术编号:37667569 阅读:20 留言:0更新日期:2023-05-26 04:27
本发明专利技术公开了一种商品营销文本生成模型的训练方法及商品营销文本生成方法。该方法包括:获取训练数据集中的训练商品序列和训练用户画像序列;其中,所述训练数据集中包含至少一个商品对应的预设商品序列以及至少一个用户标识对应的预设用户画像序列;将所述训练商品序列和所述训练用户画像序列输入到未训练完成的初始文本生成模型中,得到输出的预测商品营销文本结果;基于所述预测商品营销文本结果和标准商品营销文本结果,对所述初始文本生成模型的模型参数进行调整,直到得到训练完成的目标文本生成模型。本发明专利技术实施例解决了现有的文本生成模型的模型效果差的问题,有利于提高商品的点击率和转化率。高商品的点击率和转化率。高商品的点击率和转化率。

【技术实现步骤摘要】
商品营销文本生成模型的训练方法及商品营销文本生成方法


[0001]本专利技术涉及互联网
,尤其涉及一种商品营销文本生成模型的训练方法及商品营销文本生成方法。

技术介绍

[0002]在电子商务行业中存在大量的文本应用场景,如商品的推荐语、详情页和广告词等等,随着电子商务行业的蓬勃发展,人工撰写的方式已经不能满足其海量的文本需求。
[0003]文本生成技术是自然语言处理研究领域的一种基础且重要的技术,在机器翻译、文档摘要和对话系统等场景中有着广泛且深入的应用。针对某一商品,现有的文本生成技术主要将该商品的描述序列(如商品的类别、材质、地理位置等)输入到预先训练完成的文本生成模型中,得到所需的文本信息。
[0004]在实现本专利技术的过程中,发现现有技术中至少存在以下技术问题:
[0005]现有的文本生成模型的模型效果较差,输出的文本信息存在多样性和个性化匮乏的问题,从而导致商品的点击率和转化率都较低。

技术实现思路

[0006]本专利技术实施例提供了一种商品营销文本生成模型的训练方法及商品营销文本生成方法,以解决现有的文本生成模型的模型效果差的问题,丰富文本生成模型输出的文本信息的多样性和个性化,提高商品的点击率和转化率。
[0007]根据本专利技术一个实施例提供了一种商品营销文本生成模型的训练方法,该方法包括:
[0008]获取训练数据集中的训练商品序列和训练用户画像序列;其中,所述训练数据集中包含至少一个商品对应的预设商品序列以及至少一个用户标识对应的预设用户画像序列;
[0009]将所述训练商品序列和所述训练用户画像序列输入到未训练完成的初始文本生成模型中,得到输出的预测商品营销文本结果;
[0010]基于所述预测商品营销文本结果和标准商品营销文本结果,对所述初始文本生成模型的模型参数进行调整,直到得到训练完成的目标文本生成模型。
[0011]根据本专利技术另一个实施例提供了一种商品营销文本生成方法,该方法包括:
[0012]响应于检测到文本生成指令,获取与所述文本生成指令对应的待测数据集;其中,所述待测数据集中包含至少一个目标商品分别对应的待测商品序列以及目标用户标识对应的待测用户画像序列;
[0013]针对每个目标商品,将与所述目标商品对应的待测商品序列和所述待测用户画像序列输入到预先训练完成的目标文本生成模型中,得到输出的与所述目标商品对应的目标商品营销文本结果;
[0014]其中,所述目标文本生成模型是基于本专利技术实施例中的商品营销文本生成模型的
训练方法训练得到的。
[0015]根据本专利技术另一个实施例提供了一种商品营销文本生成模型的训练装置,该装置包括:
[0016]训练用户画像序列获取模块,用于获取训练数据集中的训练商品序列和训练用户画像序列;其中,所述训练数据集中包含至少一个商品对应的预设商品序列以及至少一个用户标识对应的预设用户画像序列;
[0017]预测商品营销文本结果输出模块,用于将所述训练商品序列和所述训练用户画像序列输入到未训练完成的初始文本生成模型中,得到输出的预测商品营销文本结果;
[0018]文本生成模型训练模块,用于基于所述预测商品营销文本结果和标准商品营销文本结果,对所述初始文本生成模型的模型参数进行调整,直到得到训练完成的目标文本生成模型。
[0019]根据本专利技术另一个实施例提供了一种商品营销文本生成装置,该装置包括:
[0020]待测数据集获取模块,用于响应于检测到文本生成指令,获取与所述文本生成指令对应的待测数据集;其中,所述待测数据集中包含至少一个目标商品分别对应的待测商品序列以及目标用户标识对应的待测用户画像序列;
[0021]目标商品营销文本结果输出模块,用于针对每个目标商品,将与所述目标商品对应的待测商品序列和所述待测用户画像序列输入到预先训练完成的目标文本生成模型中,得到输出的与所述目标商品对应的目标商品营销文本结果;
[0022]其中,所述目标文本生成模型是基于本专利技术实施例中的商品营销文本生成模型的训练方法训练得到的。
[0023]根据本专利技术另一个实施例提供了一种电子设备,所述电子设备包括:
[0024]至少一个处理器;以及
[0025]与所述至少一个处理器通信连接的存储器;其中,
[0026]所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例所述的商品营销文本生成模型的训练方法和/或商品营销文本生成方法。
[0027]根据本专利技术另一个实施例,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的商品营销文本生成模型的训练方法和/或商品营销文本生成方法。
[0028]本专利技术实施例的技术方案,通过将训练数据集中的训练商品序列和训练用户画像序列输入到未训练完成的初始文本生成模型中,得到输出的预测商品营销文本结果,基于预测商品营销文本结果和标准商品营销文本结果,对初始文本生成模型的模型参数进行调整,直到得到训练完成的目标文本生成模型,使得训练得到的目标文本生成模型的具备个性化定制功能,解决了现有的文本生成模型的模型效果差的问题,丰富了文本生成模型输出的文本信息的多样性,有助于提高商品的点击率和转化率。
[0029]应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0030]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0031]图1为本专利技术一个实施例所提供的一种商品营销文本生成模型的训练方法的流程图;
[0032]图2为本专利技术一个实施例所提供的一种初始文本生成模型的模型架构图;
[0033]图3为本专利技术一个实施例所提供的另一种商品营销文本生成模型的训练方法的流程图;
[0034]图4为本专利技术一个实施例所提供的一种商品营销文本生成方法的流程图;
[0035]图5为本专利技术一个实施例所提供的一种目标商品营销文本的示意图;
[0036]图6为本专利技术一个实施例所提供的一种商品营销文本生成模型的训练装置的结构示意图;
[0037]图7为本专利技术一个实施例所提供的一种商品营销文本生成装置的结构示意图;
[0038]图8为本专利技术一个实施例所提供的一种电子设备的结构示意图。
具体实施方式
[0039]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种商品营销文本生成模型的训练方法,其特征在于,包括:获取训练数据集中的训练商品序列和训练用户画像序列;其中,所述训练数据集中包含至少一个商品对应的预设商品序列以及至少一个用户标识对应的预设用户画像序列;将所述训练商品序列和所述训练用户画像序列输入到未训练完成的初始文本生成模型中,得到输出的预测商品营销文本结果;基于所述预测商品营销文本结果和标准商品营销文本结果,对所述初始文本生成模型的模型参数进行调整,直到得到训练完成的目标文本生成模型。2.根据权利要求1所述的方法,其特征在于,所述初始文本生成模型包括编码层、前馈网络层和解码层;所述将所述训练商品序列和所述训练用户画像序列输入到未训练完成的初始文本生成模型中,得到输出的预测商品营销文本结果,包括:通过所述初始文本生成模型中的编码层,基于输入的训练商品序列,确定训练商品特征,并基于输入的训练用户画像序列,确定训练用户画像特征;通过所述初始文本生成模型中的前馈网络层,基于所述编码层输出的训练用户画像特征,确定训练画像编码特征;通过所述初始文本生成模型中的解码层,基于所述编码层输出的训练商品特征以及所述前馈网络层输出的训练画像编码特征,输出预测商品营销文本结果。3.根据权利要求2所述的方法,其特征在于,所述编码层包括向量转换模块和编码模块,所述向量转换模块用于将输入的训练商品序列转化为训练商品向量,以及将输入的训练用户画像序列转换为训练用户画像向量;所述编码模块用于基于所述向量转换模块输出的训练商品向量,确定训练商品特征,以及基于所述向量转换模块输出的训练用户画像向量,确定训练用户画像特征。4.根据权利要求2所述的方法,其特征在于,所述预测商品营销文本结果包括由至少一个预测商品营销词语构成的预测商品营销文本;所述基于所述编码层输出的训练商品特征以及所述前馈网络层输出的训练画像编码特征,输出预测商品营销文本结果,包括:获取与当前时刻对应的上一时刻确定的上一预测商品营销词语;基于所述编码层输出的训练商品特征、所述前馈网络层输出的训练画像编码特征和所述上一预测商品营销词语,确定当前预测词语向量;基于所述当前预测词语向量,确定当前时刻的当前预测商品营销词语;基于至少一个时刻分别对应的预测商品营销词语,输出预测商品营销文本。5.根据权利要求4所述的方法,其特征在于,所述编码层是采用注意力机制的编码层,和/或,所述解码层是采用注意力机制的解码层。6.根据权利要求5所述的方法,其特征在于,所述解码层中当前时刻的当前查询矩阵是基于当前预测词语向量确定的,所述解码层中的键矩阵和值矩阵是基于训练商品特征与训练画像编码特征对应的训练融合特征确定的;其中,所述训练商品特征包括与所述训练商品序列中的至少一个训练商品属性词语分别对应的商品属性词语特征;所述训练融合特征包括至少一个商品融合特征,所述商品融合特征是通过对各所述商品属性词语特征和所述训练画像编码特征执行融合操作得到的。7.根据权利要求5所述的方法,其特征在于,所述预测商品营销文本结果还包括各所述预测商品营销词语分别对应的预测概率;所述基于所述编码层输出的训练商品特征以及所
述前馈网络层输出的训练用户向量,输出预测商品营销文本结果,还包括:基于所述当前预测词语向量和第一激活函数,确定生成概率;基于查询矩阵、键矩阵和第二激活函数,确定注意力权重,并基于所述注意力权重,确定拷贝概率;基于所述注意力权重和值矩阵,确定概率权重,并基于所述概率权重、所述生成概率和所述拷贝概率,...

【专利技术属性】
技术研发人员:李伟康李浩然徐松袁鹏
申请(专利权)人:京东科技信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1