用于输出信息的方法和装置制造方法及图纸

技术编号:31227763 阅读:12 留言:0更新日期:2021-12-08 09:37
本申请实施例公开了用于输出信息的方法和装置。该方法的一具体实施方式包括:获取物品的描述文本,提取描述文本中字符的字符向量和位置编码向量,其中,位置编码向量用于表征字符在描述文本中的位置;将输入向量输入预先训练的卖点词识别模型中,得到描述文本中字符的标签和字符对应的概率,其中,卖点词识别模型是基于预设的卖点词集合中的卖点词对应的相关指标,利用强化学习方法训练得到的,相关指标包括以下至少一项:转化率和点击率;基于描述文本中字符的标签,生成卖点词集合;基于卖点词中的字符对应的概率,确定卖点词对应的概率,以及基于卖点词对应的概率,从卖点词集合中选取卖点词进行输出。该实施方式可以挖掘出更加优质的卖点词。出更加优质的卖点词。出更加优质的卖点词。

【技术实现步骤摘要】
用于输出信息的方法和装置


[0001]本申请实施例涉及计算机
,具体涉及用于输出信息的方法和装置。

技术介绍

[0002]商品的卖点词挖掘,是指从输入文本中提取有价值有亮点的词汇。在电商领域,优质的卖点词往往既能方便用户快速了解商品特性,又能提升商品转化率,为商家带来利润。商品的卖点词挖掘通常被视为序列标注问题,传统的基于序列标注策略的卖点词挖掘,受到交叉熵优化目标函数的影响,挖掘到的卖点词往往集中在高频词。但是高频并不意味着线上转化率高,很多转化率高的低频卖点词,现有方法难以挖掘出来。如何挖掘出用户感兴趣的优质卖点词,而不是千篇一律的通用高频卖点词,对于各个电商公司具有重要意义。

技术实现思路

[0003]本申请实施例提出了用于输出信息的方法和装置。
[0004]第一方面,本申请实施例提供了一种用于输出信息的方法,包括:获取物品的描述文本,提取描述文本中字符的字符向量和位置编码向量,其中,位置编码向量用于表征字符在描述文本中的位置;将输入向量输入预先训练的卖点词识别模型中,得到描述文本中字符的标签和字符对应的概率,其中,输入向量是基于字符的字符向量和位置编码向量所确定出的,标签包括用于表征字符是卖点词中的字符的标签,卖点词识别模型是基于预设的卖点词集合中的卖点词对应的相关指标,利用强化学习方法训练得到的,相关指标包括以下至少一项:转化率和点击率;基于描述文本中字符的标签,生成卖点词集合;基于卖点词中的字符对应的概率,确定卖点词对应的概率,以及基于卖点词对应的概率,从卖点词集合中选取卖点词进行输出。
[0005]第二方面,本申请实施例提供了一种用于输出信息的装置,包括:获取单元,被配置成获取物品的描述文本,提取描述文本中字符的字符向量和位置编码向量,其中,位置编码向量用于表征字符在描述文本中的位置;输入单元,被配置成将输入向量输入预先训练的卖点词识别模型中,得到描述文本中字符的标签和字符对应的概率,其中,输入向量是基于字符的字符向量和位置编码向量所确定出的,标签包括用于表征字符是卖点词中的字符的标签,卖点词识别模型是基于预设的卖点词集合中的卖点词对应的相关指标,利用强化学习方法训练得到的,相关指标包括以下至少一项:转化率和点击率;生成单元,被配置成基于描述文本中字符的标签,生成卖点词集合;输出单元,被配置成基于卖点词中的字符对应的概率,确定卖点词对应的概率,以及基于卖点词对应的概率,从卖点词集合中选取卖点词进行输出。
[0006]第三方面,本申请实施例提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如第一方面中任一实现方式描述的方法。
[0007]第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,其
中,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
[0008]本申请的上述实施例提供的用于输出信息的方法和装置,通过获取物品的描述文本,提取上述描述文本中字符的字符向量和位置编码向量;之后,将输入向量输入预先训练的卖点词识别模型中,得到上述描述文本中字符的标签和字符对应的概率,其中,上述卖点词识别模型是基于预设的卖点词集合中的卖点词对应的转化率和/或点击率,利用强化学习方法训练得到的;而后,基于上述描述文本中字符的标签,生成卖点词集合;最后,基于卖点词中的字符对应的概率,确定卖点词对应的概率,以及基于卖点词对应的概率,从上述卖点词集合中选取卖点词进行输出。这种方式以提高点击率和/或转化率的线上指标为优化目标,对卖点词识别模型进行强化学习,通过这种方式可以挖掘出更加优质的卖点词,从而提高商品信息的点击率和/或转化率。
附图说明
[0009]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
[0010]图1是本申请的各个实施例可以应用于其中的示例性系统架构图;
[0011]图2是根据本申请的用于输出信息的方法的一个实施例的流程图;
[0012]图3是根据本申请的用于输出信息的方法的又一个实施例的流程图;
[0013]图4是根据本申请的用于输出信息的方法的利用强化学习方法训练卖点词识别模型的一个示意图;
[0014]图5是根据本申请的用于输出信息的装置的一个实施例的结构示意图;
[0015]图6是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
[0016]下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。
[0017]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0018]图1示出了可以应用本申请的用于输出信息的方法的实施例的示例性系统架构100。
[0019]如图1所示,系统架构100可以包括用户终端1011、1012,网络1021、1022,服务器103和输出终端1041、1042、1043。网络1021用以在用户终端1011、1012和服务器103之间提供通信链路的介质。网络1022用以在服务器103和输出终端1041、1042、1043之间提供通信链路的介质。网络1021、1022可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0020]用户终端1011、1012可以通过网络1021与服务器103交互,以发送或接收消息(例如,服务器103可以从用户终端1011、1012中获取物品的描述文本)。用户终端1011、1012上可以安装有各种通讯客户端应用,例如购物类应用、文本编辑类应用和即时通讯软件等。
[0021]用户终端1011、1012可以是硬件,也可以是软件。当用户终端1011、1012为硬件时,
可以是支持信息交互的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当用户终端1011、1012为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
[0022]输出终端1041、1042、1043可以通过网络1022与服务器103交互,以发送或接收消息等(例如,输出终端1041、1042、1043可以接收服务器103输出的卖点词)。输出终端1041、1042、1043上可以安装有各种通讯客户端应用,例如购物类应用、即时通讯软件等。
[0023]输出终端1041、1042、1043可以是硬件,也可以是软件。当输出终端1041、1042、1043为硬件时,可以是支持信息交互的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当输出终端本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于输出信息的方法,包括:获取物品的描述文本,提取所述描述文本中字符的字符向量和位置编码向量,其中,所述位置编码向量用于表征字符在所述描述文本中的位置;将输入向量输入预先训练的卖点词识别模型中,得到所述描述文本中字符的标签和字符对应的概率,其中,所述输入向量是基于字符的字符向量和位置编码向量所确定出的,所述标签包括用于表征字符是卖点词中的字符的标签,所述卖点词识别模型是基于预设的卖点词集合中的卖点词对应的相关指标,利用强化学习方法训练得到的,所述相关指标包括以下至少一项:转化率和点击率;基于所述描述文本中字符的标签,生成卖点词集合;基于卖点词中的字符对应的概率,确定卖点词对应的概率,以及基于卖点词对应的概率,从所述卖点词集合中选取卖点词进行输出。2.根据权利要求1所述的方法,其中,所述卖点词识别模型包括双向编码层、双向长短期记忆层和条件随机场层;以及所述将输入向量输入预先训练的卖点词识别模型中,得到所述描述文本中字符的标签和字符对应的概率,包括:将输入向量输入所述双向编码层,得到第一向量;将所述第一向量输入所述双向长短期记忆层,得到第二向量;将所述第二向量输入所述条件随机场层,得到所述描述文本中字符的标签和字符对应的概率。3.根据权利要求1所述的方法,其中,所述卖点词识别模型的策略是通过如下公式确定的:其中,γ表征折扣率,γ∈[0,1],k表征执行次数,t表征当前时刻,r
t+k
表征所述卖点词识别模型在第k次执行时所获得的奖励值,s
t
表征当前时刻的状态,表征在当前时刻的状态下执行一组动作后所得到的累积奖励值,表征累积奖励值的期望值,π表征使累积奖励值的期望值取最大值时所对应的卖点词选取路径。4.根据权利要求3所述的方法,其中,所述奖励值是卖点词对应的转化率和点击率的加权平均值。5.根据权利要求1-4之一所述的方法,其中,所述方法还包括:针对所述卖点词集合中的每个卖点词,确定该卖点词是否对应有相关指标,若否,则获取该卖点词的k近邻卖点词,将所述k近邻卖点词对应的相关指标的加权平均值确定为该卖点词对应的相关指标,其中,针对所述k近邻卖点词中的每个近邻卖点词,该近邻卖点词的权重为该近邻卖点词的词向量与该卖点词的词向量之间的...

【专利技术属性】
技术研发人员:徐松李浩然袁鹏
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1