一种评论生成方法、装置、设备及存储介质制造方法及图纸

技术编号:23099656 阅读:29 留言:0更新日期:2020-01-14 20:42
本申请提供了一种评论生成方法、装置、设备及存储介质,其中,方法包括:获取目标对象的上下文信息,其中,目标对象的上下文信息包括目标对象的标识、购买目标对象的用户的标识和购买目标对象的用户对目标对象的评分;利用预先建立的评论生成模型以及目标对象的上下文信息,生成针对目标对象的目标评论文本。本申请提供的评论生成方法利用评论生成模型能够自动生成对目标对象进行准确和全面评价的评论文本。

A review generation method, device, device and storage medium

【技术实现步骤摘要】
一种评论生成方法、装置、设备及存储介质
本申请涉及自然语言处理
,尤其涉及一种评论生成方法、装置、设备及存储介质。
技术介绍
随着互联网技术的发展,越来越多的用户选择在电商网站上购买自己需要的物品或服务,用户对物品或服务的评论对商家和消费者两方的影响都很大。可以理解的是,大多数消费者在针对物品或服务做出购买决策之前,通常会阅读针对物品或服务的用户评论,并且,消费者的购买行为会受评论内容的影响。另外,商家也会根据用户对已购物品或服务的评论调整服务方向。因此,优质的用户评论是帮助消费者发现产品质量和做出相应决策的重要信息源,也是帮助商家提升服务质量的催化剂。编写一段语义丰富、语法结构正确的评论需要用户花费较多的时间和精力,然而,大多数用户并不愿意花较多的时间和精力对其购买的物品或服务进行评论,这导致用户评论并不能对产品或服务进行准确全面的评价,用户评论不能对产品或服务进行准确评价不利于商家提升服务质量,同时在一定程度上也影响潜在消费者的购买决策。
技术实现思路
有鉴于此,本申请提供了一种评论生成方法、装置、设备及存储介质,用以生成能够对目标对象进行准确评价的评论文本,其技术方案如下:一种评论生成方法,包括:获取目标对象的上下文信息,其中,所述上下文信息包括所述目标对象的标识、购买所述目标对象的用户的标识,所述用户对所述目标对象的评分;利用预先建立的评论生成模型以及所述目标对象的上下文信息,生成针对所述目标对象的目标评论文本。可选的,所述利用预先建立的评论生成模型以及所述目标对象的上下文信息,生成针对所述目标对象的目标评论文本,包括:通过所述评论生成模型和所述目标对象的上下文信息,预测能够反映待生成的所述目标评论文本的整体内容走向的评论主题序列;通过所述评论生成模型和所述评论主题序列,生成评论模板,其中,所述评论模板中包括表征粗粒度语义的词,缺失表征细粒度语义的词;通过所述评论生成模型为所述评论模板补充所述表征细粒度语义的词,获得所述目标评论文本。可选的,所述通过所述评论生成模型和所述目标对象的上下文信息,预测能够反映待生成的所述目标评论文本的整体内容走向的评论主题序列,包括:通过所述评论生成模型的上下文编码器,将所述目标对象的上下文信息编码为上下文向量;通过所述评论生成模型的主题解码器和所述上下文向量,预测所述评论主题序列。可选的,所述通过所述评论生成模型和所述评论主题序列,生成评论模板,包括:通过所述评论生成模型的模板解码器,为所述评论主题序列中的每个主题预测一个评论模板,获得所述评论主题序列中每个主题对应的评论模板。可选的,所述通过所述评论生成模型为所述评论模板补充所述表征细粒度语义的词,获得所述目标评论文本,包括:通过所述评论生成模型的模板编码器,对所述评论模板进行编码,获得所述评论模板的向量表示;通过所述评论生成模型的评论解码器和所述评论模板的向量表示,预测所述评论模板缺失的表征细粒度语义的词,并将预测出的词补充至所述评论模板中。可选的,预先建立所述评论生成模型的过程包括:获取训练数据集,其中,所述训练数据集中包括多条训练数据,每条训练数据包括一训练上下文信息、该训练上下文信息对应的真实评论文本、该训练上下文信息对应的真实主题序列以及该训练上下文信息对应的真实评论模板;利用所述训练数据集中的训练数据训练评论生成模型。可选的,所述评论生成模型包括上下文编码器、主题解码器、模板解码器、模板编码器和评论解码器;所述利用所述训练数据集中的训练数据训练评论生成模型,包括:利用训练数据中的训练上下文信息训练所述上下文编码器;利用训练数据中的训练上下文信息和该训练上下文信息对应的真实主题序列,训练主题解码器;利用训练数据中训练上下文信息对应的真实主题序列和该训练上下文信息对应的真实评论模板,训练模板解码器;利用训练数据中训练上下文信息对应的真实评论模板和该训练上下文信息对应的真实评论文本,训练模板编码器和评论解码器。可选的,所述利用训练数据中的训练上下文信息和训练上下文信息对应的真实主题序列,训练所述主题解码器,包括:通过训练得到的上下文编码器,将训练上下文信息编码为上下文向量,得到该训练上下文信息对应的上下文向量;将该训练上下文信息对应的上下文向量输入主题解码器,获得主题解码器预测的主题序列,作为该训练上下文信息对应的预测主题序列;根据该训练上下文信息对应的预测主题序列、该训练上下文信息对应的真实主题序列,以及预设的第一损失函数,更新主题解码器的参数。可选的,所述通过训练得到的上下文编码器,将训练上下文信息编码为上下文向量,包括:利用预先构建的用户标识词典确定训练上下文信息中用户标识的索引标识,利用预先构建的对象标识词典确定该训练上下文信息中对象标识的索引标识,利用预先构建的评分词典确定该训练上下文信息中评分的索引标识;分别将所述用户标识的索引标识、所述对象标识的索引标识和所述评分的索引标识向量化,获得能够分别表征该训练上下文信息中用户标识、对象标识和评分的三个向量;通过所述训练得到的上下文编码器,将所述能够分别表征该训练上下文信息中用户标识、对象标识和评分的三个向量编码为一个上下文向量。可选的,所述利用训练数据中训练上下文信息对应的真实主题序列和该训练上下文信息对应的真实评论模板,训练模板解码器,包括:通过模板解码器为训练上下文信息对应的真实主题序列预测评论模板,得到该训练上下文信息对应的预测评论模板,其中,每个主题对应一个评论模板;根据该训练上下文信息对应的预测评论模板、该训练上下文信息对应的真实评论模板,以及预设的第二损失函数,更新模板解码器的参数。可选的,所述通过模板解码器为训练上下文信息对应的真实主题序列预测评论模板,包括:利用预先构建的主题词典,确定训练上下文信息对应的真实主题序列中每个主题的索引标识,获得评论主题索引标识序列;将所述评论主题索引标识序列输入模板解码器,获得该训练上下文信息对应的真实主题序列中每个主题对应的评论模板索引标识;利用预先建立的评论模板词典和该训练上下文信息对应的真实主题序列中每个主题对应的评论模板索引标识,确定该训练上下文信息对应的真实主题序列中每个主题对应的评论模板。可选的,预先构建所述评论模板词典的过程包括:获取评论文本集;对于所述评论文本集中的任一评论文本,对该评论文本中的每个词进行词性标注,得到该评论文本的词性标签序列,以得到所述评论文本集中每个评论文本的词性标签序列;对于所述评论文本集中的任一评论文本,根据该评论文本的词性标签序列和预先构建的主题代表词集合,对该评论文本中的非主题代表词用对应的词性标签替换,获得该评论文本对应的初始评论模板,以得到所述评论文本集中每个评论文本对应的初始评论模板;其中,所述主题代表词集合包括所述评论本文档来自技高网...

【技术保护点】
1.一种评论生成方法,其特征在于,包括:/n获取目标对象的上下文信息,其中,所述上下文信息包括所述目标对象的标识、购买所述目标对象的用户的标识,所述用户对所述目标对象的评分;/n利用预先建立的评论生成模型以及所述目标对象的上下文信息,生成针对所述目标对象的目标评论文本。/n

【技术特征摘要】
1.一种评论生成方法,其特征在于,包括:
获取目标对象的上下文信息,其中,所述上下文信息包括所述目标对象的标识、购买所述目标对象的用户的标识,所述用户对所述目标对象的评分;
利用预先建立的评论生成模型以及所述目标对象的上下文信息,生成针对所述目标对象的目标评论文本。


2.根据权利要求1所述的评论生成方法,其特征在于,所述利用预先建立的评论生成模型以及所述目标对象的上下文信息,生成针对所述目标对象的目标评论文本,包括:
通过所述评论生成模型和所述目标对象的上下文信息,预测能够反映待生成的所述目标评论文本的整体内容走向的评论主题序列;
通过所述评论生成模型和所述评论主题序列,生成评论模板,其中,所述评论模板中包括表征粗粒度语义的词,缺失表征细粒度语义的词;
通过所述评论生成模型为所述评论模板补充所述表征细粒度语义的词,获得所述目标评论文本。


3.根据权利要求2所述的评论生成方法,其特征在于,所述通过所述评论生成模型和所述目标对象的上下文信息,预测能够反映待生成的所述目标评论文本的整体内容走向的评论主题序列,包括:
通过所述评论生成模型的上下文编码器,将所述目标对象的上下文信息编码为上下文向量;
通过所述评论生成模型的主题解码器和所述上下文向量,预测所述评论主题序列。


4.根据权利要求2所述的评论生成方法,其特征在于,所述通过所述评论生成模型和所述评论主题序列,生成评论模板,包括:
通过所述评论生成模型的模板解码器,为所述评论主题序列中的每个主题预测一个评论模板,获得所述评论主题序列中每个主题对应的评论模板。


5.根据权利要求2所述的评论生成方法,其特征在于,所述通过所述评论生成模型为所述评论模板补充所述表征细粒度语义的词,获得所述目标评论文本,包括:
通过所述评论生成模型的模板编码器,对所述评论模板进行编码,获得所述评论模板的向量表示;
通过所述评论生成模型的评论解码器和所述评论模板的向量表示,预测所述评论模板缺失的表征细粒度语义的词,并将预测出的词补充至所述评论模板中。


6.根据权利要求1所述的评论生成方法,其特征在于,预先建立所述评论生成模型的过程包括:
获取训练数据集,其中,所述训练数据集中包括多条训练数据,每条训练数据包括一训练上下文信息、该训练上下文信息对应的真实评论文本、该训练上下文信息对应的真实主题序列以及该训练上下文信息对应的真实评论模板;
利用所述训练数据集中的训练数据训练评论生成模型。


7.根据权利要求6所述的评论生成方法,其特征在于,所述评论生成模型包括上下文编码器、主题解码器、模板解码器、模板编码器和评论解码器;
所述利用所述训练数据集中的训练数据训练评论生成模型,包括:
利用训练数据中的训练上下文信息训练所述上下文编码器;
利用训练数据中的训练上下文信息和该训练上下文信息对应的真实主题序列,训练主题解码器;
利用训练数据中训练上下文信息对应的真实主题序列和该训练上下文信息对应的真实评论模板,训练模板解码器;
利用训练数据中训练上下文信息对应的真实评论模板和该训练上下文信息对应的真实评论文本,训练模板编码器和评论解码器。


8.根据权利要求7所述的评论生成方法,其特征在于,所述利用训练数据中的训练上下文信息和训练上下文信息对应的真实主题序列,训练所述主题解码器,包括:
通过训练得到的上下文编码器,将训练上下文信息编码为上下文向量,得到该训练上下文信息对应的上下文向量;
将该训练上下文信息对应的上下文向量输入主题解码器,获得主题解码器预测的主题序列,作为该训练上下文信息对应的预测主题序列;
根据该训练上下文信息对应的预测主题序列、该训练上下文信息对应的真实主题序列,以及预设的第一损失函数,更新主题解码器的参数。


9.根据权利要求8所述的评论生成方法,其特征在于,所述通过训练得到的上下文编码器,将训练上下文信息编码为上下文向量,包括:
利用预先构...

【专利技术属性】
技术研发人员:赵鑫李军毅付瑞吉王士进胡国平秦兵刘挺
申请(专利权)人:河北省讯飞人工智能研究院
类型:发明
国别省市:河北;13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1