System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 评论生成方法、装置、设备、存储介质及计算机程序产品制造方法及图纸_技高网

评论生成方法、装置、设备、存储介质及计算机程序产品制造方法及图纸

技术编号:42661010 阅读:9 留言:0更新日期:2024-09-10 12:18
本申请提供了一种评论生成方法、装置、设备、存储介质及计算机程序产品;方法包括:获取待评论数据以及对所述待评论数据的评论指示信息;其中,所述评论指示信息包括所述待评论数据的特征信息和/或待生成的评论数据的特征信息;基于所述待评论数据和所述评论指示信息,利用训练好的评论生成模型针对所述待评论数据进行符合所述评论指示信息的逐词预测处理,得到由多个预测词按照预测顺序拼接形成的评论数据;其中,所述评论生成模型为基于被评论样本数据、对所述被评论样本数据的评论指示样本、以及所述被评论样本数据关联的评论样本数据,对预设的大语言模型训练得到。通过本申请,能够提高生成的评论数据的准确性。

【技术实现步骤摘要】

本申请涉及自然语言处理技术,尤其涉及一种评论生成方法、装置、设备、存储介质及计算机程序产品


技术介绍

1、媒体平台中存在一定数量的官方媒体账号,官方媒体账号通常对一些社会时事或时政民生消息进行宣传或通报,而针对这类物料,媒体平台可以在评论区进行一些正能量的评论回复,以活跃评论区氛围并吸引更多用户的讨论,从而增强官方媒体账号的宣传功效。媒体平台通常利用各模型对这类物料生成对应的评论,但目前的模型往往局限于在较为单一且简单的文本生成任务上实现,当泛化到更复杂更广泛的数据以及任务上时,生成文本的准确性通常较低。


技术实现思路

1、本申请实施例提供一种评论生成方法、装置、存储介质及计算机程序产品,能够提高生成的评论数据与待评论数据之间的相关性,以及提高评论数据的准确性。

2、本申请实施例的技术方案是这样实现的:

3、本申请实施例提供一种评论生成方法,包括:获取待评论数据以及对所述待评论数据的评论指示信息;其中,所述评论指示信息包括所述待评论数据的特征信息和/或待生成的评论数据的特征信息;基于所述待评论数据和所述评论指示信息,利用训练好的评论生成模型针对所述待评论数据进行符合所述评论指示信息的逐词预测处理,得到由多个预测词按照预测顺序拼接形成的评论数据;其中,所述评论生成模型为基于被评论样本数据、对所述被评论样本数据的评论指示样本、以及所述被评论样本数据关联的评论样本数据,对预设的大语言模型训练得到。

4、本申请实施例提供一种评论生成装置,包括:第一获取模块,用于获取待评论数据以及对所述待评论数据的评论指示信息;其中,所述评论指示信息包括所述待评论数据的特征信息和/或待生成的评论数据的特征信息;生成模块,用于基于所述待评论数据和所述评论指示信息,利用训练好的评论生成模型针对所述待评论数据进行符合所述评论指示信息的逐词预测处理,得到由多个预测词按照预测顺序拼接形成的评论数据;其中,所述评论生成模型为基于被评论样本数据、对所述被评论样本数据的评论指示样本、以及所述被评论样本数据关联的评论样本数据,对预设的大语言模型训练得到。

5、在一些可能的实施方式中,所述装置还包括:第二获取模块,用于获取样本数据集;其中,所述样本数据集中的每一样本数据至少包括被评论样本数据、对所述被评论样本数据的评论指示样本、以及所述被评论样本数据关联的评论样本数据;其中,所述评论指示样本包括所述被评论样本数据的特征信息和/或所述评论样本数据的特征信息;迭代模块,用于基于所述样本数据集对所述大语言模型进行迭代训练,直至符合收敛条件得到所述评论生成模型,每次迭代训练的过程包括:针对每一样本数据,基于所述被评论样本数据以及对所述被评论样本数据的评论指示样本,利用所述大语言模型针对所述被评论样本数据进行符合所述评论指示样本的逐词预测处理,得到由多个预测词按照预测顺序拼接形成的评论预测数据;基于每一样本数据对应的评论预测数据与评论样本数据之间的差异,对所述大语言模型进行微调,得到对所述大语言模型进行微调后的模型参数。

6、在一些可能的实施方式中,所述第二获取模块,用于基于获取的历史被评论数据以及所述历史被评论数据关联的各历史评论数据,确定所述样本数据集中的被评论样本数据以及评论样本数据;其中,一个所述历史被评论数据为一个所述被评论样本数据,一个所述历史评论数据为一个所述评论样本数据;针对每一被评论样本数据,提取关联的各被评论样本数据的特征信息和/或评论样本数据的特征信息,并基于提取的特征信息生成所述被评论样本数据的评论指示样本。

7、在一些可能的实施方式中,所述评论样本数据的特征信息包括所述评论样本数据的语言风格特征;所述第二获取模块,用于针对每一评论样本数据,利用预设的语言风格分类模型对评论样本数据进行分类处理,得到评论样本数据的语言风格分类结果;其中,所述评论样本数据的语言风格分类结果用于表征所述评论样本数据的语言风格特征;基于每一评论样本数据的语言风格分类结果,生成包括各评论样本数据的语言风格特征的评论指示样本。

8、在一些可能的实施方式中,所述评论样本数据的特征信息包括所述评论样本数据的情感极性特征;所述第二获取模块,用于针对每一评论样本数据,利用预设的情感极性分类模型对评论样本数据进行分类处理,得到评论样本数据的情感极性分类结果;其中,所述评论样本数据的情感极性分类结果用于表征所述评论样本数据的情感极性特征;基于每一评论样本数据的情感极性分类结果,生成包括各评论样本数据的情感极性特征的评论指示样本。

9、在一些可能的实施方式中,所述评论样本数据的特征信息包括所述评论样本数据的频次特征;所述第二获取模块,用于对所述被评论样本数据关联的各评论样本数据进行聚类处理,得到关联评论内容主题的评论样本簇;确定每一评论样本簇包括的评论样本数据的数量;针对每一评论样本数据,基于所属的评论样本簇所包括的评论样本数据的数量,生成包括各评论样本数据的频次特征的评论指示样本;其中,所述评论样本数据所属的评论样本簇所包括的评论样本数据的数量,用于表征所述评论样本数据的频次特征。

10、在一些可能的实施方式中,所述被评论样本数据的特征信息包括所述被评论样本数据的第一用户特征,所述评论样本数据的特征信息包括所述评论样本数据的第二用户特征,所述第二获取模块,用于针对每一评论样本数据,获取所述评论样本数据关联的被评论样本数据的第一用户信息,和/或获取所述评论样本数据的第二用户信息;对每一评论样本数据关联的第一用户信息和/或第二用户信息进行特征提取;基于提取的第一用户信息的特征生成包括所述第一用户特征的评论指示样本;和/或,基于提取的第二用户信息的特征生成包括所述第二用户特征的评论指示样本。

11、在一些可能的实施方式中,所述迭代模块,用于基于所述被评论样本数据和所述评论指示样本,生成预设格式的待处理样本数据;基于所述待处理样本数据,利用所述大语言模型进行逐词预测处理,并将多个预测词按照预测顺序拼接形成所述评论预测数据。

12、在一些可能的实施方式中,所述迭代模块,用于针对每一样本数据,确定评论预测数据与评论样本数据之间的差异;基于每一样本数据的差异确定损失值;基于所述损失值对所述大语言模型进行微调,得到对所述大语言模型进行微调后的模型参数。

13、在一些可能的实施方式中,所述迭代模块,用于基于所述损失值调整预设的第一矩阵和预设的第二矩阵中的矩阵数据,其中,所述第一矩阵和第二矩阵为初始参数矩阵的低秩矩阵;基于所述初始参数矩阵,矩阵数据调整后的第一矩阵和第二矩阵,得到对所述大语言模型进行微调后的模型参数。

14、本申请实施例提供一种电子设备,包括:

15、存储器,用于存储可执行指令或者计算机程序;

16、处理器,用于执行所述存储器中存储的可执行指令或者计算机程序时,实现本申请实施例提供的评论生成方法。

17、本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序或可执行指令,用于引起处理器执本文档来自技高网...

【技术保护点】

1.一种评论生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述评论生成模型的训练方法,包括:

3.根据权利要求2所述的方法,其特征在于,所述获取样本数据集,包括:

4.根据权利要求3所述的方法,其特征在于,所述评论样本数据的特征信息包括所述评论样本数据的语言风格特征;

5.根据权利要求3所述的方法,其特征在于,所述评论样本数据的特征信息包括所述评论样本数据的情感极性特征;

6.根据权利要求3所述的方法,其特征在于,所述评论样本数据的特征信息包括所述评论样本数据的频次特征;

7.根据权利要求3所述的方法,其特征在于,所述被评论样本数据的特征信息包括所述被评论样本数据的第一用户特征,所述评论样本数据的特征信息包括所述评论样本数据的第二用户特征;

8.根据权利要求2或3所述的方法,其特征在于,所述基于所述被评论样本数据以及对所述被评论样本数据的评论指示样本,利用所述大语言模型针对所述被评论样本数据进行符合所述评论指示样本的逐词预测处理,得到由多个预测词按照预测顺序拼接形成的评论预测数据,包括:

9.一种评论生成装置,其特征在于,所述装置包括:

10.一种电子设备,其特征在于,所述电子设备包括:

11.一种计算机可读存储介质,其上存储有计算机程序或可执行指令,其特征在于,所述计算机程序或所述可执行指令被处理器执行时实现权利要求1至8任一项所述的方法。

12.一种计算机程序产品,包括计算机程序或可执行指令,其特征在于,所述计算机程序或所述可执行指令被处理器执行时实现权利要求1至8任一项所述的方法。

...

【技术特征摘要】

1.一种评论生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述评论生成模型的训练方法,包括:

3.根据权利要求2所述的方法,其特征在于,所述获取样本数据集,包括:

4.根据权利要求3所述的方法,其特征在于,所述评论样本数据的特征信息包括所述评论样本数据的语言风格特征;

5.根据权利要求3所述的方法,其特征在于,所述评论样本数据的特征信息包括所述评论样本数据的情感极性特征;

6.根据权利要求3所述的方法,其特征在于,所述评论样本数据的特征信息包括所述评论样本数据的频次特征;

7.根据权利要求3所述的方法,其特征在于,所述被评论样本数据的特征信息包括所述被评论样本数据的第一用户特征,所述评论样本数据的特征信息包括所述评论样本数据的第...

【专利技术属性】
技术研发人员:王晶魏梦溪周鑫王鹿鸣
申请(专利权)人:微梦创科网络科技中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1