System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于大语言模型的自适应知识增强的多域推荐方法技术_技高网

基于大语言模型的自适应知识增强的多域推荐方法技术

技术编号:43267263 阅读:7 留言:0更新日期:2024-11-08 20:45
本发明专利技术提供一种基于大语言模型的自适应知识增强的多域推荐方法,包括:获取目标用户的样本数据;基于多个推荐域对应的文本信息分别构建域共享提示模板;基于目标用户在目标域对应的文本信息和用户知识库构建独域提示模板;调用大语言模型基于域共享提示模板和独域提示模板进行特征学习,得到目标用户的域不变特征和独域偏好特征;基于目标用户的域不变特征和独域偏好特征进行多任务模型构建,对多任务模型进行优化训练生成多域推荐模型,通过多域推荐模型完成针对目标用户的多域推荐。通过设计两类提示模板对大语言模型进行训练,学习目标用户的域不变特征和独域偏好特征,有效提升了多域推荐模型的预测性能。

【技术实现步骤摘要】

本专利技术涉及电数字数据处理,尤其涉及一种基于大语言模型的自适应知识增强的多域推荐方法


技术介绍

1、多域推荐(multi-domain recommendation, mdr)旨在利用来自多个领域的各类数据(基于id的实体、标签、属性等),来同时提高各个领域的推荐性能,已经引起学术界和工业界的广泛关注。一般来说,在线平台可以提供来自不同领域的各种物品,如购物网站页面上包含的书籍、服装、玩具和其它领域的产品;平台上的用户可以浏览或购买不同领域的任何商品,他们的多域交互行为可以为推荐模型提供丰富的训练样本和偏好知识。尽管现有的许多工作都致力于提高多域推荐的预测性能,但其预测效果仍难以满足实际场景的应用要求。

2、最近,大语言模型(large language models, llms)在许多下游任务(如文本生成、智能问题和数学推理)中表现出令人印象深刻的能力,被认为是实现通用人工智能的关键一步。现有一些开创性的工作在探索llms在推荐系统中的应用方面也显示出了非凡的能力,这些工作试图根据不同的提示或指令调优来直接利用llms生成最终的推荐结果。然而,由于在特定任务训练中缺乏广泛的推荐领域数据,llms很难做出准确的预测。为此,研究者通过向模型中注入协同信号,进一步对llms进行微调,结果发现这些方法仍然无法超越以前特定的领域模型。

3、具体来说,现有的多域推荐方法主要存在以下缺陷:首先是推荐领域的协同信息与文本信息之间的语义差距问题。现有的推荐模型主要依赖基于用户或项目嵌入id(如userid、itemid等)的协同交互来进行推荐,而llms通常采用基于文本的语料库来进行模型训练。因此,通常直接将协同嵌入数据输入llms进行训练可能会大大降低推荐性能。另一方面,舍弃大量推荐数据,仅利用提供的文本数据进行llms训练,也会大大限制推荐效率。因此,训练数据间的语义差距挑战使得现有模型难以充分利用llms的生成能力来解决推荐任务。

4、其次是传统推荐模型中稀疏交互问题。大多数针对特定领域的模型可以利用少量交互样本生成推荐结果。然而,由于监督信号不足,这些模型在稀疏场景中表现不佳,而且一些用户配置文件和侧信息没有被有效利用来提高推荐性能。此外,现有的基于llms的推荐主要集中在序列推荐和新闻推荐任务上,还没有研究探讨 llm技术在多域推荐场景中的性能。


技术实现思路

1、本专利技术提供一种基于大语言模型的自适应知识增强的多域推荐方法,用以解决现有技术中推荐领域的协同信息与文本信息之间存在语义差距导致推荐性能较差,且推荐场景较为局限的缺陷,实现了通过设计两类提示模板对大语言模型进行训练,学习目标用户的域不变特征和独域偏好特征,有效提升了多域推荐模型的预测性能。

2、本专利技术提供一种基于大语言模型的自适应知识增强的多域推荐方法,包括如下步骤。

3、获取目标用户在多个推荐域分别对应的文本信息,以及在目标域对应的文本信息,所述文本信息包括文本描述信息和协同信息;

4、基于所述目标用户在多个推荐域对应的文本信息分别构建域共享提示模板;

5、基于所述目标用户在目标域对应的文本信息和用户知识库构建独域提示模板;

6、调用大语言模型基于所述域共享提示模板进行特征学习,得到所述目标用户的域不变特征,调用所述大语言模型基于所述独域提示模板进行特征学习,得到所述目标用户的独域偏好特征;

7、基于所述目标用户的域不变特征和独域偏好特征进行多任务模型构建,对所述多任务模型进行优化训练生成多域推荐模型,通过所述多域推荐模型完成针对目标用户的多域推荐。

8、根据本专利技术提供的一种基于大语言模型的自适应知识增强的多域推荐方法,所述用户知识库的构建方法,包括:

9、获取所述目标用户的历史检索实例,并基于所述历史检索实例构建初始用户知识库;

10、将所述历史检索实例与外部常识知识库中的实例进行实体链接处理,并将所述外部常识知识库中与所述历史检索实例相链接的实例添加至所述初始用户知识库,得到所述用户知识库。

11、根据本专利技术提供的一种基于大语言模型的自适应知识增强的多域推荐方法,所述文本信息还包括所述目标用户在多个推荐域中进行交互的项目信息,所述方法还包括:

12、对所述目标用户在多个推荐域分别对应的所述协同信息、所述文本描述信息和所述项目信息进行分词化处理;

13、将分词化处理结果进行混合编码处理,得到第一序列表示空间中的多域嵌入向量序列;

14、所述调用大语言模型基于所述域共享提示模板进行特征学习,得到所述目标用户的域不变特征,包括:

15、调用大语言模型基于所述多域嵌入向量序列进行特征学习,得到所述目标用户的域不变特征。

16、根据本专利技术提供的一种基于大语言模型的自适应知识增强的多域推荐方法,所述方法还包括:

17、对所述多域嵌入向量序列进行特征映射处理,得到同一特征空间的多域嵌入向量序列;

18、所述调用大语言模型基于所述多域嵌入向量序列进行特征学习,得到所述目标用户的域不变特征,包括:

19、调用大语言模型基于所述同一特征空间的多域嵌入向量序列进行特征学习,得到所述目标用户的域不变特征。

20、根据本专利技术提供的一种基于大语言模型的自适应知识增强的多域推荐方法,所述文本信息还包括与所述目标域对应的项目信息,所述方法还包括:

21、对所述目标用户在目标域对应的所述协同信息、所述用户知识库、所述文本描述信息和所述项目信息分别进行分词化处理;

22、将分词化处理结果进行混合编码处理,得到第二序列表示空间中的独域嵌入向量序列;

23、所述调用大语言模型基于所述独域提示模板进行特征学习,得到所述目标用户的独域偏好特征,包括:

24、调用大语言模型基于所述独域嵌入向量序列进行特征学习,得到所述目标用户的独域偏好特征。

25、根据本专利技术提供的一种基于大语言模型的自适应知识增强的多域推荐方法,所述方法还包括:

26、对所述独域嵌入向量序列进行特征映射处理,得到同一特征空间的独域嵌入向量序列;

27、所述调用大语言模型基于所述独域嵌入向量序列进行特征学习,得到所述目标用户的独域偏好特征,包括:

28、调用大语言模型基于所述同一特征空间的独域嵌入向量序列进行特征学习,得到所述目标用户的独域偏好特征。

29、根据本专利技术提供的一种基于大语言模型的自适应知识增强的多域推荐方法,所述协同信息包括所述目标用户的实体标识符信息,以及所述目标用户在多个推荐域中进行交互的项目的实体标识符信息。

30、本专利技术还提供一种基于大语言模型的自适应知识增强的多域推荐装置,包括如下模块:

31、获取模块,用于获取目标用户在多个推荐域分别对应的文本信息,以及在目标域对应的文本信息,其中,所述文本信息包括文本描述信息和协本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的自适应知识增强的多域推荐方法,其特征在于,包括:

2.根据权利要求1所述的基于大语言模型的自适应知识增强的多域推荐方法,其特征在于,所述用户知识库的构建方法包括:

3.根据权利要求1所述的基于大语言模型的自适应知识增强的多域推荐方法,其特征在于,所述文本信息还包括所述目标用户在多个推荐域中进行交互的项目信息,所述方法还包括:

4.根据权利要求3所述的基于大语言模型的自适应知识增强的多域推荐方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的基于大语言模型的自适应知识增强的多域推荐方法,其特征在于,所述文本信息还包括与所述目标域对应的项目信息,所述方法还包括:

6.根据权利要求5所述的基于大语言模型的自适应知识增强的多域推荐方法,其特征在于,所述方法还包括:

7.根据权利要求1所述的基于大语言模型的自适应知识增强的多域推荐方法,其特征在于,所述协同信息包括所述目标用户的实体标识符信息,以及所述目标用户在多个推荐域中进行交互的项目的实体标识符信息。

8.一种基于大语言模型的自适应知识增强的多域推荐装置,其特征在于,包括:

9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述基于大语言模型的自适应知识增强的多域推荐方法。

10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于大语言模型的自适应知识增强的多域推荐方法。

...

【技术特征摘要】

1.一种基于大语言模型的自适应知识增强的多域推荐方法,其特征在于,包括:

2.根据权利要求1所述的基于大语言模型的自适应知识增强的多域推荐方法,其特征在于,所述用户知识库的构建方法包括:

3.根据权利要求1所述的基于大语言模型的自适应知识增强的多域推荐方法,其特征在于,所述文本信息还包括所述目标用户在多个推荐域中进行交互的项目信息,所述方法还包括:

4.根据权利要求3所述的基于大语言模型的自适应知识增强的多域推荐方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的基于大语言模型的自适应知识增强的多域推荐方法,其特征在于,所述文本信息还包括与所述目标域对应的项目信息,所述方法还包括:

6.根据权利要求5所述的基于大语言模型的自适应知识增强的多域推荐方法...

【专利技术属性】
技术研发人员:李亚坤许文皓范新颜荣恩张文波
申请(专利权)人:北京林业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1