基于多视图信息感知的新闻推荐方法、系统、装置和介质制造方法及图纸

技术编号:39006366 阅读:11 留言:0更新日期:2023-10-07 10:37
本发明专利技术公开了一种基于多视图信息感知的新闻推荐方法、系统、装置和介质,本发明专利技术可广泛应用于新闻处理技术领域。本发明专利技术通过多视图新闻编码器获取包含新闻标题信息、新闻实体信息、新闻摘要信息和新闻主题信息的最终联合统一表示,从而可以捕获更多角度的新闻特征,使得用户编码器可以从最终联合统一表示中捕获更准确的用户兴趣偏好,再通过用户兴趣偏好预测候选新闻的点击概率后,通过候选新闻的点击概率进行新闻推荐模型的训练,从而使得训练后的新闻推荐模型可以为用户推荐更加准确的新闻,提高新闻推荐效果。提高新闻推荐效果。提高新闻推荐效果。

【技术实现步骤摘要】
基于多视图信息感知的新闻推荐方法、系统、装置和介质


[0001]本专利技术涉及新闻处理
,尤其是一种基于多视图信息感知的新闻推荐方法、系统、装置和介质。

技术介绍

[0002]相关技术中,许多基于深度学习和神经网络的推荐算法模型一般分为三个模块:新闻模型、用户模型和点击预测。核心问题是如何学习新闻和用户的表征。新闻模型的主要作用是抓取新闻的主题特征,为推荐过程提供候选新闻库。用户模型的主要作用是抓取用户的兴趣特征。由于现有的方法提取新闻特征的角度不够丰富,从而无法很好的通过用户历史点击新闻捕获新闻表征向量,进而无法充分提取用户的兴趣表征向量,导致新闻推荐效果不加。

技术实现思路

[0003]本专利技术旨在至少解决现有技术中存在的技术问题之一。为此,本专利技术提出一种基于多视图信息感知的新闻推荐方法、系统、装置和介质,能够充分提取用户的兴趣表征向量,提高新闻推荐结果的准确度。
[0004]一方面,本专利技术实施例提供了一种基于多视图信息感知的新闻推荐方法,包括以下步骤:
[0005]通过词级注意力网络、卷积神经网络和视图级注意力网络构造多视图新闻编码器;
[0006]通过所述多视图新闻编码器获取历史新闻的最终联合统一表示,所述最终联合统一表示通过新闻标题信息、新闻实体信息、新闻摘要信息和新闻主题信息获取;
[0007]通过门控神经网络构造用户编码器;
[0008]通过所述用户编码器从所述最终联合统一表示中捕获用户兴趣偏好;
[0009]根据所述用户兴趣偏好,通过点击预测模块预测候选新闻的点击概率;
[0010]通过所述候选新闻的点击概率训练新闻推荐模型,所述新闻推荐模型包括所述多视图新闻编码器、用户编码器和所述点击预测模块;
[0011]通过预设指标衡量评估所述新闻推荐模型的推荐效果,通过评估后的新闻推荐模型进行新闻推荐。
[0012]在一些实施例中,所述通过所述多视图新闻编码器获取历史新闻的最终联合统一表示,包括:
[0013]通过所述词级注意力网络获取新闻标题的最终向量表示;
[0014]通过所述视图级注意力网络获取新闻摘要的最终向量表示;
[0015]将所述新闻标题的最终向量表示和所述新闻摘要的最终向量表示进行拼接,得到拼接向量表示;
[0016]根据所述拼接向量表示,通过所述卷积神经网络提取新闻的上下文词语表示;
[0017]通过所述视图级注意力网络获取新闻实体的最终向量表示;
[0018]将新闻主题转换为主题嵌入向量;
[0019]对新闻不同信息的权重比例、所述新闻标题的最终向量表示、所述上下文词语表示、所述新闻实体的最终向量表示和所述主题嵌入向量进行加权处理,得到所述历史新闻的最终联合统一表示。
[0020]在一些实施例中,所述通过所述词级注意力网络获取新闻标题的最终向量表示,包括:
[0021]将新闻标题中的每个词转换为第一向量表示;
[0022]通过所述词级注意力网络计算所述新闻标题中的每个词的第一注意力权重;
[0023]根据所述第一注意力权重和所述第一向量表示计算所述新闻标题的最终向量表示。
[0024]在一些实施例中,所述通过所述视图级注意力网络获取新闻摘要的最终向量表示,包括:
[0025]将所述新闻摘要中的每个词转换为第二向量表示;
[0026]通过视图级注意力网络对所述新闻摘要中的每个词做加权特征提取;
[0027]根据特征提取结果和所述第二向量表示计算得到所述新闻摘要的最终向量表示。
[0028]在一些实施例中,所述通过所述视图级注意力网络获取新闻实体的最终向量表示,包括:
[0029]将所述新闻实体转换为第三向量表示;
[0030]通过所述视图级注意力网络计算每个新闻实体的第二注意力权重;
[0031]根据所述第三向量表示和所述第二注意力权重计算得到所述新闻实体的最终向量表示。
[0032]在一些实施例中,所述通过所述候选新闻的点击概率训练新闻推荐模型,包括:
[0033]获取正样本训练数据,所述正样本训练数据包括用户浏览过的新闻;
[0034]将所有所述候选新闻作为负样本训练数据,所述负样本训练数据包括用户为点击过的新闻;
[0035]将所述正样本训练数据和所述负样本训练数据输入所述新闻推荐模型,得到正样本点击概率和负样本的点击概率;
[0036]根据所述正样本点击概率和所述负样本的点击概率计算所述正样本训练数据的后验点击概率;
[0037]根据所述后验点击概率计算所述新闻推荐模型的损失函数。
[0038]在一些实施例中,所述通过预设指标衡量评估所述新闻推荐模型的推荐效果,包括:
[0039]分别计算所述新闻推荐模型的AUC、MRR和nDCG@N;
[0040]根据所述AUC、所述MRR和所述nDCG@N评估所述新闻推荐模型的推荐效果。
[0041]另一方面,本专利技术实施例提供了一种基于多视图信息感知的新闻推荐系统,包括:
[0042]第一模块,用于通过词级注意力网络、卷积神经网络和视图级注意力网络构造多视图新闻编码器;
[0043]第二模块,用于通过所述多视图新闻编码器获取历史新闻的最终联合统一表示,
所述最终联合统一表示通过新闻标题信息、新闻实体信息、新闻摘要信息和新闻主题信息组成;
[0044]第三模块,用于通过门控神经网络构造用户编码器;
[0045]第四模块,用于通过所述用户编码器从所述最终联合统一表示中捕获用户兴趣偏好;
[0046]第五模块,用于根据所述用户兴趣偏好,通过点击预测模块预测候选新闻的点击概率;
[0047]第六模块,用于通过所述候选新闻的点击概率训练新闻推荐模型,所述新闻推荐模型包括所述多视图新闻编码器、用户编码器和所述点击预测模块;
[0048]第七模块,用于通过预设指标衡量评估所述新闻推荐模型的推荐效果,通过评估后的新闻推荐模型进行新闻推荐。
[0049]另一方面,本专利技术实施例提供了一种基于多视图信息感知的新闻推荐装置,包括:
[0050]至少一个存储器,用于存储程序;
[0051]至少一个处理器,用于加载所述程序以执行所述的基于多视图信息感知的新闻推荐方法。
[0052]另一方面,本专利技术实施例提供了一种存储介质,其中存储有计算机可执行的程序,所述计算机可执行的程序被处理器执行时用于实现所述的基于多视图信息感知的新闻推荐方法。
[0053]本专利技术实施例提供的一种基于多视图信息感知的新闻推荐方法,具有如下有益效果:
[0054]本实施例通过多视图新闻编码器获取包含新闻标题信息、新闻实体信息、新闻摘要信息和新闻主题信息的最终联合统一表示,从而可以捕获更多角度的新闻特征,使得用户编码器可以从最终联合统一表示中捕获更准确的用户兴趣偏好,再通过用户兴趣偏好预测候选新闻的点击概率后,通本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多视图信息感知的新闻推荐方法,其特征在于,包括以下步骤:通过词级注意力网络、卷积神经网络和视图级注意力网络构造多视图新闻编码器;通过所述多视图新闻编码器获取历史新闻的最终联合统一表示,所述最终联合统一表示通过新闻标题信息、新闻实体信息、新闻摘要信息和新闻主题信息组成;通过门控神经网络构造用户编码器;通过所述用户编码器从所述最终联合统一表示中捕获用户兴趣偏好;根据所述用户兴趣偏好,通过点击预测模块预测候选新闻的点击概率;通过所述候选新闻的点击概率训练新闻推荐模型,所述新闻推荐模型包括所述多视图新闻编码器、用户编码器和所述点击预测模块;通过预设指标衡量评估所述新闻推荐模型的推荐效果,通过评估后的新闻推荐模型进行新闻推荐。2.根据权利要求1所述的一种基于多视图信息感知的新闻推荐方法,其特征在于,所述通过所述多视图新闻编码器获取历史新闻的最终联合统一表示,包括:通过所述词级注意力网络获取新闻标题的最终向量表示;通过所述视图级注意力网络获取新闻摘要的最终向量表示;将所述新闻标题的最终向量表示和所述新闻摘要的最终向量表示进行拼接,得到拼接向量表示;根据所述拼接向量表示,通过所述卷积神经网络提取新闻的上下文词语表示;通过所述视图级注意力网络获取新闻实体的最终向量表示;将新闻主题转换为主题嵌入向量;对新闻不同信息的权重比例、所述新闻标题的最终向量表示、所述上下文词语表示、所述新闻实体的最终向量表示和所述主题嵌入向量进行加权处理,得到所述历史新闻的最终联合统一表示。3.根据权利要求2所述的一种基于多视图信息感知的新闻推荐方法,其特征在于,所述通过所述词级注意力网络获取新闻标题的最终向量表示,包括:将新闻标题中的每个词转换为第一向量表示;通过所述词级注意力网络计算所述新闻标题中的每个词的第一注意力权重;根据所述第一注意力权重和所述第一向量表示计算所述新闻标题的最终向量表示。4.根据权利要求2所述的一种基于多视图信息感知的新闻推荐方法,其特征在于,所述通过所述视图级注意力网络获取新闻摘要的最终向量表示,包括:将所述新闻摘要中的每个词转换为第二向量表示;通过视图级注意力网络对所述新闻摘要中的每个词做加权特征提取;根据特征提取结果和所述第二向量表示计算得到所述新闻摘要的最终向量表示。5.根据权利要求2所述的一种基于多视图信息感知的新闻推荐方法,其特征在于,所述通过所述视图级注意力网络获取新闻实体的最终向量表示,包括:将所述新闻实体转换为第三向量表示...

【专利技术属性】
技术研发人员:毛承洁顾文静汤非易陈国华于露常超滕璐瑶李伟生张晓晗叶飞
申请(专利权)人:广州易飞信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1