新闻客户端智能推荐系统技术方案

技术编号:34484590 阅读:16 留言:0更新日期:2022-08-10 09:01
本发明专利技术涉及内容推荐技术领域,具体涉及新闻客户端智能推荐系统。所述系统包括:本地端和服务器端;其特征在于,所述本地端包括:用户兴趣泡构建单元,配置用于基于预设的配置信息构建用户的兴趣泡,每个兴趣泡对应一个一级分类,所述一级分类为定义的用户兴趣类别,每个一级类别包括多个不同的二级类别,所述兴趣泡包括一个兴趣中心和多个兴趣类别集合。本发明专利技术通过建立兴趣泡,然后通过用户的行为来驱动兴趣泡的运动,以变更用户的兴趣分析,最后通过检索特征来生成推荐内容,实现了内容推荐的智能化,且不依赖于用户的行为,在特征检索过程中,基于兴趣泡的方式更能分清楚主次,提升检索的效率。索的效率。索的效率。

【技术实现步骤摘要】
新闻客户端智能推荐系统


[0001]本专利技术属于内容推荐
,具体涉及互联网新闻内容数据智能审核系统。

技术介绍

[0002]个性化推荐系统是一种帮助用户快速发现有用信息的工具,可以为不同的用户提供个性化服务,以满足其特定的兴趣和需求。与搜索引擎不同,推荐系统不需要用户提供明确的需求,而是通过分析用户的历史行为对用户的兴趣建模,并以此为依据主动给用户推荐能够满足他们兴趣和需求的信息。
[0003]在互联网的各类网站中都可以看到个性化推荐系统的应用,包括电子商务、电影及视频、音乐、社交网络等等。淘宝、亚马逊等应用推荐系统,通过协同过滤等个性化推荐模型预测用户可能感兴趣的商品为其推荐。协同过滤推荐(Collaborative Filtering,CF)是利用某个兴趣相投、拥有共同经验的群体的喜好来向使用者推荐其感兴趣的物品或信息。
[0004]个性化新闻推荐系统是根据用户的兴趣特点和行为,向用户推荐其感兴趣的新闻资讯的推荐系统。个性化新闻推荐技术则是个性化推荐在新闻处理领域中的一个延伸应用,它是通过推荐系统将新闻自动推荐给对其感兴趣的用户,实现新闻网站及网站用户的利益双贏。个性化新闻推荐系统将个性化推荐应用于新闻的推荐,它可以帮助用户从互联网上的海量信息中轻松获取感兴趣的新闻,并挖掘用户可能感兴趣的内容。
[0005]目前,应用最广泛的协同过滤个性化推荐技术有两种方式:基于用户的协同过滤和基于项目的协同过滤。前者主要包括三个步骤:用户行为数据表示;利用用户相似度计算方法,查找与目标用户最相似的多个用户;根据该多个相似用户对项目的行为来预测目标用户对项目的行为,并进行推荐。后者也包括三个步骤:项目行为数据表示;利用项目相似度计算方法,计算项目之间的相似度;把与用户产生行为的项目最相似的项目推荐给用户。
[0006]该种方法始终是基于用户相似度和项目相似度的,而在相似度的判定上,因为算法误差,很容易影响最终的推荐结果。且通过目标用户画像的方式,会需要搜集和调用大量的用户数据,一方面效率低,另一方面叫需要获取较多的用户权限。

技术实现思路

[0007]有鉴于此,本专利技术的主要目的在于提供新闻客户端智能推荐系统,本专利技术通过建立兴趣泡,然后通过用户的行为来驱动兴趣泡的运动,以变更用户的兴趣分析,最后通过检索特征来生成推荐内容,实现了内容推荐的智能化,且不依赖于用户的行为,在特征检索过程中,基于兴趣泡的方式更能分清楚主次,提升检索的效率。
[0008]为达到上述目的,本专利技术的技术方案是这样实现的:新闻客户端智能推荐系统,所述系统包括:本地端和服务器端;所述本地端包括:用户兴趣泡构建单元,配置用于基于预设的配置信息构建用户的兴趣泡,每个兴趣泡对应一个一级分类,所述一级分类为定义的用户兴趣类别,每个一级类别包括多个不同的二级类别,所述兴趣泡包括一个兴趣中心和多个兴趣类别集合,所述兴趣类别集合以浮动的兴
趣集合的方式围绕在兴趣中心周围,与兴趣中心的欧式距离均为相等的设定值;用户兴趣路径确立单元,配置用于在设定的时间范围内,采集用户的完整行为路径;所述用户的完整行为路径定义为:在设定的时间范围内,用户浏览内容的起点、中间点和终点;一级用户兴趣图谱构建单元,配置用于对用户的完整行为路径中的起点、中间点和终点进行一级分类,找到分类级别为一级的起点、中间点和终点,并找到其对应的兴趣泡,并统计这些起点、中间点和终点属于同一类别的个数,以及每个起点、中间点和终点在路径中所处的位置,使用预设的第一兴趣权重计算模型,计算这些起点、中间点和终点的第一权重值,并基于计算出的权重值,推动兴趣泡朝向兴趣中心运动;二级用户兴趣图谱构建单元,配置用于对用户的完整行为路径中的起点、中间点和终点进行二级分类,找到分类级别为二级的起点、中间点和终点,将二级的起点、中间点和终点划分到隶属的一级的起点、中间点和终点对应的兴趣泡内,同时基于这些二级的起点、中间点和终点的二级类别,使用兴趣检索特征生成模型,生成每个兴趣泡对应的检索特征;所述服务器端,包括:内容数据库,配置用于存储内容;检索单元,配置用于按照兴趣泡与兴趣中心的距离,从近到远,依次调取检索特征在内容数据库中进行特征检索,找到与检索匹配的内容;内容呈现单元,配置用于将检索匹配的内容发送至客户端进行呈现。
[0009]进一步的,所述第一兴趣权重计算模型使用如下公式进行表示: ;其中, 为权重值; 为同属于一个一级分类的类别的起点、中间点或终点的个数; 为起点、中间点和终点的总数; 为同属于一个类别的起点、中间点、或终点分别与其他类别的起点、中间点或终点的相隔距离;所述相隔距离定义为,起点、中间点和终点与其他的不同类别的点之间点的个数; 为权重初始值,为设定值,取值范围为:100~300。
[0010]进一步的,所述兴趣检索特征生成模型生成检索特征的方法包括:提取每个二级类别对应的类别关键词;所述类别关键词为二级类别生成时加入的标签关键词;对类别关键词中的每个标签关键词进行预处理,转化为词序列;确定每个词的词向量,并计算每个标签关键词的标签关键词向量;对标签关键词向量进行聚类,将类别关键词划分出多个标签关键词子集;根据划分后的标签关键词子集,提取检索特征。
[0011]进一步的,对类别关键词中的每个标签关键词进行预处理,转化为词序列,包括:对于英文标签关键词,判断每个词之间是否存在空格,若是,则切分为词,添加序列;对于中文标签关键词,通过分词和/或停顿词,将中文标签关键词转化为词序列。
[0012]进一步的,确定每个词的词向量,并计算每个标签关键词的标签关键词向量,确定每个词的词向量;根据每个词的词向量,计算每个标签关键词的标签关键词向量。
[0013]进一步的,所述检索单元按照兴趣泡与兴趣中心的距离,从近到远,依次调取检索特征在内容数据库中进行特征检索,找到与检索匹配的内容的方法包括:获取检索特征;使用卷积神经网络模型从所述检索特征中提取所述检索特征的核心特征,其中,所述卷积神经网络模型基于历史检索特征和历史检索数据的训练集训练得到;基于提取的所述检索特征的核心特征,检索核心特征与所述检索特征的核心特征匹配的目标内容。
[0014]进一步的,所述基于提取的所述检索特征的核心特征,检索核心特征与所述检索特征的核心特征匹配的目标内容,包括:通过哈希函数确定所述检索特征的核心特征所映
射的哈希桶;将所述哈希桶中已存在的各个元素所对应的内容确定为所述目标内容;其中,所述哈希桶中已存在的各个元素是预先通过所述哈希函数分别对各个内容的核心特征进行映射得到,所述各个内容的核心特征是通过所述卷积神经网络模型分别从所述各个内容中提取得到。
[0015]进一步的,所述使用卷积神经网络模型从所述检索特征中提取所述检索特征的核心特征,包括:对使用所述卷积神经网络模型从所述检索特征中提取的核心特征进行降维处理,将降维处理后得到的核心特征作为所述检索特征的核心特征。
[0016]进一步的,所述基于提取的所述检索特征的核心特征,检索核心特征与所述检本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.新闻客户端智能推荐系统,所述系统包括:本地端和服务器端;其特征在于,所述本地端包括:用户兴趣泡构建单元,配置用于基于预设的配置信息构建用户的兴趣泡,每个兴趣泡对应一个一级分类,所述一级分类为定义的用户兴趣类别,每个一级类别包括多个不同的二级类别,所述兴趣泡包括一个兴趣中心和多个兴趣类别集合,所述兴趣类别集合以浮动的兴趣集合的方式围绕在兴趣中心周围,与兴趣中心的欧式距离均为相等的设定值;用户兴趣路径确立单元,配置用于在设定的时间范围内,采集用户的完整行为路径;所述用户的完整行为路径定义为:在设定的时间范围内,用户浏览内容的起点、中间点和终点;一级用户兴趣图谱构建单元,配置用于对用户的完整行为路径中的起点、中间点和终点进行一级分类,找到分类级别为一级的起点、中间点和终点,并找到其对应的兴趣泡,并统计这些起点、中间点和终点属于同一类别的个数,以及每个起点、中间点和终点在路径中所处的位置,使用预设的第一兴趣权重计算模型,计算这些起点、中间点和终点的第一权重值,并基于计算出的权重值,推动兴趣泡朝向兴趣中心运动;二级用户兴趣图谱构建单元,配置用于对用户的完整行为路径中的起点、中间点和终点进行二级分类,找到分类级别为二级的起点、中间点和终点,将二级的起点、中间点和终点划分到隶属的一级的起点、中间点和终点对应的兴趣泡内,同时基于这些二级的起点、中间点和终点的二级类别,使用兴趣检索特征生成模型,生成每个兴趣泡对应的检索特征;所述服务器端,包括:内容数据库,配置用于存储内容;检索单元,配置用于按照兴趣泡与兴趣中心的距离,从近到远,依次调取检索特征在内容数据库中进行特征检索,找到与检索匹配的内容;内容呈现单元,配置用于将检索匹配的内容发送至客户端进行呈现。2.如权利要求1所述的系统,其特征在于,所述第一兴趣权重计算模型使用如下公式进行表示:;其中,为权重值;为同属于一个一级分类的类别的起点、中间点或终点的个数;为起点、中间点和终点的总数;为同属于一个类别的起点、中间点、或终点分别与其他类别的起点、中间点或终点的相隔距离;所述相隔距离定义为,起点、中间点和终点与其他的不同类别的点之间点的个数;为权重初始值,为设定值,取值范围为:100~300。3.如权利要求1所述的系统,其特征在于,所述兴趣检索特征生成模型生成检索特征的方法包括:提取每个二级类别对应的类别关键词;所述类别关键词为二级类别生成时加入的标签关键词;对类别关键词中的每个标签关键词进行预处理,转化为词序列;确定每个词的词向量,并计算每个标签关键词的...

【专利技术属性】
技术研发人员:郑创伟符捷雯陈义飞金勇谢志成王泳陈少彬刑谷涛罗佩珊
申请(专利权)人:深圳市创意智慧港科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1