【技术实现步骤摘要】
信息推荐方法及系统
[0001]本专利技术涉及信息处理
,尤其涉及一种信息推荐方法及系统。
技术介绍
[0002]信息推荐是信息过滤处理的典型应用,很多不同的搜索网站中都广泛使用了信息推荐方法,例如电商购物、影视娱乐、广告等。目前应用最广泛的信息推荐方法主要包括基于关联规则的信息推荐、基于内容的信息推荐、协同过滤信息推荐等。
[0003]基于关联规则的推荐是根据用户历史数据建立关联规则,从而进行推荐,其优点是实现推荐的过程简单直接,缺点是推荐个性化程度较低且关联规则质量很难保证。
[0004]基于内容的推荐是根据用户选择对象的历史数据,推荐与用户选择对象类似的对象,其优点是有助于解决数据稀疏的问题,但是特征提取方法受到信息获取技术的限制,计算量大,特征提取代价较高。
[0005]协同过滤推荐是从用户购买或浏览等行为中挖掘用户兴趣,而后识别出与用户兴趣相似的用户或项目,进而完成推荐,其优点是自动化程度高,计算速度快,可以通过相似度计算处理复杂的对象,但“冷启动”问题突出,当系统中有新用户加入时,由于没有该用户的历史评分记录,现有的协同过滤推荐算法无法计算其相似度,也就不能完成推荐;另外,现有的协同过滤推荐结果中冗余信息较多导致推荐准确度不高。
[0006]因此,如何有效解决现有的信息推荐在新用户加入时存在的“冷启动”问题,是目前本领域技术人员亟待解决的问题。
技术实现思路
[0007]本专利技术旨在至少解决现有技术中存在的技术问题之一,特别创新地提出了一种信息推荐方 ...
【技术保护点】
【技术特征摘要】
1.一种信息推荐方法,其特征在于,包括:获取目标用户的用户信息,其中,所述用户信息包括用户属性信息和用户历史项目信息;根据所述用户信息中的用户属性信息判断所述目标用户的用户类型,其中,所述用户类型包括新用户和老用户;基于所述目标用户的用户类型利用对应的信息推荐算法在信息数据库选择第一预设数量的待推荐信息形成预推荐信息列表;对所述预推荐信息列表中的待推荐信息进行冗余信息判断得到冗余信息判断结果;根据所述冗余信息判断结果对所述预推荐列表中的待推荐信息进行处理得到最终推荐信息列表;将所述最终推荐信息列表中的待推荐信息作为目标推荐信息推荐给所述目标用户。2.根据权利要求1所述的信息推荐方法,其特征在于,所述基于所述目标用户的用户类型利用对应的信息推荐算法在信息数据库选择第一预设数量的待推荐信息形成预推荐信息列表包括:当所述目标用户的用户类型为新用户时,根据所述目标用户的用户属性信息判断所述目标用户与所述信息数据库中的现有用户是否存在关系;若存在关系,则基于所述用户属性信息计算所述目标用户与所述信息数据库中的现有用户的相似度,依据相似度计算结果在所述信息数据库选择第一预设数量的待推荐信息形成预推荐信息列表;若不存在关系,则从所述信息数据库的候选信息列表中随机抽选第一预设数量的不同受欢迎度的候选信息作为待推荐信息形成预推荐信息列表,其中,所述候选信息列表为将所述信息数据库中的所有候选信息按照受欢迎度进行降序排列得到。3.根据权利要求2所述的信息推荐方法,其特征在于,所述基于所述目标用户的用户类型利用对应的信息推荐算法在信息数据库选择第一预设数量的待推荐信息形成预推荐信息列表还包括:当所述目标用户的用户类型为老用户时,判断所述信息数据库的当前数据规模是否小于预设数据总量阈值;若是,则基于所述目标用户的用户属性信息和用户历史项目信息,采用混合协同过滤算法计算所述目标用户与所述信息数据库中的现有用户的相似度;依据相似度计算结果采用Top
‑
N推荐算法在所述信息数据库选择与所述目标用户最相似的前若干个用户;在所述前若干个用户的相关项目信息中选择第一预设数量的待推荐信息形成所述预推荐信息列表;若否,则基于所述目标用户的用户属性信息和用户历史项目信息,根据预先建立的用户索引使用随机行走算法在所述目标用户所在的各个用户群组中进行随机行走以随机选出设定数量的现有用户;采用混合协同过滤算法计算所述目标用户与选出的现有用户的相似度;依据相似度计算结果采用Top
‑
N推荐算法在所述信息数据库选择与所述目标用户最相似的前若干个用户;在所述前若干个用户的相关项目信息中选择第一预设数量的待推荐信息形成所述预推荐信息列表,其中,所述用户索引的建立过程包括:采用概率潜在语义索引PLSI算法对所述信息数据库中的所有现有用户进行群组划分
得到若干用户群组;采用最小独立排列哈希MinHash算法对群组划分得到的所述若干用户群组建立用户索引。4.根据权利要求1
‑
3任一项所述的信息推荐方法,其特征在于,所述对所述预推荐信息列表中的待推荐信息进行冗余信息判断得到冗余信息判断结果包括:根据预先设定的信息来源信任等级划分机制判断所述预推荐信息列表中的各条待推荐信息的信息来源的信任等级,其中,所述信任等级包括可信级和不可信级,所述可信级包括多个可信程度等级;若所述待推荐信息的信息来源为可信级,则获取该待推荐信息的若干观察值形成观察值序列;采用隐马尔科夫模型对该待推荐信息进行求解,得到能够最佳匹配该待推荐信息的所述观察值序列的参数值;基于所述参数值利用Baum
‑
Welch算法判断该待推荐信息是否为冗余信息。5.根据权利要求4所述的信息推荐方法,其特征在于,所述根据所述冗余信息判断结果对所述预推荐列表中的待推荐信息进行处理得到最终推荐信息列表包括:根据所述预推荐信息列表中的每条待推荐信息的信任等级、各条待推荐信息是否为冗余信息的判断结果以及各条冗余信息的可信程度等级对所述预推荐列表中的待推荐信息进行排序和/或筛选得到包含第二预设数量的待推荐信息;基于所述第二预设数量的待推荐信息生成最终推荐信息列表,其中,所述第二预设数量小于等于所述第一预设数量。6.一种信息推荐系统,其特征在于,包括:用户信息获取模块,用于获取目标用户的用户信息,其中,所述用户...
【专利技术属性】
技术研发人员:马建威,赵航,陈光伟,徐利,宋优,张坚强,
申请(专利权)人:中国人民解放军陆军军医大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。