当前位置: 首页 > 专利查询>同济大学专利>正文

一种基于混合推荐算法的技术资源及服务推荐系统技术方案

技术编号:29156803 阅读:52 留言:0更新日期:2021-07-06 22:56
本发明专利技术基于网络协同制造技术资源服务平台提供了一种基于混合推荐算法的技术资源及服务推荐系统,包括数据预处理模块、用户语义描述模块、个性化技术资源推荐模块、企业相似度计算模块、个性化服务推荐模块、技术资源及服务潜在组合挖掘模块。所述数据预处理模块包括对用户浏览与购买记录、企业注册信息等数据的预处理;所述用户语义描述模块对用户可能感兴趣的领域信息进行建模;所述个性化技术资源推荐模块向用户推荐技术资源;所述企业相似度计算模块包括两种相似度计算方法。本发明专利技术充分利用平台数据,通过多种数据分析算法混合,全方位向用户推荐技术资源及企业服务,达到提高网络协同制造程度的目的。

【技术实现步骤摘要】
一种基于混合推荐算法的技术资源及服务推荐系统
本专利技术涉及线上服务领域,尤其涉及一种基于混合推荐算法的技术资源及服务推荐系统。
技术介绍
随着通信技术、信息技术、云计算等技术的发展,企业制造模式发生了巨大的改变。有着敏捷制造、信息共享、资源最充分利用等特点的网络协同制造模式得到了越来越多的关注和应用。实现网络协同制造模式的基础就是网络协同制造技术资源服务平台。在该平台上,有着大量用户或企业上传的技术资源,包括文献资源,文章资源,文档资源,软件资源,制造类资源,人才资源等等。也有企业发布的服务供用户购买使用。用户可以根据实际项目需要,查阅技术资源,购买相关企业服务,从而加快项目实施进度。由于平台上技术资源及服务种类和数量众多,用户无法第一时间获取感兴趣的技术资源及服务。为了增加用户体验,平台有必要开发一套推荐系统,向用户推荐技术资源及服务。
技术实现思路
本专利技术提供了一种基于混合推荐算法的技术资源及服务推荐系统,对平台上发布的技术资源及服务进行推荐。附图说明图1为本专利技术基于混合推荐算法的技术资源及服务推荐系统的系统结构框图。图2为技术资源及服务潜在组合挖掘模块的流程图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1,一种基于混合推荐算法的技术资源及服务推荐系统,包括数据预处理模块、用户语义描述模块、个性化技术资源推荐模块、企业相似度计算模块、个性化服务推荐模块、技术资源及服务潜在组合挖掘模块。以下具体对各个模块进行详细说明。数据预处理模块以用户浏览技术资源记录、用户购买企业服务记录、企业注册信息为输入。其中以用户浏览技术资源记录、用户购买企业服务记录从服务器日志文件中通过正则表达式提取;企业注册信息从数据库中得到。然后使用基于密度的聚类算法DBSCAN根据用户行为记录产生的时间进行聚类得到用户行为聚类簇。其中:用户浏览技术资源记录、企业信息向量分别用于用户语义描述模块、企业相似度计算模块,得到的用户浏览技术资源记录聚类簇、用户购买企业服务记录聚类簇提供给技术资源及服务潜在组合挖掘模块。数据预处理模块首先读入用户浏览技术资源记录、用户购买企业服务记录、企业注册信息,用户浏览技术资源记录包括用户ID、技术资源ID、记录时间、技术资源浏览量等信息;用户购买企业服务记录包括用户ID、服务ID、记录时间等信息。根据用户在一段时间内的项目需求或感兴趣内容集中在某几个有限领域的假设,对记录按照时间进行基于密度的聚类,得到聚类簇。企业注册信息包括企业面向的领域、企业的注册资金、企业员工人数、企业成立时间、企业营业额、企业利润率等等。对特征如企业面向的领域进行one-hot编码,对特征如企业的注册资金、企业员工人数、企业成立时间、企业营业额、企业利润率进行标准化,得到企业信息向量。用户语义描述模块在计算某个技术资源的权重时,会根据技术资源的浏览量进行一定的惩罚,用于提供给个性化技术资源推荐模块。因为很多用户浏览热门的技术资源仅仅只是因为它热门,并不能反映该用户的个性;相反,如果用户浏览了冷门的技术资源,则大概率可以确定该用户感兴趣的领域。用户语义描述模块以标签形式对用户建模。首先,每一项技术资源在上传时会经过TextRank算法提取出得分最高的前N个关键词,作为该技术资源的标签。用户在浏览技术资源后,用户标签中与该技术资源标签相同的标签会被增加一定的权重(如果用户标签中没有该标签则新增)。具体如下:由于技术资源以文本形式保存并呈现,采用TextRank算法提取技术资源关键词。具体来说,取得分最高的前N个关键词作为该技术资源的标签,同时对每个关键词得分进行归一化,作为对应标签的权重。假设用户u的标签集合为Lu,技术资源i的标签集合为Li,技术资源i的浏览量为Si,技术资源i中标签a的权重为wia,则用户u中标签a的权重增加值Δwua为如果用户一段时间内没有浏览与某个标签相关的技术资源,则该标签的权重会衰减,以此来反应用户最近的兴趣。假设用户有t个时间单位没有浏览过某个标签的技术资源,该标签衰减前的权重为w,权重衰减因子为α,那么衰减后的权重w′为由于有些用户喜欢大量浏览技术资源,从而造成用户标签数量很多的情况,所以取用户标签权重最大的前K个标签构成用户的语义描述向量。个性化技术资源推荐模块以用户语义描述向量为输入,通过余弦相似度计算和该用户语义描述向量最相似的M个技术资源,并加入该用户的技术资源推荐列表。个性化技术资源推荐模块的输入是用户u的语义描述向量Vu,假设该向量中标签a的权重为wua,技术资源i中标签a的权重为wia,则用户u对技术资源i的喜爱程度p(u,i)为计算得到用户对所有技术资源的喜爱程度后,向该用户推荐前M个喜爱程度最高的技术资源。企业相似度计算模块包含两种相似度计算方法,分别是使用企业注册信息计算企业相似度;使用企业用户群体重合度计算企业相似度。方法一用于推荐系统冷启动时,新加入的企业因为没有客户群体,所以无法使用方法二计算企业相似度。方法一输入为数据预处理模块得到的企业信息向量,通过余弦相似度计算得到两个企业的相似度。假设企业e1的信息向量为Ve1,企业e2的信息向量为Ve2,那么相似度方法二通过计算两个企业之间的用户群体重合度作为企业相似度,用户群体重合度可以用Jaccard相似度计算。具体的,输入为企业的用户群体集合,也就是使用过该企业提供的服务的用户,通过Jaccard相似度计算得到两个企业的相似度。假设企业e1的用户群体为Ue1,企业e2的用户群体为Ue2,那么相似度个性化服务推荐模块基于相似企业计算模块实现其功能。根据用户历史购买的服务所属的企业,通过企业相似度计算模块得到和该企业最接近的N个企业,并将它们的热门服务推荐给该用户。如图2所示:技术资源及服务潜在组合挖掘模块首先根据用户购买企业服务的时间,寻找该时间点附近用户浏览技术资源的聚类簇,并将该服务ID和聚类簇中的技术资源ID保存为一个集合。在得到了大量上述服务ID和技术资源ID组成的集合后,通过关联规则算法FPGrowth(已有算法)计算得到频繁项集,该集合表明许多用户在购买某项服务前后会浏览的技术资源,这表明该服务和技术资源存在很强的相关性,即服务与技术资源可能存在的组合。在得到许多频繁项集的基础上,如果一个用户浏览了其中的技术资源,则向其推荐对应的企业服务;如果用户购买了企业服务,则向其推荐对应的技术资源。本文档来自技高网...

【技术保护点】
1.一种基于混合推荐算法的技术资源及服务推荐系统,其特征在于,包括数据预处理模块、用户语义描述模块、个性化技术资源推荐模块、企业相似度计算模块、个性化服务推荐模块、技术资源及服务潜在组合挖掘模块;/n所述数据预处理模块以用户浏览技术资源记录、用户购买企业服务记录、企业注册信息为输入,其中:/n对用户浏览技术资源记录预处理得到向量化的记录数据和聚类簇,前者用于用户语义描述模块,后者用于技术资源及服务潜在组合挖掘模块;/n对用户购买企业服务记录进行预处理得到聚类簇用于技术资源及服务潜在组合挖掘模块;/n对企业注册信息进行预处理用于企业相似度计算模块;/n所述用户语义描述模块以用户浏览技术资源记录为输入,通过用户浏览的技术资源对用户可能感兴趣的领域信息进行建模,输出用户语义描述向量用于个性化技术资源推荐模块;/n所述个性化技术资源推荐模块以用户语义描述向量作为输入,输出每个用户个性化的技术资源推荐列表;/n所述企业相似度计算模块包括两种相似度计算方法;第一种是基于内容的企业相似度计算,其输入为数据预处理模块得到的企业信息向量,在推荐系统冷启动时使用;第二种是数据驱动的企业相似度计算,其主要在企业有一定客户群体之后使用;两种算法都会得到企业之间的相似度用于个性化服务推荐模块;/n所述个性化服务推荐模块以企业相似度为输入,输出每个用户个性化的的企业服务推荐列表;/n所述技术资源及服务潜在组合挖掘模块的输入为数据预处理模块得到的用户浏览技术资源记录数据聚类簇和用户购买企业服务记录;通过关联规则算法挖掘技术资源与企业服务之间可能存在的某种组合关系,并在此基础上向用户进行推荐,输出每个用户个性化的技术资源推荐列表和企业服务推荐列表。/n...

【技术特征摘要】
1.一种基于混合推荐算法的技术资源及服务推荐系统,其特征在于,包括数据预处理模块、用户语义描述模块、个性化技术资源推荐模块、企业相似度计算模块、个性化服务推荐模块、技术资源及服务潜在组合挖掘模块;
所述数据预处理模块以用户浏览技术资源记录、用户购买企业服务记录、企业注册信息为输入,其中:
对用户浏览技术资源记录预处理得到向量化的记录数据和聚类簇,前者用于用户语义描述模块,后者用于技术资源及服务潜在组合挖掘模块;
对用户购买企业服务记录进行预处理得到聚类簇用于技术资源及服务潜在组合挖掘模块;
对企业注册信息进行预处理用于企业相似度计算模块;
所述用户语义描述模块以用户浏览技术资源记录为输入,通过用户浏览的技术资源对用户可能感兴趣的领域信息进行建模,输出用户语义描述向量用于个性化技术资源推荐模块;
所述个性化技术资源推荐模块以用户语义描述向量作为输入,输出每个用户个性化的技术资源推荐列表;
所述企业相似度计算模块包括两种相似度计算方法;第一种是基于内容的企业相似度计算,其输入为数据预处理模块得到的企业信息向量,在推荐系统冷启动时使用;第二种是数据驱动的企业相似度计算,其主要在企业有一定客户群体之后使用;两种算法都会得到企业之间的相似度用于个性化服务推荐模块;
所述个性化服务推荐模块以企业相似度为输入,输出每个用户个性化的的企业服务推荐列表;

【专利技术属性】
技术研发人员:洪佳升贾宁
申请(专利权)人:同济大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1