基于标签位置权重与自学习的招投标好友推荐系统技术方案

技术编号：13282481 阅读：69 留言：0更新日期：2016-07-09 00:05

本发明专利技术公开了一种基于标签位置权重与自学习的招投标好友推荐系统，该系统包括数据源模块、标签预处理模块、热门标签库模块、标签检测与存储模块、自学习模块以及结果筛选模块；本发明专利技术以标签位置权重及自学习模型为设计思路开发设计了此推荐系统，该系统建立一套考虑标签位置权重的标签系统，同时使用扩展的FP‑Growth算法挖掘采购行为流程中的关联规则，最终组合并筛选基于标签的推荐结果与基于挖掘的推荐结果，形成推荐结果列表。系统运行的数据表明，相比传统的基于标签的企业级招投标推荐系统，提升了标签系统的作用并挖掘了标签系统相对不擅长的系统潜在关联规则，提供了有效的推荐性能。

全部详细技术资料下载

【技术实现步骤摘要】
基于标签位置权重与自学习的招投标好友推荐系统
本专利技术涉及招投标好友推荐的研究领域，特别涉及一种基于标签位置权重与自学习的招投标好友推荐系统。
技术介绍
在网上招投标系统中，采购方负责发起采购需求，系统根据采购需求推荐合适的供应商列表，采购商与供应商可以互相添加好友或关注对方。旧有的基于标签的招投标好友推荐系统或多或少存在以下不足：(1)多义词、同义词等噪声问题待处理，标签系统不受约束的语法可能造成上述问题。(2)采购行为流程考虑欠缺，如某公司采购了手机，则推荐系统可以向该公司推荐销售手机壳、手机膜等产品的供应商。(3)推荐有效性依赖于用户、标签、资源之间关联关系的稠密性要求，由于招投标系统中的用户只能对自己发布的信息添加标签，使得实际中并不一定能很好地达到该稠密性要求，限制了标签推荐系统的推荐性能。(4)对用户填写标签的个人规律关注不够,用户填写标签的相关统计学规律待认识与应用，如可以考虑对不同标签位置赋予不同权重，以此为基础计算标签相似程度。所以传统的基于标签的招投标好友推荐系统中，个性化标签的随意性、标签位置权重的粗略处理及系统推荐标签的质量局限等问题限制了系统的推荐效率，且现有的网上招投标系统较少考虑到采购行为流程中的产业链关系。
技术实现思路
本专利技术的主要目的在于克服现有技术的缺点与不足，提供一种基于标签位置权重与自学习的招投标好友推荐系统(以下简称BID-RS)。为了达到上述目的，本专利技术采用以下技术方案：本专利技术提供了一种基于标签位置权重与自学习的招投标好友推荐系统，包括数据源模块、标签预处理模块、热门标签库模块、标签检测与存储模块、自...

【技术保护点】
基于标签位置权重与自学习的招投标好友推荐系统，其特征在于，包括数据源模块、标签预处理模块、热门标签库模块、标签检测与存储模块、自学习模块以及结果筛选模块；所述数据源模块，用于收集收集招投标平台上的历史招投标数据；所述标签预处理模块，用于从招投标公司发表的招投标数据中提取部分关键字作为标签以减轻稀疏问题；所述热门标签库模块，用于提供系统热门标签给用户作为输入；所述标签检测与存储模块，用于对用户填入的标签质量进行检测，并最终进行持久化存储；所述自学习模块，用于在历史招投标数据上进行挖掘，同时若用户在线，还会对其实时招投标数据进行挖掘；所述结果筛选模块，用于通过进一步筛选得到具有双重特点的推荐列表。

【技术特征摘要】
1.基于标签位置权重与自学习的招投标好友推荐系统，其特征在于，包括数据源模块、标签预处理模块、热门标签库模块、标签检测与存储模块、自学习模块以及结果筛选模块；所述数据源模块，用于收集招投标平台上的历史招投标数据；所述标签预处理模块，用于从招投标公司发表的招投标数据中提取部分关键字作为标签以减轻稀疏问题；所述热门标签库模块，用于提供系统热门标签给用户作为输入；所述标签检测与存储模块，用于对用户填入的标签质量进行检测，并最终进行持久化存储；所述自学习模块，用于在历史招投标数据上进行挖掘，同时若用户在线，还会对其实时招投标数据进行挖掘；所述结果筛选模块，用于通过进一步筛选得到具有双重特点的推荐列表；在结果筛选模块中，通过标签检测与存储模块和自学习模块产生推荐列表，其具体方法为：S1、设需要计算标签相似度的用户实体为UA、UB，TA、TB分别为UA与UB的标签集合，UA与UB的共同标签记为CT，LocInA(x)、LocInB(x)为x标签实体在TA或TB中的位置，WeightInLocA(x)与WeightInLocB(x)分别表示上述位置对应的标签权重；S2、使用递减的底数为p的指数函数来计算标签权重，并采用公式(1)计算UA与UB的标签相似度，UA与UB的共同标签c越靠前，其标签权值越大，则公式(1)的结果越大，UA与UB相似度越高；式(1)中WeightInLocA(c)＝pLocInA(c)，WeightInLocB(c)＝pLocInB(c)，由于位置权重为小数，系数20用来“放大”小数以得到更稳定结果，公式(1)的结果记作wSim，它为累加和形式，每一项的值落在区间(-1,1)上，wSim∈(-N,N)，N为CT元素个数；S3、建立各个地区的位置权重表[D1:W1，D2:W2，..Dn:Wn]，记为weightList，n为BID-RS中已维护相应信息的地区数，Dn为地区n的名称，Wn为Dn对应的权重值；S4、在FP-GROWTH算法中，扫描数据库后使用支持度作为排序依据对实体进行排序。2.根据权利要求1所述的基于标签位置权重与自学习的招投标好友推荐系统，其特征在于，所述数据源模块中的招投标数据包括采购行为、销售行为、新闻及动态行为产生的数据，通过开源的轻量级对象映射框架Hibernate将上述的多种行为...

【专利技术属性】
技术研发人员：张墨琴，
申请(专利权)人：张墨琴，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人