当前位置: 首页 > 专利查询>张墨琴专利>正文

基于标签位置权重与自学习的招投标好友推荐系统技术方案

技术编号:13282481 阅读:61 留言:0更新日期:2016-07-09 00:05
本发明专利技术公开了一种基于标签位置权重与自学习的招投标好友推荐系统,该系统包括数据源模块、标签预处理模块、热门标签库模块、标签检测与存储模块、自学习模块以及结果筛选模块;本发明专利技术以标签位置权重及自学习模型为设计思路开发设计了此推荐系统,该系统建立一套考虑标签位置权重的标签系统,同时使用扩展的FP‑Growth算法挖掘采购行为流程中的关联规则,最终组合并筛选基于标签的推荐结果与基于挖掘的推荐结果,形成推荐结果列表。系统运行的数据表明,相比传统的基于标签的企业级招投标推荐系统,提升了标签系统的作用并挖掘了标签系统相对不擅长的系统潜在关联规则,提供了有效的推荐性能。

【技术实现步骤摘要】
基于标签位置权重与自学习的招投标好友推荐系统
本专利技术涉及招投标好友推荐的研究领域,特别涉及一种基于标签位置权重与自学习的招投标好友推荐系统。
技术介绍
在网上招投标系统中,采购方负责发起采购需求,系统根据采购需求推荐合适的供应商列表,采购商与供应商可以互相添加好友或关注对方。旧有的基于标签的招投标好友推荐系统或多或少存在以下不足:(1)多义词、同义词等噪声问题待处理,标签系统不受约束的语法可能造成上述问题。(2)采购行为流程考虑欠缺,如某公司采购了手机,则推荐系统可以向该公司推荐销售手机壳、手机膜等产品的供应商。(3)推荐有效性依赖于用户、标签、资源之间关联关系的稠密性要求,由于招投标系统中的用户只能对自己发布的信息添加标签,使得实际中并不一定能很好地达到该稠密性要求,限制了标签推荐系统的推荐性能。(4)对用户填写标签的个人规律关注不够,用户填写标签的相关统计学规律待认识与应用,如可以考虑对不同标签位置赋予不同权重,以此为基础计算标签相似程度。所以传统的基于标签的招投标好友推荐系统中,个性化标签的随意性、标签位置权重的粗略处理及系统推荐标签的质量局限等问题限制了系统的推荐效率,且现有的网上招投标系统较少考虑到采购行为流程中的产业链关系。
技术实现思路
本专利技术的主要目的在于克服现有技术的缺点与不足,提供一种基于标签位置权重与自学习的招投标好友推荐系统(以下简称BID-RS)。为了达到上述目的,本专利技术采用以下技术方案:本专利技术提供了一种基于标签位置权重与自学习的招投标好友推荐系统,包括数据源模块、标签预处理模块、热门标签库模块、标签检测与存储模块、自学习模块以及结果筛选模块;所述数据源模块,用于收集收集招投标平台上的历史招投标数据;所述标签预处理模块,用于从招投标公司发表的招投标数据中提取部分关键字作为标签以减轻稀疏问题;所述热门标签库模块,用于提供系统热门标签给用户作为输入;所述标签检测与存储模块,用于对用户填入的标签质量进行检测,并最终进行持久化存储;所述自学习模块,用于在历史招投标数据上进行挖掘,同时若用户在线,还会对其实时招投标数据进行挖掘;所述结果筛选模块,用于通过进一步筛选得到具有双重特点的推荐列表。作为优选的技术方案,所述数据源模块中的招投标数据包括采购行为、销售行为、新闻及动态行为产生的数据,通过开源的轻量级对象映射框架Hibernate将上述的多种用户行为产生的数据做持久性封装,为后续其他模块提供数据支撑。作为优选的技术方案,所述标签预处理模块中,提取技术采用扩展的TF-IDF模型,以招投标公司主页的新闻、动态为出发点,采用增加特殊段落词语权重的方法对TF-IDF模型进行扩展,使其能够考虑到位置信息权重。作为优选的技术方案,所述热门标签库模块中热门标签库的生成从下述两方面取得:(1)系统后台线程根据系统中实时的标签流行度生成热门标签;(2)通过管理员设置参数来进行干预控制。作为优选的技术方案,所述标签检测与存储模块在标签预处理模块的基础上,系统允许用户手动添加个性化的标签,但同时会对标签质量进行检测,最后加上手动选择的系统热门标签,用户所有标签信息通过Hibernate持久化存储。作为优选的技术方案,在自学习模块中,当招投标公司双方互相关注或互相添加好友以及产生互相招投标业务行为时,及时更新关联规则,以及时反映双方招投标公司的采购或供应兴趣,其次,管理员可以对偏差较大的规则数据进行干预、纠正。作为优选的技术方案,在结果筛选模块中,通过标签检测与存储和自学习模块产生推荐列表,其具体方法为:S1、设需要计算标签相似度的用户实体为UA、UB,TA、TB分别为UA与UB的标签集合,UA与UB的共同标签记为CT,LocInA(x)、LocInB(x)为x标签实体在TA或TB中的位置,WeightInLocA(x)与WeightInLocB(x)分别表示上述位置对应的标签权重;S2、使用递减的底数为p的指数函数来计算标签权重,并采用公式(1)计算UA与UB的标签相似度,UA与UB的共同标签c越靠前,其标签权值越大,则公式(1)的结果越大,UA与UB相似度越高;式(1)中WeightInLocA(c)=pLocInA(c),WeightInLocB(c)=pLocInB(c),由于位置权重为小数,系数20用来“放大”小数以得到更稳定结果,公式(1)的结果记作wSim,它为累加和形式,每一项的值落在区间(-1,1)上,wSim∈(-N,N),N为CT元素个数;S3、建立各个地区的位置权重表[D1:W1,D2:W2,..Dn:Wn],记为weightList,n为BID-RS中已维护相应信息的地区数,Dn为地区n的名称,Wn为Dn对应的权重值;S4、在FP-GROWTH算法中,扫描数据库后使用支持度作为排序依据对实体进行排序。作为优选的技术方案,在步骤S4中,还包括下述步骤:考虑地理位置因素后,使用以下方式对上述排序方式进行扩展:S41、使用递减支持度数排序筛选出前m个实体;S42、设定基于位置权重的最小支持度数MS,通过公式(2)计算实体的加权支持度数并筛除结果小于MS的实体;计算公式如下:support(weightList[Dx],Frequency(x))=weightList[Dx]*Frequency(x)(2)公式(2)中函数的第一个参数weighList[Dx]表示地区x的权重值,第二个参数Frequency(x)为x的支持度数;S43、根据support函数的输出值对m个实体排序。作为优选的技术方案,还包括下述步骤:在上述排序方式的基础上建立FP-Tree,然后在FP-Tree上进行BID-RS的关联规则挖掘。本专利技术与现有技术相比,具有如下优点和有益效果:1、本专利技术以标签位置权重及自学习模型为设计思路开发设计了此推荐系统,该系统建立一套考虑标签位置权重的标签系统,同时使用扩展的FP-Growth算法挖掘采购行为流程中的关联规则,最终组合并筛选基于标签的推荐结果与基于挖掘的推荐结果,形成推荐结果列表。系统运行的数据表明,相比传统的基于标签的企业级招投标推荐系统,提升了标签系统的作用并挖掘了标签系统相对不擅长的系统潜在关联规则,提供了有效的推荐性能。2、本专利技术使用基于标签及数据挖掘的相关基础理论开发而来,通过运行期间的数据,表明该系统的推荐方式有效可行,系统通过使用标签位置权重,考虑了实际系统中用户的标签习惯;系统的自学习模块生成的关联规则库,考虑了BID-RS等招投标平台上存在的特殊产业链结构,从而适应了实际场景。3、本专利技术的推荐系统减少了招投标用户为了采购物品而浪费的寻找供应商家的时间,同时增加了用户对平台的依赖性。附图说明图1是本专利技术基于标签权重与自学习的招投标好友推荐系统的结构示意图;图2是本专利技术数据源模块的工作流程图;图3是本专利技术标签预处理模块的工作流程图;图4是本专利技术热门标签库模块的工作流程图;图5是本专利技术标签系统建立模块工作流程;图6是本专利技术自学习模块的工作流程;图7是本专利技术结果筛选模块的工作流程图;图8是本专利技术产生推荐列表工作流程图。具体实施方式下面结合实施例及附图对本专利技术作进一步详细的描述,但本专利技术的实施方式不限于此。实施例如图1所示,本专利技术基于标签位置权重与自学习本文档来自技高网...

【技术保护点】
基于标签位置权重与自学习的招投标好友推荐系统,其特征在于,包括数据源模块、标签预处理模块、热门标签库模块、标签检测与存储模块、自学习模块以及结果筛选模块;所述数据源模块,用于收集收集招投标平台上的历史招投标数据;所述标签预处理模块,用于从招投标公司发表的招投标数据中提取部分关键字作为标签以减轻稀疏问题;所述热门标签库模块,用于提供系统热门标签给用户作为输入;所述标签检测与存储模块,用于对用户填入的标签质量进行检测,并最终进行持久化存储;所述自学习模块,用于在历史招投标数据上进行挖掘,同时若用户在线,还会对其实时招投标数据进行挖掘;所述结果筛选模块,用于通过进一步筛选得到具有双重特点的推荐列表。

【技术特征摘要】
1.基于标签位置权重与自学习的招投标好友推荐系统,其特征在于,包括数据源模块、标签预处理模块、热门标签库模块、标签检测与存储模块、自学习模块以及结果筛选模块;所述数据源模块,用于收集招投标平台上的历史招投标数据;所述标签预处理模块,用于从招投标公司发表的招投标数据中提取部分关键字作为标签以减轻稀疏问题;所述热门标签库模块,用于提供系统热门标签给用户作为输入;所述标签检测与存储模块,用于对用户填入的标签质量进行检测,并最终进行持久化存储;所述自学习模块,用于在历史招投标数据上进行挖掘,同时若用户在线,还会对其实时招投标数据进行挖掘;所述结果筛选模块,用于通过进一步筛选得到具有双重特点的推荐列表;在结果筛选模块中,通过标签检测与存储模块和自学习模块产生推荐列表,其具体方法为:S1、设需要计算标签相似度的用户实体为UA、UB,TA、TB分别为UA与UB的标签集合,UA与UB的共同标签记为CT,LocInA(x)、LocInB(x)为x标签实体在TA或TB中的位置,WeightInLocA(x)与WeightInLocB(x)分别表示上述位置对应的标签权重;S2、使用递减的底数为p的指数函数来计算标签权重,并采用公式(1)计算UA与UB的标签相似度,UA与UB的共同标签c越靠前,其标签权值越大,则公式(1)的结果越大,UA与UB相似度越高;式(1)中WeightInLocA(c)=pLocInA(c),WeightInLocB(c)=pLocInB(c),由于位置权重为小数,系数20用来“放大”小数以得到更稳定结果,公式(1)的结果记作wSim,它为累加和形式,每一项的值落在区间(-1,1)上,wSim∈(-N,N),N为CT元素个数;S3、建立各个地区的位置权重表[D1:W1,D2:W2,..Dn:Wn],记为weightList,n为BID-RS中已维护相应信息的地区数,Dn为地区n的名称,Wn为Dn对应的权重值;S4、在FP-GROWTH算法中,扫描数据库后使用支持度作为排序依据对实体进行排序。2.根据权利要求1所述的基于标签位置权重与自学习的招投标好友推荐系统,其特征在于,所述数据源模块中的招投标数据包括采购行为、销售行为、新闻及动态行为产生的数据,通过开源的轻量级对象映射框架Hibernate将上述的多种行为...

【专利技术属性】
技术研发人员:张墨琴
申请(专利权)人:张墨琴
类型:发明
国别省市:广东;44

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1