基于用户生成内容及用户关系的技能评估与岗位匹配方法,其特征:首先提取出用户生成内容包含的技能关键词,形成用户在某个技能关键词下发表内容的统计信息。然后计算用户技能关键词得分。再通过用户技能关键词得分计算出用户声望得分初值,将其在用户关系网络中迭代计算得出最终的用户声望得分。至此建立起由用户技能关键词得分和用户声望得分组成的用户技能评估模型。从用户技能评估模型构建用于将用户和岗位进行匹配的查询库,查询库中的条目为由技能关键词作为索引对应由具有该技能关键词的用户、用户技能关键词得分、用户声望得分组成的列表。将岗位的技能需求部分拆分为技能关键词集合,使用这些关键词在查询库中查找与之匹配的用户。
【技术实现步骤摘要】
本专利技术涉及到数据挖掘,特别是对用户生成内容及用户关系的挖掘以进行技能评估与岗位匹配。
技术介绍
一直以来招聘方对求职者的初步筛选主要依靠简历来完成。随着web技术的发展,求职者对简历的投递以及招聘方对简历的收集都从线下转移到了线上。简历的投递更加方便导致滥投简历情况严重,同时,人才已经成为社会最重要的资源,招聘方需要主动出击查找符合需求的简历。这样一来简历筛选的工作量日益加剧,一些有效的加快简历筛选的方法已经被提了出来。例如,申请号为201110216654.4的专利技术专利《一种从简历库中快速检索简历的方法》,申请号为201410617426.1的专利技术专利《一种简历模型匹配系统及方法》,申请号为201310598050.X的专利技术专利《简历邮件筛选系统及方法》。但是由于互联网的分布式特性以及只能依靠道德进行约束致使简历造假的成本底下,出现了简历虚假夸大问题。通常用户并不会及时更新他们发布在网络上的简历。这导致基于简历的求职者筛选方案还会遇到简历更新不及时的问题。随着互联网的深度普及,用户在网络上发表了海量的内容,同时人际关系网络也搬到了线上。通过这些数据完成对用户技能的认定和评估并据此完成求职者与岗位的匹配具有了高度可行性。基于用户生成内容及用户关系对求职者进行技能评估,能够解决基于传统简历进行求职者筛选的各种弊端。申请号为201310538500.6的专利技术专利《一种基于社交网络的招聘信息匹配方法》提供一
种利用社交网络用户个人信息、社交网络用户发布的数据、社交网络用户的一级和二级好友进行求职者初步筛选的方法。虽然没有基于简历进行筛选的各种问题,但仍然具有以下缺陷导致其难以实际利用。第一,仅仅使用社交网络上的数据难以全方位评估用户实力;第二,把招聘需求中规则化的能够进行精确匹配的可以作为过滤条件的学历、经验年限、期望工作地点等信息和其它信息抽取成了一个关键词集合,这在进行匹配时会产生主题漂移导致不能查找到符合要求的候选人;第三,关键词匹配方法不明确,仅仅提到了使用微博API接口,事实上不同的匹配方法对匹配结果有很大的影响;第四,所提到的用户列表的初始能量值与用户能力并无相关性,导致后续步骤中利用好友为用户的岗位匹配度背书的操作没有事实依据;第五,在岗位匹配时仅仅利用了关系网络中一级好友和二级好友。
技术实现思路
为解决
技术介绍
中的问题,本专利技术提供了一种全方位使用用户生成内容和用户关系完成用户与岗位技能需求匹配的方案。本专利技术能够避免了传统基于简历的求职者初步筛选所具有简历筛选任务量大、简历虚假夸大、简历更新不及时的问题。同时,本专利技术提出得技能评估模型、技能需求匹配方法,解决了申请号为201310538500.6的专利技术专利所提供方法的上述问题。本专利技术的技术方案是:首先提取出用户生成内容中包含的技能关键词,并记录下该篇数据与技能关键词的对应关系,并逐渐形成用户在某个技能关键词下发表内容的统计信息,包括篇数、字数、评论数、关注数、赞同数、反对数等。如果某类用户生成内容不包含某种统计信息,那么其值直接取0;如,在用户在BBS中提出的问题可能不包含评论数、赞同数、反对数,那么这些统计信息直接取0值。用户在某个技能关键词所代表的技术上的精通程度与用户在该技能关键字上发表内容的数量、热度和认可程度正相关。经验表明他们之间的关系并不是线性的,而是一种对数关系;也就是,当用户发表内容继续增多时并不表明用户的精通程度线性的增加,实际上精通程度的增加略少。所以表示用户在某个技能关键词所代表技能上的精通程度的数值化表示,即用户技能关键词得分的计算公式为:P=logN(1+a·Piece+b·Length+c·Remark+d·Pros-e·Cons)其中Piece表示篇数,Length表示字数,Remark表示评论数,Pros表示赞同数,Cons表示反对数;a、b、c、d、e分别为他们的系数。底N越大用户技能关键词得分P的增长速度越缓慢,其值可以取自然对数e或者10等,还可以根据具体行业的实际情况确定。系数a默认可以取1,b可以取数据来源站该类型内容平均字数的倒数,c可以取数据来源站该类型内容的平均评论数的倒数,d和e可以取数据来源站该类型内容平均赞同和反对数之和的倒数。在实现技能知识分享、技能成果分享和技能讨论的博客、社区等网站的用户中形成了一种由关注和被关注构成的用户关系网络。一个用户关注另一个用户能够表示前者对后者的技能水平表示认可。一个技能水平高超的用户所认可的其它用户的技能水平也会是高超的;反之,一个技能水平普通的用户认可的其它用户的技能水平不一定是高超的。也就是说,一个用户的关注者的水平从侧面反映了这个用户的技能水平,这个用户的关注者的技能水平又能够被他们的关注者从侧面进行反映,如此便形成了一种网状依赖关系。在这种网状关系中,由一个用户的所有关注者、所有关注者的关注者、以此递推以致无限层次的关注者所反映出来的用户的技能水平的数值化表示称作用户声望得分。下面给出用户声望得分的初值设定与计算方法。以用户技能关键词得分之和除以用户技能关键词数量得出平均得分,将大于等于平均得分的用户技能关键词得分之和除以大于等于平均得分的用户技能关键词数量再次得出一个平均得分。将这个平均得分作为用户声望得分的初值,并将其在用户关系网络中进行传播。传播策略为将某个用户的当前声望得分平均分配给他所关注的其它用户。在下一次迭代前在用户的原始用户声望得分上加上由其关注者传递过来的声望得分。使用该方法进行迭代计算,直至所有用户的连续两次计算出的用户声望得分之差小于某个给定的经验值时结束。至此个人技能评估模型建立完成,它由用户技能关键词得分和用户声望得分组成。需要注意的是,用户关系网络只存在于某一个网站内部,因此需要分网站计算出得分,再利用求和或者求均值的方法计算出求职用户的最终声望得分。为了将这种个人技能模型用于岗位匹配,需要将其转换为一种利于检索的结构,即将技能关键词作为索引对应由具有该技能关键词的用户、用户技能关键词得分、用户声望得分组成的列表。把所有的这类列表集合在一起组成一个查询库。通常,某项技能被越多的人掌握,那么它的价值就越低。所以还要统计出技能关键词用户频数,即具有某个技能关键词的用户数量。然后计算出技能关键词用户逆频率。技能关键词用户逆频率本质上是用户数量与技能关键词用户频数的比值。为了易于使用给出了下列规范化的计算公式,其中numUsers是用户数量,userFreq是技能关键词用户频数。 IUF = 1 + log N ( numUsers ( userFreq + 1 ) ) ]]>岗位需求的年龄、学历、经验、求职意向等部分采用传统的方法进行过滤。岗位需求的技能需求部分需要采用一定的方法转换为技能关键词集合。转换方
法可以使用技能关键词库进行分词,也可以由招聘方直接提供。然后使用技能关键词集合在前述“查询库”中检索出与技能关键词匹配的用户,并按照本文档来自技高网...
【技术保护点】
基于用户生成内容及用户关系的技能评估与岗位匹配方法,其特征在于:通过用户生成内容和用户关系创建由用户技能关键词得分和用户声望得分组成的用户技能评估模型;将岗位的技能需求部分拆分成技能关键词,然后在由用户技能评估模型创建的查询库中查询与岗位技能需求匹配的用户。
【技术特征摘要】
1.基于用户生成内容及用户关系的技能评估与岗位匹配方法,其特征在于:通过用户生成内容和用户关系创建由用户技能关键词得分和用户声望得分组成的用户技能评估模型;将岗位的技能需求部分拆分成技能关键词,然后在由用户技能评估模型创建的查询库中查询与岗位技能需求匹配的用户。2.根据权利要求1所述的基于用户生成内容及用户关系的技能评估与岗位匹配方法,其特征在于:所述用户技能关键词得分通过用户生成内容的篇数、字数、评论数、赞同数、反对数进行量化。3.根据权利要求1所述的基于用户生成内容及用户关系的技能评估与岗位匹配方法,其特征在于:所述用户声望...
【专利技术属性】
技术研发人员:唐锐,
申请(专利权)人:唐锐,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。