一种基于推荐算法的就业信息匹配方法、系统、介质及设备技术方案

技术编号:34110699 阅读:22 留言:0更新日期:2022-07-12 01:18
本发明专利技术涉及数据推荐匹配的技术领域,特别涉及一种基于推荐算法的就业信息匹配方法、系统、介质及设备。所述方法包括:获取相关企业编号、就职人员编号及在职月份数数据,并根据该数据生成第一训练数据集、第二训练数据集;再采用协同推荐算法对第一训练数据集、第二训练数据集进行处理,分别生成第一相似度模型、第二相似度模型;最后,基于被推荐人的历史就业数据对第一相似度模型及第二相似度模型的数据进行处理和排序,以生成推荐结果。本发明专利技术方法利用在职月份数建立相似度模型能够更为客观地反应企业与就职人员之间的关联性,使得最终得到的推荐结果与被推荐人更加匹配,从而提高就业信息匹配的准确性、有效性和可靠性。有效性和可靠性。有效性和可靠性。

【技术实现步骤摘要】
一种基于推荐算法的就业信息匹配方法、系统、介质及设备


[0001]本专利技术涉及数据推荐匹配的
,特别涉及一种基于推荐算法的就业信息匹配方法、系统、介质及设备。

技术介绍

[0002]目前,就业难已经成为国家和社会的重点关注问题。为做好困难群体就业援助,减轻其就业压力和生活压力,相关机构、组织的人员需反复多次地进行上门沟通、电话联系来确定就业困难人员的就职意向,并根据就职意向在众多企业中筛选合适的企业进行沟通,从而促进就业困难人员实现就业。该种方式不仅费时费力,还存在信息传递偏差、人力成本高、整个沟通时效长的问题。
[0003]因此,如何利用大数据技术实现精准的就业困难人员和企业之间的匹配成为了刚性需求。而目前市面上的产品大多是依靠简单的关键字匹配或依靠单一数据来源分析的信息检索技术完成,存在效率低、准确度不高等问题。

技术实现思路

[0004]为解决上述现有技术中就业困难人员与企业之间匹配不易的不足,本专利技术提供一种基于推荐算法的就业信息匹配方法,包括:
[0005]步骤S10,获取相关企业编号、就职人员编号及对应的在职月份数数据,并根据上述数据生成至少两份数据文本格式,分别记为第一训练数据集、第二训练数据集;
[0006]步骤S20,采用协同推荐算法对数据文本格式进行处理,通过遍历第一训练数据集来确定两两企业之间的相似度系数,以生成第一相似度模型;通过遍历第二训练数据集来确定两两就职人员之间的相似度系数,以生成第二相似度模型;
[0007]步骤S30,获取被推荐人的历史就业数据,基于该历史就业数据分别读取第一相似度模型及第二相似度模型中对应的相似度系数,并对该系数进行处理和排序,以生成推荐结果。
[0008]在一实施例中,在步骤S10中,所述第一训练数据集的JSON数据格式为{

$就职人员编号

:{

$就职企业编号

:$在职月份数},

$就职人员编号

:{

$就职企业编号

:$在职月份数,

$就职企业编号

:$在职月份数}};
[0009]所述第二训练数据集的JSON数据格式为{

$企业编号

:{

$就职人员编号

:$在职月份数},

$企业编号

:{

$就职人员编号

:$在职月份数,

$就职人员编号

:$在职月份数}}。
[0010]在一实施例中,在步骤20中,生成所述第一相似度模型包括以下步骤:
[0011]步骤S201a,遍历第一训练数据集,记录每一家企业在职过的总在职月份数并保存于数据集N;
[0012]步骤S202a,再遍历第一训练数据集,记录同时在i企业和j企业就职过的在职月份数并保存于数据集C;
[0013]步骤S203a,遍历数据集C,通过以下模型公式计算i企业和j企业的相似度系数Wij,从而得到第一相似度模型:
[0014][0015]其中,为i企业和j企业之间的惩罚系数;
[0016]步骤S204a,对第一相似度模型内的相似度系数进行降序排序,并按照企业分组保留系数关联性最大的m条信息,再将其对应的信息卸载为新的数据文本格式,记为第一结果数据集。
[0017]在一实施例中,在步骤S20中,生成所述第二相似度模型包括以下步骤:
[0018]步骤S201b,遍历第二训练数据集,记录每个就职人员的总在职月份数并保存于数据集N;
[0019]步骤S202b,再遍历第二训练数据集,记录同时有a就职人员和b就职人员就职过的在职月份数保存于数据集C;
[0020]步骤S203b,遍历数据集C,通过以下模型公式计算a就职人员和b就职人员的相似度系数Wab,从而得到第二相似度模型:
[0021][0022]步骤S204b,对第二相似度模型内的相似度系数进行降序排序,并按照就职人员分组保留系数关联性最大的n条信息,再将其对应的信息卸载为新的数据文本格式,记为第二结果数据集。
[0023]在一实施例中,在步骤S30中,生成推荐结果具体包括以下步骤:
[0024]步骤S301,获取被推荐人的历史就业数据,包括该被推荐人的编号、曾就职过的企业编号及对应的在职月份数数据,再按照第一训练数据集、第二训练数据集的数据格式进行卸载;
[0025]步骤S302,通过该被推荐人曾就职过的企业编号读取第一结果数据集并匹配出相关企业,再对相关企业中具有被推荐人曾就职过的企业数据进行剔除后,将剩余的每一相关企业的就职月份数分别乘以第一结果数据集中对应的相似度系数以得到计算结果,并将相同企业的计算结果进行累加;
[0026]步骤S303,通过该被推荐人的编号读取第二结果数据集并匹配出相关就职人员,再对上述每一就职人员的就职历史中有关被推荐人的曾就职企业进行剔除,获取在职月份数最高的企业编号,再将该就职人员的系数映射为该企业,并将相同企业的计算结果进行累加;
[0027]步骤S304,将步骤S302与步骤S303的两份最终计算结果中相同企业对应的系数进行相乘,对两份最终计算结果中不相同企业对应的系数乘以另一份最终计算结果中对应的最小系数;再对其相乘所得的所有结果进行降序排序,从而获得系数最高的前K家企业,并将该推荐结果输出。
[0028]在一实施例中,在步骤S10~S30中,还包括根据{

$企业编号

:

$企业名称

}的JSON数据格式来获得另外一份数据文本格式,记为可视化数据集;所述可视化数据集用于
模型计算过程中的可视化展现。
[0029]本专利技术还提供一种基于推荐算法的就业信息匹配系统,包括:
[0030]训练数据集生成模块,获取相关企业编号、就职人员编号及对应的在职月份数数据,并根据上述数据生成至少两份数据文本格式,分别记为第一训练数据集、第二训练数据集;
[0031]模型生成模块,采用协同推荐算法对数据文本格式进行处理,通过遍历第一训练数据集来确定两两企业之间的相似度系数,以生成第一相似度模型;通过遍历第二训练数据集来确定两两就职人员之间的相似度系数,以生成第二相似度模型;
[0032]推荐结果生成模块,获取被推荐人的历史就业数据,基于该历史就业数据分别读取第一相似度模型及第二相似度模型中的相似度系数,并对该系数进行处理和排序,以生成推荐结果。
[0033]在一实施例中,还包括数据可视化展现模块,用于根据{

$企业编号

:

$企业名称

}的JSON数据格式来获得另外一份数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于推荐算法的就业信息匹配方法,其特征在于,包括以下步骤:步骤S10,获取相关企业编号、就职人员编号及对应的在职月份数数据,并根据上述数据生成至少两份数据文本格式,分别记为第一训练数据集、第二训练数据集;步骤S20,采用协同推荐算法对数据文本格式进行处理,通过遍历第一训练数据集来确定两两企业之间的相似度系数,以生成第一相似度模型;通过遍历第二训练数据集来确定两两就职人员之间的相似度系数,以生成第二相似度模型;步骤S30,获取被推荐人的历史就业数据,基于该历史就业数据分别读取第一相似度模型及第二相似度模型中对应的相似度系数,并对该系数进行处理和排序,以生成推荐结果。2.根据权利要求1所述的基于推荐算法的就业信息匹配方法,其特征在于:在步骤S10中,所述第一训练数据集的JSON数据格式为{

$就职人员编号

:{

$就职企业编号

:$在职月份数},

$就职人员编号

:{

$就职企业编号

:$在职月份数,

$就职企业编号

:$在职月份数}};所述第二训练数据集的JSON数据格式为{

$企业编号

:{

$就职人员编号

:$在职月份数},

$企业编号

:{

$就职人员编号

:$在职月份数,

$就职人员编号

:$在职月份数}}。3.根据权利要求2所述的基于推荐算法的就业信息匹配方法,其特征在于:在步骤20中,生成所述第一相似度模型包括以下步骤:步骤S201a,遍历第一训练数据集,记录每一家企业在职过的总在职月份数并保存于数据集N;步骤S202a,再遍历第一训练数据集,记录同时在i企业和j企业就职过的在职月份数并保存于数据集C;步骤S203a,遍历数据集C,通过以下模型公式计算i企业和j企业的相似度系数Wij,从而得到第一相似度模型:其中,为i企业和j企业之间的惩罚系数;步骤S204a,对第一相似度模型内的相似度系数进行降序排序,并按照企业分组保留系数关联性最大的m条信息,再将其对应的信息卸载为新的数据文本格式,记为第一结果数据集。4.根据权利要求3所述的基于推荐算法的就业信息匹配方法,其特征在于,在步骤S20中,生成所述第二相似度模型包括以下步骤:步骤S201b,遍历第二训练数据集,记录每个就职人员的总在职月份数并保存于数据集N;步骤S202b,再遍历第二训练数据集,记录同时有a就职人员和b就职人员就职过的在职月份数保存于数据集C;步骤S203b,遍历数据集C,通过以下模型公式计算a就职人员和b就职人员的相似度系数Wab,从而得到第二相似度模型:
步骤S204b,对第二相似度模型内的相似度系数进行降序排序,并按照就职人员分组保留系数关联性最大的n条信息,再将其对应的信息卸载为新的数据文本格式,记为第二结果数据集。5...

【专利技术属性】
技术研发人员:陈平谢江龙郭望郭劲军
申请(专利权)人:厦门畅享信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1