一种基于特征离散系数和注意力机制的智能人岗匹配方法组成比例

技术编号：36890458 阅读：39 留言：0更新日期：2023-03-15 21:53

本发明专利技术公开了一种基于特征离散系数和注意力机制的智能人岗匹配方法，所述方法包括获取简历/岗位文本语料对预训练语义抽取模型进行模型精调；根据各个字段的描述类型将简历/岗位文本语料划分为文本特征、数值型特征、等级型特征；根据不同特征类型分析简历/岗位文本语料以提取特征，并存储于向量数据库中；取应聘者在客户端最近的前N条浏览记录，在向量数据库中查找浏览记录对应的各特征值，以计算应聘者的兴趣画像和各特征对应的兴趣度；对于每一个候选岗位推荐项，根据岗位的各个特征值与对应特征的兴趣画像之间的相似度与该特征的兴趣度得到匹配度；对各候选项的匹配度进行排序，得到推荐结果。得到推荐结果。得到推荐结果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于特征离散系数和注意力机制的智能人岗匹配方法

[0001]本专利技术属于岗位匹配推荐领域，尤其涉及一种基于特征离散系数和注意力机制的智能人岗匹配方法。

技术介绍

[0002]近年来随着人工智能技术的发展，以往需要专业招、应聘双方从海量候选对象中自行筛选查找目标对象的现象也不复存在，而是利用供需双方提供的文本描述或者其历史浏览记录，借助文本向量匹配技术或者序列预测技术等深度学习方法实现对供需双方的智能匹配和推荐。
[0003]上述通过文本向量匹配的方法主要是借助word2vec或者TFIDF等技术简单的将整个简历文本或者特定字段转化成文本向量，然后借助向量相似技术进行岗位匹配。这种方法存在多种问题和缺点。首先，招、应聘双方的真实需求往往存在一定的模糊性和弹性，这种模糊性和弹性本身就很难通过文字来准确地表达，如果再加上文本材料撰写人的知识水平和文字功底有限，文本材料所表示的含义就更容易偏离作者的真实意图。其次word2vce或者TFIDF等文本向量生成方法仅仅是利用词频统计或者词频共现等信息生成词向量，然后再利用词向量通过平均或者简单加权的方法来计算文本向量，这种方法计算出来的文本向量仅含浅层语义信息，无法挖掘出文本所蕴含的深度语义信息，这样在进行文本语义匹配的时候就会出现对相似文本匹配不够准确的情况。再者，这种将简历不同字段无差别的进行向量转化然后进行相似度计算的方法忽略了不同字段对岗位匹配模型的重要度差异，这明显是违背现实招聘场景的。最后这种方法还忽略了一个明显的事实，即招、应聘双方的兴趣并不是一成不变...

【技术保护点】

【技术特征摘要】
1.一种基于特征离散系数和注意力机制的智能人岗匹配方法，其特征在于，所述方法包括以下子步骤：S1，获取简历/岗位文本语料，通过人工标注的方式生成相似句子对，将其标记为正例，再将相似句子对打乱顺序作为负例，然后作为正例和负例输入到预训练语义抽取模型进行模型精调；S2，根据各个字段的描述类型将简历/岗位文本语料划分为文本特征、数值型特征、等级型特征；将文本特征转化为语义向量，将数值型特征、等级型特征转化为数值标量，并将语义向量和数值标量作为特征值存储于向量数据库中；S3，自定义浏览记录超参数N，取应聘者在客户端最近的前N条浏览记录，在向量数据库中查找浏览记录对应的各特征值，以获取应聘者的兴趣画像和各特征对应的兴趣度；S4，对于每一个候选岗位推荐项，根据候选岗位的各个特征值与对应特征的兴趣画像之间的相似度与该特征的兴趣度得到匹配度；S5，对步骤S4得到的各候选项的匹配度进行排序，得到推荐结果。2.根据权利要求1所述的基于特征离散系数和注意力机制的智能人岗匹配方法，其特征在于，基于精调的预训练语义抽取模型、特征类型分析简历/岗位文本语料以提取特征的过程包括：对于文本特征，利用步骤S1精调后的预训练语义抽取模型将文本特征转换成语义向量；对于数值型特征，先推理得到数值型特征的数据范围，然后进行极大极小值归一化处理；对于等级型特征根据等级数量不同，将其按照等差数列形式进行极大极小值归一化处理；将上述提取的特征存储于向量数据库ES中。3.根据权利要求1所述的基于特征离散系数和注意力机制的智能人岗匹配方法，其特征在于，所述步骤S3具体包括以下子步骤：S31，对于每条浏览记录，将其浏览开始时间与浏览结束时间差值进行softmax归一化，然后将其作为每条浏览记录的兴趣注意力分数Wr_i；S32，对于每条浏览记录，将其浏览结束时间与当前时间的差值的倒数进行softmax归一化，然后将其作为每条浏览记录的记忆注意力分数Wr_m；S33，对不同浏览记录中的相同特征计算其特征平均值，对于每条浏览记录，每个特征计算其与对应特征平均值的相似度Srf；S34，对每个特征，计算其在不同浏览记录下的相似度Srf的离散系数Df；S35，对每个特征，利用其离散系数Df计算其更新权重Uf；S36，对不同特征的更新权重Uf进行softmax归一化计算，得到该特征的兴趣度If；S37，对每个特征，将步骤S33计算得到的在不同浏览记录下的相似度Srf进行softmax归一化计算，并将结果作...

【专利技术属性】
技术研发人员：魏伟，朱晓明，黄程韦，阚保春，郑海天，刘海丰，陈圆谜，
申请(专利权)人：浙江杭钢职业教育集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人