本发明专利技术提供简历筛选方法及装置,所述简历筛选方法包括获得符合客户端用人需求的标准简历;按与标准简历相似度由高到低的顺序筛选出至少一个候选简历。本发明专利技术采用与符合客户端用人需求的标准简历匹配的方法筛选候选简历,能够更为简单有效的筛选出与客户端用人需求相符的候选人才。相符的候选人才。相符的候选人才。
Resume screening method and device
【技术实现步骤摘要】
简历筛选方法及装置
[0001]本专利技术属于简历
,具体涉及简历筛选方法及装置。
技术介绍
[0002]简历匹配在人岗匹配中具有重要的实际应用价值,对于员工个人发展、企业寻找合适的员工和整个社会的人力资源合理分配均有直接应用。目前的人岗匹配主要是基于职位描述(Jobdescr i pt i on,JD)与简历(CV)进行相似度的计算。企业人员通常通过编写JD中的职位指责、任职要求等描述对该职位人员的期望。但是职位描述通常难以描述对职位的完整需求,尤其对经验要求较高的职位更是如此。
[0003]文本匹配是自然语言处理领域的常用任务,已经有很多相关的方法与系统,简历匹配与其他文本匹配任务的较大区别,主要包括以下四个方面:
[0004](1)简历结构复杂:简历是一个相对结构化的文本,通常包括个人信息、个人简介、工作经历、项目经历、教育经历等几个主要部分,现有的简历匹配没有考虑不同部分之间的相似度。
[0005](2)简历匹配的计算复杂度高:由于简历规模较大、包含的字段较多且文本较长,采用直接简历与所有候选简历匹配的匹配结果不理想。
[0006](3)术语匹配难度大:传统的文本匹配依赖于字面相似度,然而简历中包含大量的描述胜任力、技能等术语,这些术语字面语义和真实语义差别较大,如“命名实体识别”与“事件抽取”字面上完全不同,但语义上非常相关,因此现有技术容易漏检符合用人需求的语义不同的简历。
技术实现思路
[0007]针对现有技术存在问题中的一个或多个,本专利技术提供一种简历筛选方法,包括:
[0008]获得符合客户端用人需求的标准简历;
[0009]按与标准简历相似度由高到低的顺序筛选出至少一个候选简历。
[0010]根据本专利技术的一个方面,所述获得符合客户端用人需求的标准简历的步骤包括:
[0011]客户端上传初始简历或/和从简历库调取初始简历,优选地,客户端上传已胜任人才的简历作为初始简历;或/和从简历库调出客户端已胜任人才的简历作为初始简历,所述简历库包括客户端数据库或/和第三方数据库;
[0012]将上述初始简历文本化;
[0013]将文本化的初始简历结构化,提取内容块,所述内容块包括基本信息、教育经历、工作经历和自我评价的一个或多个;
[0014]对内容块进行知识抽取,获得知识信息,所述知识信息包括毕业院校、工作地域、学历、任职公司、职位、项目和技能中的一个或多个;
[0015]将知识信息归一化到知识图谱的知识标引,知识标引是知识图谱对简历中知识和实体的标引,形成标准简历。
[0016]根据本专利技术的一个方面,所述将文本化的初始简历结构化的步骤包括:
[0017]采用深度学习方法提取初始简历的各字段,一个字段作为一个内容块;
[0018]利用规则匹配的方法将内容块进行组合。
[0019]根据本专利技术的一个方面,所述对内容块进行知识抽取的步骤包括:
[0020]采用实体识别模型抽取内容块的知识信息,
[0021]优选地,所述采用实体识别模型抽取内容块的知识信息的步骤包括:
[0022]利用标准术语进行检索;
[0023]对标准术语对应的信息采用Bert+BiLSTM+CRF的模型进行抽取;
[0024]对于非标准术语对应的信息采用Bert+BiLSTM+MLP模型进行抽取。
[0025]根据本专利技术的一个方面,所述按与标准简历相似度由高到低的顺序筛选出至少一个候选简历的步骤包括:
[0026]利用结构化搜索按照内容块对候选简历进行召回,所述结构化搜索包括一个或多个知识标引的表达式;
[0027]利用结构化匹配的方法获得标准简历与召回的候选简历的相似度;
[0028]按相似度由高到低对候选简历进行排序;
[0029]选取排序靠前的设定数量的候选简历。
[0030]根据本专利技术的一个方面,所述利用结构化搜索按照内容块对候选简历进行召回的步骤包括:
[0031]利用结构化搜索筛选简历,优选地,包括:对数值型信息采用差值查找法搜索;对实体采用垂直性搜索;
[0032]按照内容块筛选出的简历进行结构化;
[0033]优选地,所述按照内容块筛选出的简历进行结构化的步骤之前还包括:将TFIDF作为特征权重,通过字面相似度筛选出与标准简历相似的简历。
[0034]根据本专利技术的一个方面,所述利用结构化匹配的方法获得标准简历与召回的候选简历的相似度的步骤包括:
[0035]分别获得标准简历和候选简历的各内容块的相似度;
[0036]对各内容块的相似度进行加权组合获得标准简历与候选简历的相似度。
[0037]根据本专利技术的一个方面,所述分别获得标准简历和候选简历的各内容块的相似度的步骤包括:
[0038]获得内容块的字段类型,所述字段类型包括数字类型、文本类型和知识类型;
[0039]不同字段类型采用不同相似度方法,获得内容块各字段的相似度;
[0040]对各字段的相似度进行加权组合获得内容块的相似度。
[0041]根据本专利技术的一个方面,所述不同字段类型采用不同相似度方法的步骤包括:
[0042]通过归一化差值方法获得数字类型的字段的相似度,优选地,通过差值绝对值的倒数获得数字类型的字段的相似度;
[0043]采用基于Bert的文本相似度方法获得文本类型的字段的相似度;
[0044]采用基于图神经网络的知识表示相似度方法获得知识类型的字段的相似度。
[0045]根据本专利技术的一个方面,所述采用基于Bert的文本相似度方法获得文本类型的字段的相似度的步骤包括:
[0046]对于文本信息采用Bert+BiLSTM进行建模,使用余弦相似度获得文本类型的字段的相似度。
[0047]根据本专利技术的一个方面,所述采用基于图神经网络的知识表示相似度方法获得知识类型的字段的相似度的步骤包括:
[0048]与标准简历的工作地域的知识标引完全匹配的相似度为1,否则为0;
[0049]采用类别相似度获得与标准简历的毕业院校的毕业院校的知识标引、知识标引、技能的知识标引相关的简历、职位的知识标引的相似度。
[0050]根据本专利技术的另一个方面,提供一种简历筛选装置,包括:
[0051]标准化部,获得符合客户端用人需求的标准简历;
[0052]筛选部,按与标准化部提供的标准简历相似度由高到低的顺序筛选出至少一个候选简历。
[0053]根据本专利技术的第三方面,提供一种电子设备,所述电子设备包括至少一个处理器;以及,
[0054]与所述至少一个处理器通信连接的存储器;其中,
[0055]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述简历筛选方法。
[0056]根据本专利技术的第四方面,提供一种计算机可读存储介质,存储有本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种简历筛选方法,其特征在于,包括:获得符合客户端用人需求的标准简历;按与标准简历相似度由高到低的顺序筛选出至少一个候选简历。2.根据权利要求1所述的简历筛选方法,其特征在于,所述获得符合客户端用人需求的标准简历的步骤包括:客户端上传初始简历或/和从简历库调取初始简历,优选地,客户端上传已胜任人才的简历作为初始简历;或/和从简历库调出客户端已胜任人才的简历作为初始简历,所述简历库包括客户端数据库或/和第三方数据库;将上述初始简历文本化;将文本化的初始简历结构化,提取内容块,所述内容块包括基本信息、教育经历、工作经历和自我评价的一个或多个;对内容块进行知识抽取,获得知识信息,所述知识信息包括毕业院校、工作地域、学历、任职公司、职位、项目和技能中的一个或多个;将知识信息归一化到知识图谱的知识标引,知识标引是知识图谱对简历中知识和实体的标引,形成标准简历;优选地,所述将文本化的初始简历结构化的步骤包括:采用深度学习方法提取初始简历的各字段,一个字段作为一个内容块;利用规则匹配的方法将内容块进行组合。3.根据权利要求2所述的简历筛选方法,其特征在于,所述对内容块进行知识抽取的步骤包括:采用实体识别模型抽取内容块的知识信息,优选地,所述采用实体识别模型抽取内容块的知识信息的步骤包括:利用标准术语进行检索;对标准术语对应的信息采用Bert+BiLSTM+CRF的模型进行抽取;对于非标准术语对应的信息采用Bert+BiLSTM+MLP模型进行抽取。4.根据权利要求2所述的简历筛选方法,其特征在于,所述按与标准简历相似度由高到低的顺序筛选出至少一个候选简历的步骤包括:利用结构化搜索按照内容块对候选简历进行召回,所述结构化搜索包括一个或多个知识标引的表达式;利用结构化匹配的方法获得标准简历与召回的候选简历的相似度;按相似度由高到低对候选简历进行排序;选取排序靠前的设定数量的候选简历。5.根据权利要求4所述的简历筛选方法,其特征在于,所述利用结构化搜索按照内容块对候选简历进行召回的步骤包括:利用结构化搜索筛选简历,优选地,包括:对数值型信息采用差值查找法搜索;对实体采用垂直性搜索;按照内容块筛选出的简历进行结构化;优选地,所述按照内容块筛选出的简历进行结构化的步骤之前还包括:将...
【专利技术属性】
技术研发人员:雷真,安波,孙绍军,赵阿民,
申请(专利权)人:图谱天下北京科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。