一种智能简历评估方法技术

技术编号:20045140 阅读:42 留言:0更新日期:2019-01-09 04:14
本发明专利技术公开了一种智能简历评估方法,包括:从数据库中获取招聘数据集合,所述招聘数据集合至少包括企业招聘信息;从所述招聘数据集合中抽取数据,所述数据包括:一个或多个属性在职位上对应的招聘要求,所述属性为企业招聘信息中用于表征职位要求的参数;从数据库中逐条获取简历文本数据;从所述简历文本数据中抽取数据,其中所述数据包括:一个或多个用于表征应聘者特征的属性;将由简历文本数据中抽取的数据与由招聘数据集合中抽取的数据进行匹配,匹配通过的数据写入数据库,本发明专利技术解决了现有技术中人工筛选简历耗时长、效率低,而借助信息手段筛选对数据全面性和来源要求过高造成局限的问题。

【技术实现步骤摘要】
一种智能简历评估方法
本专利技术涉及数据处理
,尤其涉及一种智能简历评估方法。
技术介绍
目前许多企业HR对于应聘者投递的简历往往还采用人工识别、判断、筛选的方式,这种方式较为依赖个人的经验判断,且在长时间的筛选、评估中,评估人容易对重复浏览相似的内容感觉到疲劳,从而影响到招聘效率和主观判断,另一方面,现有的招聘过程中,企业还倾向于通过招聘网站寻找人才,大多数此类招聘网站的特点在于通过社交网络、行为数据等对应聘者进行全面刻画,对应聘者的兴趣、性格、能力进行全方位评估,帮助企业找到合适的人才,但其存在的问题是:对于评估所需的数据要求较高,准确性局限较大,难度较高,目前尚未出现有效的解决方案。
技术实现思路
鉴以此,本专利技术的目的在于提供一种智能简历评估方法,以至少解决以上问题。一种智能简历评估方法,包括:从数据库中获取招聘数据集合,所述招聘数据集合至少包括企业招聘信息;从所述招聘数据集合中抽取数据,其中所述数据包括:一个或多个属性在职位上对应的招聘要求,所述属性为企业招聘信息中用于表征职位要求的参数;从数据库中逐条获取简历文本数据;从所述简历文本数据中抽取数据,其中所述数据包括:一个或多个用于表征应聘者特征的属性;将由简历文本数据中抽取的数据与由招聘数据集合中抽取的数据进行匹配,匹配通过的简历文本数据写入数据库。进一步的,所述从数据库中逐条获取简历文本数据,包括对所述简历文本数据进行筛选,所述筛选包括:将不符合条件的简历文本从所述简历文本数据中去除;逐条获取筛选后的简历文本数据。进一步的,所述不符合条件的简历文本,为未采用半结构化数据形式的简历文本。进一步的,从所述简历文本数据中抽取数据,包括:将简历文本切分为基本信息类和复杂信息类集合;从基本信息类中抽取数据;对复杂信息类集合进行分类;从复杂信息类中抽取目标信息。进一步的,将简历文本切分为基本信息类和复杂信息类集合时,首先采用基于正则表达式的匹配策略对关键字进行识别以寻找切分点;若无可识别的关键字,则将简历文本的前5-10行文本作为模糊基本信息类以抽取数据。进一步的,从基本信息类中抽取数据,包括:对强标识元素内容进行识别;基于元素上下文位置对元素类型进行判断。进一步的,对复杂信息类集合进行分类时,首先采取基于正则表达式的关键字符匹配策略对复杂信息类集合进行分类;若找不到相匹配的关键词,则通过分析文本的格式、字体进行复杂信息类集合的分类,或通过基于简单向量的自动分类算法进行分类。进一步的,从复杂信息类中抽取目标信息时采用基于正则表达式的关键字符匹配策略抽取目标信息,所述目标信息为简历文本数据中用于表征应聘者专业技能和技术水平的信息。与现有技术相比,本专利技术的有益效果是:本专利技术提供的一种智能简历评估方法,通过分别对招聘信息和简历文本数据进行特定信息提取并自动匹配,简化了筛选简历的过程,相较于传统的人工筛选简历方式,效率更高,减少了对人力资源的使用,另一方面,对于筛选数据的来源要求较低,从投递者的简历中即可自动抽取所需数据,筛选依据可根据招聘方的需求调整,目标信息抽取准确率更高。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的优选实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例的智能简历评估方法流程示意图。图2是本专利技术实施例的简历文本数据抽取流程示意图。具体实施方式以下结合附图对本专利技术的原理和特征进行描述,所列举实施例只用于解释本专利技术,并非用于限定本专利技术的范围。以下的实施例可以应用到可以应用到普通的终端中,例如计算机。当然以下的实施例也可以应用到服务器当中,服务器也可以理解为由一个或多个计算机组成的设备。因此,下面所示出的计算机的结构也适用于服务器。当移动终端计算能力逐步增强,以下实施例也可以在移动终端中实施。当然,下述实施例中的步骤或者模块可以在分别在不同的服务器或者终端或者移动终端中进行,这些服务器或者终端或者移动终端之间进行必要的数据交互即可。参照图1,本专利技术提供一种智能简历评估方法,具体包括:步骤S1,从数据库中获取招聘数据集合,所述招聘数据集合至少包括企业招聘信息。在上述步骤中,作为一种可选的实施方式,数据库中存储的招聘数据集合为招聘企业最近一次的企业招聘信息,由于招聘企业的招聘标准可能会随着时间的推移而改变,对于应聘者的要求会产生变化,因此,将招聘企业最近一次的企业招聘信息作为招聘数据集合的来源,以保证招聘目标的准确性。步骤S2,从所述招聘数据集合中抽取数据,其中所述数据包括:一个或多个属性在职位上对应的招聘要求,所述属性为企业招聘信息中用于表征职位要求的参数。在上述步骤中,所述用于表征职位要求的属性可以是职位所要求的学历、专业、技能、工作经验等参数。所述抽取的数据则是对所述属性的具体要求,例如,企业招聘信息中要求职位的应聘者学历应为硕士及以上,专业应为软件工程。步骤S3,从数据库中逐条获取简历文本数据;在上述步骤中,所述简历文本数据为应聘者所投递的简历文本。在本专利技术的实施例中,上述步骤还包括了对所述简历文本数据进行筛选,所述筛选包括:将不符合条件的简历文本从所述简历文本数据中去除;逐条获取筛选后的简历文本数据。所述不符合条件的简历文本,为未采用半结构化数据形式的简历文本。根据文本的特点,可以将文本数据分为三类:结构化数据,即按照一定格式严格生成的文本数据,例如各种票据、成绩单等;无结构数据,即以人类习惯的交流方式为主导的、合乎自然语法规则的文本数据,例如新闻报道、小说、散文等;半结构化数据,这种形式的文本数据介于前两者之间,从文本的整体看,这类文本数据有一定的格式约束,不完全符合自然语法规则,但从局部上看,又使用了自然语法规则组织语言,例如通知、公告、绝大多数的简历等,都属于半结构化形式的文本。为了便于计算机对简历文本数据的识别与信息的抽取,因此在获取应聘者投递的简历文本数据时需要将其中未采用半结构化数据形式的简历文本去除,即将不采用常规的简历撰写形式的文本去除。步骤S4,从所述简历文本数据中抽取数据,其中所述数据包括:一个或多个用于表征应聘者特征的属性。上述步骤中,所述用于表征应聘者特征的属性,可以是姓名、性别、学校、学历、专业、技能、工作经验等信息。步骤S5,将由简历文本数据中抽取的数据与由招聘数据集合中抽取的数据进行匹配,匹配通过的数据写入数据库。步骤S5中,通过将由简历文本数据中抽取的表征应聘者特征的数据与由招聘数据集合中抽取的表征招聘企业招聘要求的数据进行匹配,匹配通过即表示应聘者的某方面特征满足招聘企业的招聘要求,则将匹配通过的简历文本数据写入数据库中,方便人力资源部门根据数据库中的简历文本数据安排应聘者进行面试,提高招聘工作效率。参照图2,在上述实施例的基础上,步骤S4中,从所述简历文本数据中抽取数据,包括:步骤S41,将简历文本切分为基本信息类和复杂信息类集合;步骤S42,从基本信息类中抽取数据;步骤S43,对复杂信息类集合进行分类;步骤S44,从复杂信息类中抽取目标信息。在本专利技术的实施例中,将简历文本分为基本信息类和复杂信息类,从类的内容特点上看,基本信息类指本文档来自技高网...

【技术保护点】
1.一种智能简历评估方法,其特征在于,包括:从数据库中获取招聘数据集合,所述招聘数据集合至少包括企业招聘信息;从所述招聘数据集合中抽取数据,其中所述数据包括:一个或多个属性在职位上对应的招聘要求,所述属性为企业招聘信息中用于表征职位要求的参数;从数据库中逐条获取简历文本数据;从所述简历文本数据中抽取数据,其中所述数据包括:一个或多个用于表征应聘者特征的属性;将由简历文本数据中抽取的数据与由招聘数据集合中抽取的数据进行匹配,匹配通过的简历文本数据写入数据库。

【技术特征摘要】
1.一种智能简历评估方法,其特征在于,包括:从数据库中获取招聘数据集合,所述招聘数据集合至少包括企业招聘信息;从所述招聘数据集合中抽取数据,其中所述数据包括:一个或多个属性在职位上对应的招聘要求,所述属性为企业招聘信息中用于表征职位要求的参数;从数据库中逐条获取简历文本数据;从所述简历文本数据中抽取数据,其中所述数据包括:一个或多个用于表征应聘者特征的属性;将由简历文本数据中抽取的数据与由招聘数据集合中抽取的数据进行匹配,匹配通过的简历文本数据写入数据库。2.根据权利要求1所述的一种智能简历评估方法,其特征在于,所述从数据库中逐条获取简历文本数据,包括对所述简历文本数据进行筛选,所述筛选包括:将不符合条件的简历文本从所述简历文本数据中去除;逐条获取筛选后的简历文本数据。3.根据权利要求2所述的一种智能简历评估方法,其特征在于,所述不符合条件的简历文本,为未采用半结构化数据形式的简历文本。4.根据权利要求1所述的一种智能简历评估方法,其特征在于,从所述简历文本数据中抽取数据,包括:将简历文本切分为基本信息类和复杂信息类集合;从基本...

【专利技术属性】
技术研发人员:吴毅
申请(专利权)人:天涯社区网络科技股份有限公司
类型:发明
国别省市:海南,46

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1