每一个猎头顾问都应该了解的简历解析技术

2017年11月14日

本周,展招系统上线了国内第一个人工智能的简历解析功能,展小招在应对图片识别方面的能力已经与人类相当了。

简单的简历解析技术也算是人工智能吗?

我们特别采访了研发小哥给大家讲讲简历解析的前世今生:

简历解析是干啥的?

猎头顾问每天要处理大量简历,为积累更加丰富完善的人才库,必须在前期付出大量手工的、枯燥的、重复的文字处理工作,将来自于各渠道的简历整理为标准格式录入人才库。

行业数据显示,在猎头工作的有效时间中,超过 20% 的时间用来对简历进行文字处理。伴随着技术的发展,识别简历中固定字段的简历解析技术也越来越成熟。

根据简历的不同类型,目前的简历解析技术也遇到了不同的挑战:

网页版或网站下载简历的解析

1.1

应聘者在各网站上,按网站提供的固定模板填写信息,形成网页版或从网页下载的其它格式简历(统称网页版简历)。

针对网页版简历的基础解析技术,各公司准确率不相上下,难度在于针对每一个固定模板做细致的分析,简历解析技术的准确度依赖于勤奋和经验。

展招针对各类网站简历模板进行了一对一精准解析,逐一根据这些网页版简历格式,编写了定制化,且有自动矫正功能的解析算法。

1.2

在模板固定的情况下,靠正则表达式,算法可以准确地解析出性别,年龄,工作经历等这些固定字段。但是如果招聘网站简历模板规则做了调整,比如更换了性别和年龄的填写位置,之前的算法就会出现解析错误。尤其是在各主要招聘网站频繁调整规则时,当解析程序不能及时进行调整就会造成解析结果出错,甚至无法使用。大部分简历解析技术的解决方案是根据网页简历解析新规则进行技术调整。

针对这种不确定因素下的调整,怎样才能避免不确定因素导致简历解析给用户造成工作影响呢?

展招的研发人员通过技术自动预警机制根据简历解析的空白率自动预警,进而在后台自动调整算法,使之匹配新的简历模板。这种调整完全由系统自动,无需重启停服,对用户在使用的过程中不受影响,系统自纠正解析错误。在任何情况下,展招简历解析的结果都是最值得信赖的。

1.3

最具挑战的是以图片形式显示基本信息,很多顾问都见过吧?

目前针对此种情况,解决方案是:手动!简历的正文部分进行系统解析,基本信息人工核查手工录入。

展招的研发小哥对于解决棘手的技术难题似乎都很偏执,他们的解决方案:人工智能。展招的图文识别技术直接对接百度 AI 技术,同时建立了正误信息关联词库,一旦出现错误识别,机器将会把人工更正的信息与识别对象做关联,在下一次出现时自动识别后联想正确信息。随着数据信息的不断累积,解析的准确率将会不断提高。

目前,展招图片识别的简历解析技术和解析后系统即所得的用户界面设计可做到 100% 准确。

2.极度复杂的本地简历解析

应聘者按照自己的想法和偏好,制作word、pdf、png,甚至是 excel 格式的电子文档简历。

格式五花八门的本地简历不是直接以网页代码的模式呈现,且没有相对固定的模板和字段,就给系统识别带来了挑战。自由发挥下的本地简历让系统寻找规律并进行判断和识别就有一定的难度,展招系统对这一类的简历解析无法做到百分百的满意,但是研发的小哥一直在努力,他们让简历解析技术不断的迭代,学习,越来越好!

每一次技术上的突破能够为用户带来一些方便都是对研发小哥巨大的鼓励,他们一直深受鼓舞愉快的奔走在突破各种技术难题的路上,以他们的方式用技术的力量让招聘服务行业更美好!