当前位置:人工智能行业动态 → 正文

人工智能在大规模招聘求职上的应用

责任编辑:zsheng |来源:企业网D1Net  2018-11-13 11:32:49 本文摘自:CSDN

作为在领英工作六年的开发者和程序员,今天我想和大家分享领英这一全球最大的职场社交平台在世界做了什么,在中国做了什么,以及AI人工智能技术在领英如何被应用,我们是如何通过AI来解决诸多问题的。

目前,领英在全球有5亿9000万用户、3000万家公司、2000万个工作,这是领英的全球经济图谱。领英致力于连接全球职场人士,并协助他们事半功倍,发挥所长。我们希望连接全世界的同行,为他们提供更多的职业发展机会。

在中国,我们有4400万用户,领英中国的商业和各方面都发展得非常迅速。

人工智能——领英的“氧气”

人工智能是领英所有用户体验的DNA,它就像是领英的氧气,是我们一切工作的驱动力,我们将人工智能技术应用到了领英所有的产品中。在恰当的时间、恰当的地点给恰当的用户推荐恰当的内容,这是领英人工智能研发部门的使命。

我们很多产品都深入地应用了人工智能,比如你所认识的人、我们主页上的内容、职位推荐、搜索、为招聘专员和销售专员专门定制的产品……

目前,每天领英平台上被处理的数据达到了2PB的规模,领英的机器学习模型动辄拥有上十亿甚至上百亿个参数,每个星期都会有上百个AB在线测试在运行,由此可见,领英AI体量是非常庞大的。那么如何在这样一个大规模的计算平台上、在几百毫秒延迟的范围内,提升用户的使用体验呢?这是一个很大的挑战。

领英的职位推荐系统

职位推荐是领英的主打产品。那么在这方面,我们是如何应用人工智能来解决具体的技术问题呢?

用户在领英上传个人简历,平台会推荐适合求职者的工作职位,但首先,领英需要了解你的背景,从哪个学校毕业,在哪些公司工作过,拥有哪些技能……根据以上,我们可以预测哪些工作可能比较适合求职者。领英做的第一步是建立知识图谱和研发针对自然语言的标准化技术。我们针对每位用户的简历,使用基于深度学习模型的标准化技术来实现信息抓取,比如LSTM, CNN等等。对于工作职位,我们也做了同样的事情。

六七年前,我们的职位推荐一开始做的是做线性模型,比如说求职者是一个软件工程师,我们就会推荐一个软件工程师的职位。但后来我们发现,根据用户简历和工作职位的描述来做推荐,不一定能够完全实现个性化,我们还希望根据用户之前的职位申请,为他推荐更多类似的职位,我们将其称之为深度的个性化。我们因而研发了Generalized Linear Mixed Model(GLMix),针对每个用户和每个职位建立一个单独为他们服务的模型,这样使得我们模型的参数量达到了上百亿的规模。同时也成功地把职位申请的数量提高了30%。领英中国团队把这个模型用在中国的数据上,又将职位申请的数量额外提高了11%。

进一步地,我们建立了一个Deep & Wide的模型,其中整合了深度学习,树状结构模型,以及GLMix,我们发现这个模型的效果非常好,也极大地提升了领英的用户体验。为了实时更新上百亿的模型参数以及在毫秒级别内满足用户的职位推荐需求,领英搭建了大规模运算平台来实现人工智能模型的技术。这个平台包括线下和线上两个模块:线下模块自动收集用户的反馈、基于Spark自动训练,之后把模型结果和参数上传到线上。线上我们使用自己的实时数据传输和搜索引擎技术来实现低延迟的模型运算。并且,领英专门研发了一个叫做Pro-ML的“人工智能自动化”系统,为所有工程团队集中管理特征和机器学习模型。这一系统为机器学习模型的整个开发、培训、部署、测试提供单一化平台,已经极大加快了领英开发及上线新产品的速度。

我们在职位推荐方面也遇到过一些有意思的问题。下图说的是一个边际收益递减的例子,比如我是一个招聘专员,刚刚发布了一个工作到网上,那么我收到的第一份申请是最有价值的,因为我之前一个申请都没有收到。但等到第100个人申请的时候,这个边际价值就不一定比以前多了,因为100到101和从0到1完全不是一回事。等到有上万个工作申请的时候,可能反馈就是,我们不小心收了1万份简历,我们看不过来,可能最后也就能看前100个。

这时就体现了一个问题,我们不应只从求职者的角度去考虑问题,也要考虑招聘者的思维。因为招聘的成功率体现了平台的价值,如果现在这个平台上面有几千万个工作,可能1%的工作是Google,Facebook,百度,包括小米,京东这些最知名的公司,他们收的简历数量非常大,但也有一些公司收集的简历可能没有那么多,或者完全没有,那么这个平台价值对他们就没有体现出来。为什么没有体现出来呢?因为我们这个平台的目的是为了服务全世界所有的公司,是希望所有的人能够找到他们合适的工作。并且,对于这些大公司来说,每个职位发出去,收到的上万个简历中可能只能有时间看前100个,这也是浪费社会资源的一种表现。

所以在领英的平台上做职位推荐,我们有几点要注意:第一,我们要保证每个人都能找到适合的工作,第二,我们要保证每一份工作不会收到太多、或太少的申请,我们要从整个产品的体验以及整个平台的效率去考虑这个问题。

在经济学上,这是一个市场效率优化的问题。这个市场有三方角色,第一方是找工作的,申请越多机会相对来说就会越大;第二方是招聘专员,他们希望每一个工作职位发出去,有足够多的人申请,但也不能太泛滥,最好是人选恰好就是想找的那一位;第三方就是领英这个平台,这个平台想要通过这个职位推荐的市场得到收入。那么如何把这三方的利益综合起来考虑,达到市场效率的最优化,建立市场长期发展的生态,这本身就是一个很难的问题,这也是我们这一两年内一直在做的事情。

我们在2016年的KDD有一篇论文,谈的就是如何平衡这三方需求。我们可以做到在不影响用户体验的前提下,让工作职位的申请数量更加均匀。如果用熵(entropy)来度量每个职位申请数量的均匀度的话,这个方法使得熵增加了12%。

领英在智能问答领域的探索

智能问答在领英有很多可能的应用。比如刚才招聘这个案例,就可以做一个智能问答系统:求职者来让我推荐工作,招聘方想了解适合某一职位在某一地区符合资格的人数,这些都是很有价值的问题,我们希望将来能够有这样一个智能问答系统,可以服务于领英平台上的所有用户。

原则上,智能问答系统的开发通常分为四步:第一,首先要做自然语言的处理;第二,对于对话实时信息的跟踪;第三,根据现在已知的信息和对具体问题的理解,能够知道下一步要做什么;第四,根据下一步要做的,将它转换成自然语言,给出一个回答。

在领英公司的内部,每天会很多人来问数据科学家关于领英数据的问题,为了让这一过程更加自动化,同时减轻数据科学家们的负担,我们希望通过制造一个机器人来自动回答这样的问题。我们给这个机器人取名叫做安娜(Analytics Bot)。

Ana现在的主要功能有两个,第一是回答关于某个具体数据指标的定义。比如,领英内部有一个数据指标叫contributor,即每天主页上有多少人分享,多少人评论等等,如果用户问contributor是什么,Ana就能够给出回答。第二个功能是某个数据指标在某几个维度上的数值。比如领英主页过去7天有多少中国用户访问,Ana就会把这个问题自动转化为SQL的语句来查询我们内部的数据库,然后给出答案。

关键字:应用招聘智能

本文摘自:CSDN

x 人工智能在大规模招聘求职上的应用 扫一扫
分享本文到朋友圈
当前位置:人工智能行业动态 → 正文

人工智能在大规模招聘求职上的应用

责任编辑:zsheng |来源:企业网D1Net  2018-11-13 11:32:49 本文摘自:CSDN

作为在领英工作六年的开发者和程序员,今天我想和大家分享领英这一全球最大的职场社交平台在世界做了什么,在中国做了什么,以及AI人工智能技术在领英如何被应用,我们是如何通过AI来解决诸多问题的。

目前,领英在全球有5亿9000万用户、3000万家公司、2000万个工作,这是领英的全球经济图谱。领英致力于连接全球职场人士,并协助他们事半功倍,发挥所长。我们希望连接全世界的同行,为他们提供更多的职业发展机会。

在中国,我们有4400万用户,领英中国的商业和各方面都发展得非常迅速。

人工智能——领英的“氧气”

人工智能是领英所有用户体验的DNA,它就像是领英的氧气,是我们一切工作的驱动力,我们将人工智能技术应用到了领英所有的产品中。在恰当的时间、恰当的地点给恰当的用户推荐恰当的内容,这是领英人工智能研发部门的使命。

我们很多产品都深入地应用了人工智能,比如你所认识的人、我们主页上的内容、职位推荐、搜索、为招聘专员和销售专员专门定制的产品……

目前,每天领英平台上被处理的数据达到了2PB的规模,领英的机器学习模型动辄拥有上十亿甚至上百亿个参数,每个星期都会有上百个AB在线测试在运行,由此可见,领英AI体量是非常庞大的。那么如何在这样一个大规模的计算平台上、在几百毫秒延迟的范围内,提升用户的使用体验呢?这是一个很大的挑战。

领英的职位推荐系统

职位推荐是领英的主打产品。那么在这方面,我们是如何应用人工智能来解决具体的技术问题呢?

用户在领英上传个人简历,平台会推荐适合求职者的工作职位,但首先,领英需要了解你的背景,从哪个学校毕业,在哪些公司工作过,拥有哪些技能……根据以上,我们可以预测哪些工作可能比较适合求职者。领英做的第一步是建立知识图谱和研发针对自然语言的标准化技术。我们针对每位用户的简历,使用基于深度学习模型的标准化技术来实现信息抓取,比如LSTM, CNN等等。对于工作职位,我们也做了同样的事情。

六七年前,我们的职位推荐一开始做的是做线性模型,比如说求职者是一个软件工程师,我们就会推荐一个软件工程师的职位。但后来我们发现,根据用户简历和工作职位的描述来做推荐,不一定能够完全实现个性化,我们还希望根据用户之前的职位申请,为他推荐更多类似的职位,我们将其称之为深度的个性化。我们因而研发了Generalized Linear Mixed Model(GLMix),针对每个用户和每个职位建立一个单独为他们服务的模型,这样使得我们模型的参数量达到了上百亿的规模。同时也成功地把职位申请的数量提高了30%。领英中国团队把这个模型用在中国的数据上,又将职位申请的数量额外提高了11%。

进一步地,我们建立了一个Deep & Wide的模型,其中整合了深度学习,树状结构模型,以及GLMix,我们发现这个模型的效果非常好,也极大地提升了领英的用户体验。为了实时更新上百亿的模型参数以及在毫秒级别内满足用户的职位推荐需求,领英搭建了大规模运算平台来实现人工智能模型的技术。这个平台包括线下和线上两个模块:线下模块自动收集用户的反馈、基于Spark自动训练,之后把模型结果和参数上传到线上。线上我们使用自己的实时数据传输和搜索引擎技术来实现低延迟的模型运算。并且,领英专门研发了一个叫做Pro-ML的“人工智能自动化”系统,为所有工程团队集中管理特征和机器学习模型。这一系统为机器学习模型的整个开发、培训、部署、测试提供单一化平台,已经极大加快了领英开发及上线新产品的速度。

我们在职位推荐方面也遇到过一些有意思的问题。下图说的是一个边际收益递减的例子,比如我是一个招聘专员,刚刚发布了一个工作到网上,那么我收到的第一份申请是最有价值的,因为我之前一个申请都没有收到。但等到第100个人申请的时候,这个边际价值就不一定比以前多了,因为100到101和从0到1完全不是一回事。等到有上万个工作申请的时候,可能反馈就是,我们不小心收了1万份简历,我们看不过来,可能最后也就能看前100个。

这时就体现了一个问题,我们不应只从求职者的角度去考虑问题,也要考虑招聘者的思维。因为招聘的成功率体现了平台的价值,如果现在这个平台上面有几千万个工作,可能1%的工作是Google,Facebook,百度,包括小米,京东这些最知名的公司,他们收的简历数量非常大,但也有一些公司收集的简历可能没有那么多,或者完全没有,那么这个平台价值对他们就没有体现出来。为什么没有体现出来呢?因为我们这个平台的目的是为了服务全世界所有的公司,是希望所有的人能够找到他们合适的工作。并且,对于这些大公司来说,每个职位发出去,收到的上万个简历中可能只能有时间看前100个,这也是浪费社会资源的一种表现。

所以在领英的平台上做职位推荐,我们有几点要注意:第一,我们要保证每个人都能找到适合的工作,第二,我们要保证每一份工作不会收到太多、或太少的申请,我们要从整个产品的体验以及整个平台的效率去考虑这个问题。

在经济学上,这是一个市场效率优化的问题。这个市场有三方角色,第一方是找工作的,申请越多机会相对来说就会越大;第二方是招聘专员,他们希望每一个工作职位发出去,有足够多的人申请,但也不能太泛滥,最好是人选恰好就是想找的那一位;第三方就是领英这个平台,这个平台想要通过这个职位推荐的市场得到收入。那么如何把这三方的利益综合起来考虑,达到市场效率的最优化,建立市场长期发展的生态,这本身就是一个很难的问题,这也是我们这一两年内一直在做的事情。

我们在2016年的KDD有一篇论文,谈的就是如何平衡这三方需求。我们可以做到在不影响用户体验的前提下,让工作职位的申请数量更加均匀。如果用熵(entropy)来度量每个职位申请数量的均匀度的话,这个方法使得熵增加了12%。

领英在智能问答领域的探索

智能问答在领英有很多可能的应用。比如刚才招聘这个案例,就可以做一个智能问答系统:求职者来让我推荐工作,招聘方想了解适合某一职位在某一地区符合资格的人数,这些都是很有价值的问题,我们希望将来能够有这样一个智能问答系统,可以服务于领英平台上的所有用户。

原则上,智能问答系统的开发通常分为四步:第一,首先要做自然语言的处理;第二,对于对话实时信息的跟踪;第三,根据现在已知的信息和对具体问题的理解,能够知道下一步要做什么;第四,根据下一步要做的,将它转换成自然语言,给出一个回答。

在领英公司的内部,每天会很多人来问数据科学家关于领英数据的问题,为了让这一过程更加自动化,同时减轻数据科学家们的负担,我们希望通过制造一个机器人来自动回答这样的问题。我们给这个机器人取名叫做安娜(Analytics Bot)。

Ana现在的主要功能有两个,第一是回答关于某个具体数据指标的定义。比如,领英内部有一个数据指标叫contributor,即每天主页上有多少人分享,多少人评论等等,如果用户问contributor是什么,Ana就能够给出回答。第二个功能是某个数据指标在某几个维度上的数值。比如领英主页过去7天有多少中国用户访问,Ana就会把这个问题自动转化为SQL的语句来查询我们内部的数据库,然后给出答案。

关键字:应用招聘智能

本文摘自:CSDN

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^