领英如何认识并运用人工智能

标签: 业界 | 发表时间:2018-11-09 19:27 | 作者:睢岭
出处:http://news.csdn.net/yejie/

作者 | 领英人工智能负责人Deepak Agarwal

2005年,我在AT&T(美国电报电话公司)贝尔实验室开始了我的职业生涯。当时,电信产业正受困于价格战和来自无线运营商的竞争,看着一个又一个同事离职,前往谷歌和雅虎这样正蓬勃发展的消费互联网产业寻求职业发展机会时,我不禁也开始思考自己的下一步。

尽管当时领英已经成立,但我却没有听过这个平台。我当时做了什么呢?我开始联系自己身边的朋友和曾经的老板,参加了一场接一场的招聘面试,最终那年年末,我在雅虎研究院找到了工作。这是我在科技行业职业发展的起点。

我分享自己故事的原因是,它和很多领英会员的故事十分类似:我在自己的人际关系网中找到机会。领英的愿景就是促进大规模的经济流动。我们希望连接全球职场人士,为每一位会员都创造经济机会。为了践行这一宏大的愿景,我们采用人工智能帮助会员匹配合适的求职岗位,为客户筛选理想求职者。在人工智能的协助下,我们能够将海量数据转化为洞察,包括招聘职位、希望建立的人脉、信息流内容等,根据会员的兴趣提供高效精准的推荐。

多年来,我们一直把人工智能应用到我们的产品和服务中,我们也曾在博客中谈到过人工智能在领英的几个具体应用案例。在本博文中,我会更深层次地谈谈我们是如何应用人工智能来改善会员和客户体验的。由于人工智能技术在不断发展进步,它在领英的应用已经无处不在,而不仅仅局限于一两个应用。全面观察人工智能在领英的应用将有助于展现并解释人工智能是如何融入到领英的方方面面中。

什么是人工智能?

根据基本定义,人工智能(AI)是构建智能计算机程序的科学和工程,可以实现复杂的目标,例如驾驶汽车,识别图像中的一只猫,或向你推荐可能感兴趣的工作。广义的人工智能下有多个专业分支,例如机器学习和深度学习等等。

为了了解人工智能系统如何帮助我们实现目标,需要首先了解人工智能算法的基本原理。

  • 首先需要为人工智能系统定义一个宽泛的目标,例如为“为会员提供符合其技能和兴趣的工作机会”或者“为招聘者提供满足搜索标准、同时符合招聘要求的求职者名单”。
  • 接着建立一套中间指标(图1中的“相关度”指标),用以衡量系统在多大程度上实现了这一目标。这是必要的步骤,因为机器学习算法很难直接优化最原始的指标(例如:招聘成功)。在领英,此类指标一般包括申请职位的会员数量、成功招聘的数量、点击职位列表的会员数量等等。
  • 然后根据相关指标开发一种算法,它可以改进现有的依靠数据获得结果的方法。例如,某一模型采用了一个不同的标准向会员进行职位推荐,从而增加了求职列表中的会员点击数,这表明职位推荐算法得到了改善。

最后,采用科学方法测试算法、调整算法,以及通过相互比较不同的算法进而确定哪种系统变更能够实现最佳成果。以下的A/B测试可以作为一个例子。

图1:产品设计、人工智能系统和A/B测试之间的关系图

对于每一个应用人工智能的企业来说,确保采用正确的指标十分重要。例如,当企业想增加职位推荐的互动时,就可能由于推荐的职位过多而破坏了用户体验,尤其是那些并不想找新工作的会员。同样的,一般会员们并不想花费过多时间去申请录用几率渺茫的工作。领英的一个关键策略是:采用一个最优化、整体而全面的机器学习算法,可以让客户和会员的体验得到同时优化,包括动态内容和职位推荐,以及向招聘者提供求职者搜索结果。了解此项研究的更多详情,大家可以通过观看KDD’14视频,了解关于这项研究的更多信息,同时通过另一篇博客文章,了解如何应用于会员的信息流推送功能中。

另一个值得关注的点是,要及时对会员的反馈做出反应。无论反馈是来自A/B测试,还是来自访谈和小组座谈会,通过多种方式做出反馈是与长期的成功同等重要的。

领英如何使用人工智能?

人工智能支持着领英的方方面面。会员每一天的使用过程中都蕴含了人工智能的成果,例如向其推送合适的职位和联系人,或者在信息流中提供有价值的内容。我们在针对企业客户的产品中也应用了人工智能,例如帮助销售人员预测客户的反馈、向会员提供精准的广告服务,或者帮助招聘人员找到新的人才库。我们在后台也采用人工智能技术,例如确保会员不受有害内容干扰,自动寻找最佳连接点以提高网站接入速度,并确保向会员推送有价值而不是令人感到厌烦的通知。

图2:领英动态信息流及职位页面

  • 人机结合,最大限度地利用大数据

很多人认为,人工智能是一个不需要人力投入、完全自动化的流程。实际上,我们人工智能系统中所使用的非常多的数据,以及人工智能系统的部署方式都依赖于人力的投入。以领英档案数据为例,几乎所有会员数据都是由会员自己自行输入的。因此,同一个职位在一家公司可能称为“资深软件工程师”,而在另一家公司则称为“研发负责人”。汇总上百万份会员档案后,你会发现,在职位名称错综复杂的情况下为招聘者提供良好的搜索体验是一件极具挑战的事情。将数据标准化成人工智能系统可以理解的形式是打造良好搜索体验非常重要的第一步,而这一过程需要人工和机器的共同努力。我们的分类学家创建了职位分类体系,然后采用机器学习模型(LSTM模型、其他神经网络等等)进一步将大量职位进行关联。了解这些关联后,我们就可以进一步推断出每名会员在档案内容之外具备的深层次技能;例如,具有“机器学习”技能的会员同时也了解“人工智能”。这就是构建领英知识图谱分类和关联体系的一个实例。

从这里可以看出,我们的人工智能方法既不是彻底的机器驱动,也不是彻底的人工驱动,而是二者的结合。我们认为,机器和人工密切协作才是最好的解决方案。

  • 深度学习促进个性化和内容理解

为了向会员提供个性化服务,我们需要采用能够从多角度理解内容的机器学习算法。将机器学习与会员意图信号、档案数据和会员人脉网络信息结合起来,我们就能实现会员推荐和搜索结果的高度个性化。

我们广泛采用了机器学习的一个分支—深度学习,这是一种能够使用多层神经网络自动学习复杂层级结构,从而理解各种类型的内容的算法。我们在广义线性混合效应模型(GLMix)的基础上开发了全新类型的机器学习模型,将来自不同渠道的数据结合起来为会员提供个性化服务。

另外,深度学习方法还可以高效地识别暂存、时序和空间数据中的非线性规律。我们针对大部分自然语言处理和计算机视觉任务采用三大类深度学习方法:即上述的LSTM、CNN和序列到序列模型。对于某些指导性学习任务,我们还会在必要时采用典型多层感知器。

人工智能开始被大规模地使用

开发和启动人工智能系统是一项巨大的挑战。几年前,当我入职领英的人工智能团队时,我们已经从多个渠道积累了大量数据,这也为我们创建人工智能提供了方便。但是我们接下来仍然面临双重挑战:全球人工智能人才短缺,如何扩大我们的人才队伍;如何扩展基础架构以部署那些需要大量计算和处理大规模数据的系统。在当今的科技行业中,很多公司依旧面临着类似挑战。

  • 扩大人才队伍

为了扩大人工智能工程师、统计师和数据科学家队伍,我们采用了集中式组织模式,在保持人工智能团队内部汇报关系的情况下,分配我们的专家进驻到不同产品团队中。我们因而能够有独特的跨部门合作机会,在为整个会员体验解决问题的同时,在产品层面对机器学习问题进行更多本地优化工作。在集中式组织体系下,我们的工程师经常就各个不同项目开展合作,并轻松地分享知识。

领英人工智能学院是另一个为公司全体员工提供学习机会的计划,学院培训涵盖工程、产品管理等领域。他们在学院学到的知识帮助他们更加高效地为会员提供影响深远的人工智能体验。例如,一名工程师可以参与每周一天、共计五次的深度课程,然后参与核心人工智能团队的一月学徒培训。学员通过培训将学到如何从接入、维护人工智能系统,到为团队实际交付一个人工智能系统的知识。对产品经理和公司高管来说,可以参加为期一天的深度课程,课程专注于他们管理人工智能产品所需的特定领域知识。

  • 一个可以培训并部署任何人工智能模型的平台

每个人工智能系统都只可利用特定类型的数据,这种限制是由模型中内置的 "特征" 所决定的。这些“特征”指出了可以帮助我们为用户做出更好推荐的不同信息。例如,你的职位头衔可以作为一个特征,利用它来匹配未来的新工作机会。我们的专家和A/B测试框架教给人工智能系统如何使用这些特征,根据已有数据来推送更适合的推荐信息,例如使用“实习生”职位的用户更关注初级开发工程师信息,而非高级开发工程师。

这项工作非常耗时。在领英,我们为多项产品开发了数百个模型及数十万个特征。我们由此建立了名为Pro-ML的“人工智能自动化”平台,通过一个统一的系统为所有工程团队集中管理这些特征和机器学习模型。这一系统为机器学习模型的整个开发、培训、部署、测试的生命周期提供单一化平台,已经极大加快了领英开发及上线新产品的速度。

  • 扩展我们的基础架构

在数据基础架构方面,领英在该领域的创新有着悠久的历史。

例如,我们将著名的数据消息系统Kafka作为管理领英所有信息的“中央神经系统”。我们拥有自己的流处理框架Samza,它采用开源结构,也为世界上的其他企业所使用。除上述流数据系统外,我们还为Hadoop生态系统及其他各种类型的项目做出了贡献,其中包括Ambry。我们还贡献了新的开源项目,从而加速Spark机器学习的应用案例。

我们同时也在自己的项目中使用各种开源软件。例如,我们在深度学习流程中广泛地使用了谷歌打造的TensorFlow。我们在数据处理中广泛使用Spark和Scala,在数据分析中使用Pig和Hive。

除上述开源创新外,我们近期还与微软开展合作,从而利用Azure云平台上的人工智能服务。例如,正如上篇博文所述,我们采用微软文本分析API对推送内容进行动态翻译。

魔法成真

人工智能就像是领英的氧气,它是我们一切工作的驱动力。为什么我们会认为我们所作的所有事情都将受益于人工智能?原因如下:

  • 领英的人工智能系统为那些正在找工作的会员提供了极大的帮助。自领英上线了一个新的为会员推送“可能感兴趣的职位”的个性化人工智能模型之后,工作职位申请数量随之增长了30%。
  • 领英同时为会员和招聘专员提供了很多人工智能技术驱动下的用户体验优化和产品更新,从而使工作职位申请量实现了40%的年度增长。
  • 通过利用人工智能改进的领英招聘解决方案已经使招聘站内信的回复率提高了45%,同时还减少了我们向会员短信推送的数量。
  • 人工智能成功地优化了领英主页上会员的文章阅读体验,文章的点击率提高了10-20%。

领英中国:共赴愿景

作为全球领先的职场社交平台,领英一向致力于连接全球职场人士,并协助他们事半功倍、发挥所长。领英的愿景就是为全球30亿劳动力中的每一位都创造经济机会,进而绘制世界首个经济图谱。

中国无疑是这一愿景中极为重要的一部分。为了更好地连接中国4,400万用户,向他们提供全球化的发展平台,助力他们实现职业理想,我们构建了一支60余人的国际化研发团队,在硅谷和北京两地以“One Team”的形式高效协作:20余名常驻硅谷的工程师实时分享总部最新产品计划和资源;超过40名常驻北京的工程师专攻适合本地会员的产品与服务;两地团队的工作无缝衔接。“One Team”的研发形式满足了从资源层面到人员层面的交流共享需求,保证在紧跟全球最新技术趋势的同时,实现产品本地化,从而实现领英的终极愿景。

值得骄傲的是,在这60人的团队中,五分之一的成员为女性工程师,这和领英一贯秉承的“多样性”文化相契合。为了助力女性职业发展,领英还通过Women In Tech、Women at LinkedIn等活动,培养年轻女性对科学、技术、工程和数学类职业 (STEM) 的兴趣。此外,领英中国通过开放、多元、包容的工作环境为员工创造了自由的办公空间、完善的配套设备。我们鼓励平衡工作和生活,将优秀的工程师文化和前沿的全球视角带入国内;我们支持员工学习和深造,通过主办Learning InDay等企业文化活动,鼓励员工提升更广泛的技能、开拓更广阔的自我发展空间。

相关 [领英 认识 人工智能] 推荐:

领英如何认识并运用人工智能

- - 业界
作者 | 领英人工智能负责人Deepak Agarwal. 2005年,我在AT&T(美国电报电话公司)贝尔实验室开始了我的职业生涯. 当时,电信产业正受困于价格战和来自无线运营商的竞争,看着一个又一个同事离职,前往谷歌和雅虎这样正蓬勃发展的消费互联网产业寻求职业发展机会时,我不禁也开始思考自己的下一步.

人工智能技术新进展

- - 生命奥秘
新的计算机人脑模型可以模拟更加复杂的人类行为. 人类的大脑是一个高度复杂的器官,在众多对人类大脑的研究工作当中就包括了从分子水平到人类行为活动水平等多个层面采集大脑相关信息的工作. 这种超大范围的研究方式很有可能会让大脑研究走向专业不断细化的发展方向,这种趋势虽然有利于大脑研究的不断深化,可是同时也会带来知识碎片化的结果.

由人工智能管理的港铁

- - Solidot
港铁公司运营香港地铁跻身全世界最出色地铁系统之列,它的准时抵达记录高达99.9%,超过了伦敦和纽约地铁. 数百公里长的繁忙地铁系统需要大量人力维护,港铁公司平均每周有多达1万人执行2600项维护工作,工人们工作都是提前规划好的,由人工智能进行管理. 港铁公司计划将人工智能推广到它在其它城市运营的地铁系统,其中北京有可能第一个采用.

[微言]人工智能有多可怕?

- - 海德沙龙(HeadSalon)
@whigzhou: 花了两个多小时思考强人工智能引出的问题,得出的结论是:相信陪审团. 然后发现,这不就是 我去年得出过的结论嘛~哈. 不过,其间经历的逻辑链条那是相当漫长,而且有了一些新想法,容我慢慢道来. @whigzhou: 1)强人工智能很快(也就是几十年内)会出现;2)强AI的出现会让世界很不一样,但并不像有些人所想象的#那么#不一样;3)其实,“只有一小撮人(或组织)有能力做一些绝大多数人做不到、甚至完全无法理解的事情”——这早就不是什么新鲜事了.

注意:人工智能非你所想!

- - 译言最新精选
译者: 果果向前冲 原文地址: gizmodo.com. 艾萨克·阿西莫夫的机器人三定律还不足以控制人工智能. 上图是幻想插画家之父迈克尔·蕙兰为《曙光中的机器人》设计的封面. 近20年前“深蓝”与盖里·卡斯帕罗夫对战象棋获胜一事被誉为史上最具意义的机器智能测试. 时至今日,谷歌的“阿法狗”与国手李世石在围棋锦标赛中决一胜负,对决前三局两次告捷,表明多年来人工智能经历了显著进化.

恰到好处的人工智能

- - 可能吧
技术不应该给用户带来使用难度,而是提高效率,并恰到好处地提供帮助. 这是我在使用 Google 智能音箱 Google Home 之后的总结. 智能、AI,是今年创投圈的关键词. 如果你在京东、淘宝上搜索各种家电,多多少少这些产品都会说自己是「智能」的,到底什么是智能. 把安卓系统塞到硬件里,这个硬件是不是就是智能了.

2017年人工智能研究报告

- - 互联网数据中心-199IT
81%的IT公司正在或者计划投资人工智能(AI). Cowen预测人工智能将会将人类的生产力提升到一个新的水平,而微软会冲在最前面. 数字化市场或市场自动化、Salesforce自动化(CRM)和数据分析将成为人工智能最为成熟的三大应用领域. 据angel.co的数据显示,目前有2200多家人工智能初创公司,其中超过50%的初创公司是在最近两年成立的.

我第一次谈人工智能

- - IT瘾-dev
不知道谁这么坏,给起了一个人工智能这个词,让通过科幻片才了解啥叫智能的普罗大众老误解人工智能,就像现在我仍然对智能手机这个词有微言,这怎么就智能了呢. 从现在表现出来的人工智能规模应用来说,本质上就是个概率统计的事,和智能根本不沾边,倒是和人工挺沾边,需要人工做大量的数据标准化加工、数据标注,再喂给算法.

ChatGPT背后人工智能算法

- - 今日话题 - 雪球
ChatGPT背后人工智能算法,关键的原创技术,其实全部都是国外公司发明的. 这里做一点简单的科普,人工智能原创性研究,中国还有很大进步空间,ChatGPT也不是普通的公司能够复刻的出来的. 深度残差网络(ResNet)由微软(亚洲)研究院发明. 在此之前,研究员们发现深度神经网络的效果要比浅层神经网络要好得多,这也就是所谓的深度学习.

人工智能碰上人工智能:两个机器人的爆笑对话

- 地安门城管 - cnBeta.COM
大家都听说过判断人工智能(AI)的图灵测试吧. 或者都和一些聊天机器人说过话吧. 不过那只是人与机器人之间的故事. 如果两个机器人放在一起会发生什么事呢. 其实这是一个名为Cleverbot(聪明机器人)的两份复制品,彼此是完全相同的,为了便于识别而分别做成女性和男性,但依然显示了不同的“人格”,其中男性比较单纯,女性则有些狡猾.