如何构建一个器学习项目来找到工作?

标签: 人工智能 | 发表时间:2018-12-22 19:59 | 作者:
出处:https://www.leiphone.com

雷锋网 AI 科技评论按:如何找到一份机器学习的工作?对于这个问题, SharpestMindsAI 创始人、物理学家和机器学习专家 Edouard Harris 写了一篇博客,雷锋网 AI 科技评论整理。

我是一个在 YC 初创公司工作的物理学家。我们的工作是帮助刚毕业的学生得到他们的第一份机器学习工作。

前一段时间,我写了一篇关于如何才能获得第一份机器学习工作的文章。我在那篇文章中说,有一件你应该做的事是建立个人机器学习项目。但我并没有说明如何去做这件事,所以在这篇文章里,我会告诉你怎么做。

由于工作原因,我看到过成百上千的个人项目的例子,它们有的非常好,有的很糟糕。下面我将给你讲讲其中的两个非常好的项目。

全力以赴地投入项目

下面是一个真实的故事,只是为了保护隐私,我改了名字。

当杂货店需要更新库存的时候,X 公司使会用人工智能去提醒它们。我们有一个名叫 Ron 的学生,他真的很想去 X 公司工作。Ron 实在是太想去 X 公司工作了,因此,他投入所有的精力建立了一个个人项目,这个项目让他得到了 X 公司的面试机会。

像这样全力以赴地为进入一家公司做准备是一件冒险的事情,我们通常不建议这样做。但是我在前面说过,Ron 真的非常想去 X 公司工作。

那么 Ron 建立了一个什么样的个人项目?

红色的矩形框表示缺货

  1. Ron 先把手机绑到购物车上,之后他推着购物车在杂货店的过道上来回走动,同时用相机把杂货店的货架拍摄下来。他在不同的杂货店做了 10 到 12 次这样的工作。

  2. Ron 一到家,就开始着手建立机器学习模型。他的模型可以识别出杂货店货架上没有货物的地方,这些地方的玉米片(或其他东西)被拿走了。

  3. Ron 在 GitHub 上实时构建模型,并完全公开。每天,他都会对自己的模型进行改进来提高它的准确性,并记录其中的变化。

  4. 当注意到 Ron 所做的事情时,X 公司表现出了极大的兴趣。事实上,X 公司甚至对此感到紧张。他们为什么会紧张?因为 Ron 不知不觉地在几天内重构了他们的专有的技术栈的一部分。

X 公司实力强劲,他们的技术在同行业中首屈一指。尽管如此,在 4 天之内,Ron 的项目已经引起了 X 公司 CEO 的注意。

试验项目

这是另一个真实的故事。

Alex 是历史系的学生,同时他辅修了俄语研究。不同于其他历史专业的学生,他对机器学习特别感兴趣。更不寻常的是,尽管从未写过一行 Python 代码,他决定去学习机器学习。

Alex 选择通过实践来学习。他决定建立一个分类器来检测飞机上的飞行员是否失去意识。Alex 想通过观看飞行员的视频来探索这个问题。人们很容易通过观察就能判断一个飞行员是否失去意识,所以 Alex 认为机器也有可能做到这一点。

以下是 Alex 花了几个月做的事情:

Alex 的意识丧失感应探测器模型 G-force

  1. Alex 在 YouTube 上下载了从驾驶舱里拍摄的飞行员驾驶飞机的每个视频片段。

  2. 接下来,他开始标记数据。Alex 创建了一个 UI,他可以在上面滚动观看数千个视频片段,这个 UI 上有两个按钮,按其中一个按钮显示「有意识」,按另一个按钮显示「无意识」。按下按钮后,当前视频片段会被自动保存在正确标记的文件夹中。这个过程非常无聊,花了他很多很多天的时间。

  3. Alex 为这些图像建立了一条数据管道,可以将飞行员从驾驶舱的背景中裁剪出来,以便使他的分类器更容易地将注意力集中在飞行员身上。最后,他建立了他的意识丧失分类器。

  4. 在做这些工作的同时,Alex 也在社交活动中向招聘经理展示他项目的照片。每次当他拿出手机展示他的项目时间,他们问会他是怎么做到这些的,关于他如何建造管道,以及他如何收集数据。但是他们从来没有抽出时间去问过他的模型的精确度--低于 50%。

Alex 当然打算提高他的准确性,但是在做这个事情之前他就被录用了。事实证明,他的项目所带来的视觉冲击,以及他在数据收集方面不屈不挠、足智多谋的特质,对公司来说比他的模型实际有多好更重要。
我提过 Alex 是主修历史辅修俄语研究吗?

他们有什么共同点?

是什么让 Ron 和 Alex 如此成功?因为他们做到了下面四点:

  1. Ron 和 Alex 没有花太多精力去建模。我知道这听起来很奇怪,但是对于现在许多用例来说,建模是一个已经解决的问题。在真正的工作中,除非你做的是最先进的人工智能研究,否则无论如何,你将花费 80-90% 的时间来清理数据。是什么让你的个人项目与众不同?

  2. Ron和Alex收集了他们自己的数据。正因为如此,它们最终得到的数据比 Kaggle 或 UCI 数据库中的数据更混乱。但是这些混乱的数据教会了他们如何处理混乱数据。相比从学术服务器下载数据,这种方式让他们更好地理解了他们的数据。

  3. Ron 和 Alex 创造了可以被看到的东西。面试不是让你的技能被一个通晓一切的面试官客观地评估,而是一个向别人推销自己的过程。人类是视觉动物。所以,拿出你的手机,向面试官展示你所做的一切吧,确保你所做的看起来很有趣是值得的。

  4. Ron 和 Alex 的所作所为看起来很疯狂,实际上也很疯狂。一般人不会把手机绑在购物车上。普通人不会花时间从 YouTube 视频中裁剪飞行员,你知道谁会干这种事情吗?想尽所有办法都要达到目标的人。而公司真的很想雇佣这些人。

Ron 和 Alex 看起来似乎做了太多的工作,但实际上,这并不比你在一份真正的工作中所需要做的事情多。这就是最关键的一点:当你没有做 X 的工作经验时,招聘经理会从你做过的事情中寻找那些和 X 相关的事情。

幸运的是,你只需要构建一两个项目---Ron 和 Alex 的项目在他们所有的面试中被反复使用。
因此,如果要我用一句话概括一个伟大的机器学习项目的秘密,那就是:构建一个带有一个有趣的数据集的项目,这个数据集必须是花费了显而易见的努力收集来的,并使这个项目尽可能给人以深刻的视觉印象。

雷锋网

相关 [建一 学习 项目] 推荐:

如何构建一个器学习项目来找到工作?

- - 雷锋网
雷锋网 AI 科技评论按:如何找到一份机器学习的工作. 对于这个问题, SharpestMindsAI 创始人、物理学家和机器学习专家 Edouard Harris 写了一篇博客,雷锋网 AI 科技评论整理. 我是一个在 YC 初创公司工作的物理学家. 我们的工作是帮助刚毕业的学生得到他们的第一份机器学习工作.

Ruby的机器学习项目

- - 阳志平的网志-技术类
作者是辉瑞公司的小牛,可惜烂尾了. 我在改啊改啊,可惜现在是商业项目,暂时不能放出改掉的部分. 对了,顺便做个小广告,去年组织翻译的一本小书:社会网络分析:方法与实践. 已经上市了,感兴趣的可以翻翻:. 社会网络分析:探索关系背后的科学与技术. treat:自然语言处理. 类似于igraph,也是桥接处理nlp.

值得学习的python项目

- - CSDN博客编程语言推荐文章
此网站整理的2014年值得一学的pytho项目,http://pycoders.com/2014/. 项目资源都在github上,python程序员进阶必备. Nice looking web dashboard written in Flask that can display data about your system and its processes as returned by psutil.

机器学习实战之一:一个完整的机器学习项目

- - IT瘾-jianshu
一个机器学习项目主要步骤为:. 使用Pandas加载数据,并返回一个包含所有数据的Pandas. head()方法查看该数据集的前5行:. describe()方法展示数值属性的概括:. 创建测试集(根据收入,进行分层采样):. corr()方法计算出每对属性间的标准相关系数(standard correlation coefficient,也称作皮尔逊相关系数):.

一页纸项目管理表格学习笔记

- - 标点符
一、什么是一页纸项目管理表格. 一页纸的项目管理表格(One Page Project Manager)简称OPPM,为高层管理者准备的一种工具或者说是一份报告. 这个工具使我们可以方便地与高层管理者就项目情况进行沟通,激励并确保各项任务所有者对自己的工作负责. 是用很直观的方式将项目的几个核心要素例如:任务、目标、负责人、进度、成本(资源)在一个表格内罗列出来.

软件项目经理要向NASA学习什么

- - CSDN博客研发管理推荐文章
原文:http://www.itworld.com/article/2845997/what-software-project-managers-can-learn-from-nasa.html. 无可否认,NASA 的工程经验相当丰富. 他们不只做出了火箭和太空船这些酷炫的硬件,还做出了一系列 高可用的软件.

某智能家居项目框架学习总结

- - CSDN博客架构设计推荐文章
这个月来第一篇博客,各种其他事情. 之前负责过一个智能家居项目的二次开发,苏州一家公司做的,项目还是分了好几个系统,对业务流程的不同部分进行了划分,我是此项目的主要负责人,通过老师的指导,对这个项目也有了一些了解. 此项目运用了一些框架,有些也是我第一次接触到的,下面将对项目用到的一些框架进行总结.

机器学习项目如何管理:现状

- - 透明思考
Atlassian今年4月的一篇博客提出,到2020年有87%的Jira用户认为他们的工作会被AI改变. 具体到项目管理上,Atlassian的观点是,AI首先会作为项目管理助手进入我们的视野,然后透过数据拓展我们对项目的理解,更进一步还能通过主动猜测、倡导优秀实践、创造新的元数据层等方式弥补数据的缺失,最终对项目提出有益的建议.

机器学习项目如何管理:设置期望

- - 透明思考
我在之前的一篇文章中提到, 机器学习项目如何管理,目前在行业内是一个普遍存在的难题. 具体而言,对于这类项目,我们需要一套行之有效的工作办法,帮助一线工作者:(1)知道什么时候该做什么事;(2)知道什么时候该看什么指标;(3)知道什么时候可能有什么风险. 这样一套工作办法的第一步,就是对一个机器学习项目设置合理的期望.

机器学习项目如何管理:工作内容

- - 透明思考
前一篇文章介绍了机器学习的基本过程,然后讨论了如何对机器学习项目设置期望的问题. 我们了解到,度量准确率的指标可以有多种,需要根据应用场景来选择. 一旦选好了度量指标,接下来就可以围绕这个指标来划分任务、监控进度、管理风险. 站在非常宏观的角度,机器学习系统工作的方式是:你有一个模型,你把一堆数据输入给它,然后你以某种方式使用它提供给你的输出.