机器学习知识体系

标签: dev | 发表时间:2017-12-28 00:00 | 作者:
出处:http://itindex.net/relian

随着2016年Alpha Go在围棋击败李世石,2017年初卡内基梅隆大学人工智能系统Libratus在长达20天的鏖战中,打败4名世界顶级德州扑克玩家,这标志着人工智能技术又达到了一个新的高峰。人工智能已经不再是在各大公司幕后提供各种智能推荐、语音识别算法的工具,它已经慢慢走向台前进入到平常百姓的视野之中。曾经有人描述人工智能就向一列缓缓开向人们的火车,一开始非常遥远而且看起来非常缓慢,它慢慢接近,直到人们清楚看到它的时候,它已经呼啸而过,把人远远抛在身后。现在似乎就是人们可以远远看到人工智能的时候,它已经发展数十年,但直到最近才引起广泛注意,随着大数据的积累、算法的改进、硬件的提升,人工智能可以在很多细分的领域成为专家,辅助人类甚至超过人类。

作为一名初学者,我也是刚刚接触人工智能和机器学习,希望能够和大家共同学习。接触一个领域的第一步是尽快的了解全貌并且搭建出相应的知识体系。大致提纲如下(后续不断补充):

 
1 - 数学
线性代数、微积分
在整个机器学习过程中涉及大量矩阵运算和微积分导数的概念,因此建议初学者至少要有较为扎实的数学基础,对矩阵和微积分的概念了解比较清楚。否则在一些公式推导过程中会遇到较大障碍,而不断反复回来复习数学知识。
 
2 - 编程语言
Python已经成为机器学习的第一语言,至于为什么 知乎中有非常不错的解释。众多机器学习的框架都支持Python API,所以学习机器学习,Python语言语法估计是绕不过去。
 
3 - Supervise learning
监督学习指的是人们给机器一大堆标记好的数据,比如一大堆照片,标记出哪些是猫的照片,哪些不是,然后让机器自己学习归纳出算法,可以判断出其他照片是否是猫。目前这个领域算法代表:Linear regression, Logistic regression, Neural network, SVM等等。 
 
4 - Unsupervise learning
Anomaly detection:  异常检测
非监督学习指的就是人们给机器一大堆没有标记的数据,让机器可以对数据进行分类、检测异常等。
 
5 - Special topic
Recommend system
Large scale machine learning application
一些特殊算法,例如推荐系统。常用于购物网站,可以根据你的过往购物或评分情况,来向你推荐商品。
 
6 - Advice on machine learning
Regulation
Learning curve
Celling analysis
机器学习的建议,包含参数正则化、学习曲线、错误分析、调参等。
 
7 - Deep Learning
Neural Netwotk
深度学习是近期机器学习的一个热门分支,模拟人类大脑的思维方式,可以极大的提高正确率,是近来机器学习的一个非常大的突破。
8 - Tools/Framework
TensorFlow/Theano/Keras
很多大厂就开源了一些机器学习的框架,基于这些框架可以很容易搭建机器学习的平台。
 
推荐的学习资料:
Github上面有一份非常详尽的 学习路径  awesome-deep-learning 
 
我个人推荐的几个经典资料:
 
机器学习 
Andrew NG的Coursera的 机器学习入门:这个教程非常适合初学者,没有很高深的数学推导,Andrew也是业内大牛但非常谦逊,讲解非常浅显易懂。
Neural Networks for Machine Learning by Geoffrey Hinton in Coursera (2012)
周志华的 机器学习:号称最好的中文机器学习入门,这里有对这本书的 详细评价
 
深度学习
Neural Networks and Deep LearningMichael Nielsen用非常浅显易懂的方式介绍了神经网络和深度学习,并且提供了一个手写数字识别的例子,非常适合入门。
UFLDL Tutorial I  UFLDL Tutorial II:Andrew NG主导的Deep Learning的学习资料,内容非常精炼,适合稍微有些基础的同学。
Deep Learning: 几位大神共同编写的关于深度学习的free book。
零基础入门深度学习:一位大神写的关于深度学习的入门教程,由浅入深的详细介绍了深度学习的几个重要内容,非常适合入门的学习。
Deep Learning Course by Yann LeCun (2016)
 
从人工智能到机器学习,再到最近大热的深度学习,人们已经在这个领域研究了数十年,现在虽然取得一定的突破,但是离真正的人工智能还有非常长的距离。而且人工智能一定要跳出学术界的研究框架,结合工业界的应用,从2016年可以看到大量的实际应用场景,例如自动驾驶、Apple Siri、Amazon Echo、谷歌翻译等等,我相信未来人工智能领域极有可能成为下一代颠覆性的技术革命。
 

相关 [机器学习 知识 体系] 推荐:

机器学习知识体系

- - IT瘾-dev
随着2016年Alpha Go在围棋击败李世石,2017年初卡内基梅隆大学人工智能系统Libratus在长达20天的鏖战中,打败4名世界顶级德州扑克玩家,这标志着人工智能技术又达到了一个新的高峰. 人工智能已经不再是在各大公司幕后提供各种智能推荐、语音识别算法的工具,它已经慢慢走向台前进入到平常百姓的视野之中.

设计师需要的知识体系

- - 博客 - 伯乐在线
产品设计师面对复杂、庞大的制造业系统以及多元化的市场,其知识体系要同时具备广度和深度. 设计是循序渐进、不断深入的过程,因此我们面对的是交错的学科体系,以及深入的技术探究. 当国内工业设计教育界还在热烈地争论设计是艺术还是技术时,不妨退一步思考,设计本身既融合又独立,既有依附性又具有本身不可替代的意义.

谈知识体系的演进

- - 人月神话的BLOG
如果我们谈IT咨询规划顾问,或者谈大型IT项目的项目经理,很多时候往往需要的都是综合能力. 对于综合能力在这里不再谈沟通,ppt和演示,团队协同,写作能软技能能力. 而重点来谈谈业务和技术方面综合能力的演进过程和路线. 拿IT项目经理来说,如果没有真正做过比较专职化的项目经理,很难真正的理解到项目经理的工作内容和实践,项目管理中的实际问题.

Web前端知识体系精简

- - IT瘾-geek
Web前端技术由html、css和javascript三大部分构成,是一个庞大而复杂的技术体系,其复杂程度不低于任何一门后端语言. 而我们在学习它的时候往往是先从某一个点切入,然后不断地接触和学习新的知识点,因此对于初学者很难理清楚整个体系的脉络结构. 本文将对Web前端知识体系进行简单的梳理,对应的每个知识点点到为止,不作详细介绍.

机器学习五步走

- - 我爱机器学习
经常会有人问“我该如何在机器学习方面更进一步,我不知道我接下来要学什么了. 一般我都会给出继续钻研教科书的答案. 每当这时候我都会收到一种大惑不解的表情. 但是进步确实就是持续的练习,保持较强的求知欲,并尽你可能的完成具有挑战性的工作. 因为他是为数不多的几种可以让你真真让你获取坚实知识的媒介. 是的,你可以选择选一门课,注册MOOC,参加一些讨论班.

机器学习之路

- - 我爱机器学习
自从答应简二毛博士将自己的机器学习历程和心得分享给大家至今,转眼间半年已经过去了,感谢简博士分享和开源精神的鼓舞,这也正是本系列关于机器学习介绍博客的动力来源. 之前有些网友,师弟们问我,学习机器学习怎么入手,从看什么书开始. 如果你只愿意看一本书,那么推荐Bishop的PRML,全名Pattern Recognition and Machine Learning. 这本书是机器学习的圣经之作,尤其对于贝叶斯方法,介绍非常完善.

机器学习算法Boosting

- - 标点符
机器学习通常会被分为2大类:监督学习和非监督学习. 在监督学习中,训练数据由输入和期望的输出组成,然后对非训练数据进行预测输出,也就是找出输入x与输出y之间的函数关系F:y = F(x). 根据输出的精确特性又可以分为分类和回归. 分类和回归的区别在于输出变量的类型. 定量输出称为回归,或者说是连续变量预测.

产品经理必须掌握的知识体系——账号体系

- - IT瘾-tuicool
说到“账号”,想必大家对于这个名词已经习以为常. 现在市场上的大多数应用,都会有自己的账号体系. 产品设计从0到1最初的构建,用户与应用的最初触达,基本上是从最不起眼的账号体系开始. 对此,我这段时间对账号体系进行了学习和总结,在此分享给大家,希望对大家也有帮助. 我所理解的账号,是用户与系统建立的一种联系,是用户从现实映射到虚拟系统中的唯一识别标记.

Mahout实现的机器学习算法

- - ITeye博客
使用命令:mahout -h.   在Mahout实现的机器学习算法见下表:. EM聚类(期望最大化聚类). 并行FP Growth算法. 并行化了Watchmaker框架. 非Map-Reduce算法. 扩展了java的Collections类. Mahout最大的优点就是基于hadoop实现,把很多以前运行于单机上的算法,转化为了MapReduce模式,这样大大提升了算法可处理的数据量和处理性能.

国内的机器学习几个人

- - 丕子
转: http://blog.csdn.net/playoffs/article/details/7588597. 推荐几个机器学习和数据挖掘领域相关的中国大牛:. 李航:http://research.microsoft.com/en-us/people/hangli/,是MSRA Web Search and Mining Group高级研究员和主管,主要研究领域是信息检索,自然语言处理和统计学习.