[译] 每个人都应该知道的十个机器学习常识

- - IT瘾-tuicool

当别人在高谈阔论机器学习时，你却插不上嘴，这是一种怎样的体验. 不懂机器学习没有关系，但你一定要知道下面的十个机器学习基本常识. 曾经在Endeca、谷歌和LinkedIn领导机器学习开发的Daniel Tunkelang为我们概括总结了这十个常识. 机器学习就是从数据中挖掘洞见，而人工智能是炒作.

转： http://blog.csdn.net/playoffs/article/details/7588597. 推荐几个机器学习和数据挖掘领域相关的中国大牛：. 李航：http://research.microsoft.com/en-us/people/hangli/，是MSRA Web Search and Mining Group高级研究员和主管，主要研究领域是信息检索，自然语言处理和统计学习.

基于机器学习的知道推荐—Enlister

- - 搜索引擎技术博客

基于机器学习的知道推荐—Enlister. Enlister—最大的中文问答网站“百度知道”的问题推荐系统名字. 这个由几个百度一线工程师研发的系统，自2012年1月上线以来，承担着百度知道千万级登录用户的问题推荐计算. 百度知道这样的问答社区型网站有个典型特点：有些用户在平台上提出问题，这些问题被另一些用户发现，其中有能力且有意愿的人回答了这几个问题.

关于机器学习，你应该知道的 3 个热门专业术语

- - IT瘾-dev

编者按：如果你是刚入门机器学习的AI探索者，你知道什么是胶囊网络吗. 为了帮大家节省查阅晦涩难懂的论文的时间，我们邀请微软亚洲研究院机器学习组实习生吴郦军、罗人千帮大家用最通俗的语言解释了这三个机器学习领域的热门词汇，赶紧收藏吧. 胶囊网络Capsule Networks 胶囊网络（Capsule Networks）是深度学习三巨头之一的Geoffrey Hinton提出的一种全新的神经网络.

机器学习五步走

- - 我爱机器学习

经常会有人问“我该如何在机器学习方面更进一步，我不知道我接下来要学什么了. 一般我都会给出继续钻研教科书的答案. 每当这时候我都会收到一种大惑不解的表情. 但是进步确实就是持续的练习，保持较强的求知欲，并尽你可能的完成具有挑战性的工作. 因为他是为数不多的几种可以让你真真让你获取坚实知识的媒介. 是的，你可以选择选一门课，注册MOOC，参加一些讨论班.

机器学习之路

- - 我爱机器学习

自从答应简二毛博士将自己的机器学习历程和心得分享给大家至今，转眼间半年已经过去了，感谢简博士分享和开源精神的鼓舞，这也正是本系列关于机器学习介绍博客的动力来源. 之前有些网友，师弟们问我，学习机器学习怎么入手，从看什么书开始. 如果你只愿意看一本书，那么推荐Bishop的PRML，全名Pattern Recognition and Machine Learning. 这本书是机器学习的圣经之作，尤其对于贝叶斯方法，介绍非常完善.

机器学习算法Boosting

- - 标点符

机器学习通常会被分为2大类：监督学习和非监督学习. 在监督学习中，训练数据由输入和期望的输出组成，然后对非训练数据进行预测输出，也就是找出输入x与输出y之间的函数关系F：y = F(x). 根据输出的精确特性又可以分为分类和回归. 分类和回归的区别在于输出变量的类型. 定量输出称为回归，或者说是连续变量预测.

Mahout实现的机器学习算法

- - ITeye博客

使用命令:mahout -h. 在Mahout实现的机器学习算法见下表：. EM聚类（期望最大化聚类）. 并行FP Growth算法. 并行化了Watchmaker框架. 非Map-Reduce算法. 扩展了java的Collections类. Mahout最大的优点就是基于hadoop实现，把很多以前运行于单机上的算法，转化为了MapReduce模式，这样大大提升了算法可处理的数据量和处理性能.

Apache Mahout 0.8 发布，机器学习库

- - 开源中国社区最新新闻

Apache Mahout 0.8 发布了，Apache Mahout 是 Apache Software Foundation (ASF) 开发的一个全新的开源项目，其主要目标是创建一些可伸缩的机器学习算法，供开发人员在 Apache 在许可下免费使用. 该项目已经发展到了它的最二个年头，目前只有一个公共发行版.

Ruby的机器学习项目

- - 阳志平的网志-技术类

作者是辉瑞公司的小牛，可惜烂尾了. 我在改啊改啊，可惜现在是商业项目，暂时不能放出改掉的部分. 对了，顺便做个小广告，去年组织翻译的一本小书：社会网络分析：方法与实践. 已经上市了，感兴趣的可以翻翻：. 社会网络分析：探索关系背后的科学与技术. treat：自然语言处理. 类似于igraph，也是桥接处理nlp.

[译] 每个人都应该知道的十个机器学习常识

相关 [个人知道机器学习] 推荐：