大数据/数据挖掘/推荐系统/机器学习相关资源

标签: 数据技能 | 发表时间:2015-12-31 11:49 | 作者:Zhe Yu
出处:http://www.techxue.com/forum.php

Share my personal resources,本文贡献者为Zhe Yu

书籍

各种书~各种ppt~更新中~ http://pan.baidu.com/s/1EaLnZ

机器学习经典书籍小结 http://www.cnblogs.com/snake-hand/archive/2013/06/10/3131145.html

机器学习&深度学习经典资料汇总 http://www.thebigdata.cn/JiShuBoKe/13299.html

视频

浙大数据挖掘系列 http://v.youku.com/v_show/id_XNTgzNDYzMjg=.html?f=2740765

用Python做科学计算 http://www.tudou.com/listplay/fLDkg5e1pYM.html

R语言视频 http://pan.baidu.com/s/1koSpZ

Hadoop视频 http://pan.baidu.com/s/1b1xYd

42区 . 技术 . 创业 . 第二讲 http://v.youku.com/v_show/id_XMzAyMDYxODUy.html

加州理工学院公开课:机器学习与数据挖掘 http://v.163.com/special/opencourse/learningfromdata.html

QQ群

机器学习&模式识别 246159753

数据挖掘机器学习 236347059

推荐系统 274750470

36大数据  80958753

Github

推荐系统

推荐系统开源软件列表汇总和评点 http://in.sdo.com/?p=1707

Mrec(Python) https://github.com/mendeley/mrec

Crab(Python) https://github.com/muricoca/crab

Python-recsys(Python) https://github.com/ocelma/python-recsys

CofiRank(C++) https://github.com/markusweimer/cofirank

GraphLab(C++) https://github.com/graphlab-code/graphlab

EasyRec(Java) https://github.com/hernad/easyrec

Lenskit(Java) https://github.com/grouplens/lenskit

Mahout(Java) https://github.com/apache/mahout

Recommendable(Ruby) https://github.com/davidcelis/recommendable

NLTK https://github.com/nltk/nltk

Pattern https://github.com/clips/pattern

Pyrallel https://github.com/pydata/pyrallel

Theano https://github.com/Theano/Theano

Pylearn2 https://github.com/lisa-lab/pylearn2

TextBlob https://github.com/sloria/TextBlob

MBSP https://github.com/clips/MBSP

Gensim https://github.com/piskvorky/gensim

Langid.py https://github.com/saffsd/langid.py

Jieba https://github.com/fxsjy/jieba

xTAS https://github.com/NLeSC/xtas

NumPy https://github.com/numpy/numpy

SciPy https://github.com/scipy/scipy

Matplotlib https://github.com/matplotlib/matplotlib

scikit-learn https://github.com/scikit-learn/scikit-learn

Pandas https://github.com/pydata/pandas

MDP http://mdp-toolkit.sourceforge.net/

PyBrain https://github.com/pybrain/pybrain

PyML http://pyml.sourceforge.net/

Milk https://github.com/luispedro/milk

PyMVPA https://github.com/PyMVPA/PyMVPA

博客

周涛 http://blog.sciencenet.cn/home.php?mod=space&uid=3075

Greg Linden http://glinden.blogspot.com/

Marcel Caraciolo http://aimotion.blogspot.com/

RsysChina http://weibo.com/p/1005051686952981

推荐系统人人小站 http://zhan.renren.com/recommendersystem

阿稳 http://www.wentrue.net

梁斌 http://weibo.com/pennyliang

刁瑞 http://diaorui.net

guwendong http://www.guwendong.com

xlvector http://xlvector.net

懒惰啊我 http://www.cnblogs.com/flclain/

free mind http://blog.pluskid.org/

lovebingkuai http://lovebingkuai.diandian.com/

LeftNotEasy http://www.cnblogs.com/LeftNotEasy

LSRS 2013 http://graphlab.org/lsrs2013/program/

Google小组 https://groups.google.com/forum/#!forum/resys

Journal of Machine Learning Research http://jmlr.org/

在线的机器学习社区 http://www.52ml.net/16336.html

清华大学信息检索组 http://www.thuir.cn

我爱自然语言处理 http://www.52nlp.cn/

36大数据 http://www.36dsj.com/

文章

心中永远的正能量 http://blog.csdn.net/yunlong34574

机器学习最佳入门学习资料汇总 http://article.yeeyan.org/view/22139/410514

Books for Machine Learning with R http://www.52ml.net/16312.html

是什么阻碍了你的机器学习目标? http://www.52ml.net/16436.htm

推荐系统初探 http://yongfeng.me/attach/rs-survey-zhang-slices.pdf

推荐系统中协同过滤算法若干问题的研究 http://pan.baidu.com/s/1bnjDBYZ

Netflix 推荐系统:第一部分 http://blog.csdn.net/bornhe/article/details/8222450

Netflix 推荐系统:第二部分 http://blog.csdn.net/bornhe/article/details/8222497

探索推荐引擎内部的秘密 http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy1/index.html

推荐系统resys小组线下活动见闻2009-08-22 http://www.tuicool.com/articles/vUvQVn

Recommendation Engines Seminar Paper, Thomas Hess, 2009: 推荐引擎的总结性文章http://www.slideshare.net/antiraum/recommender-engines-seminar-paper

Toward the Next Generation of Recommender Systems: A Survey of the State-of-the-Art and Possible Extensions, Adomavicius, G.; Tuzhilin, A., 2005 http://dl.acm.org/citation.cfm?id=1070751

A Taxonomy of RecommenderAgents on the Internet, Montaner, M.; Lopez, B.; de la Rosa, J. L., 2003http://www.springerlink.com/index/KK844421T5466K35.pdf

A Course in Machine Learning http://ciml.info/

基于mahout构建社会化推荐引擎 http://www.doc88.com/p-745821989892.html

个性化推荐技术漫谈 http://blog.csdn.net/java060515/archive/2007/04/19/1570243.aspx

Design of Recommender System http://www.slideshare.net/rashmi/design-of-recommender-systems

How to build a recommender system http://www.slideshare.net/blueace/how-to-build-a-recommender-system-presentation

推荐系统架构小结 http://blog.csdn.net/idonot/article/details/7996733

System Architectures for Personalization and Recommendation http://techblog.netflix.com/2013/03/system-architectures-for.html

The Netflix Tech Blog http://techblog.netflix.com/

百分点推荐引擎——从需求到架构http://www.infoq.com/cn/articles/baifendian-recommendation-engine

推荐系统 在InfoQ上的内容 http://www.infoq.com/cn/recommend

推荐系统实时化的实践和思考 http://www.infoq.com/cn/presentations/recommended-system-real-time-practice-thinking

质量保证的推荐实践 http://www.infoq.com/cn/news/2013/10/testing-practice/

推荐系统的工程挑战 http://www.infoq.com/cn/presentations/Recommend-system-engineering

社会化推荐在人人网的应用 http://www.infoq.com/cn/articles/zyy-social-recommendation-in-renren/

利用20%时间开发推荐引擎 http://www.infoq.com/cn/presentations/twenty-percent-time-to-develop-recommendation-engine

使用Hadoop和 Mahout实现推荐引擎 http://www.jdon.com/44747

SVD 简介 http://www.cnblogs.com/FengYan/archive/2012/05/06/2480664.html

Netflix推荐系统:从评分预测到消费者法则 http://blog.csdn.net/lzt1983/article/details/7696578

相关 [大数据 数据挖掘 推荐系统] 推荐:

大数据/数据挖掘/推荐系统/机器学习相关资源

- - 互联网分析沙龙
Share my personal resources,本文贡献者为Zhe Yu. 各种书~各种ppt~更新中~ http://pan.baidu.com/s/1EaLnZ. 机器学习经典书籍小结 http://www.cnblogs.com/snake-hand/archive/2013/06/10/3131145.html.

大数据时代:银行如何玩转数据挖掘

- - i黑马
数据挖掘(Data Mining)是一种新的商业信息处理技术,产生于20世纪80年代的美国,首先应用在金融、电信等领域,主要特点是对大量数据进行抽取、转换、分析和模型化处理,从中提取出有助于商业决策的关键性数据. 银行信息化的迅速发展,产生了大量的业务数据. 从海量数据中提取出有价值的信息,为银行的商业决策服务,是数据挖掘的重要应用领域.

大数据、数据挖掘在交通领域有哪些应用?

- - 知乎每日精选
对交通行业缺乏深入了解,如有兴趣建议看看:. 大数据理论如何指导交通数据分析. 有数据才有分析,交通领域的数据产量巨大. 这个很好理解,详细讨论需要另开一个问题 大数据对物流管理有什么影响. 交通局通过数据实时分析一方面可以控制公交车和地铁的发车班次和时间,减少空车率,疏导客流缓解城市道路压力;另一方面也可以进行线路优化.

从长春婴儿随车被盗事件看视频大数据挖掘的意义

- - 互联网分析
2013年新春伊始的3月4日,在北国长春就发生了一件令人揪心的案件:一辆RAV4私家车主将2个月大的婴儿遗留在车上到房内开暖气,转身出来就发现车和婴儿都不见了. 到现在时间已经过去了26小时,最新消息是车辆已经被找到,但是窃贼和婴儿还是没有下落. 被盗车辆已找到,窃贼和婴儿却没下落. 在网上,消息在迅速的扩散、发酵,各种各样的评论铺天盖地:谴责窃贼者有之,希望窃贼良心发现者有之,批评警方处理不力者有之,甚至有市民愿意以100万赎回.

LibRec 2.0.0 正式版发布: 基于机器学习的大数据推荐系统

- - 开源中国社区最新新闻
LibRec: 基于机器学习的大数据推荐系统. LibRec 是领先的推荐系统Java开源算法工具库,覆盖了70余个各类型推荐算法,有效解决评分预测和物品推荐两大关键的推荐问题. 推荐系统是机器学习和大数据技术的经典实际应用,旨在提供高效准确的个性化物品推荐,是现代Web应用的重要组件. 项目结构清晰,代码风格良好,测试充分,注释与手册完善.

数据挖掘是神马?

- - 互联网分析
1、数据挖掘需要‘神马样’的流程.  2、哥,有没有详细点的,来个给力的. 4、数据在统计意义上有哪些类型. 9、知道这些工具不知道如何在工作中用呀. 11、还有没有更人性化、智能化的展现. 12、上面这图看起来很给力,背后很复杂吧.  16、转载的留个来源 ,毕竟是我辛苦收集和想出来的,谢谢. 忘记“大数据”,从“中数据”开始.

这就是数据挖掘

- - 互联网分析
当今数据库的容量已经达到上万亿的水平(T)— 1,000,000,000,000个字节. 在这些大量数据的背后隐藏了很多具有决策意义的信息,那么怎么得到这些“知识”呢. 也就是怎样通过一颗颗的树木了解到整个森林的情况. 计 算机科学对这个问题给出的最新回答就是:数据挖掘,在“数据矿山”中找到蕴藏的“知识金块”,帮助企业减少不必要投资的同时提高资金回报.

关于数据挖掘

- - 牛国柱
以下内容来自网络,关于数据挖掘的一些最基本的知识. 数据挖掘是对一系列数据进行分析和挖掘的方法的统称,在精准营销领域,最常用的数据挖掘方法主要包括以下三类:分类、聚类、关联. 分类(Classify)属于预测性模型. 分类模型的构建需要“训练样本”,训练样本中的每一个个体的类别必须是明确的. 分类模型的特征变量一般称为“自变量”,又叫“预测变量”,类别变量称为“目标变量”.

数据挖掘与Taco Bell编程

- everfly - 译言-每日精品译文推荐
来源Data Mining and Taco Bell Programming. Programmer Ted Dziuba suggests an alternative to traditional program that he called "Taco Bell Programming." The Taco Bell chain creates multiple menu items from about eight different ingredients.

使用Weka进行数据挖掘

- - 搜索研发部官方博客
数据挖掘、机器学习这些字眼,在一些人看来,是门槛很高的东西. 诚然,如果做算法实现甚至算法优化,确实需要很多背景知识. 但事实是,绝大多数数据挖掘工程师,不需要去做算法层面的东西. 他们的精力,集中在特征提取,算法选择和参数调优上. 那么,一个可以方便地提供这些功能的工具,便是十分必要的了. 而weka,便是数据挖掘工具中的佼佼者.