想学习推荐系统,如何从小白成为高手? - 知乎

标签: | 发表时间:2017-11-16 09:35 | 作者:
出处:https://www.zhihu.com
同在学习推荐算法,大概介绍一下我自己规划的推荐算法学习轨迹(还在慢慢实践中,好长时间了,捂脸...)。

首先,看完了推荐系统实战的话,应该大概了解了大部分的推荐算法。那我觉得看完了书,应该有必要再从宏观上再来了解一下推荐系统这个研究领域的研究现状,包括研究领域目前有的挑战,比如冷启动问题,大规模矩阵分解问题,增量模型计算问题等等,包括目前热门的研究方向,比如基于LBS、社交网络等等的推荐。最方便的了解这些问题的途径当然就是看论文了, 找到 Recommender System相关最新的Review 或者Survey 文章,多读几篇。这些文章往往是该领域的大牛所著,往往会非常良心的收集了近十几年来该领域的研究成果,分析好坏,做出比较,非常赞。

然后,看完理论算法就要到算法实现层面来了,一些简单的算法,比如UCF,ICF,SlopeOne等等算法,完全可以根据自己的理解手动编一编,更好的来对它做理解。当然 借助于开源解决方案也是一种非常好的学习方法。这里有几篇总结的很好的推荐系统开源软件介绍:
推荐系统开源软件列表汇总和点评
TOP 10开源的推荐系统简介
如果楼主会JAVA,那就果断推荐Mahout了,虽然Mahout是在2011年搞出来的,但是它对Hadoop的支持做的不错,而且最新版本的Mahout即将抛弃Mapreduce,转向Spark了,背后还有阿帕奇基金会的支持,相信会是不错的选择。Python的用过 Recommender Systems Framework in Python (Crab) 代码比较简洁,适合一读,号称是Mahout的python版本。其他的开源软件楼主也可以关注关注。特别之前两篇中提到的Myrrix,它是Mahout的作者之一Sean Owen基于Mahout开发的一个试验性质的推荐系统,目前已经并入Oryx项目,Oryx1.0 ( cloudera/oryx · GitHub )已经发布,Oryx2.0也正在孵化中,相较于1.0版本,Oryx2.0更好的实现了 lambda架构 ,使得各个层之间可复用性更强。实现了比1更多的机器学习算法(1.0只实现了,ALS协同过滤,随机森林,以及K-means++算法)同时2.0版本还引入更新的Spark和Streaming技术。总之社区更新非常活跃,所用的技术也非常前沿,适合学习用。

最后,(我也还停留在这一步)了解了这些东西我觉得就应该去实践了(其实边实践边了解可能更好), 找一份实习,或者相关的工作,看看如何将所学到的算法真正的结合到特定 的业务中去,不同的模型,不同的推荐算法如何进行融合,如何解决冷启动,如何解决大规模的计算等等。不同的业务比如电商,音乐,电影,新闻,咨询等等的推荐,都会有相对应的特色的方法。先进的算法和解决方案固然重要,但是如何深刻的理解业务,提取一些用特征,总结一些业务经验,有时候往往会比几个干净的算法,融合几个模型对业务提升更有效。
以上都是愚见,望与大家一起学习交流。

相关 [学习 推荐系统 小白] 推荐:

想学习推荐系统,如何从小白成为高手? - 知乎

- -
同在学习推荐算法,大概介绍一下我自己规划的推荐算法学习轨迹(还在慢慢实践中,好长时间了,捂脸...). 首先,看完了推荐系统实战的话,应该大概了解了大部分的推荐算法. 那我觉得看完了书,应该有必要再从宏观上再来了解一下推荐系统这个研究领域的研究现状,包括研究领域目前有的挑战,比如冷启动问题,大规模矩阵分解问题,增量模型计算问题等等,包括目前热门的研究方向,比如基于LBS、社交网络等等的推荐.

淘宝推荐系统的学习

- - 标点符
维基百科:推荐系统属于资讯过滤的一种应用. 推荐系统能够将可能受喜好的资讯或实物(例如:电影、电视节目、音乐、书籍、新闻、图片、网页)推荐给使用者. 推荐系统大体可分为两类,即个性化推荐和非个性化推荐. 好的推荐系统更像一个有经验的网站导购员. 不同点:搜索是通过用户主动输入的关键字进行查询. 推荐则是用户在浏览网站的过程中,不一定需要用户输入,根据当前网页的上下文进行个性化的信息输出.

推荐系统的学习笔记

- - CSDN博客综合推荐文章
一直以来对推荐系统的学习和理解来自一些机器学习书中简单介绍(如《集体智慧编程》和《机器学习实战》)和自己网上搜的一些资料. 而当被问及对推荐系统的改进和理解,发现自己对推荐系统所知甚少,除了知道几个常用的算法外,根本没有更深入的理解,更别提改进了. 本篇博客为学习《推荐系统》一书的读书笔记,记录了常见的推荐算法和其思想.

基于增强学习的旅行计划推荐系统

- - 标点符
推荐系统是一种智能化电子商务应用,可以协助用户搜索信息,为用户提供个性化的产品推荐. 旅游推荐系统的目的是支持旅行者在旅游前和旅游中面临的重要旅行规划决定. 此类系统明确(通过问)或暗示(通过挖掘用户的在线活动日志)获取用户需求,并提供各种产品和服务,如前往目的地、兴趣点、事件或活动. 近年来,研究者设计了很多旅游推荐系统,某些已经运行于主要的旅游门户网站.

5-机器学习启蒙- 商品推荐系统1

- - 神刀安全网
有大量的商品和用户,想要推荐一部分商品给用户. 怎么通过机器学习结合你和别人的历史购物记录做出适合你的推荐. 亚马逊重点关注商品推荐,另一个推荐系统流行的例子是2006-2009. 年主办的比赛,100万美金奖励推荐电影系统. 我们在哪里能见到推荐系统. 来看一些推荐系统起到重要作用的领域. 个性化正在改变我们关于世界的经验.

大数据/数据挖掘/推荐系统/机器学习相关资源

- - 互联网分析沙龙
Share my personal resources,本文贡献者为Zhe Yu. 各种书~各种ppt~更新中~ http://pan.baidu.com/s/1EaLnZ. 机器学习经典书籍小结 http://www.cnblogs.com/snake-hand/archive/2013/06/10/3131145.html.

[原]机器学习在热门微博推荐系统的应用

- - CSDN人工智能
近年来,机器学习在搜索、广告、推荐等领域取得了非常突出的成果,成为最引人注目的技术热点之一. 微博也在机器学习方面做了广泛的探索,其中在推荐领域,将机器学习技术应用于微博最主要的产品之一——热门微博,并取得了显著的效果提升. 热门微博是基于微博原生内容的个性化兴趣阅读产品. 提供最新最热优质内容阅读服务,更好地保障用户阅读效率和质量,同时达到激励微博上内容作者更好的创作和推广内容.

LibRec 2.0.0 正式版发布: 基于机器学习的大数据推荐系统

- - 开源中国社区最新新闻
LibRec: 基于机器学习的大数据推荐系统. LibRec 是领先的推荐系统Java开源算法工具库,覆盖了70余个各类型推荐算法,有效解决评分预测和物品推荐两大关键的推荐问题. 推荐系统是机器学习和大数据技术的经典实际应用,旨在提供高效准确的个性化物品推荐,是现代Web应用的重要组件. 项目结构清晰,代码风格良好,测试充分,注释与手册完善.

从先进走向普遍的广告和推荐系统方法之一: 在线学习 | AlgorithmDog

- -
      广告和推荐系统作为机器学习领域的“摇钱树”,一直受到广泛的关注. 在这 5 年,或者说 10 年的维度上,广告和推荐系统发生了改头换面的变化. 传统的方法已经远去,一时先进的新兴的方法广泛走向千家万户. 今天介绍的在线学习,就已经从先进走向了千家万户.       广告和推荐系统的 CTR 预估模型有三种部署形态: 离线预测,在线预测和在线学习,其中在线学习是近几年迅速推广的架构.

Min-Hash和推荐系统

- - xlvector - Recommender System
前几年看Google News Recommendation的那篇Paper,对里面提到的MinHash的算法基本没有注意,因为之前的习惯都是只注意论文的模型那块,至于怎么优化模型一般都只是扫一眼. 不过最近看了大量的Google Paper,发现Google在实现一个算法方面确实有很多独到之处. 其实,Min-Hash是LSH(Locality Sensitive Hash)的一种,我之前对LSH的了解仅仅限于知道它能把两个相似的东西Hash成两个汉明距离接近的2进制数.