世面上除了使用mahout做推荐系统,还有别的吗? - 知乎

标签: | 发表时间:2018-08-02 13:32 | 作者:
出处:https://www.zhihu.com
需要看应用场景(基于内容的推荐引擎或协同过滤)、语言(Python、Java/Scala等)以及方案完整度(完整系统或库)。

1、基于内容的推荐
Python的话,推荐考察一下gensim: gensim: Topic modelling for humans
Java的话,可以考虑easyrec: easyrec :: open source recommendation engine
另外可以考虑类似solr或Elasticsearch的MoreLikeThis或直接基于lucene term vector方案(例如semanticvectors https://github.com/semanticvectors/semanticvectors)。

2、协同过滤
除了采用mahout外,目前我知道很多公司推荐引擎都转向spark MLLib(底层算法可以采用mahout)或GraphLab。

有几个完整解决方案的项目推荐考察一下(prediction、seldon都是基于spark的):
prediction: PredictionIO Open Source Machine Learning Server
seldon: Seldon - Open Source Machine Learning for Enterprise
oryx(以前叫Myrrix): cloudera/oryx: Simple real-time large-scale machine learning infrastructure.

相关 [mahout 推荐系统 知乎] 推荐:

世面上除了使用mahout做推荐系统,还有别的吗? - 知乎

- -
需要看应用场景(基于内容的推荐引擎或协同过滤)、语言(Python、Java/Scala等)以及方案完整度(完整系统或库). Python的话,推荐考察一下gensim:. Java的话,可以考虑easyrec:. 另外可以考虑类似solr或Elasticsearch的MoreLikeThis或直接基于lucene term vector方案(例如semanticvectors.

基于Mahout的电影推荐系统

- - CSDN博客推荐文章
Apache Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序. 经典算法包括聚类、分类、协同过滤、进化编程等等,并且,在 Mahout 中还加入了对Apache Hadoop的支持,使这些算法可以更高效的运行在云计算环境中.

[转]mahout in action 中文翻译 第2章 推荐系统简介

- - 小鸥的博客
评价一个引擎的准确率和召回率. 在真实数据集:GroupLens 上评价推荐系统. 我们每天都会对喜欢的、不喜欢的、甚至不关心的事情有很多观点. 你在收音机上听歌,因为它容易记住或者因为听起来可怕而关注它 -- 又或者根本不去关注它. 同样的事情有可能发生在T恤衫,色拉,发型,滑雪胜地,面孔,电视节目.

使用Mahout搭建推荐系统之入门篇2-玩转你的数据1

- - 互联网 - ITeye博客
用意: 搞推荐系统或者数据挖掘的, 对数据要绝对的敏感和熟悉, 并且热爱你的数据. 分析数据既要用统计分析那一套,又要熟悉业务发掘有趣的特征(feature). 后者有意思的多,但是因为我业务做的不多,还不太熟悉, 跪求大牛们分析业务经历. 听豆瓣上的大神"懒惰啊我"说过,有一个Nokia的比赛,有一个团队直接用陀螺仪参数就发现了性别分布,因为男生手机都放在 口袋里, 而女生往往放在包里面.

推荐系统领域有啥巧妙的idea? - 知乎

- -
机器学习中较为简单的算法有哪些. 》,很多同学私信我询问我FM算法在推荐系统中的应用细节,索性今天就专门写一篇文章,仔细聊一聊FM这把“. 机器学习算法中的瑞士军刀,可不是随便起的. 以前Xgboost因为方便易用、功能广泛、性能优异,被誉为Kaggle比赛中的瑞士军刀. 因为同样的优点,我将FM称作“推荐算法中的瑞士军刀”,其中有两个含意:.

想学习推荐系统,如何从小白成为高手? - 知乎

- -
同在学习推荐算法,大概介绍一下我自己规划的推荐算法学习轨迹(还在慢慢实践中,好长时间了,捂脸...). 首先,看完了推荐系统实战的话,应该大概了解了大部分的推荐算法. 那我觉得看完了书,应该有必要再从宏观上再来了解一下推荐系统这个研究领域的研究现状,包括研究领域目前有的挑战,比如冷启动问题,大规模矩阵分解问题,增量模型计算问题等等,包括目前热门的研究方向,比如基于LBS、社交网络等等的推荐.

Mahout介绍

- - 互联网 - ITeye博客
Mahout 是机器学习和数据挖掘的一个分布式框架,区别于其他的开源数据挖掘软件,它是基于hadoop之上的; 所以hadoop的优势就是Mahout的优势. http://mahout.apache.org/ 上说的Scalable就是指hadoop的可扩展性. Mahout用map-reduce实现了部分数据挖掘算法,解决了并行挖掘的问题.

mahout部署实践

- - CSDN博客云计算推荐文章
一 下载mahout并解压. JAVA_HOME mahout运行需指定jdk的目录. MAHOUT_JAVA_HOME指定此变量可覆盖JAVA_HOME值. HADOOP_HOME  如果配置,则在hadoop分布式平台上运行,否则单机运行. HADOOP_CONF_DIR指定hadoop的配置文件目录.

mahout 实用教程之一

- - CSDN博客云计算推荐文章
mahout 实用教程 (一). 本文力求把mahout从使用的角度为读者建立一个框架,为后续的使用打下基础. 本文为原创文章转载请注明原网址 http://blog.csdn.net/comaple,谢谢. 下面首先给出源代码svn地址以及用于测试的公共数据集,大家可以下载并测试. mahout svn仓库地址: http://svn.apache.org/repos/asf/mahout/trunk.

Mahout: SVDRecommender SVD推荐算法

- -