使用Mahout搭建推荐系统之入门篇2-玩转你的数据1

基于Mahout的电影推荐系统

- - CSDN博客推荐文章

Apache Mahout 是 Apache Software Foundation（ASF）旗下的一个开源项目，提供一些可扩展的机器学习领域经典算法的实现，旨在帮助开发人员更加方便快捷地创建智能应用程序. 经典算法包括聚类、分类、协同过滤、进化编程等等，并且，在 Mahout 中还加入了对Apache Hadoop的支持，使这些算法可以更高效的运行在云计算环境中.

使用Mahout搭建推荐系统之入门篇2-玩转你的数据1

- - 互联网 - ITeye博客

用意: 搞推荐系统或者数据挖掘的, 对数据要绝对的敏感和熟悉, 并且热爱你的数据. 分析数据既要用统计分析那一套,又要熟悉业务发掘有趣的特征(feature). 后者有意思的多,但是因为我业务做的不多,还不太熟悉, 跪求大牛们分析业务经历. 听豆瓣上的大神"懒惰啊我"说过,有一个Nokia的比赛,有一个团队直接用陀螺仪参数就发现了性别分布,因为男生手机都放在口袋里, 而女生往往放在包里面.

[转]mahout in action 中文翻译第2章推荐系统简介

- - 小鸥的博客

评价一个引擎的准确率和召回率. 在真实数据集：GroupLens 上评价推荐系统. 我们每天都会对喜欢的、不喜欢的、甚至不关心的事情有很多观点. 你在收音机上听歌，因为它容易记住或者因为听起来可怕而关注它 -- 又或者根本不去关注它. 同样的事情有可能发生在T恤衫，色拉，发型，滑雪胜地，面孔，电视节目.

世面上除了使用mahout做推荐系统，还有别的吗？ - 知乎

- -

需要看应用场景（基于内容的推荐引擎或协同过滤）、语言（Python、Java/Scala等）以及方案完整度（完整系统或库）. Python的话，推荐考察一下gensim：. Java的话，可以考虑easyrec：. 另外可以考虑类似solr或Elasticsearch的MoreLikeThis或直接基于lucene term vector方案（例如semanticvectors.

[原]Mahout 对推荐数据的抽象表示（下部分）

- - huruzun的专栏

这篇博客是延续上部分的补充： Mahout 对推荐数据的抽象表示（上部分）. 处理无Preference values 数据. 下面都是围绕Mahout对没有Preference values的数据的推荐. 有时进入推荐引擎的数据没有Preference values，而是只有相关联的一个userID、itemID，它们之间有多强的联系我们没有一个Preference values来量化衡量.

学习Mahout推荐相关算法前，我们必须先要理解Mahout如何对推荐数据进行抽象表示. 首先来看下Preference，该抽象是最基本的抽象，这个抽象对象一般代表一个单独的 userID、itemID、Preference 分数，在具体实现层面首先是Preference接口：. * The ASF licenses this file to You under the Apache License, Version 2.0 * (the "License"); you may not use this file except in compliance with * the License.

使用Mahout搭建推荐系统之入门篇2-玩转你的数据1

一. 前期数据分析的三个阶段

二. 数据分析实例

三. 不错的数据来源

相关 [mahout 推荐系统数据] 推荐：

基于Mahout的电影推荐系统