使用Mahout实现协同过滤 spark

- - zzm

Mahout使用了Taste来提高协同过滤算法的实现，它是一个基于Java实现的可扩展的，高效的推荐引擎. Taste既实现了最基本的基于用户的和基于内容的推荐算法，同时也提供了扩展接口，使用户可以方便的定义和实现自己的推荐算法. 同时，Taste不仅仅只适用于Java应用程序，它可以作为内部服务器的一个组件以HTTP和Web Service的形式向外界提供推荐的逻辑.

Spark MLlib中的协同过滤

- - JavaChen Blog

本文主要通过Spark官方的例子理解ALS协同过滤算法的原理和编码过程，然后通过对电影进行推荐来熟悉一个完整的推荐过程. 协同过滤常被应用于推荐系统，旨在补充用户-商品关联矩阵中所缺失的部分. MLlib当前支持基于模型的协同过滤，其中用户和商品通过一小组隐语义因子进行表达，并且这些因子也用于预测缺失的元素.

[原]Mahout 协同过滤 itemBase RecommenderJob源码分析

- -

Mahout支持2种 M/R 的jobs实现itemBase的协同过滤. 下面我们对RecommenderJob进行分析，版本是mahout-distribution-0.7. 源码包位置：org.apache.mahout.cf.taste.hadoop.item.RecommenderJob. RecommenderJob前几个阶段和ItemSimilarityJob是一样的，不过ItemSimilarityJob 计算出item的相似度矩阵就结束了，而RecommenderJob 会继续使用相似度矩阵，对每个user计算出应该推荐给他的top N 个items.

如何使用Spark ALS实现协同过滤

- - 鸟窝

转载自 JavaChen Blog，作者： Junez. 本文主要记录最近一段时间学习和实现Spark MLlib中的协同过滤的一些总结，希望对大家熟悉Spark ALS算法有所帮助. 【2016.06.12】Spark1.4.0中MatrixFactorizationModel提供了recommendForAll方法实现离线批量推荐，见 SPARK-3066.

基于Spark MLlib平台的协同过滤算法---电影推荐系统

- - zzm

又好一阵子没有写文章了，阿弥陀佛...最近项目中要做理财推荐，所以，回过头来回顾一下协同过滤算法在推荐系统中的应用. 说到推荐系统，大家可能立马会想到协同过滤算法. 本文基于Spark MLlib平台实现一个向用户推荐电影的简单应用. 基于模型的协同过滤应用---电影推荐. 一、协同过滤算法概述.

[原]Spark MLlib系列(二):基于协同过滤的电影推荐系统

- -

随着大数据时代的到来，数据当中挖取金子的工作越来越有吸引力. 利用Spark在内存迭代运算、机器学习领域强悍性能的优势，使用spark处理数据挖掘问题就显得很有实际价值. 这篇文章给大家分享一个spark MLlib 的推荐实战例子. 我将会分享怎样用spark MLlib做一个电影评分的推荐系统.

【实践】Spark 协同过滤ALS之Item2Item相似度计算优化 - CSDN博客

- -

CF召回优化，自之前第一版自己实现的基于item的协同过滤算法. http://blog.csdn.net/dengxing1234/article/details/76122465，考虑到用户隐型评分的. 稀疏性问题，所以尝试用Spark ml包（非mllib）中的ALS算法的中间产物item的隐性向量，进行进一步item到item的余弦相似度计算.

协同过滤算法

- - CSDN博客推荐文章

今天要讲的主要内容是协同过滤，即Collaborative Filtering，简称 CF. 关于协同过滤的一个最经典的例子就是看电影，有时候不知道哪一部电影是我们喜欢的或者评分比较高的，那. 么通常的做法就是问问周围的朋友，看看最近有什么好的电影推荐. 在问的时候，都习惯于问跟自己口味差不.

协同过滤 Collaborative Filtering

- - IT技术博客大学习

协同过滤算法是推荐系统中最古老，也是最简单高效的推荐算法. 简单说协同过滤就是根据以往的用户产生的数据分析，对用户的新行为进行匹配分析来给用户推荐用户最有可能感兴趣的内容. 协同过滤算法是为了解决长尾现象，也就是说推荐系统是为了解决长尾现象而诞生的. 因为在之前在有限的空间（如：书店的书架、服装店的衣架、商店的货架、网页的展示区域）只能摆有限的物品进行展示，造成大量的非热门物品很难进入人们的视野，也就无法产生任何价值.

使用Mahout实现协同过滤 spark

接口相关介绍

单机运行

在Spark中运行

分布式运行

相关 [mahout 协同过滤 spark] 推荐：