首页

搜索结果

"tag:"mahout""


标题及摘要 日期/时间
1
使用Mahout基于用户和物品相似度进行协同过滤推荐内容
基于用户User协同过滤 package mahout; import java.io.File; import java.io.IOException; import java.util.List; import org.apache.mahout.cf.taste.common.TasteException; import org.apache.mahout.cf.taste.impl.model.file.FileDataModel; import org.apache.mahout.cf.ta...
2015-6-2
23:31:00
2
Mahout学习笔记-分类算法之Decision Forest - 潘的博客 - 博客园
根据最近的Mahout Wiki,Mahout实现的分类算法有:随机梯度下降(SGD),贝叶斯分类,Online Passive Aggressive,HMM和决策森林(随机森林)。随机梯度下降当前不能并行处理,贝叶斯分类更适合处理文本数据,所以这两个算法都不太适合我的应用场景(并行处理,特征类型为数字),OPA和HMM不太熟悉,所以就选用了决策森林(随机森林)。 决策森林,顾名思义,就是由多个决策树组成森林,然后用这个森林进行分类,非常适合用MapReduce实现,进行并行处理。决策森林又称为随机森林...
2013-8-19
15:06:00
3
推荐引擎:使用Mahout协同过滤
Mahout is a collection of machine learning algorithms intended to perform the following operations as recommendation (Collaborative Filtering), Clustering and Classification. Initially to implement recommendation we need an input data file where every lin...
2013-8-19
14:56:00
4
使用Mahout为布尔型数据生成推荐内容
关于在Spark MLlib中基于布尔型数据集推荐可参考:Spark MLlib中的协同过滤 通过指定alpha:是一个针对于隐性反馈 ALS 版本的参数,这个参数决定了偏好行为强度的基准。 val alpha = 0.01 val model = ALS.trainImplicit(ratings, rank, numIterations, 0.01, alpha) 参考:http://spark.apache.org/docs/latest/mllib-collaborative-filtering...
2013-8-19
14:50:00