《推荐系统实践》关于Latent Factor Model

标签: 未分类 | 发表时间:2011-12-22 12:55 | 作者:xlvector
出处:http://xlvector.net/blog

Latent Factor Model,很多人称为SVD,其实是比较伪的SVD,一直是最近今年推荐系统研究的热点。但LFM的研究一直是在评分预测问题上的,很少有人用它去生成TopN推荐的列表,而且也很少有人研究如何将这个数据用到非评分数据上。

本来这本书不准备在实践部分讲这个算法,而只准备在后面介绍学术界研究热点的时候讲这个算法。但后来发现,如果不讲,显得实践部分都是些加减乘除的小把戏,没啥技术含量啊。于是我还是将如何在非评分数据上做LFM放到了实践的部分,当然这方面的相关论文还非常少。不过我觉得LFM在实践部分还是有其前景的。

具体怎么做,先卖个关子不忙说。先公布一个实验结果吧。我们知道,LFM有一个副产品是对物品自动聚类,我今天写书的时候在MovieLens数据集上试了一把,发现效果不错,先公布出来。

您可能也喜欢:
推荐中的graph model
clustering items and users by latent factors?
用Topic组织你的兴趣
Aardvark 专家推荐式的问答系统
推荐系统和协同过滤面临的主要问题
无觅

相关 [推荐系统 实践 latent] 推荐:

《推荐系统实践》关于Latent Factor Model

- - xlvector - Recommender System
Latent Factor Model,很多人称为SVD,其实是比较伪的SVD,一直是最近今年推荐系统研究的热点. 但LFM的研究一直是在评分预测问题上的,很少有人用它去生成TopN推荐的列表,而且也很少有人研究如何将这个数据用到非评分数据上. 本来这本书不准备在实践部分讲这个算法,而只准备在后面介绍学术界研究热点的时候讲这个算法.

推荐系统入门实践:世纪佳缘会员推荐(完整版)

- - 博客园_首页
     本文以2011年举办的第一届数据挖掘邀请赛的"世纪佳缘会员推荐"赛题为例,尝试了 5 种排序方法来为新注册会员推荐容易受到亲睐的老会员.      先看5种排序方法的测试结果,以便朋友们有针对性地浏览本文. 基于training set验证. SVM-Rank(投票加权平均+Profile特征).

推03,最最最简单的推荐系统是什么样的 | 附Spark实践案例

- -
接前面这篇《 推02,就算是非技术人员也都有必要了解的一些推荐系统常识》,之前的开篇01/02,其实都是以理论、场景化,概念进行铺垫的,让大伙儿大概知道推荐系统是怎么回事,从这篇开始,照顾一下技术的童鞋,我们开始回归到技术层面,并且 附上代码案例(见后面部分). 当然,依然是入门级,高高高手可以绕路.

从原理到策略算法再到架构产品看推荐系统 | 附Spark实践案例

- -
本文源自于前阵子连续更新的推荐系统系列,前段时间给朋友整理一个关于推荐系统相关的知识教学体系,刚好自身业务中,预计明年初随着业务规模增长,估摸着又要启动推荐相关的项目了,所以也是趁机把相关的知识结构梳理了一遍. 这这里重新做整理,并额外做了一些增减,让整体逻辑会更通顺一点. 整个文章的结构逻辑,先从推荐系统的基础知识结构讲起,然后由浅入深过渡到几个推荐策略算法上,并且为每个推荐策略算法提供一些简单的入门Spark案例代码,再从策略过渡到系统层级,包括数据架构、策略组合、效果评估等,最终再从上层产品设计的角度去补充整个系统知识结构.

Min-Hash和推荐系统

- - xlvector - Recommender System
前几年看Google News Recommendation的那篇Paper,对里面提到的MinHash的算法基本没有注意,因为之前的习惯都是只注意论文的模型那块,至于怎么优化模型一般都只是扫一眼. 不过最近看了大量的Google Paper,发现Google在实现一个算法方面确实有很多独到之处. 其实,Min-Hash是LSH(Locality Sensitive Hash)的一种,我之前对LSH的了解仅仅限于知道它能把两个相似的东西Hash成两个汉明距离接近的2进制数.

推荐系统实战

- - 博客园_首页
推荐算法:基于特征的推荐算法. 推荐算法准确度度量公式:. 其中,R(u)表示对用户推荐的N个物品,T(u)表示用户u在测试集上喜欢的物品集合. 集合相似度度量公式(N维向量的距离度量公式):. 其中,N(u)表示用户u有过正反馈的物品集合. 其中,S(u,k)表示和用户u兴趣最接近的K个用户集合;N(i)表示对物品i有过正反馈的用户集合;w(u,v)表示用户u和用户v的兴趣相似度;r(v,i)表示用户v对物品i的兴趣.

推荐系统杂谈

- - 后端技术杂谈 | 飒然Hang
推荐系统是近些年非常火的技术,不管是电商类软件还是新闻类app,都号称有精准的推荐系统能给你推送你最感兴趣的内容. 现象级的资讯类app“今日头条”就得益于此成为了势头非常猛的一款产品. 本文就针对推荐系统讲述一些相关概念和实践经验. 首先需要明确的就是推荐系统的目标,一般来说不外乎以下几个:. 用户满意性:首当其冲的,推荐系统主要就是为了满足用户的需求,因此准确率是评判一个推荐系统好坏的最关键指标.

个性化推荐系统综述

- Tony - 所有文章 - UCD大社区
上个月写过一篇产品推荐的文章,详情请见《我所了解的产品推荐》,内容很泛,多为工作心得. 本周读了几篇相关的论文,收获颇多,分享点干货. 以下内容摘自《个性化推荐系统的研究进展》,该文发表于2009年1月的《自然科学进展》专题评述,作者是刘建国、周涛、汪秉宏. 我略去了具体的算法和许多公式,重点看原理、思路和比较.

推荐系统开源工具 – SVDFeature

- Roger - Resys China
SVDFeature是我们(上海交大Apex实验室)在参加KDDCUP 2011期间开发的. 通过这个工具,我们和港科大(HKUST)的联合小组InnerPeace在KDDCUP 2011中获得Track 1第三名,并创造单模型最好成绩. 在此分享给大家,并希望和大家有更多的交流. (1)基于feature的可扩展性 —— SVDFeature实现了我们的基础模型feature-based matrix factorization.

Reculike : 开源论文推荐系统

- votis - Resys China
今天这篇博文主要总结一下reculike的系统架构. 两周前我们宣布发布了reculike的alpha版. 本着分享的原则,今天在这儿介绍一下我们的各个模块的设计方法. 我们这个项目一开始叫paperlens,这是因为我们想学习业界的前辈movielens,开发一个源代码和数据都开源的系统. 关于数据的开源,我想当用户数达到一定程度后,每个月会dump一次我们所有的数据库(密码等隐私信息除外),放到网络上供大家下载.