大数据-推荐引擎

标签: IT咨询 | 发表时间:2016-12-08 17:09 | 作者:人月神话
出处:http://blog.sina.com.cn/cmmi


推荐引擎在当前电商平台用的相当多,本文简单理解下常见的几张推荐方式。首先说明下大数据用户画像可以用于针对性营销和单品推荐,但是即使没做用户画像也可以进行商品推荐。

推荐引擎的分类

推荐引擎是不是为不同的用户推荐不同的数据根据这个指标,推荐引擎可以分为基于大众行为的推荐引擎和个性化推荐引擎。

  • 大众行为的推荐引擎,对每个用户都给出同样的推荐,这些推荐可以是静态的由系统管理员人工设定的,或者基于系统所有用户的反馈统计计算出的当下比较流行的物品。
  • 个性化推荐引擎,对不同的用户,根据他们的口味和喜好给出更加精确的推荐,这时,系统需要了解需推荐内容和用户的特质,或者基于社会化网络,通过找到与当前用户相同喜好的用户,实现推荐。

这是一个最基本的推荐引擎分类,其实大部分人们讨论的推荐引擎都是将个性化的推荐引擎,因为从根本上说,只有个性化的推荐引擎才是更加智能的信息发现过程。

根据推荐引擎的数据源

其实这里讲的是如何发现数据的相关性,因为大部分推荐引擎的工作原理还是基于物品或者用户的相似集进行推荐。那么参考图 1 给出的推荐系统原理图,根据不同的数据源发现数据相关性的方法可以分为以下几种:

  • 基于人口统计学的推荐:基于用户的基本信息发现用户的相关程度
  • 基于内容的推荐:根据推荐物品或内容的元数据,发现物品或者内容的相关性
  • 基于协同过滤的推荐:根据用户对物品或者信息的偏好,发现物品或者内容本身的相关性,或者是发现用户的相关性

下面根据我重新画的图来说明下常见的一些模式:

1. 基于用户画像后的推荐

注意基于用户画像的针对性营销本身也是一种推荐引擎,要做到这样首先是要对用户进行精确画像,然后再根据用户画像+商品营销策略进行针对性推荐。

举例来说我们要对一款发烧耳机进行针对性营销,那么我们首先要从用户画像里面找到20岁以下,爱好音乐,发烧友这几个关键用户标签,然后再进行针对性推荐。

2. 基于人口统计学的推荐

简单来说找到用户A和用户B的相关性和相似性,然后将用户A的购买行为推荐给用户B。可以看到该模式下只分析用户相关性,没有分析物品相关性,也没有分析用户购买行为间的相关性。这种模式本身的推荐准确度个人感觉偏低,但是好处就是解决新用户冷启动问题。

比如当一个18岁的女大学生注册成功后,虽然这个用户还没有发生任何购买,但是根据用户相关性分析已经可以马上就可以进行相关物品的推荐。

3. 基于内容的推荐

根据推荐物品或内容的元数据,发现物品或者内容的相关性。举个简单例子即当我看了一部爱情浪漫影片后,可以马上给我推荐类似的影片。

主要什么影片是类似影片?要基于内容推荐首先就要对物品的相关性或相似性进行建模,这种相关性是静态的关系,物品相似度的分析仅仅依赖于物品本身的特征,这里没有考虑人对物品的态度。

举例来说,最近几天我都在某电商网站浏览某类的产品,这个时候我们根本没有登陆电商系统,只是做了浏览和加购物车的操作等。可能过2两天你就会收到电商平台发出的EDM营销或推荐邮件。在这种模式下即基本是基于内容推荐。当然推荐的时候电商平台会优先帮你选择销量高,评价好或性价比高的相似产品。

4. 用户相关性+用户购买行为协同过滤推荐

注意不是单纯静态用户相关性推荐,也不是单纯的用户购买行为推荐,而是将两者结合起来进行协同过滤推荐。简单来说就是首先根据用户购买行为发现了用户A和用户C是相关或相似用户,而不是根据静态用户属性简单判断用户相似,然后再根据相关性特点将用户A的购买推荐给用户C。

5. 物品相关性+用户购买行为的协同过滤推荐

即物品相关性不是简单进行物品静态相关性建模,而是根据用户购买行为来发现物品相关性。即我们常说的购买了物品A的也同时购买了物品B。比如购买了苹果手机的用户也同时购买了苹果手机保护膜。

这种推荐模式是我们经常看到的模式,比如我们在电商购买购买书籍,购买某种商品的时候,实时出现的推荐都属于这种模式为主。系统会告诉你购买了某本书的用户一般还同时购买了哪些书籍。我们不用去探究用户本身是否相关,而是关系用户购买行为触发的物品相关性。

对于推荐引擎,可以先阅读下IBM网站的一篇文章

索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探


 

相关 [大数据 推荐引擎] 推荐:

大数据-推荐引擎

- - 人月神话的BLOG
推荐引擎在当前电商平台用的相当多,本文简单理解下常见的几张推荐方式. 首先说明下大数据用户画像可以用于针对性营销和单品推荐,但是即使没做用户画像也可以进行商品推荐. 推荐引擎是不是为不同的用户推荐不同的数据根据这个指标,推荐引擎可以分为基于大众行为的推荐引擎和个性化推荐引擎. 大众行为的推荐引擎,对每个用户都给出同样的推荐,这些推荐可以是静态的由系统管理员人工设定的,或者基于系统所有用户的反馈统计计算出的当下比较流行的物品.

初识推荐机制、推荐引擎

- 山河之外 - 互联网的那点事...
随着互联网的发展 估计大多数的产品都会遇到推荐机制的策划,作为互联网产品人员也需要研究一下推荐机制的核心算法,这篇文章是我看到的言简意赅讲了一些基础的推荐机制的文章,转过来分享给大家. 如今已经进入了一个数据爆炸的时代,随着 Web 2.0 的发展, Web 已经变成数据分享的平台,那么,如何让人们在海量的数据中想要找到他们需要的信息将变得越来越难.

从Web 2.0到推荐引擎2.0

- Race forward! - 学而时嘻之
(《新知客》,2010年9月). 互联网应用的新概念似乎总是层出不穷,然而相对于2005年前后中国一下子冒出来的一大批 web 2.0 网站和最近几年出现的“云计算”,此时此刻的互联网业界似乎有点沉闷. 人们开始谈论,互联网下一个有趣的事情是什么. 百姓网 CEO 王建硕,最近在《中国企业家》杂志发表文章《2011年注定是中国互联网第三春》,提出一个五年周期理论,认为每隔五年左右就会有一批人出来创业,就会有一批风险投资周转完毕转而支持新的项目,这样经过这两年的沉闷,2011年必将有新东西爆发.

协同过滤和推荐引擎

- - 刘思喆@贝吉塔行星
推荐系统在个性化领域有着广泛的应用,从技术上讲涉及概率、抽样、最优化、机器学习、数据挖掘、搜索引擎、自然语言处理等多个领域. 东西太多,我也不准备写连载,今天仅从基本算法这个很小的切入点来聊聊推荐引擎的原理. 推荐引擎(系统)从不同的角度看有不同的划分,比如:. 按照数据的分类:协同过滤、内容过滤、社会化过滤.

推荐引擎:信息逆流

- - 《商业价值》杂志
信息时代用户链接内容的方式将再次产生深刻变化,而这一变化的驱动者,正是推荐引擎技术. 如果回到20世纪80年代,面对一台当时的电脑,你很可能会不知所措. 原因很简单,当时要访问电脑内的内容——不管是软件或者游戏,你起码必须掌握基本的Dos命令. 换句话说,当时用户与内容链接的方式,是输入大量电脑“听得懂”的命令,再让电脑将其执行出来.

Spotify推荐引擎Discover Weekly的故事

- - Solidot
Spotify的软件工程师Edward Newett说,赋权自下而上的创新,奇迹将会发生. 他在上周举行的@Scale 会议上分享了开发Discover Weekly推荐引擎的故事. Discover Weekly设计帮助用户发现他们从未听过的新音乐,于一年前上线,至今已积累了4000多万的用户. Newett最初的工作是开发个性化网页,其中包含了向用户推荐他们可能感兴趣的专辑的系统.

探索推荐引擎内部的秘密:推荐引擎初探

- adow - 互联网的那点事...
“探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基本的优化方法,例如聚类和分类的应用. 同时在理论讲解的基础上,还会结合 Apache Mahout 介绍如何在大规模数据上实现各种推荐策略,进行策略优化,构建高效的推荐引擎的方法. 本文作为这个系列的第一篇文章,将深入介绍推荐引擎的工作原理,和其中涉及的各种推荐机制,以及它们各自的优缺点和适用场景,帮助用户清楚的了解和快速构建适合自己的推荐引擎.

探索推荐引擎内部的秘密: 第 1 部分:推荐引擎初探

- JingSQ - IBM developerWorks 中国 : 文档库
随着 Web 技术的发展,使得内容的创建和分享变得越来越容易. 每天都有大量的图片、博客、视频发布到网上. 信息的极度爆炸使得人们找到他们需要的信息将变得越来越难. 传统的搜索技术是一个相对简单的帮助人们找到信息的工具,也广泛的被人们所使用,但搜索引擎并不能完全满足用户对信息发现的需求,原因一是用户很难用恰当的关键词描述自己的需求,二是基于关键词的信息检索在很多情况下是不够的.

推荐《探索推荐引擎的秘密》系列

- linyehui - Tinyfool的Blog
最近推荐引擎成为显学,主要原因应该是电子商务的蓬勃发展. 头些日子和图灵的两位老师吃饭,我甚至了解到因为推荐引擎以及机器学习领域的日渐火爆,图灵出的线性代数最近销量都很好,更别提大家现在到处都可以看到这个领域相关的招聘. 我最近的创业项目iApp4Me其实也是一个推荐引擎的应用,我关注这个领域有很长一段时间了.

数据驱动销售——个性化推荐引擎

- - 互联网旁观者
在当前这个信息量飞速增长的时代,一个企业,尤其是电子商务企业的成功已经越来越多地与其海量数据处理能力相关联. 高效、迅速地从海量数据中挖掘出潜在价值并转化为决策依据的能力,将成为企业的核心竞争力. 数据的重要性毋庸置疑,但随着数据的产生速度越来越快,数据量越来越大,数据处理技术的挑战自然也越来越大.