对于数据分析与数据挖掘的数据10个问题

标签: 互联网 | 发表时间:2013-11-27 08:00 | 作者:中国统计网
出处:http://www.lewuxian.com

1,作为支付宝数据首席分析师,你怎么看待“数据挖掘”这个词?

所谓的“数据挖掘”是基于用户的行为挖掘出有价值的东西,以及这个东西被用到商业环境上。比如非常著名的“啤酒与尿布”的案例,它的背景是在1992年的美国,每周四或者每周五下午5点-7点的时间形成的连锁销售。但是这个联合销售的方法并不适合任何时间和任何场合,单纯地剥离其背景本身,谈数据挖掘就是一个很泛的事情。

 

2,你认为,支付宝的数据和淘宝的数据有什么不一样?

我不在淘宝工作,所以很难全面地去了解淘宝内的数据。简单来说,支付宝的数据很广,它是以结果为导向的,显示的是买家交易最后一步动作,而淘宝探讨的是影响其购买的多项数据,是过程数据,它的数据更深,更细分。

 

3,作为产品出身的数据分析师,按道理你应该对影响消费者购买以及过程数据更感兴趣,为什么会选择支付宝这种以结果为导向的交易数据分析呢?

支付宝也有其特殊的优势。从我个人而言,选择一个公司做数据分析有几个理由,第一,公司高层对数据的理解和重视程度;第二,公司的数据量足够大,足够丰富,能和你本身的研究方向相契合;第三,公司文化与就是个人性格的匹配,这三点支付宝都符合。

 

4,你个人认为数据能帮助卖家解决什么问题?

其实数据的核心就是+将复杂问题简单化。今天的数据是否成功主要看两方面:第一是从时间(Righttime)上,数据出现的时间能否在你最需要它的时候出现;第二,从技术层面讲,有关数据的技术门槛能不能再降低。如果你能让你的用户用2秒时间,只要按一个箭头就可看到他想看的数据,那么这些数据就更有价值的。

 

5,作为产品出身的人,你看数据的角度会和单纯的数据分析师有什么不一样么?

从我本身而言,我认为不懂商业的人别谈数据。因为做任何数据都应该从问题出发。比如,你在用数据解决问题之前,首先要问自己几个问题:what is the problem(是什么问题?);who(用户是谁);why me(为什么是我做?);why now(为什么是现在做?);What scale(用户层大么?)。这几个问题,如果都是YES,那么这个产品就一定值得做。

 

6,如果你是支付宝的CEO,你最关心支付宝的哪些数据?

这就要看你所指的时间性了,比如周度,月度,甚至年度是不一样的。如果你的问题是指周度(week)敏感的话而我的时间只有十分钟的话我的答案会是:第一,新/老用户支付成功率;第二,新增用户数的周环比及最近峰比较;第三,十大业务量最高的支付场景中那一个超出了我的预期。第四,商户及用户上周投诉的分类排行榜。

 

7,现在很多卖家开口闭口就会必谈pv.uv和转化率,你认为这是卖家最应该关心的数据吗?

我不是卖家,但是这个问题的答案是:显然不是。数据是需要背景的,并不是任何类目,任何级别的卖家他关心的都应该是所谓的流量和转化率等。比如京东前一段时间最关注的是物流是否给力,因此京东的CEO最想要看的就是送达率的情况,而如果老板关注的是新品成功率,又或者是追单率等数据,这些数据都不是空想,而是经过沉淀和契合卖家自身发展背景的。因此,肯定不是所有的卖家在任何阶段关心的数据都是一样。

 

8,你觉得作为淘宝卖家,应该如何使用数据?

卖家更应该学会关注搜索数据(Buyer demanddata),而不是交易数据,比如作为一个女装卖家,你输入“新款”,会发现,其实早在3月11日,就应该是春装打折的时候,如果你对搜索数据敏感,就更容易发现商机,而不是只盯着所谓的交易数据不放。要注意的是其实百分之九十影响你的数据不一定在站内。

 

9,如果你是淘宝卖家,你会关注哪些数据?

如果我是卖家,我关心的数据有两个纬度:第一,新用户从那个渠道找到我,看了什么? 买了什么。;第二,存量用户中的留存情况。

 

10,你觉得,一个公司或者一个卖家,如何合理利用数据来制定KPI呢?

很多公司的KPI大多是以业务目标为导向,很少以用户为导向。其实更好的KPI导向应该是以用户为核心。我们常说用户很重要,但是用户到底有多重要,那些用户对你更重要,可以量化吗?。其实要知道用户对你的感知只要问一个问题就可以,用户失去你,他会不会不爽?比如失去了QQ密码,用户会慌,没有了支付宝,对用户影响大么?从这个角度去分析,自然能找到答案。

举报

相关 [数据分析 数据挖掘 数据] 推荐:

对于数据分析与数据挖掘的数据10个问题

- - 乐无限-微信公众号内容聚合站
1,作为支付宝数据首席分析师,你怎么看待“数据挖掘”这个词. 所谓的“数据挖掘”是基于用户的行为挖掘出有价值的东西,以及这个东西被用到商业环境上. 比如非常著名的“啤酒与尿布”的案例,它的背景是在1992年的美国,每周四或者每周五下午5点-7点的时间形成的连锁销售. 但是这个联合销售的方法并不适合任何时间和任何场合,单纯地剥离其背景本身,谈数据挖掘就是一个很泛的事情.

数据挖掘是神马?

- - 互联网分析
1、数据挖掘需要‘神马样’的流程.  2、哥,有没有详细点的,来个给力的. 4、数据在统计意义上有哪些类型. 9、知道这些工具不知道如何在工作中用呀. 11、还有没有更人性化、智能化的展现. 12、上面这图看起来很给力,背后很复杂吧.  16、转载的留个来源 ,毕竟是我辛苦收集和想出来的,谢谢. 忘记“大数据”,从“中数据”开始.

这就是数据挖掘

- - 互联网分析
当今数据库的容量已经达到上万亿的水平(T)— 1,000,000,000,000个字节. 在这些大量数据的背后隐藏了很多具有决策意义的信息,那么怎么得到这些“知识”呢. 也就是怎样通过一颗颗的树木了解到整个森林的情况. 计 算机科学对这个问题给出的最新回答就是:数据挖掘,在“数据矿山”中找到蕴藏的“知识金块”,帮助企业减少不必要投资的同时提高资金回报.

关于数据挖掘

- - 牛国柱
以下内容来自网络,关于数据挖掘的一些最基本的知识. 数据挖掘是对一系列数据进行分析和挖掘的方法的统称,在精准营销领域,最常用的数据挖掘方法主要包括以下三类:分类、聚类、关联. 分类(Classify)属于预测性模型. 分类模型的构建需要“训练样本”,训练样本中的每一个个体的类别必须是明确的. 分类模型的特征变量一般称为“自变量”,又叫“预测变量”,类别变量称为“目标变量”.

数据挖掘与Taco Bell编程

- everfly - 译言-每日精品译文推荐
来源Data Mining and Taco Bell Programming. Programmer Ted Dziuba suggests an alternative to traditional program that he called "Taco Bell Programming." The Taco Bell chain creates multiple menu items from about eight different ingredients.

使用Weka进行数据挖掘

- - 搜索研发部官方博客
数据挖掘、机器学习这些字眼,在一些人看来,是门槛很高的东西. 诚然,如果做算法实现甚至算法优化,确实需要很多背景知识. 但事实是,绝大多数数据挖掘工程师,不需要去做算法层面的东西. 他们的精力,集中在特征提取,算法选择和参数调优上. 那么,一个可以方便地提供这些功能的工具,便是十分必要的了. 而weka,便是数据挖掘工具中的佼佼者.

数据挖掘 - 分类算法比较

- - IBM developerWorks 中国 : 文档库
随着计算能力、存储、网络的高速发展,人类积累的数据量正以指数速度增长. 对于这些数据,人们迫切希望从中提取出隐藏其中的有用信息,更需要发现更深层次的规律,对决策,商务应用提供更有效的支持. 为了满足这种需求,数据挖掘技术的得到了长足的发展,而分类在数据挖掘中是一项非常重要的任务,目前在商业上应用最多.

数据挖掘分类技术

- - CSDN博客云计算推荐文章
从分类问题的提出至今,已经衍生出了很多具体的分类技术. 下面主要简单介绍四种最常用的分类技术,不过因为原理和具体的算法实现及优化不是本书的重点,所以我们尽量用应用人员能够理解的语言来表述这些技术. 而且我们会在第4章再次给读者讲述分类算法和相关原理. 在我们学习这些算法之前必须要清楚一点,分类算法不会百分百准确.

数据挖掘之R与SQL

- Wolf - 刘思喆 @ 贝吉塔行星
今天看到老同学@JulieJulieJulieJulie 的浪漫求婚,真的很浪漫、很唯美、很感动. 正如评论说的,我们又相信爱情了. 于是,小兴奋,睡不着,爬起来补一篇文章. 最近在数据挖掘专业网站 KDnuggets 上刊出了2011年度关于数据挖掘/分析语言流行度的调查,不出意料R、SQL、Python果然排在了前三位.

数据挖掘的标准流程

- - CSDN博客推荐文章
    CRISP-DM (cross-industry standard process for data mining), 即为"跨行业数据挖掘过程标准". 此KDD过程模型于1999年欧盟机构联合起草. 通过近几年的发展,CRISP-DM 模型在各种KDD过程模型中占据领先位置,采用量达到近60%.(数据引自Cios and Kurgan于2005年合著的论文trands in data mining and knowledge discovery中 )    在1996年,当时数据挖掘市场是年轻而不成熟的,但是这个市场显示了爆炸式的增长.