分析报告、统计分析和数据挖掘的区别

标签: 分析视角 | 发表时间:2013-03-26 22:27 | 作者:admin
出处:http://www.datakong.cn

关于数据挖掘的作用,Berry and Linoff的定义尽管有些言过其实,但清晰的描述了数据挖掘的作用。“分析报告给你后见之明 (hindsight);统计分析给你先机 (foresight);数据挖掘给你洞察力 (insight)”。

举个例子说。

你看到孙悟空跟二郎神打仗,然后写了个分析报告,说孙悟空在柔韧性上优势明显,二郎神在力气上出类拔萃,所以刚开始不相上下;结果两个人跑到竹林里,在竹子上面打,孙悟空的优势发挥出来,所以孙悟空赢了。这叫分析报告。

孙悟空要跟二郎神打架了,有个赌徒找你预测。你做了个统计,发现两人斗争4567次,其中孙悟空赢3456次。另外,孙悟空斗牛魔王,胜率是89%,二郎 神斗牛魔王胜率是71%。你得出趋势是孙悟空赢。因为你假设了这次胜利跟历史的关系,根据经验作了一个假设。这叫统计分析。

你什么都没做,让计算机自己做关联分析,自动找到了出身、教育、经验、单身四个因素。得出结论是孙悟空赢。计算机通过分析发现贫苦出身的孩子一般比皇亲国 戚功夫练得刻苦;打架经验丰富的人因为擅长利用环境而机会更多;在都遇得到明师的情况下,贫苦出身的孩子功夫可能会高些;单身的人功夫总比同样环境非单身 的高。孙悟空遇到的名师不亚于二郎神,而打架经验绝对丰富,并且单身,所以这次打头,孙悟空赢。这叫数据挖掘。

数据挖掘跟LOAP的区别在于它没有假设,让计算机找出这种背后的关系,而这种关系可能是你所想得到的,也可能是所想不到的。比如数据挖掘找出的结果发现在2亿条打斗记录中,姓孙的跟姓杨的打,总是姓孙的胜利,孙悟空姓孙,所以,悟空胜利。

用 在现实中,我们举个例子来说,做OLAP分析,我们找找哪些人总是不及时向电信运营商缴钱,一般会分析收入低的人往往会缴费不及时。通过分析,发现不及时 缴钱的穷人占71%。而数据挖掘则不同,它自己去分析原因。原因可能是,家住在五环以外的人,不及时缴钱。这些结论对推进工作有很深的价值,比如在五环外 作市场调研,发现需要建立更多的合作渠道以方便缴费。这是数据挖掘的价值。

您可能也喜欢:

统计名词汇总,值得分享!

《白领网民系列调查》报告分享

二十大数据可视化工具点评

揭秘LInkedin数据科学家如何工作

数据挖掘是神马?
无觅

相关 [分析 报告 统计分析] 推荐:

分析报告、统计分析和数据挖掘的区别

- - 互联网分析
关于数据挖掘的作用,Berry and Linoff的定义尽管有些言过其实,但清晰的描述了数据挖掘的作用. “分析报告给你后见之明 (hindsight);统计分析给你先机 (foresight);数据挖掘给你洞察力 (insight)”. 你看到孙悟空跟二郎神打仗,然后写了个分析报告,说孙悟空在柔韧性上优势明显,二郎神在力气上出类拔萃,所以刚开始不相上下;结果两个人跑到竹林里,在竹子上面打,孙悟空的优势发挥出来,所以孙悟空赢了.

移动市场统计分析

- 壮壮爱 - 译言-每日精品译文推荐
来源Microsoft\'s Growth of Mobile Marketing. 译者chunfengqiushui. 人们相比以前花更多的时间在手机上,这个新的市场包括:智能手机、SEO(搜索引擎优化)、移动网站、地理定位和社交营销. 全世界40多亿在用手机中有10.8亿是智能手机,30.5亿是能收发短信的手机.

实时统计分析技术浅谈

- - CSDN博客推荐文章
    实时统计分析技术主要是为了满足数据应用中大家对数据的变化情况有一个较高时间灵敏度需求的情况. 应用要求能够近乎及时的反映数据的整体变化情况. 那么实时统计分析的核心关键点是实时性,也就是性能. 其还伴有另一个明确的特征,就是对于要统计的内容是十分明确的.     传统上,我们的数据统计分析方法是在一个关系数据库中创建表,然后将数据存储到表中.

使用R进行统计分析——回归分析

- - 蓝鲸的网站分析笔记
首先导入数据并创建名为lr_data的数据表. #读取并创建数据表 lr_data=data.frame(read.csv('lr_data.csv',header = 1)). 查看导入数据表的维度,结果显示456行,4列. #查看数据表维度 dim(lr_data) [1] 456 4. 查看数据表中各字段的名称,结果显示共有4个字段,三个变量和一个目标.

SEOMOZ 2011排名因素的数据收集与统计分析

- liang - SEM WATCH
SEOmoz在此次的2011版搜索引擎优化排名因素的调查中,使用了让人耳目一新的统计学方法. 其中主要采用到的是Pearson积距相关系数. 而具体使用的方法,在http://www.seomoz.org/article/search-ranking-factors#methodology此文中有一些概述性的阐述.

博客2011年度流量统计分析

- - 月光博客
  下面是使用Google Analytics(谷歌分析)中查看月光博客的2011年度流量统计分析,分析时间为今年一年时间,今年全年和去年全年的数据进行横向对比分析.   独立访问数增加了9.50%,综合浏览量增加了12.32%;每次访问页数为1.74,增加2.58%;跳出率74.06%,减少2.62%;平均网站停留时间00:01:39;增加14.09%;新访问次数百分比76.30%,减少1.86%.

统计分析抓住翻译国外论文的剽窃者

- - Solidot
懒惰的学生注意了,不要以为从网上找一篇论文,然后翻译到另一种语言,将其作为自己的成果不会被人注意到. 通过将文本分解对比两种语言中的相似词元素,或者利用双语字典,自动检查不同语言版本中有多少相同单词,西班牙Polytechnic理工大学 Alberto Barron-Cedeno的团队利用统计分析方法检查可疑文章.

R语言:优雅、卓越的统计分析及绘图环境

- - 技术改变世界 创新驱动中国 - 《程序员》官网
R语言由新西兰奥克兰大学的Ross Ihaka和Robert Gentleman两人共同发明,其词法和语法分别源自Scheme和S语言,一般认为R语言是S语言【注:John Chambers,贝尔实验室,1972】的一种方言. R是“GNU S”,一个能够自由有效地用于统计计算和绘图的语言和环境,它提供了广泛的统计分析和绘图技术,包括线性和非线性模型、统计检验、时间序列、分类、聚类等方法.

销售行业ERP数据统计分析都有哪些维度?

- - CSDN博客综合推荐文章
当前的企业信息化建设主要包括ERP系统、OA系统等. 企业希望实现信息系统数据的整合,对企业资源进行分析汇总,方便对企业相关数据的掌控从而便于对业务流程进行及时调整监控. 但是由于系统间数据的组合众多,对于数据的分析维度也有太多选择,由于人力和系统的支持度问题,对于这些可能性的维度都进行数据分析显然并不现实,那么一个销售行业如何针对行业特点、选定维度分析数据呢就成了一个需要思考的问题.

R You Ready?——大数据时代下优雅、卓越的统计分析及绘图环境

- - 统计之都
R(R Development Core Team, 2011)语言由新西兰奥克兰大学的 Ross Ihaka 和 Robert Gentleman 两人共同发明,其词法和语法分别源自 Scheme 和 S 语言,R 语言一般认为是 S 语言(John Chambers, Bell Labs, 1972)的一种方言.