[转载]《谁说菜鸟不会数据分析》读后感

标签: 菜鸟 | 发表时间:2013-07-11 08:29 | 作者:小蚊子
出处:http://blog.sina.com.cn/xiaowenzi22

@小蚊子乐园 





其实我是犹豫了一段时间后才决定购买这本书的。因为觉得这本书太过于简单无趣,于是就直接去学习SPSS和SAS

。至于EXCEL,由于之前使用过,所以没太在意,特别是OFFICE 2010。因为之前认为OFFICE 2003可以解决大部分

的日常办公问题,而且现在用这软件的单位还不少,所以忽视了OFFICE 2010。事实上,OFFICE在实际工作中能提

供比OFFICE 2003强得多的感受。但是直接学习了SPSS和SAS之后又感觉好像学不到什么东西似的,不知道这两个

统计软件真正的用途是什么,更重要的是对于数据分析这一行业的彻底迷茫。我又看了很多统计学理论的书,但

是这些书里很多是复杂的数学公式,学起来很头大。我不知道自己选择往这行走是否正确,但又不甘心,只能蒙

着头走下去。我本来想通过网上下载的方式获得此书,但是一直没有得逞。现在想想,如果真的是通过PDF的形式

获取此书,可能只会浏览而已,不会真正用心去学习,更不会写这篇文章了。


我想,此书最大的意义在于对具体实践的解释,能把数据分析这一过程作为一个整体进行讲解。最重要的是介绍

了数据分析的基本思路,和实际操作的流程。各个过程中的注意事项也是本书的亮点,这些细节往往是非常重要

的,有很多启发意义。这本书对于初学者帮助很大,数据分析是一个大的整体,不像IT行业一样,可能只要精于

其中某一刻就行。数据分析要求对于相关技术和行业情况都有一定的了解才行,否则就无法入手了。在整体性方

面的讲解上,此书刚好填补了这块的空白。


最后,提一点建议。能不能提供一个数据分析学习体系的整体思路和相关推荐书籍。这可能会对今后进一步学习

和进行实践提供更大的帮助。(如果怕有什么问题可以私下发个我!



附:我对于此书的要点总结:

第1章      数据分析那些事儿

1、  其实他们最主要的区别在于目的是否明确,如果目的明确,所有问题就自然迎刃而解了。

 

2、  一般来说,数据挖掘侧重解决四类数据分析问题:分类、聚类、关联和预测,重点在 寻找模式与规律

 

3、  比例是指在 总体中各部分的数值占全部数值的比重,常反映总体的构成和结构; 比率是指 不同类别数值的对比,它反映的不是部分与整体之间的关系,而是一个整体中各部分之间的关系。

 

 

第2章      结构为王——确定分析思路

1、  逻辑树的使用三原则:

(1)       要素化:把相同问题总结归纳成要素。

(2)       框架化:将各个要素组织成框架,遵守不重不漏的原则。

(3)       关联化:框架内的各要素保持必要的相互关系,简单而不孤立。

 

 

第3章      无米难为巧妇——数据准备

 

 

第4章      三心二意——数据处理

1、  数据清洗:重复数据处理、缺失数据处理、检查数据逻辑错误;数据加工:数据抽取、数据计算、数据分组、数据转换;数据抽样。

 

 

第5章      工欲善其事必先利其器——数据分析

1、  数据分析方法的三大作用:现状分析、原因分析、预测分析。

作用

方法

数据分析方法

现状分析

对比

对比、平均、综合评价

原因分析

细分

分组、结构、交叉、杜邦、漏斗图、矩阵关联、聚类

预测分析

预测

回归、时间、决策树、神经网络

对比、分组、结构、平均、交叉、综合评分、杜邦、漏斗图、矩阵关联、高级数据分析方法。

 

2、  对比分析法:与目标对比、不同时期对比、同级部门、单位、地区对比、行业内对比、活动效果对比。

 

3、  分组法必须与对比法结合运用。

 

4、  结构分析法是指分析总体内各部分与 总体之间进行对比的分析方法。

 

5、  综合评价分析法的基本思想是将多个指标转化为 一个能够反映综合情况的指标来进行分析评价。

 

 

第6章       给数据量体裁衣——数据展现

1、  图表的作用:表达形象化、突出重点、体现专业化。

 

2、  数据间的关系:成分、排序、时间序列、频率分布、相关性、多重数据比较。

 

3、  图表制作五步法:

确定所要表达的主题或目的=》

确定哪种图表最适合你的目的=》

选择数据制作图表=》

检查是否真实有效地展示数据=》

检查是否表达了你的观点

 

4、  表格中突出显示单元格、项目选取、数据条、图表集、迷你图等几种展现数据的表格技巧。

 

5、  常用图表:平均线图、双坐标图、竖形折线图、瀑布图、帕累托图、旋风图、人口金字塔图、漏斗图、矩阵图。

 

 

第7章       专业化生存——图表可以更美的

1、  标题、图例、单位、脚注、资料来源这些图表元素是图表的五脏六腑。

 

2、  要注意的条条框框:

A 避免生出无意义的图表;

B 不要把图表撑破;

C 只选对的,不选复杂的;

D 一句话标题。

 

3、各个图表的注意事项

 

饼图

A 对于饼图要按照时钟表盘的刻度,把数据从 12 点钟的位置开始排列,最重要的成分紧靠 12 点钟的位置;

B 数据项不要太多,保持在5项以内;

C 不要使用爆炸式的“饼图分离”;

D 饼图不要使用图例;

E 尽量不要使用标签连线,如果要用则切记凌乱;

F 尽量不适用3D效果,如果要用厚度要尽量薄一些;

G 当扇区使用颜色填充时,推荐使用白色的边框线,具有较好的切割感。

柱形图

A 同一数据序列使用相同的颜色;

B 不要使用倾斜的标签,别让读者歪着脑袋看;

C 纵坐标轴一般刻度从0开始;

D 一般来说,柱形图最好添加数据标签,这样让读者一眼就能看到具体数值;

E 如果柱状图已经有了数据标签,纵坐标刻度线和网格线则显得多余了,最好删除。

条形图

A 同一数据序列使用相同的颜色;

B 尽量让数据由大到小排序,方便阅读;

C 不要使用倾斜的标签;

D 最好添加数据标签。

折线图

A 折线选用的线型要相对粗些,最好比网格线、坐标轴更突出;

B 线条一般不超过5条,否则像意大利面条,非常杂乱。如果线条太多的话可以分开做图表;

C 不要使用倾斜的标签;

D 纵坐标轴一般刻度从0开始。

 

4、  图表会说谎:a虚张声势的增长;b3D效果的伪装;c逆序排列的误导;d一维图形的障眼法。

 

5、  图表美化的三原则:简约、整洁、对比。

 

6、  美化图表的技巧:最大化数据墨水比、找出隐形的线、图表喜欢的数字格式、如何突出对比。

 

7、              数据墨水比最大化的步骤

A 去掉不必要的背景充填色;

B 去掉无意义的颜色分类;

C 去掉装饰性的渐变色;

D 去掉网格线、边框;

E 删掉不必要的图例;

F 去掉不必要的坐标轴;

G 去掉装饰性图片;

H 以上不能去掉的元素就尽量淡化;

I 对需强调的数据元素进行突出标识。

 

 

第8章       专业的报告——体现你的职场价值

1、  数据分析报告的作用:展示分析结果、验证分析质量、提高决策参考。

 

2、  数据分析报告种类:专题分析报告、综合分析报告、日常数据通报。

 

项目

word

excel

powerpoint

优势

·易于排版

·可打印装订成册

·可含有动态图表

·结果可实时更新

·交互性更强

·可加入丰富的元素

·适合演示汇报

·增强展示效果

劣势

·缺乏交互性

·不适合演示汇报

·不适合演示汇报

·不适合大篇文章

适用

范围

·综合分析报告

·专题分析报告

·日常数据通报

·日常书记通报

·综合分析报告

·专题分析报告

 

3、  数据分析报表由标题、目录、前言、正文、结论与建议、附录六大组成部分组成。

 

4、  撰写数据分析报告的五大注意事项:

A 合理的结构以及清晰的逻辑;

B 实事求是,反映真相;

C 用词准确,避免含糊

D 篇幅适宜,简洁有效;

E 结合具体业务进行合理的分析。

 

5、  标题常用类型:解释基本观点、概括主要内容、交代分析主题、提出问题。

 

6、  前言:为何要开展此次分析?有何意义?;通过此次分析要解决什么问题?达到何种目的?;如何开展此次分析?主要通过哪几方面开展?

 

7、  报告正文的特点:包含所有数据分析事实和观点、通过数据图表和相关的文章结合分析、正文各部分具有逻辑关系。

 

8、  撰写报告时的注意事项:

A 结构合理,逻辑清晰;

B 实事求是,反映真相;

C 用词准确,避免含糊;

D 篇幅适宜,简洁有效;

E 结合业务,分析合理。


  青春就应该这样绽放   游戏测试:三国时期谁是你最好的兄弟!!   你不得不信的星座秘密

相关 [菜鸟 数据分析] 推荐:

《谁说菜鸟不会数据分析》笔记一则

- Oswin - 小蚊子乐园
作者:@recobeyang  http://weibo.com/1662436833. 《谁说菜鸟不会数据分析》--基于通用的Excel工具,像小说一样通俗易懂的数据分析教程,现在  卓越   京东   当当   China-pub 上可订购. 谁说菜鸟不会数据分析--业内人士联合推荐.

[转载]《谁说菜鸟不会数据分析》读后感

- - 小蚊子乐园
原文地址: 《谁说菜鸟不会数据分析》读后感 作者: 雪梦. 其实我是犹豫了一段时间后才决定购买这本书的. 因为觉得这本书太过于简单无趣,于是就直接去学习SPSS和SAS. 至于EXCEL,由于之前使用过,所以没太在意,特别是OFFICE 2010. 因为之前认为OFFICE 2003可以解决大部分.

Excel 数据分析

- - ITeye博客
用Excel做数据分析——直方图. 已有 0 人发表留言,猛击->> 这里<<-参与讨论. —软件人才免语言低担保 赴美带薪读研.

扯扯数据分析

- - 互联网分析
在别人的眼里数据分析既是很深奥的职业,也是被人挑战的职业,更是让你又恨又爱的职业. 其实这些都不重要的,重要的是对此行感兴趣,骨子里有量化一切的 意识. 很多人首先脑海中出现的是1、2、3……等等,为何有这样的印象. 其实是我们数据分析师为了更好的运用“统计学”所以要将许多 数据想尽办法来转化为1、2、3这样的数据形式,从而更深入、科学的分析data,不扯这个了,这个没什么意思,看图:.

数据分析那些事

- - 小蚊子乐园
今早突然有个想法,就是经常有网友会对数据分析方面有一些困惑,并且咨询我该怎么办. 并且经常是同样的问题,所以觉得有必要对一些经典共性的问题进行整理,与大家分享,这里并非标准答案,仅作参考. 欢迎提出自己对数据方面的疑问,将在此篇将持续更新,敬请关注. ----------------------------------------我不是完美的分割线--------------------------------------- .

谈大数据分析

- - 人月神话的BLOG
对于数据分析层,我们可以看到,其核心重点是针对海量数据形成一个分布式可弹性伸缩的,高查询性能的,支持标准sql语法的一个ODS库. 我们看到对于Hive,impala,InfoBright更多的都是解决这个层面的问题,即解决数据采集问题,解决采集后数据行列混合存储和压缩的问题,然后形成一个支撑标准sql预防的数据分析库.

Twitter收购数据分析公司BackType

- zou guangxian - 36氪
Twitter刚刚宣布已经收购BackType,一家帮助公司和品牌衡量社交媒体影响力的数据分析公司. BackType在博客上宣布这一消息时称团队将集中精力为Twitter发布商合作伙伴开发工具. 总部位于旧金山的BackType是一家由YC孵化的创业公司,自2008年以来已获得130万美元投资. 作为交易的一部分,BackType将停止BackTweets(帮助内容发布商了解推讯是如何转化为网站流量和销售额)的新用户注册.

数据分析中遇到的“圆”

- simple - 所有文章 - UCD大社区
与十年前不同,当今令数据分析师迷茫的,可能不再是数据很少,而是数据很多;今天不是不知道玩好数据的重要性,而是不知道玩错数据的危害性,即所谓甜蜜的烦恼. 一个数据分析师,如果能体会到,当下数据存在的核心问题,并且能清楚解决办法,就可以精益求精了. 这次想跟大家讲的是一个由受、想、行、识四个部份所组成生生不息的圈(Feedback Loop),彼此互相推进.

数据分析师的基本素质

- AWard - 小蚊子乐园
摘自《谁说菜鸟不会数据分析》第一章.     Mr.林看到小白斗志昂扬的样子非常高兴:别光说不做啊,要成为一名优秀的数据分析师,并非一件容易的事. 虽然所学的专业与数据分析不相关,但你可以通过工作中的实践学习数据分析,需要付出大量的时间和精力,不经一番寒彻骨,怎得梅花扑鼻香.     下面,我给你介绍一名合格的数据分析师需要具备的五大基本能力和素质.

新读图时代:500px.com数据分析

- holic536 - 东西
500px是一个由世界各地的摄影爱好者组成的高品质图片社区. 网站旨在寻找最优秀的摄影人才,分享和发现精彩的照片,找到志同道合的朋友. 网站创建于2003年,2009年500px重新改版升级成为2.0版. 从2009年的1000用户发展到现如今的4.5万用户,也就是在社交网络兴起之后,网站发展更加迅猛.