【读书笔记】数据分析学习总结(一):数据分析那些事儿

标签: 数据分析 产品经理 大数据 | 发表时间:2013-09-15 18:16 | 作者:kevin
出处:http://www.woshipm.com

上周从买了两本书《谁说菜鸟不会数据分析》和《大数据时代》,学习过程中想把书本内容通过总结、理解、实践、内化掌握来变成自己的东西,把握好学习的节奏,坚持就好。

    初级阶段我更多的是来转述前辈们总结出的东西,但自己若有实践中的体会也会写入其中 (自己的体会粗体标出)。本来就是记录菜鸟成长过程,所以内容对行家来说太小儿科,对新手入门来说或许会有些帮助。

    以下开始是对《谁说菜鸟不会分析数据》一书的学习总结,第一章:数据分析那些事儿。

一、数据分析是神马?

1.何谓数据分析?

    用适当的统计分析方法对收集来的大量数据进行详细研究和概括总结,以求最大化地发挥数据的作用,提取有用信息和形成结论,这一过程叫做数据分析。

2.数据分析的三大作用:现状分析、原因分析、预测分析。

二、数据分析六步曲:

1.明确分析思路:

    首先要明确分析目的:菜鸟与数据分析师的区别就在于菜鸟做分析时目的不明确,从而导致分析过程非常盲目。 这点有比较深的体会,在公司里做过关于搜索和新手的产品数据分析,自己对分析目的没考虑太多,靠的是前人留下的上期数据分析结果,倘若让我从零开始做,估计会很盲目。

    然后确定分析思路:梳理分析思路,并搭建分析框架,把分析目的分解成若干个不同的分析要点,即如何具体开展数据分析,需要从哪几个角度进行分析,采用哪些分析指标。

    最后还要确保分析框架的体系化,使分析结果具有说服力:营销方面的理论模型有4P、用户使用行为、STP理论、SWOT等;管理方面的理论模型有PEST、5W2H、时间管理、生命周期、逻辑树、金字塔、SMART等。 在上周一个汇报上使用了 SWOT 分析方法,对这些营销或管理的模型还都很陌生。

2.数据收集:

    一般数据来源于以下几种方式:数据库、公开出版物(统计年鉴或报告)、互联网、市场调查。

3.数据处理:

    数据处理主要包括数据清洗、数据转化、数据提取、数据计算等处理方法。 导师提过在做数据处理时,不要在原始数据上进行数据处理以防原始数据丢失,保留数据处理过程以便发现错误时查找。

4.数据分析:

    数据分析是指用适当的分析方法及工具,对处理过的数据进行分析,提取有价值的信息,形成有效结论的过程。

    与数据挖掘的关系是数据挖掘侧重解决四类数据分析问题:分类、聚类、关联和预测,重点在寻找模式与规律。

5.数据展现:

    一般情况下,数据是通过表格和图形的方式来呈现的。常用的数据图表包括饼图、柱形图、条形图、折线图、散点图、雷达图等。进一步加工整理变成我们需要的图形,如金字塔图、矩阵图、漏斗图、帕雷托图等。

    在一般情况下,能用图说明问题的就不用表格,能用表说明问题的就不用文字。

6.报告撰写:

    一份好的数据分析报告,首先需要有一个好的分析框架,并且图文并茂,层次明晰,能够让阅读者一目了然。结构清晰、主次分明可以使阅读者正确理解报告内容;图文并茂,可以令数据更加生动活泼,提高视觉冲击力,有助于阅读者更形象、直观地看清楚问题和结论,从而产生思考。

    另外,数据分析报告需要有明确的结论,没有明确结论的分析称不上分析,好的分析报告一定要有建议或解决方案。

三、数据分析的三大误区:

1.分析目的不明确,为分析而分析。

2.缺乏业务知识,分析结果偏离实际:数据分析师的任务不是单纯做数学题,数据分析师还必须懂营销,懂管理,更要懂策略。 上周五听了公司专门做数据分析的同事做的关于新手留存的数据分析专题,他们数理统计专业知识必然过硬,而且对业务比较熟悉,能通过数据结合不同业务做出相应结论,还能为不同业务提出改进意见,不熟悉业务不懂策略怎行?

3.一味追求使用高级分析方法,热衷研究模型。

四、数据分析师的职业发展:

1.数据分析的广阔前景:根据美国劳工部预测,到2018年,数据分析师的需求量将增长20%。就算你不是数据分析师,但数据分析技能也是未来必不可少的工作技能之一。

2.数据分析师的职业要求:懂业务,懂管理,懂分析,懂工具,还要懂设计。

    其中,懂分析中,基本的分析方法有:对比分析法、分组分析法、交叉分析法、结构分析法、漏斗图分析法、综合评价分析法、因素分析法、矩阵关联分析法等;高级的分析方法有:相关分析法、回归分析法、聚类分析法、判别分析法、主成分分析法、因子分析法、对应分析法、时间序列等。

    懂工具中,常用的数据分析工具有Excel、Access、SPSS、SAS,先学会用Excel,它能解决80%甚至100%的问题。

    懂设计中,图表的设计是大学问,如图形的选择、版式的设计、颜色的搭配等,都需要掌握一定的设计原则。

五、几个常用指标和术语:

    以下几个常见的只是提一下:平均数、绝对数和相对数、百分比和百分点、频数和频率、比例和比率。

    另外倍数与番数、同比与环比,我之前有疑问的特别提下。番数是指原来数量的2的N次方倍,比如翻一番为原来数量的2倍(2的一次方),翻两番为4倍(2的二次方)。同比是与历史同时期进行比较得到的数值,环比是指与前一个统计期进行比较得到的数值。

 

    这部分主要是对数据分析有了一个全面的了解而又粗略的认识,说实话这样的总结复述后很多地方我印象也不深,但总比看过一遍后不再管能多记住一些,当然能实践才会印象更深。

 本文系作者 Junehi授权发布,转载请注明来源于人人都是产品经理,并保留本文链接。


本文链接《 【读书笔记】数据分析学习总结(一):数据分析那些事儿
微信号:woshipm,产品干货天天推荐,欢迎订阅

相关 [读书 笔记 数据] 推荐:

分布式系统 读书笔记(二)数据平滑迁移

- - 企业架构 - ITeye博客
在开始进行数据迁移时,记录增量的日志,在迁移结束后,再对增量变化进行处理. 在最后,可以把要迁移的数据的写暂停,保证增量日志都处理完毕后,再切换规则,放开所有的写,完成迁移工作. 我们希望根据id去模把上面这个表 划分到两个数据库中,  也就是id  mod 2 为0的还在原数据库  为1的在新库中.

【读书笔记】数据分析学习总结(一):数据分析那些事儿

- - 人人都是产品经理
上周从买了两本书《谁说菜鸟不会数据分析》和《大数据时代》,学习过程中想把书本内容通过总结、理解、实践、内化掌握来变成自己的东西,把握好学习的节奏,坚持就好.     初级阶段我更多的是来转述前辈们总结出的东西,但自己若有实践中的体会也会写入其中 (自己的体会粗体标出). 本来就是记录菜鸟成长过程,所以内容对行家来说太小儿科,对新手入门来说或许会有些帮助.

《精力管理》读书笔记-1

- 黎明 - 战隼的学习探索
这本书是我前几天阅读的,这是当时的阅读记录:. #每天一本书#,70天,2011年2月25日,阅读书籍《精力管理》这本书的理念不错,但内容水分很大. 但这个理论正好给自己的时间管理观点和规划做个补充,评价3.5分. 时间管理应该根据自己的精力进行安排和调整,周期性地补充精力,来平衡精力消耗. 需要对你的精力进行海战略性的规划和应用,并把它当成一种习惯.

分享读书笔记 Data Mining Concepts and Techniques

- redhobor - BlogJava-首页技术区
Data Mining涵盖的内容非常多,学着学着就走进乱石阵,看不到大的picture了,Data Mining Concepts and Techniques是本经典的好书,虽然有些细节并不详尽,(如果详尽就变成圣经了)可以用它来把data mining的知识点结成一张网. 它包括数据的预处理,frequent patterns,decision tree, netural network, regression, clustering, time series等等很多方面.

读书笔记:少有人走的路

- zhoujg - 博客园-周金根
       记得好像是五六年前在公司投稿后得到一本书,这本书叫做《少有人走的路》. 当时看了一下,简单翻阅之后发现看不下去了,于是一直搁置着. 后来有同事知道我有这本书,她们想我借阅,并且说是听别人介绍才知道这本书的. 我也不知道她们后来得了之后有什么感受,反正还给我之后我还是放着. 这本书于是就静静的在我这个搁置了好几年.

云计算读书笔记(二)

- Gabriel - 博客园-首页原创精华区
google云计算服务包括:google文件系统GFS,分布式计算编程模形MapReduce,分布式锁服务Chubby,分布式结构化数据表Bigtable,分布式存储系统Megastore以及分布式监控系统Dapper等. GFS提供了海量数据的存储和访问能力. 分为三类角色,client(客户端),Master(主服务器)和Chunk Server(数据块服务器).

《思维导图》读书笔记

- Spectrophobia. - 读书笔记
今天分享的图书《思维导图》英国著名心理学家东尼·博赞在研究大脑的力量和潜能过程中,发现伟大的艺术家达·芬奇在他的笔记中使用了许多图画、代号和连线. 他意识到,这正是达芬奇拥有超级头脑的秘密所在. 在此基础上,博赞于19世纪60年代发明了思维导图这一风靡世界的思维工具. 这本书中过于夸大思维导图的作用而且废话过多,没有必须细读.

读书笔记 - How Google Test Software

- - CSDN博客研发管理推荐文章
(《谷歌如何测试软件》)的确为神秘谷歌公司揭开一层面纱,讲到了谷歌的代码文化和测试文化,讲到了角色划分,职责划分,测试种类划分,讲到优秀的不同角色的人应该具有什么样子的,讲到测试的创新和工具,还有大量的人物访谈. 这里的笔记主要包含:个人感兴趣的,值得备忘的,需要后续关注的东西记录.

《百问知识管理》读书笔记

- - 海涛的成长碎碎念
当时是为了买给妹子买 @秋叶 的大项目售前的那本书的,为了凑单免运费顺手把这本书也扔到了购物车里面,这也算是真爱了,支持大叔的同时还不忘支持下大叔的红颜知己,整本书大概花了两趟地铁的时间加上晚上睡觉前的一个多小时的时间看完的,不是很厚的一本很实用的工具手册. 公司部门在年中开会的时候提到了知识管理这块的一些东西,因为之前我一直在做个人知识管理的一些东西,业界除了一些企业知识管理的内容,所以部门知识管理这块就交给我在负责了,因为对企业知识管理大多了解都是理论上的,实践性的东西还真没怎么做过,还是有点发虚的,读完这本书算是松了口气.

《精益创业》读书笔记

- - CSDN博客推荐文章
        创业的过程是否可以总结、规范、提炼出共性和成功的方法. 《精益创业》无疑是这样的一本书,书中提到的很多创业观点其实平时我也领悟过,但是能以书面、可描述的语言总结出来,这是作者的厉害之处.         精益创业 (Lean Startup) 总结起来就是用3个动词驱动3个名词的轮回迭代过程:IPD -> BML ,即: .