大数据:方法与技术
- - 透明思考 - Thoughts(商业读书会第23期的题目:Big Data. McKinsey Quarterly 的,和一篇. 通篇无非就是在讲(1)数据真的很大;(2)各行各业都要学会处理大数据. 于是 另一篇文章 进入视野. 不过最精彩的还是麦肯锡的 分析报告 ,其中最吸引我的是“方法和技术”的部分. 关于“怎么做”的这部分,麦肯锡的报告里分成三个部分:分析方法;技术;可视化展现.
(商业读书会第23期的题目:Big Data。文章有三篇,一篇 Economist 的,一篇 McKinsey Quarterly 的,和一篇 Forbes 的。)
其实这三篇都是空话。通篇无非就是在讲(1)数据真的很大;(2)各行各业都要学会处理大数据。然而我真正关心的是“怎么做”。于是 另一篇文章 进入视野。不过最精彩的还是麦肯锡的 分析报告 ,其中最吸引我的是“方法和技术”的部分。
关于“怎么做”的这部分,麦肯锡的报告里分成三个部分:分析方法;技术;可视化展现。其中第三部分相对简单。我对前两部分又做了一次细分。首先是如何使用大数据的方法,我把它细分为 Applications、 Approaches和 Academic Disciplines三个子类。这部分讲的是大数据这件事有哪些具体的工作,需要用到哪些知识基础。
说实话,这部分的内容(尤其是“应用”部分)有点超出我最初的想象。显然大数据远不止是BI。它实际上是 Validated Learning 的必要前提。大数据与敏捷、精益的结合将是必然的趋势,为支持精益运营而做的BI不可能六个月才交付一次。
相关技术这部分,我把它细分为 Tools、 Concepts和 Fundamentals三个子类。这部分讲的就是处理大数据所需的软件技术。这部分的最大困扰在于:想学习这些技术比较难找到练手的场景。所以我还在豆瓣上标了几本书,例如 Manning的这本 看起来应该是不错的入门。
接下来的学习从两个角度开始:理论基础,和实践。找一本合适的书,做一个合适的例子,熟悉这个领域的信息地图和术语。