产品数据体系建设基础:一个产品的数据体系建设

标签: 数据分析 2年 初级 数据体系 | 发表时间:2018-10-06 16:18 | 作者:观花
出处:http://www.woshipm.com

本文抽象介绍了一个产品数据体系建设,以支持产品了解数据如何采集、计算与展现。

近期有师弟师妹不断问到产品经理必备技能中,数据分析是怎么回事?产品怎么就有数据可以分析了?

简单了解了下其产生问题的原因与诉求,将其问题拆分为二:

  1. 产品的数据体系如何建设?
  2. 如何进行数据分析?

关于问题2,网上已经有足够丰富的资源进行学习与讨论,这里不再赘述,简而言之根据运营或迭代的目的进行深度思考与结论沉淀。

以下内容仅针对问题1在产品数据体系思路层面进行介绍,主要面向平台类产品策划。不足之处请多包涵。

一、为何要建设数据分析体系?

任何一个产品的迭代与运营都需要数据进行指导,基于线上数据情况,可以更准确的支持策划与运营同学做出有效决策。

二、数据分析体系包含哪些部分?

不同行业与不同公司对产品体系的定义与诉求不同,这里仅以平台类抽象举例,包含:存储格式、上报逻辑、计算逻辑与展现方式。

三、为什么包含这些内容?

如果PM想监测一种数据,首先需要打开数据报表来查看(即展现方式),而数据报表的制作依赖要拿到这些数据(即上报逻辑),这些数据上报后如何在后台计算才可以支持报表快速展现(即计算逻辑),这些数据均基于用户行为触发而生成,因此需要在用户触发某个行为时进行数据上报(即上报逻辑)。

最后,数据上报如果是杂乱无章的,则在进行数据提取时会遇到各种各样复杂的问题,因此我们需要给数据上报定义一个格式,格式和开发约定好,以此格式为依据,开发进行后台数据库定义存储(即存储格式)。

四、每个内容详细是什么?

存储格式

即开发与产品同学约定好的数据上报格式,产品同学根据这个格式制定数据上报账单,开发同学根据这个格式进行数据存储,拿最简单的数据格式举例:

上报逻辑

约定好上报格式后,产品侧根据自身目的定制上报账单,举例:

开发拿到此账单后,根据“上报时机”进行数据上报,上报后数据直接存储到后台以构建的数据库中,即完成数据采集。

其中,“页面id”和“标记id”用于给每个上报分配其“唯一识别标识”,方便后面做出具处理。上报时机则根据自身产品进行定义,通常会有“点击时”、“曝光时”和“停留时”几类。

计算逻辑

通常,产品发布后我们会拿到海量数据上报,如果不对这些数据进行过滤和计算,则后期提取时则耗时巨大。因此需要在数据存储后对数据进行一次过滤,目的是剔除无效数据并加快数据提取速度。这里涉及涉及到比较复杂的数据挖掘算法,每个公司都会搭建专门的数据研发团队,不再赘述,仅用下图简单描述。

展现方式

通常情况下,数据经过一层处理存储到过滤表后,依旧不是我们最终想要的数据,部分数据需要再处理一次并制作数据报表以支持后续快速查看,这里涉及到两个问题:

1,过滤表中的数据如何做成数据报表?
2,数据报表通常有哪些?

第1个问题,这里就与之前的“数据账单”有关,根据之前的数据账单,构建数据处理逻辑,给到开发进行进一步开发,并根据你的目的绘制数据报表格式。拿上面的数据账单举例:

比方说,我想监测“每天点击某个按钮的性别分布是怎样的?”,那么我需要给开发提需求,以“拓展字段1”为区分,开发数据报表,其中标记id为1,仅提取该标记下的数据。报表样式如下:

之后开发即可了解如何进行报表开发,后面只需要等待开发完成,每日定时监测报表数据即可。其他类型的报表逻辑同上。

第2个问题,不同产品的报表区分维度不同,比较常用的有用户数据与用户行为类数据,如果是平台类产品还应该包含内容类数据。

  • 用户数据:基于用户生命周期的各项数据。
  • 用户行为数据:用户在使用产品时各个页面各个按钮的操作记录。
  • 内容类数据:app内容用户消费情况与流转情况(新闻/商品/游戏等均为内容)

五、总结

本文主要介绍一个产品的数据体系建设逻辑,主要包含:“存储格式”、“上报逻辑”、“计算逻辑”和“展现方式”。多数内容抽象到1到2个点进行介绍,仅仅为对数据分析后台建设感兴趣的同学进行思路疏通。

另外,不同公司有不同的数据建设框架,市面上也有不少性价比较高的数据SDK可以直接拿来使用,但思路大同小异。

以上,如有意见或深入问题探讨,可随时联系。

 

本文由 @观花 原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自 Unsplash,基于 CC0 协议

相关 [产品 数据 体系] 推荐:

产品数据体系建设基础:一个产品的数据体系建设

- - 人人都是产品经理
本文抽象介绍了一个产品数据体系建设,以支持产品了解数据如何采集、计算与展现. 近期有师弟师妹不断问到产品经理必备技能中,数据分析是怎么回事. 简单了解了下其产生问题的原因与诉求,将其问题拆分为二:. 关于问题2,网上已经有足够丰富的资源进行学习与讨论,这里不再赘述,简而言之根据运营或迭代的目的进行深度思考与结论沉淀.

关于产品的数据分析体系

- - 神刀安全网
今晚听了【产品壹佰讲堂】诸葛io产品总监于晓松关于《如何建设产品的数据分析体系》的分享,有些许感悟,记录如下:. 产品是一种抽象化标准化的解决方案,同时也是一种商业模式. 那么,与之对应的,一款成功的产品,就必须同时满足两个条件:一是帮助用户解决问题,创造价值,二是帮助企业赚钱或获取其他收益. 简单概括下,就是一款成功的产品必须同时具备用户价值和商业价值.

产品经理“玩”数据

- - 一个产品经理的博客...
  产品经理生来就是要解决问题的. 那如何才能更好、更高效地解决问题?首先要求我们能发现问题,数据分析就是一种常用的发现问题的手段. 通过数据定位问题,然后用设计方案来尝试解决问题,之后再用量化的数据指标来评估问题是否解决了,解决了多少. 通过迭代优化,问题就能够得到较好解决.   本文结合自己在在登录产品的体验优化中积累的一些实战经验,重现过程中的设计点滴,有效果明显的方案,也有效果不明显的优化尝试,最后将总结一些通用的设计思路.

商业产品色彩体系

- Stan - 所有文章 - UCD大社区
商业产品有这样几个特点:1.信息量大;2.功能模块繁多;3.用户角色多样化;4.操作者水平参差不齐. 通常情况下,图形及色彩是引导用户的第一要素. 那么如何用色彩引导用户获取信息是系统设计中的一个重点. 这里举个例子:导视系统会告诉你在哪里,你想去的地方怎么走,那里有什么?. 合理的色彩应用亦有这样的效果:.

Google数据库产品LevelDB对决MySQL

- - HTML5研究小组
去年一月份,Google发布了LevelDB. LevelDB是Key-Value嵌入式数据库管理系统编程库,目前的版本能够支持Billion级别的数据量. LevelDB是一个C++库,可按照字符串键值顺序映射. 源于其本身的良好设计,特别是LSM算法,LevelDB性能非常之高. 在一台4个Q6600的CPU机器上,每秒钟写数据超过40w,而随机读的性能每秒钟超过10w.

数据库产品如何选型

- - BlogJava-qileilove
   一.是否满足业务场景,各DB系统软件功能对比.   oracle功能是大而全并且非常完善,无论是锁定机制还是事物支持,无论是内置函数还是外部可扩展功能,无论OLTP和OLAP都能很好的支撑.   mysql作为开源数据的代表,得到了广泛的应用,关系型数据库的常用功能也全面覆盖到了,但mysql的缺失大表的hash join功能,这让他在OLAP发展受阻.

oracle 数据库体系结构

- - Oracle - 数据库 - ITeye博客
       任何硬件平台或操作系统下的ORACLE体系结构都是相同的,包括如下四个方面:.         数据文件,日志文件,控制文件,参数文件.         表空间、段、区间、数据块.         共享池,数据缓冲区,日志缓冲区,PGA.         用户进程、服务器进程、后台进程.

产品经理必须掌握的知识体系——账号体系

- - IT瘾-tuicool
说到“账号”,想必大家对于这个名词已经习以为常. 现在市场上的大多数应用,都会有自己的账号体系. 产品设计从0到1最初的构建,用户与应用的最初触达,基本上是从最不起眼的账号体系开始. 对此,我这段时间对账号体系进行了学习和总结,在此分享给大家,希望对大家也有帮助. 我所理解的账号,是用户与系统建立的一种联系,是用户从现实映射到虚拟系统中的唯一识别标记.

Facebook内部资料:产品设计评价体系解密

- Nick - 19楼UED Team
如何对设计进行评判,一定有很多答案,有利有弊. 问100位设计师,会得到100种回答. 用线上PV、UV等数据说话,更多受产品属性、运营动作影响;采用用户调研,往往得到的是用户角度的单方面看法,缺少专业指导性意见;用需求方的满意来衡量,可能最后需求方认可的是设计师认为最滥的方案. 两家都挂有“天下第一”相邻卖臭豆腐的师傅.