产品数据体系建设基础:一个产品的数据体系建设

标签: 数据分析 2年 初级 数据体系 | 发表时间:2018-10-06 16:18 | 作者:观花
出处:http://www.woshipm.com

本文抽象介绍了一个产品数据体系建设,以支持产品了解数据如何采集、计算与展现。

近期有师弟师妹不断问到产品经理必备技能中,数据分析是怎么回事?产品怎么就有数据可以分析了?

简单了解了下其产生问题的原因与诉求,将其问题拆分为二:

  1. 产品的数据体系如何建设?
  2. 如何进行数据分析?

关于问题2,网上已经有足够丰富的资源进行学习与讨论,这里不再赘述,简而言之根据运营或迭代的目的进行深度思考与结论沉淀。

以下内容仅针对问题1在产品数据体系思路层面进行介绍,主要面向平台类产品策划。不足之处请多包涵。

一、为何要建设数据分析体系?

任何一个产品的迭代与运营都需要数据进行指导,基于线上数据情况,可以更准确的支持策划与运营同学做出有效决策。

二、数据分析体系包含哪些部分?

不同行业与不同公司对产品体系的定义与诉求不同,这里仅以平台类抽象举例,包含:存储格式、上报逻辑、计算逻辑与展现方式。

三、为什么包含这些内容?

如果PM想监测一种数据,首先需要打开数据报表来查看(即展现方式),而数据报表的制作依赖要拿到这些数据(即上报逻辑),这些数据上报后如何在后台计算才可以支持报表快速展现(即计算逻辑),这些数据均基于用户行为触发而生成,因此需要在用户触发某个行为时进行数据上报(即上报逻辑)。

最后,数据上报如果是杂乱无章的,则在进行数据提取时会遇到各种各样复杂的问题,因此我们需要给数据上报定义一个格式,格式和开发约定好,以此格式为依据,开发进行后台数据库定义存储(即存储格式)。

四、每个内容详细是什么?

存储格式

即开发与产品同学约定好的数据上报格式,产品同学根据这个格式制定数据上报账单,开发同学根据这个格式进行数据存储,拿最简单的数据格式举例:

上报逻辑

约定好上报格式后,产品侧根据自身目的定制上报账单,举例:

开发拿到此账单后,根据“上报时机”进行数据上报,上报后数据直接存储到后台以构建的数据库中,即完成数据采集。

其中,“页面id”和“标记id”用于给每个上报分配其“唯一识别标识”,方便后面做出具处理。上报时机则根据自身产品进行定义,通常会有“点击时”、“曝光时”和“停留时”几类。

计算逻辑

通常,产品发布后我们会拿到海量数据上报,如果不对这些数据进行过滤和计算,则后期提取时则耗时巨大。因此需要在数据存储后对数据进行一次过滤,目的是剔除无效数据并加快数据提取速度。这里涉及涉及到比较复杂的数据挖掘算法,每个公司都会搭建专门的数据研发团队,不再赘述,仅用下图简单描述。

展现方式

通常情况下,数据经过一层处理存储到过滤表后,依旧不是我们最终想要的数据,部分数据需要再处理一次并制作数据报表以支持后续快速查看,这里涉及到两个问题:

1,过滤表中的数据如何做成数据报表?
2,数据报表通常有哪些?

第1个问题,这里就与之前的“数据账单”有关,根据之前的数据账单,构建数据处理逻辑,给到开发进行进一步开发,并根据你的目的绘制数据报表格式。拿上面的数据账单举例:

比方说,我想监测“每天点击某个按钮的性别分布是怎样的?”,那么我需要给开发提需求,以“拓展字段1”为区分,开发数据报表,其中标记id为1,仅提取该标记下的数据。报表样式如下:

之后开发即可了解如何进行报表开发,后面只需要等待开发完成,每日定时监测报表数据即可。其他类型的报表逻辑同上。

第2个问题,不同产品的报表区分维度不同,比较常用的有用户数据与用户行为类数据,如果是平台类产品还应该包含内容类数据。

  • 用户数据:基于用户生命周期的各项数据。
  • 用户行为数据:用户在使用产品时各个页面各个按钮的操作记录。
  • 内容类数据:app内容用户消费情况与流转情况(新闻/商品/游戏等均为内容)

五、总结

本文主要介绍一个产品的数据体系建设逻辑,主要包含:“存储格式”、“上报逻辑”、“计算逻辑”和“展现方式”。多数内容抽象到1到2个点进行介绍,仅仅为对数据分析后台建设感兴趣的同学进行思路疏通。

另外,不同公司有不同的数据建设框架,市面上也有不少性价比较高的数据SDK可以直接拿来使用,但思路大同小异。

以上,如有意见或深入问题探讨,可随时联系。

 

本文由 @观花 原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自 Unsplash,基于 CC0 协议

相关 [产品 数据 体系] 推荐:

产品数据体系建设基础:一个产品的数据体系建设

- - 人人都是产品经理
本文抽象介绍了一个产品数据体系建设,以支持产品了解数据如何采集、计算与展现. 近期有师弟师妹不断问到产品经理必备技能中,数据分析是怎么回事. 简单了解了下其产生问题的原因与诉求,将其问题拆分为二:. 关于问题2,网上已经有足够丰富的资源进行学习与讨论,这里不再赘述,简而言之根据运营或迭代的目的进行深度思考与结论沉淀.

关于产品的数据分析体系

- - 神刀安全网
今晚听了【产品壹佰讲堂】诸葛io产品总监于晓松关于《如何建设产品的数据分析体系》的分享,有些许感悟,记录如下:. 产品是一种抽象化标准化的解决方案,同时也是一种商业模式. 那么,与之对应的,一款成功的产品,就必须同时满足两个条件:一是帮助用户解决问题,创造价值,二是帮助企业赚钱或获取其他收益. 简单概括下,就是一款成功的产品必须同时具备用户价值和商业价值.

产品经理“玩”数据

- - 一个产品经理的博客...
  产品经理生来就是要解决问题的. 那如何才能更好、更高效地解决问题?首先要求我们能发现问题,数据分析就是一种常用的发现问题的手段. 通过数据定位问题,然后用设计方案来尝试解决问题,之后再用量化的数据指标来评估问题是否解决了,解决了多少. 通过迭代优化,问题就能够得到较好解决.   本文结合自己在在登录产品的体验优化中积累的一些实战经验,重现过程中的设计点滴,有效果明显的方案,也有效果不明显的优化尝试,最后将总结一些通用的设计思路.

商业产品色彩体系

- Stan - 所有文章 - UCD大社区
商业产品有这样几个特点:1.信息量大;2.功能模块繁多;3.用户角色多样化;4.操作者水平参差不齐. 通常情况下,图形及色彩是引导用户的第一要素. 那么如何用色彩引导用户获取信息是系统设计中的一个重点. 这里举个例子:导视系统会告诉你在哪里,你想去的地方怎么走,那里有什么?. 合理的色彩应用亦有这样的效果:.

Google数据库产品LevelDB对决MySQL

- - HTML5研究小组
去年一月份,Google发布了LevelDB. LevelDB是Key-Value嵌入式数据库管理系统编程库,目前的版本能够支持Billion级别的数据量. LevelDB是一个C++库,可按照字符串键值顺序映射. 源于其本身的良好设计,特别是LSM算法,LevelDB性能非常之高. 在一台4个Q6600的CPU机器上,每秒钟写数据超过40w,而随机读的性能每秒钟超过10w.

数据库产品如何选型

- - BlogJava-qileilove
   一.是否满足业务场景,各DB系统软件功能对比.   oracle功能是大而全并且非常完善,无论是锁定机制还是事物支持,无论是内置函数还是外部可扩展功能,无论OLTP和OLAP都能很好的支撑.   mysql作为开源数据的代表,得到了广泛的应用,关系型数据库的常用功能也全面覆盖到了,但mysql的缺失大表的hash join功能,这让他在OLAP发展受阻.

网易严选数据产品实践

- - IT瘾-dev
数据产品是个新兴的产品分类,每个人眼里都有一个自己的数据产品,尽管在绝大部分人的概念中都是一堆报表. 在过去的3年里,我们在用户需求的推动下一步步构建了网易严选数据产品体系,下文分享我们在构建过程中自己的一些思考和总结.     本文内容来自我在2020产品经理大会上《网易严选数据产品实践与方法论》分享的文字总结,由于篇幅原因,只包含了实践部分.

oracle 数据库体系结构

- - Oracle - 数据库 - ITeye博客
       任何硬件平台或操作系统下的ORACLE体系结构都是相同的,包括如下四个方面:.         数据文件,日志文件,控制文件,参数文件.         表空间、段、区间、数据块.         共享池,数据缓冲区,日志缓冲区,PGA.         用户进程、服务器进程、后台进程.

产品经理必须掌握的知识体系——账号体系

- - IT瘾-tuicool
说到“账号”,想必大家对于这个名词已经习以为常. 现在市场上的大多数应用,都会有自己的账号体系. 产品设计从0到1最初的构建,用户与应用的最初触达,基本上是从最不起眼的账号体系开始. 对此,我这段时间对账号体系进行了学习和总结,在此分享给大家,希望对大家也有帮助. 我所理解的账号,是用户与系统建立的一种联系,是用户从现实映射到虚拟系统中的唯一识别标记.

数据运营:如何搭建App的数据监控体系?

- - 人人都是产品经理
精细化运营的核心是数据驱动增长,透过数据分析指引产品迭代和运营推广. 因此,产品和运营需要掌握一定的数据运营能力,特别是需要搭建一套产品运营数据的监测体系来对日常运营效果进行复盘. 本文介绍了搭建App数据监控体系的四大数据层次,与大家分享. 移动互联网进入到下半场,流量红利逐渐消失,互联网公司的竞争从增量用户的争夺转向存量用户的争夺.