深度剖析知乎目前的内容架构模型

标签: 干货 | 发表时间:2014-03-15 09:33 | 作者:木柄
出处:http://www.techxue.com/portal.php?mod=list&catid=8

本文深度剖析知乎目前的内容架构模型,对于社区应用开发者可将其中的架构思维推广到一般 UGC 网站产品的优化上。

知乎是目前国内用户平均素质最高的网站,其日均访问 IP 在 60 万以上。对于这样一个用户活跃度极高、产出大量优质内容(UGC)网站来说,如何把内容更好地组织呈现并将其中优质部分的价值最大化,非常重要。

 

基础模块(1 问题-n 回答-n 评论模块)

知乎基础模块中一个问题对应于 n 个回答,一个回答又对应于 n 个评论,因此我们可以把基础模块称为 1 问题-n 回答-n 评论模块。假设知乎架构模型中仅存在基础模块,将会是一个怎样的场景?那就是信息流随着时间的推移不断生成新的内容并把旧信息快速替换冲刷掉,这种对基础模块无差别的线性陈列,对用户来说将是一个灾难:

  1. 在简单罗列的线性信息海洋中,用户汲取其所需信息的成本太高;
  2. 信息流如同大河奔流,那些有挖掘价值的信息点稍纵即逝,即信息价值被严重挥霍;
  3. 用户不能将有价值的信息点从信息大河里“舀”出来,信息可见而不可用,无法产生长效作用。

知乎的产品设计者很好地意识到了这些潜在的“灾难”,并对每个问题点做出了针对性的产品设计方案,下面木柄逐一展开分析。

话题模块

话题模块用来解决“在线性简单罗列的信息海洋中,用户汲取所需信息的成本太高”的问题。知乎中,每一个基础模块(1 问题-n 回答-n 评论模块)可以添加“话题”标识,“话题”描述了基础模块的“类别”,话题模块与基础模块是多对多的映射关系(many2many)。事实上,为内容添加“标识”的做法在以内容为核心的网站的组织架构模型中屡见不鲜,很多网站将这种“标识”称为标签(比如 lofter)。

但是知乎的话题比普通网站的标签走的更远:知乎的各个话题之间不像标签那样是孤立的,它定义了一套将话题组织起来的数据结构。请注意,话题本身就是对基础模块的一种组织形式,而又存在一套数据结构描述了话题的组织形式,那么我们可以将这种数据结构称作“描述结构组织的结构组织”,知乎自己是这么介绍这个“描述结构组织的结构组织”:知乎的全部话题通过父子关系构成一个有根无循环的有向图;根话题即为所有话题的最上层的父话题;请不要在问题上直接绑定根话题。

发现模块

发现模块解决了信息流如同大河奔流,那些有挖掘价值的信息点稍纵即逝,即信息价值被严重挥霍的问题。发现模块主要有两部分内容组成:推荐与热门。热门内容是由用户群体行为所做出来的“内容精选”,而推荐内容是知乎运营人员对“群体行为”的补充完善,最大程度地让有价值的信息减缓流速,或者二次“逆流”,目的就是让有价值的信息得以“上浮”与“驻留”。

此外值得一提的是,如果说发现模块是构筑在知乎基础模块上的信息“驻留模块”, 那么话题模块也有一个针对其信息的“驻留模块”——“话题精华模块”。发现模块是挖掘全局的有价值的信息,而“话题精华模块”挖掘的是该话题的有价值的信息,从而使有价值的信息在不同的组织维度上得到“驻留”,而不被浩大的信息流冲的无影无踪。

收藏模块

收藏模块解决了用户不能将有价值的信息点从信息大河里“舀”出来,信息可见而不可用,无法产生长效作用的问题。收藏功能是很多内容为王的网站架构中重要的一环,使用户可以从浩淼的信息流中舀出其感兴趣的那一瓢。知乎的收藏模块支持创建收藏文件夹,即用户可以对收藏内容再组织,存放到相应的收藏文件夹中。

此外知乎的收藏模块还走的更远,用户组织的收藏夹可以设置为“公有”状态,并分享给其他用户。也就是用户的利己行为(收藏自己感兴趣或者有帮助的内容),产生了利他的效果(其他用户也能看到由别人的收藏夹并从中获益)。从内容组织角度上来说,知乎的收藏夹不但提供了将信息“舀”出保存的作用,而且也起到将优质信息“驻留”与“上浮”的作用。

知乎日报模块

知乎日报模块是一个比较特殊的模块,它并不是知乎的主体模块,你可以将其理解成知乎产品的衍生模块,它事实上也从另外一个角度在解答信息价值被严重挥霍的问题。知乎日报模块与知乎主体模块采用松耦合的架构模式,它是对知乎这个庞大的优质内容生产机器的二次开发。知乎日报采取“日报”的方式,每天对知乎中产生的经典内容做一次组织成刊。知乎日报简单的布局、呈现方式,更加符合人们在移动端的阅读习惯,使那些觉得在移动端使用知乎不方便的用户,或者想在碎片时间里进行阅读的用户,有一个更加贴心的知乎产品可以选择。


相关 [深度 知乎 目前] 推荐:

深度剖析知乎目前的内容架构模型

- - 互联网分析沙龙 - 干货
本文深度剖析知乎目前的内容架构模型,对于社区应用开发者可将其中的架构思维推广到一般 UGC 网站产品的优化上. 知乎是目前国内用户平均素质最高的网站,其日均访问 IP 在 60 万以上. 对于这样一个用户活跃度极高、产出大量优质内容(UGC)网站来说,如何把内容更好地组织呈现并将其中优质部分的价值最大化,非常重要.

目前人脸识别技术的挑战是什么? - 知乎

- -
也是放假太闲,上知乎来锻炼一下手指. 在回答题主的问题的时候,我觉得应该注意做『科研』和做『产品』之间的区别. 论文中汇报的人脸识别技术是属于科研的行列. 比如在LFW上99.7%,这种数字的意义更多是让搞研究的那个圈子里面的人更加直观的了解到一些情况,你也知道,通常来说这个准确率是非常高的了,所以我们可以说『人脸识别技术在.

目前中国有哪些亚文化? - 知乎

- -
目前中国可以划分出10大类的至少72种不同的亚文化群体,依据精神生活对象的不同进行分类,现罗列如下. 更新声明1:感谢大家积极参与讨论,接下来我会继续扩充列表~不过为了可读性,尽量归类整理,尤其是小众作品、小众收藏品,小众音乐类型等. 更新声明2:有一些弄进来会导致本答案被炸的圈子就还是不放了,活着更重要[飙泪笑].

基于深度卷积神经网络进行人脸识别的原理是什么? - 知乎

- -
OpenFace中实现人脸识别的pipeline. ,这个pipeline可以看做是使用深度卷积网络处理人脸问题的一个基本框架,很有学习价值,它的结构如下图所示:. 输入:原始的可能含有人脸的图像. 输出:人脸位置的bounding box. 这一步一般我们称之为“人脸检测”(Face Detection),在OpenFace中,使用的是dlib、OpenCV现有的人脸检测方法.

使用Mxnet进行图像深度学习训练工具 InsightFace - 使用篇, 如何一键刷分LFW 99.80%, MegaFace 98%. - 知乎

- -
开头先把论文和开源项目地址放一下:. InsightFace库是对我们上述论文中提出算法的开源实现. 其中不仅仅包括我们自己的算法, 也包括其他常见的人脸loss, 比如Softmax, SphereFace, AMSoftmax, CosFace, Triplet Loss等等. 除了代码实现以外, 我们还提供了打包对齐好的人脸训练数据供下载, 免除了一大堆数据准备的工作.

知乎 HBase 实践 - 知乎

- -
HBase 是一个基于 Hadoop 面向列的非关系型分布式数据库(NoSQL), 设计概念来源于谷歌的 BigTable 模型,面向实时读写、随机访问大规模数据集的场景,是一个高可靠性、高性能、高伸缩的分布式存储系统,在大数据相关领域应用广泛. HBase 系统支持对所存储的数据进行透明切分,从而使得系统的存储以及计算具有良好的水平扩展性..

知乎问答

- - 人月神话的BLOG
没有编程经验的,至少需要掌握哪些知识,才能胜任软件产品的需求分析工作. 在这里首先要注意编程经验和懂编程,编码和软件工程是两回事情. 举个例子你没有在生产线做过工人,但是不代表你不可以了解一个产品从原材料开始如何从生产线生产出来的. 你可以当生产线去参观和学习,当然如果你能够在生产线实习一段时间印象更加深刻.

知乎的困境

- zhengyun - 无网不剩
为什么有的照片拍出来建筑物是倾斜的. 陈奕迅的『爱情转移』到底想要表达什么. iphone4升级到ios5 beta3后,可不可以降到4.3.3. 第一反应是到知乎提问,且能在较短时间内得到满意的答复,那么知乎就成了. 其实从产品上是完全可以应付的,最难的是用户为什么要来这里提问. 如果我有iphone4,第一反应肯定是去weiphone.