LinkedIn架构这十年

- - 鸟窝

原文： A Brief History of Scaling LinkedIn. Josh Clemm是LinkedIn的高级工程经理，自2011年加入LinkedIn. 他最近(2015/07/20)写了一篇文章，介绍了LinkedIn针对用户规模急速扩大带来的架构方面的变革. 文章有点像子柳写的淘宝技术这十年.

从LinkedIn的数据处理机制学习数据架构

- - 博客 - 伯乐在线

LinkedIn.com是当今最流行的专业社交网站之一，本文描述了LinkedIn.com是如何管理数据的. 如你对文中的观点有异议亦或文中有遗漏的部分请随时告诉我. LinkedIn.com数据用例. 下面是一些数据用例，可能我们在浏览LinkedIn网页时都已经看到过了. 更新后的个人资料后几乎可以实时的出现在招聘搜索页面.

中国的LinkedIn们

- - It Talks-魏武挥的blog

我倒并不想完全断言中国BSNS没有一点点的未来，但做生意是真金白银的消耗，非常讲究一个timing问题. 中国BSNS，要想走出中国的LinkedIn的道路，恐怕得花上比LinkedIn自身发展更长的时间. 与目前股价一路扶摇直上的LinkedIn相比，中国的BSNS（商务社交，也有自称PSNS专业社交的）显得有些不愠不火，差强人意.

向LinkedIn学习什么

- 车东 - 《商业价值》杂志

准确的定位和极优的数据整理能力，是LinkedIn最终成功的原因. 中国模仿者们需要模仿到基因层面才会有希望. 2010年12月，美国非上市公司股票交易平台SecondMarket评选出五大估值超10亿美元的非上市公司，LinkedIn挤掉Youtube等大热门而上榜. LinkedIn这家比Facebook还早的老牌社交网站，在将近10年的互联网大潮中，一直以低调稳健但内容乏味的姿态潜行.

本周根据外电，Linkedin已经为自己的IPO做了定价，区间大致在32-35美元，预期募集资金2.71亿，估值在30-33亿美元. 这个主打所谓高端人群，74%会员受过高等教育，被誉为“职场SNS”的网络公司，拥有1亿用户，2010年营收2.43亿美元，利润1500多万. 据公司声称，在linkedin上，有200万个公司页面，73%的财富100强公司用过它的招聘解决方案，世界500强则全数成为它的会员.

[原]LinkedIn Cubert安装指南

- - OopsOutOfMemory盛利的博客

最近工作需要，调研了一下LinkedIn开源的用于复杂大数据分析的高性能计算引擎Cubert. 自己测了下，感觉比较适合做报表统计中的Cube计算和Join计算，效率往往比Hive高很多倍，节省资源和时间. 下面看下这个框架的介绍：. Cubert完全用Java开发，并提供一种脚本语言. 它是针对报表领域里经常出现的复杂连接和聚合而设计的.

用户到底如何使用 LinkedIn?

- jl1987 - 爱范儿 · Beats of Bits

作为最热门的职业社交网络，LinkedIn 正以每秒增加一位新注册用户的速度快速扩张. 近日，由互联网调研公司 Lab42 根据500位LinkedIn用户的调查反馈，制作了一张名为 “The LinkedIn Profile”的信息图. 调查问卷就用户使用LinkedIn 网站的目的和效果进行了分析和归总.

LinkedIn CEO：人们没空玩Google+

- Ice - cnBeta.COM

据国外媒体报道，LinkedIn CEO 杰夫・威纳(Jeff Weiner)认为，人们没空去玩Google+. 当被问及社交网络是否有共存的数量限制时，威纳表示，谷歌必须变得更社交化，但他质疑在这点上谷歌能走多远.

从 LinkedIn 发现企业家“基因”

- danefy - 爱范儿 · Beats of Bits

或许是 Facebook, Apple 的故事太耳熟能详了，以致让许多年轻人都觉得“创业需趁早”，“名校毕业的人创业成功几率更大”……诸如此类的想法多多少少给科技公司企业家打上了许多失实的标签. 为了通过数据找到真实原貌，LinkedIn 高级数据研究员 Monica Rogati 通过筛选了1万名科技公司创始人的个人资料，并基于他们的个人背景为我们描绘了一名美国出生的科技公司企业家的大致图景.

Linkedin 大数据生态系统

- - 冰火岛

随着hadoop及其生态系统技术的应用，海量数据挖掘和机器学习算法在实际项目中的作用不断增加. Linkedin的大数据生态系统主要基于hadoop,hive,pig等，从而帮助数据科学家和机器学习研究人员从海量数据中抽取知识，构建新的数据产品特征. 实际上，主要是为了解决最后一公里，提出一套丰富的开发生态系统.

LinkedIn架构这十年

早期

Leo

Member Graph (会员关系图)

Replica read DBs (多个只读数据库副本)

Service Oriented Architecture (面向服务的架构)

cache (缓存)

Kafka

Inversion(反转)

近几年

Rest.li

Super Blocks (超级块)

Multi-Data Center (多数据中心)

我们还做了哪些工作？

下一步

相关 [linkedin 架构十年] 推荐：