从LinkedIn的数据处理机制学习数据架构

- - 博客 - 伯乐在线

LinkedIn.com是当今最流行的专业社交网站之一，本文描述了LinkedIn.com是如何管理数据的. 如你对文中的观点有异议亦或文中有遗漏的部分请随时告诉我. LinkedIn.com数据用例. 下面是一些数据用例，可能我们在浏览LinkedIn网页时都已经看到过了. 更新后的个人资料后几乎可以实时的出现在招聘搜索页面.

向LinkedIn学习什么

- 车东 - 《商业价值》杂志

准确的定位和极优的数据整理能力，是LinkedIn最终成功的原因. 中国模仿者们需要模仿到基因层面才会有希望. 2010年12月，美国非上市公司股票交易平台SecondMarket评选出五大估值超10亿美元的非上市公司，LinkedIn挤掉Youtube等大热门而上榜. LinkedIn这家比Facebook还早的老牌社交网站，在将近10年的互联网大潮中，一直以低调稳健但内容乏味的姿态潜行.

Linkedin 大数据生态系统

- - 冰火岛

随着hadoop及其生态系统技术的应用，海量数据挖掘和机器学习算法在实际项目中的作用不断增加. Linkedin的大数据生态系统主要基于hadoop,hive,pig等，从而帮助数据科学家和机器学习研究人员从海量数据中抽取知识，构建新的数据产品特征. 实际上，主要是为了解决最后一公里，提出一套丰富的开发生态系统.

linkedin 数据科学实习的5个经验总结

- - 冰火岛

这些可以使接下来的工作更加简单，结果更加可信. As a data scientist at LinkedIn, you have access to Petabytes of data (1 Petabyte as much data as is transferred when viewing HDTV for about 13.5 years).

揭秘LInkedin数据科学家如何工作

- - 互联网分析

在互联网企业中，LinkedIn是一家出了名的“慢公司”，但LinkedIn也是最成功的社交网络，用户品质、广告价值都是行业翘楚，秘密在于LinkedIn有一个高效的数据科学家团队. 作为社交网络， LinkedIn并不是最大的，也不是生长最快的. 成立于2003年的LinkedIn, 花了500天，才达到了100万用户.

LinkedIn是如何利用数据分析驱动产品的？

- - PingWest中文网

让我们看看这家全球最大的职业社交网站、第三大社交网络的运营数据. 目前，LinkedIn有着2.7亿注册用户，大约400万家公司入驻，已经成为了职场人士最重要的在线交流和招聘求职平台. 更引人注意的是它对高端企业用户的吸引力：大约90％左右的TOP100企业在使用Linkedin的服务. 从它的营收数据中也可以看出这些业务的增长潜力.

LinkedIn实时低延迟数据抓取系统Databus开源

- - InfoQ cn

去年的架构师峰会上，来自LinkedIn的高级软件工程师 Lei Gao做了一场名为《LinkedIn的数据处理架构》的演讲，着重介绍LinkedIn内部的数据基础设施的演变，其中提到Databus数据总线项目，当时就引起大家诸多好奇. 前不久，LinkedIn工程团队官方博客发布消息：Databus项目开源.

LinkedIn开源低延时变化数据捕获系统Databus

- - CSDN最新资讯

LinkedIn于2月26日开源了其低延时变化数据捕获系统Databus，该系统在低延时情况下仍然具备高有效性. 能服务于LinkedIn生态系统数年之久，除上述特性以外当然还有其不可忽视的独到之处——无限制的lookback能力及丰富的subscription功能. 文章在最后公布了Databus源码及相关下载.

首席工程师揭秘：LinkedIn大数据后台是如何运作的

- - 博客园_知识库

　　英文原文： The Log: What every software engineer should know about real-time data's unifying abstraction. 　　我在六年前的一个令人兴奋的时刻加入到LinkedIn公司. 从那个时候开始我们就破解单一的、集中式数据库的限制，并且启动到特殊的分布式系统套件的转换.

LinkedIn：2014年最吃香工作技能-统计分析和数据挖掘位列第一

- - 199IT互联网TMT数据

LinkedIn对全球超过3.3亿用户的工作经历和技能进行分析，公布 2014年最受雇主喜欢、最炙手可热的25项技能. 其中位列榜首的是统计分析和数据挖掘. 这项技能在去年只排名第五，而当时的最热技能是社交媒体营销. 25岁的Quint Gribbin是Red Owl Analytics的数据科学家.

从LinkedIn的数据处理机制学习数据架构

LinkedIn.com数据用例

早期的LinkedIn数据架构

LinkedIn如今的数据架构

在线数据库系统

离线数据库系统

近线数据库系统（时间线一致性）

用数据用例来展示它们是如何工作的

数据架构经验

参考文献

相关文章

相关 [linkedin 数据学习] 推荐：