从分布式存储设计到自动化运维

- - 五四陈科学院-坚信科学，分享技术

以下内容由 [五四陈科学院]提供. http://www.infoq.com/cn/articles/nosql-dynamo 三年前在infoq发表的一篇关于两种特别有代表性的分布式存储的设计思路解析，三年过去了，今天再来总结看看这几年的变化. 实际上，这三年，还是两个东西，一直没有冒出来更牛B的东西.

在前文《多IDC的数据分布设计(一)》中介绍了多IDC数据一致性的几种实现原理，遗憾的是，目前虽然有不少分布式产品，但几乎都没有开源的产品专门针对IDC来优化. 本文从实践的角度分析各种方法优缺点. 背景资料 Latency差异. Jeff Dean提到不同数据访问方式latency差异. 这个数据对于我们设计多IDC数据访问策略具有关键的指导作用，我们可以用这个数据来衡量数据架构来如何设计才能满足高并发低延迟的目标.

分布式系统设计策略

- - 互联网 - ITeye博客

摘自《深入分布式缓存：从原理到实践》. 分布式系统本质是通过低廉的硬件攒在一起以获得更好地吞吐量、性能以及可用性等. 分布式系统有一些通用的设计策略，也是在分布式环境下普遍关心的几个问题：. 在分布式环境中，一般会有多个节点来分担任务的运行、计算或程序逻辑处理. 如上图所示，Client请求Server，Server转发请求到具体的Node获取请求结果.

后端分布式系列：分布式存储－HDFS 与 GFS 的设计差异

- - mindwind

「后端分布式系列」前面关于 HDFS 的一些文章介绍了它的整体架构和一些关键部件的设计实现要点. 我们知道 HDFS 最早是根据 GFS（Google File System）的论文概念模型来设计实现的. 然后呢，我就去把 GFS 的原始论文找出来仔细看了遍，GFS 的整体架构图如下：. HDFS 参照了它所以大部分架构设计概念是类似的，比如 HDFS NameNode 相当于 GFS Master，HDFS DataNode 相当于 GFS chunkserver.

【分布式系统工程实现】GFS&Bigtable设计的优势

- hikerlive - 淘宝核心系统团队博客

目前，知名度比较高的通用存储系统包括：Google GFS&Bigtable，Amazon Dynamo，Microsoft Azure存储系统及Yahoo PNUTS. 其中，GFS&Bigtable，Azure存储系统及Yahoo PNUTS都有总控节点，Amazon Dynamo采用去中心化的P2P设计.

分布式系统的设计几个要注意的地方

- - CSDN博客推荐文章

最近在做系统升级，由于当时设计的局限，导致系统不停服，保证服务的做法非常麻烦. 当时再定方案的时候，由于自己在这方面没有经验，导致有些乐观. 到了实际做的时候，预期时间至少比预想的多了一周的时间，要知道，在. 互联网公司，一周的时间是个非常长的时间. 在这里总结一下分布式系统设计的大忌，本来想试着分一下级，但是还是算了，一来标准太多，无法制定一个合适的规则来界定；二来自己的经验也在增长，低调一下是自己也没详细的研究过超过5个分布式系统；三来做事情还是要严谨，不做没有十足把握的事情.

分布式日志收集系统Apache Flume的设计介绍

- - CSDN博客架构设计推荐文章

Flume是Cloudera公司的一款高性能、高可能的分布式日志收集系统. 现在已经是Apache Top项目. 同Flume相似的日志收集系统还有 Facebook Scribe， Apache Chuwka， Apache Kafka(也是LinkedIn的). Flume是后起之秀，本文尝试简要分析Flume数据流通过程中提供的组件、可靠性保证来介绍Flume的主要设计，不涉及Flume具体的安装使用，也不涉及代码层面的剖析.

[转] 分布式存储系统(GlusterFS, Swift, Cassandra)设计对比

- - 忘我的追寻

之前转过一篇分布式文件系统比较的文章，几大分布式文件系统全方位比较，这里再从存储的角度转一个. 应该说者三个开源软件各自侧重的领域不一样，但是都具备分布式存储的特征，因此这篇文章主要是从存储的角度来进行对比. 1、文件定位：三者均采用hash算法，另外amazon的Dynamo也是采用一致性哈希；还有采用中心路由的定位方式：如HBASE,HDFS.

分布式场景，唯一键的设计

- - sling2007的博客

分布式场景下，如何设计唯一键. 方法1、集群中每个机器分配一个唯一的id，比如用1、2、3、4来标识，那么每个机器生成唯一键的时候，只需要考虑在自己内部唯一即可，然后加上个用自己的机器id的前缀或者后缀. 这种方法最简单，实现起来也方便. 方法2、用zookeeper做一个分布式锁，在生成id的时候，先获取这个锁，然后生成唯一键，然后释放，然后下一次生成.

高并发服务端分布式系统设计概要

- - 博客 - 伯乐在线

写这篇文章的目的，主要是把今年以来学习的一些东西积淀下来，同时作为之前文章《高性能分布式计算与存储系统设计概要》的补充与提升，然而本人水平非常有限，回头看之前写的文章也有许多不足，甚至是错误，希望同学们看到了错误多多见谅，更欢迎与我讨论并指正. 我大概是从2010年底起开始进入高并发、高性能服务器和分布式这一块领域的研究，到现在也差不多有三年，但其实很多东西仍然是一知半解，我所提到的许许多多概念，也许任何一个我都不能讲的很清楚，还需要继续钻研.

从分布式存储设计到自动化运维

相关 [分布设计自动化] 推荐：