分布式对象存储系统Sheepdog性能测试

对象缓存	IOPS	吞吐量（MB/s）
无	只读250，读写混合（4:1）200	数据块512KB，顺序读150，顺序写35
有	只读45000，读写混合（4:1）16000	数据块512KB，顺序读175，顺序写105；数据块4MB，顺序读240，顺序写130

- - UC技术博客

Sheepdog是一个分布式对象存储系统，专为虚拟机提供块存储，号称无单点、零配置、可线性扩展（省略更多优点介绍）. 本文主要关注其性能究竟如何，测试版本为目前的最新稳定版0.7.4. 磁盘：各节点都配备7200转SATA硬盘，型号WDC WD10EZEX-22RKKA0，容量为1TB，另外测试节点（即用于启动虚拟客户机的宿主机）多配置一块SSD硬盘，型号INTEL SSDSA2CW300G3，容量为300GB.

Hadoop分布式文件系统HDFS和OpenStack对象存储系统Swift有何不同？

- - ITeye博客

HDFS使用集中式单一节点架构(NameNode)来维护文件系统元数据，而在Swift中，元数据分布在整个集群中并拥有多个副本. 注意：集中式元数据存储使HDFS存在单点故障和扩展性问题，因此规模越大就性能越低，就越难扩展甚至不能扩展，所幸的是HDFS2使用NameNode HA和HDFS Federation解决了这两个问题.

新系统自动判断软件对象的交互

- SotongDJ - Solidot

过去四十年，软件工程中的一大创新是面向对象的编程语言. “对象”实际上是程序的软件库，让程序员从计算细节上转移注意力到更重要的编程任务上. 一个复杂的程序有数百万行代码，如果程序员从头开始参与项目，他可以方便对面向对象的程序增添功能；但如果程序员是中途进来参与大项目，了解现有对象的互动可能有些难度，需要颇费一段时间.

多重继承及虚继承中对象内存的分布

- Michael - 淘宝数据平台与产品部官方博客 tbdata.org

这篇文章主要讲解G++编译器中虚继承的对象内存分布问题，从中也引出了dynamic_cast和static_cast本质区别、虚函数表的格式等一些大部分C++程序员都似是而非的概念. 问题拿捏得十分到位，下面是我对原文的翻译，原文见这里(By Edsko de Vries, January 2006).

分布式缓存系统 Xixibase

- Le - 开源中国社区最新软件

Xixibase是一个高性能，跨平台的分布式缓存系统. Xixibase server 采用 C++ 实现，底层网络库采用的是Boost Asio. Xixibase 主要特点： 1. 实现'Local Cache'功能, 当客户端打开'Local Cache'选项, 客户端可以将数据同时存储在Server 端和本地，并且保证本地数据和Server 端的数据的一致性.

分布式检索系统 ElasticSearch

- - 丕子

ElasticSearch最近发展不错，github等都用它，可以关注I下. ElasticSearch是分布式,REST风格,搜索和分析系统. 具有实时数据，实时分析，分布式，高可用性，多租户，全文搜索，面向文档，冲突管理，自由模式，rest风格API，每个操作的持久性，Apache 2的开源许可证，基于Apache Lucene之上的特点.

分布式消息系统：Kafka

- - 标点符

Kafka是分布式发布-订阅消息系统. 它最初由LinkedIn公司开发，之后成为Apache项目的一部分. Kafka是一个分布式的，可划分的，冗余备份的持久性的日志服务. 在大数据系统中，常常会碰到一个问题，整个大数据是由各个子系统组成，数据需要在各个子系统中高性能，低延迟的不停流转. 传统的企业消息系统并不是非常适合大规模的数据处理.

分布式系统介绍-PNUTS

- - CSDN博客推荐文章

PNUTS是Yahoo!的分布式数据库系统，支持地域上分布的大规模并发操作. 它根据主键的范围区间或者其哈希值的范围区间将表拆分为表单元（Tablet），多个表单元存储在一个服务器上. 一个表单元控制器根据服务器的负载情况，进行表单元的迁移和拆分. 每条记录的数据都没有固定的模式（采用JSON格式的文本）.

Ganglia：分布式监控系统

- - CSDN博客移动开发推荐文章

1 环境安装配置. 1.1 依赖软件下载. Ganglia是伯克利开发的一个集群监控软件. 可以监视和显示集群中的节点的各种状态信息，比如如：cpu 、mem、硬盘利用率， I/O负载、网络流量情况等，同时可以将历史数据以曲线方式通过php页面呈现. 而ganglia又依赖于一个web服务器用来显示集群状态，用rrdtool来存储数据和生成曲线图，需要xml解析因此需要expat，配置文件解析需要libconfuse.

kafka分布式消息系统

- - CSDN博客云计算推荐文章

Kafka[1]是linkedin用于日志处理的分布式消息队列，linkedin的日志数据容量大，但对可靠性要求不高，其日志数据主要包括用户行为（登录、浏览、点击、分享、喜欢）以及系统运行日志（CPU、内存、磁盘、网络、系统及进程状态）. 当前很多的消息队列服务提供可靠交付保证，并默认是即时消费（不适合离线）.

分布式对象存储系统Sheepdog性能测试

测试环境

IOPS测试

测试须知

关于SATA硬盘的IOPS

关于SSD硬盘的IOPS

关于读写比例

关于电梯算法

IOPS测试1：不使用对象缓存，只读测试

IOPS测试2：使用对象缓存，只读测试

IOPS测试3：不使用对象缓存，读写混合测试

IOPS测试4：使用对象缓存，读写混合测试

吞吐量测试

测试须知

关于SATA硬盘的吞吐量

关于SSD硬盘的吞吐量

无优化sheepdog的吞吐量

吞吐量测试1：不使用对象缓存

吞吐量测试2：使用对象缓存

总结sheepdog性能

相关 [分布对象系统] 推荐：