Elasticsearch 集群规模和容量规划的底层逻辑

角色	描述	存储	内存	计算	网络
数据节点	存储和检索数据	极高	高	高	中
主节点	管理集群状态	低	低	低	低
Ingest 节点	转换输入数据	低	中	高	中
机器学习节点	机器学习	低	极高	极高	中
协调节点	请求转发和合并检索结果	低	中	中	中

节点类型	存储目标	建议磁盘类型	内存/磁盘比率
热节点	搜索优化	SSD DAS / SAN（> 200Gb / s）	1:30
暖节点	存储优化	HDD DAS / SAN（〜100Gb / s）	1:160
冷节点	归档优化	最便宜的 DAS / SAN（<100Gb / s）	1:1000+

- - IT瘾-dev

问题 1：请问下大家是如何评估集群的规模. 比如数据量达到百万，千万，亿万，分别需要什么级别的集群，这要怎么评估. ps：自己搭建的测试环境很难达到这一级别. 问题 3：我看了很多文章关于 es 集群规划的文章，总感觉乱七八糟的，没有一个统一的规划思路. 如何根据硬件条件和数据量来规划集群，设置多少节点，每个节点规划多少分片和副本.

之前对于CDN的日志处理模型是从 . logstash agent==>>redis==>>logstash index==>>elasticsearch==>>kibana3，对于elasticsearch集群搭建，可以把索引进行分片存储，一个索引可以分成若干个片，分别存储到集群里面，而对于集群里面的负载均衡，副本分配，索引动态均衡（根据节点的增加或者减少）都是elasticsearch自己内部完成的，一有情况就会重新进行分配.

Elasticsearch集群入门

- - 编程语言 - ITeye博客

欢迎来到Elasticsearch的奇妙世界，它是优秀的全文检索和分析引擎. 不管你对Elasticsearch和全文检索有没有经验，都不要紧. 我们希望你可以通过这本书，学习并扩展Elasticsearch的知识. 由于这本书也是为初学者准备的，我们决定先简单介绍一般性的全文检索概念，接着再简要概述Elasticsearch.

elasticsearch 1.x集群优化

- - ITeye博客

欢迎发送邮件至 [email protected]. 本博文为 Elasticsearch Server2nd的部分第7章部分章节的翻译，版权归原作者. 设置Filter cache. 缓存是提高性能的很重要的手段，es中的filter cache能够把搜索时的filter条件的结果进行缓存，当进行相同的filter搜索时（query不同，filter条件相同）,es能够很快的返回结果.

elasticsearch集群监控工具bigdesk

- - zzm

bigdesk是elasticsearch的一个集群监控工具，可以通过它来查看es集群的各种状态，如：cpu、内存使用情况，索引数据、搜索情况，http连接数等. 项目git地址： https://github.com/lukas-vlcek/bigdesk. 和head一样，它也是个独立的网页程序，使用方式和head一样.

Elasticsearch集群的脑裂问题

- - 互联网 - ITeye博客

所谓脑裂问题（类似于精神分裂），就是同一个集群中的不同节点，对于集群的状态有了不一样的理解. 今天，Elasticsearch集群出现了查询极端缓慢的情况，通过以下命令查看集群状态：. 发现，集群的总体状态是red，本来9个节点的集群，在结果中只显示了4个；但是，将请求发向不同的节点之后，我却发现即使是总体状态是red的，但是可用的节点数量却不一致.

Elasticsearch 索引容量管理实践

- -

作者：gavinyao，腾讯 PCG 后台开发工程师. Elasticsearch 是目前大数据领域最热门的技术栈之一，腾讯云 Elasticsearch Service（ES）是基于开源搜索引擎 Elasticsearch 打造的高可用、可伸缩的云端全托管 Elasticsearch 服务，完善的高可用解决方案，让业务可以放心的把重要数据存储到腾讯云 ES 中.

ElasticSearch-2.0.0集群安装配置与API使用实践

- - 简单之美

ElasticSearch是基于全文搜索引擎库Lucene构建的分布式搜索引擎，我们可以直接使用ElasticSearch实现分布式搜索系统的搭建与使用，都知道，Lucene只是一个搜索框架，它提供了搜索引擎操作的基本API，如果要实现一个能够使用的搜索引擎系统，还需要自己基于Lucene的API去实现，工作量很大，而且还需要很好地掌握Lucene的底层实现原理.

基于docker环境实现Elasticsearch 集群环境

- - 学习日志

最近搭建了es集群的时候，现在需要测试添加一个新的数据节点，项目是使用docker-compose命令来搭建的. 以下基于最新版本 es7.2.0进行. // docker-compose.yaml 集群配置文件. 集群配置了3个master节点，并同时作为数据节点使用，当节点未指定 node.master和node.data的时候，默认值为 true.

我在 Elasticsearch 集群内应该设置多少个分片？

- -

Elasticsearch 是一个功能十分丰富的平台，支持各种用例，能够在数据整理和复制战略方面提供很大的灵活性. 然而这一灵活性有时也会带来困扰，让您在前期难以确定如何最好地将数据整理为索引和分片，如果您刚上手使用 Elastic Stack，这一点可能更明显. 如果未能做出最佳选择，尽管这在开始的时候可能不会造成问题，但随着数据量越来越大，便有可能会引发性能问题.

Elasticsearch 集群规模和容量规划的底层逻辑

0、引言

1、Elasticsearch 基础架构

1.1 自顶向下的架构体系

1.2 节点角色划分及资源使用情况

2、维系 Elasticsearch 高性能的资源组成

2.1 存储资源

2.1.1 存储介质

2.1.2 存储建议

2.2 内存资源

2.2.1 JVM Heap

2.2.2 操作系统缓存

2.3 计算资源

2.4 网络资源

3、数据增删改查操作

3.1 增/索引数据处理流程

3.2 删除数据处理流程

3.3 更新数据处理流程

3.4 检索操作处理流程

3.5 用例场景

4、Elasticsearch 索引化流程

4.0 概述

4.1 Json 转换

4.2 数据索引化

4.3 数据压缩

4.4 副本分片拷贝

4.5 完整示例

5、集群规模和容量规划预估方法

5.1 数据量预估

5.2 分片预估

5.3 搜索吞吐量预估

5.4 冷热集群架构

5.5 集群节点角色划分

6 小结

相关 [elasticsearch 集群 容量] 推荐：

相关文章

订阅

相关 [elasticsearch 集群容量] 推荐：