Elasticsearch开发人员最佳实战指南

[译]为什么ElasticSearch应用开发者需要了解cluster state

- - SegmentFault 最新的文章

在前面的文章( ES vs Solr)中我们提到, ES构建了Loggly的很多核心功能. 在把这项通用搜索技术用于我们的日志管理系统, 并为超过5000多客户提供准实时服务的过程中, 我们在技术上成长颇多. 按照我们对开源社区的尊重, 在此希望能把我们所学到的知识回馈到社区. 本文将探讨对ES扩展过程中的性能有深远影响的关键概念: cluster state..

Elasticsearch开发人员最佳实战指南

- -

几个月以来，我一直在记录自己开发Elasticsearch应用程序的最佳实践. 本文梳理的内容试图传达Java的某些思想，我相信其同样适用于其他编程语言. 我尝试尽量避免重复教程和Elasticsearch官方文档中已经介绍的内容. 本文梳理的内容都是从线上实践问题和个人总结的经验汇总得来的. 文章从以下几个维度展开讲解：.

Elasticsearch 开发实战常用命令清单

- -

Elasticsearch 具有一组丰富的易于理解的 REST API，这些 API 均可如下几种方式通过 HTTP 调用进行访问. 开发实战环节，我推荐使用：kibana Dev-tools. 本文结合多年实战经验和网络资源，梳理出开发环节最重要的命令清单，希望对你有帮助. 1、Elasticsearch REST URL 拆解.

[译]elasticsearch mapping

- - an74520的专栏

es的mapping设置很关键，mapping设置不到位可能导致索引重建. 请看下面各个类型介绍^_^. 每一个JSON字段可以被映射到一个特定的核心类型. JSON本身已经为我们提供了一些输入,支持 string, integer/ long, float/ double, boolean, and null..

Elasticsearch as Database - taowen - SegmentFault

- -

【北京上地】滴滴出行基础平台部招聘 Elasticsearch 与 Mysql binlog databus 开发工程师. 内推简历投递给： [email protected]. 推销Elasticsearch. 时间序列数据库的秘密（1）—— 介绍. 时间序列数据库的秘密（2）——索引.

ElasticSearch 2 的节点调优（ElasticSearch性能）

- - 行业应用 - ITeye博客

一个ElasticSearch集群需要多少个节点很难用一种明确的方式回答，但是，我们可以将问题细化成一下几个，以便帮助我们更好的了解，如何去设计ElasticSearch节点的数目：. 打算建立多少索引，支持多少应用. elasticsearch版本: elasticsearch-2.x. 需要回答的问题远不止以上这些，但是第五个问题往往是容易被我们忽视的，因为单个ElasticSearch集群有能力支持多索引，也就能支持多个不同应用的使用.

Elasticsearch：使用 Elasticsearch 进行语义搜索

- - 掘金后端

在数字时代，搜索引擎在通过浏览互联网上的大量可用信息来检索数据方面发挥着重要作用. 此方法涉及用户在搜索栏中输入特定术语或短语，期望搜索引擎返回与这些确切关键字匹配的结果. 虽然关键字搜索对于简化信息检索非常有价值，但它也有其局限性. 主要缺点之一在于它对词汇匹配的依赖. 关键字搜索将查询中的每个单词视为独立的实体，通常会导致结果可能与用户的意图不完全一致.

elasticsearch的javaAPI之query

- - CSDN博客云计算推荐文章

elasticsearch的javaAPI之query API. the Search API允许执行一个搜索查询,返回一个与查询匹配的结果（hits）. 它可以在跨一个或多个index上执行，或者一个或多个types. 查询可以使用提供的 query Java API 或filter Java API.

Elasticsearch基础教程

- - 开源软件 - ITeye博客

转自:http://blog.csdn.net/cnweike/article/details/33736429. Elasticsearch有几个核心概念. 从一开始理解这些概念会对整个学习过程有莫大的帮助. 接近实时（NRT）. Elasticsearch是一个接近实时的搜索平台.

ElasticSearch索引优化

- - 行业应用 - ITeye博客

ES索引的过程到相对Lucene的索引过程多了分布式数据的扩展，而这ES主要是用tranlog进行各节点之间的数据平衡. 所以从上我可以通过索引的settings进行第一优化：. 这两个参数第一是到tranlog数据达到多少条进行平衡，默认为5000，而这个过程相对而言是比较浪费时间和资源的. 所以我们可以将这个值调大一些还是设为-1关闭，进而手动进行tranlog平衡.

Elasticsearch开发人员最佳实战指南

题记

1、映射（Mapping）

1.1 避免使用nested类型

1.2 Mapping设置strict

1.3 合理的设置string类型

2、设置（Setting）

2.1 避免过度分片

2.2 取消学习任何段合并的技巧

2.3 注意JVM内存设置

3、查询方式（Querying）

3.1 Elasticseach里面多线程修改如何保证数据准确性？

3.2 尝试分割复杂的查询，并行执行提升性能

3.3 了解你的数字类型，防止被优化导致精度损失

3.4 不要使用Elasticsearch Transport / Node客户端

3.5 使用官方的Elasticsearch High-level REST客户端

3.6 不要使用HTTP缓存来缓存Elasticsearch响应结果

3.7 使用基于_doc排序的slice scroll 遍历数据

3.8 单文档检索 优先使用 GET /index/type/{id}而非POST /index/_search

3.9 使用size: 0和includes/ excludes限定字段返回

3.10 提前做好压力测试，了解系统支持的上限

3.11 在查询中提供明确的超时

3.12 不要使用注入变量的JSON模板

4、实战技巧（Strategy）

4.1 始终（尝试）坚持使用最新的JVM和ES版本

4.2 使用Elasticsearch完整和部分快照进行备份

4.3 有一个持续的性能测试平台

4.4 使用别名

4.5 避免拥有大量同义词

4.6 在启用副本之前强制段合并及增加带宽

4.7 记录应用程序级别指标

4.8 重视CPU的配置选型和使用率监控

4.9 谨慎编写自定义的Elasticsearch插件

5、小结

相关 [elasticsearch 开发] 推荐：

相关文章

订阅

3.8 单文档检索优先使用 GET /index/type/{id}而非POST /index/_search