Spark生态圈之——Elasticsearch与Solr

- - 企业架构 - ITeye博客

Elasticsearch简介. Elasticsearch是一个实时的分布式搜索和分析引擎. 它可以帮助你用前所未有的速度去处理大规模数据. 它可以用于全文搜索，结构化搜索以及分析，当然你也可以将这三者进行组合. Elasticsearch是一个建立在全文搜索引擎 Apache Lucene™ 基础上的搜索引擎，可以说Lucene是当今最先进，最高效的全功能开源搜索引擎框架.

Spark Streaming + Elasticsearch构建App异常监控平台

- - 美团点评技术团队

本文已发表在《程序员》杂志2016年10月期. 如果在使用App时遇到闪退，你可能会选择卸载App、到应用商店怒斥开发者等方式来表达不满. 但开发者也同样感到头疼，因为崩溃可能意味着用户流失、营收下滑. 为了降低崩溃率，进而提升App质量，App开发团队需要实时地监控App异常. 一旦发现严重问题，及时进行热修复，从而把损失降到最低.

ElasticSearch位置搜索 - Spring , Hadoop, Spark , BI , ML - CSDN博客

- -

在ElasticSearch中，地理位置通过. geo_point这个数据类型来支持. 地理位置的数据需要提供经纬度信息，当经纬度不合法时，ES会拒绝新增文档. 这种类型的数据支持距离计算，范围查询等. mapping为city:. geo_point类型必须显示指定，ES无法从数据中推断. 在ES中，位置数据可以通过对象，字符串，数组三种形式表示，分别如下：.

实例展示elasticsearch集群生态,分片以及水平扩展. - 苏若年

- - 博客园_首页

　　elasticsearch用于构建高可用和可扩展的系统. 扩展的方式可以是购买更好的服务器(纵向扩展)或者购买更多的服务器（横向扩展）,Elasticsearch能从更强大的硬件中获得更好的性能，但是纵向扩展也有一定的局限性. 真正的扩展应该是横向的，它通过增加节点来传播负载和增加可靠性. 对于大多数数据库而言，横向扩展意味着你的程序将做非常大的改动来利用这些新添加的设备.

Spark概览

- - 简单文本

Spark具有先进的DAG执行引擎，支持cyclic data flow和内存计算. 因此，它的运行速度，在内存中是Hadoop MapReduce的100倍，在磁盘中是10倍. 这样的性能指标，真的让人心动啊. Spark的API更为简单，提供了80个High Level的操作，可以很好地支持并行应用.

我本人是类似Hive平台的系统工程师，我对MapReduce的熟悉程度是一般，它是我的底层框架. 我隔壁组在实验Spark，想将一部分计算迁移到Spark上. 年初的时候，看Spark的评价，几乎一致表示，Spark是小数据集上处理复杂迭代的交互系统，并不擅长大数据集，也没有稳定性. 但是最近的风评已经变化，尤其是14年10月他们完成了Peta sort的实验，这标志着Spark越来越接近替代Hadoop MapReduce了.

Spark迷思

- - ITeye博客

目前在媒体上有很大的关于Apache Spark框架的声音，渐渐的它成为了大数据领域的下一个大的东西. 证明这件事的最简单的方式就是看google的趋势图：. 上图展示的过去两年Hadoop和Spark的趋势. Spark在终端用户之间变得越来越受欢迎，而且这些用户经常在网上找Spark相关资料. 这给了Spark起了很大的宣传作用；同时围绕着它的也有误区和思维错误，而且很多人还把这些误区作为银弹，认为它可以解决他们的问题并提供比Hadoop好100倍的性能.

Spark 优化

- - CSDN博客推荐文章

提到Spark与Hadoop的区别，基本最常说的就是Spark采用基于内存的计算方式，尽管这种方式对数据处理的效率很高，但也会往往引发各种各样的问题，Spark中常见的OOM等等. 效率高的特点，注定了Spark对性能的严苛要求，那Spark不同程序的性能会碰到不同的资源瓶颈，比如：CPU，带宽、内存.

[译]elasticsearch mapping

- - an74520的专栏

es的mapping设置很关键，mapping设置不到位可能导致索引重建. 请看下面各个类型介绍^_^. 每一个JSON字段可以被映射到一个特定的核心类型. JSON本身已经为我们提供了一些输入,支持 string, integer/ long, float/ double, boolean, and null..

Elasticsearch as Database - taowen - SegmentFault

- -

【北京上地】滴滴出行基础平台部招聘 Elasticsearch 与 Mysql binlog databus 开发工程师. 内推简历投递给： [email protected]. 推销Elasticsearch. 时间序列数据库的秘密（1）—— 介绍. 时间序列数据库的秘密（2）——索引.

Spark生态圈之——Elasticsearch与Solr

搜索引擎选型调研文档

Elasticsearch简介 ^*

Elasticsearch的优缺点 ^* ^*:

优点

缺点

Solr简介 ^*

Solr的优缺点

优点

缺点

Elasticsearch与Solr的比较 ^*

实际生产环境测试 ^*

Elasticsearch 与 Solr 的比较总结

其他基于Lucene的开源搜索引擎解决方案 ^*

相关 [spark 生态 elasticsearch] 推荐：