ELK(ElasticSearch, Logstash, Kibana)搭建实时日志分析平台

标签： elk elasticsearch logstash | 发表时间：2016-01-13 12:07 | 作者：m635674608

出处：http://www.iteye.com

ELK平台介绍

在搜索ELK资料的时候，发现这篇文章比较好，于是摘抄一小段：

以下内容来自： http://baidu.blog.51cto.com/71938/1676798

日志主要包括系统日志、应用程序日志和安全日志。系统运维和开发人员可以通过日志了解服务器软硬件信息、检查配置过程中的错误及错误发生的原因。经常分析日志可以了解服务器的负荷，性能安全性，从而及时采取措施纠正错误。

通常，日志被分散的储存不同的设备上。如果你管理数十上百台服务器，你还在使用依次登录每台机器的传统方法查阅日志。这样是不是感觉很繁琐和效率低下。当务之急我们使用集中化的日志管理，例如：开源的syslog，将所有服务器上的日志收集汇总。

集中化管理日志后，日志的统计和检索又成为一件比较麻烦的事情，一般我们使用grep、awk和wc等Linux命令能实现检索和统计，但是对于要求更高的查询、排序和统计等要求和庞大的机器数量依然使用这样的方法难免有点力不从心。

开源实时日志分析ELK平台能够完美的解决我们上述的问题，ELK由ElasticSearch、Logstash和Kiabana三个开源工具组成。官方网站： https://www.elastic.co/products

Elasticsearch是个开源分布式搜索引擎，它的特点有：分布式，零配置，自动发现，索引自动分片，索引副本机制，restful风格接口，多数据源，自动搜索负载等。
Logstash是一个完全开源的工具，他可以对你的日志进行收集、过滤，并将其存储供以后使用（如，搜索）。
Kibana 也是一个开源和免费的工具，它Kibana可以为 Logstash 和 ElasticSearch 提供的日志分析友好的 Web 界面，可以帮助您汇总、分析和搜索重要数据日志。

---------------------------- 摘抄内容结束-------------------------------

画了一个ELK工作的原理图：

如图：Logstash收集AppServer产生的Log，并存放到ElasticSearch集群中，而Kibana则从ES集群中查询数据生成图表，再返回给Browser。

ELK平台搭建

系统环境

System: Centos release 6.7 (Final)

ElasticSearch: 2.1.0

Logstash: 2.1.1

Kibana: 4.3.0

Java: openjdk version "1.8.0_65"

注：由于Logstash的运行依赖于Java环境，而Logstash 1.5以上版本不低于java 1.7，因此推荐使用最新版本的Java。因为我们只需要Java的运行环境，所以可以只安装JRE，不过这里我依然使用JDK，请自行搜索安装。

ELK下载： https://www.elastic.co/downloads/

ElasticSearch

配置ElasticSearch：

?

1 2	`tar` `-zxvf elasticsearch-2.1.0.` `tar` `.gz` `cd` `elasticsearch-2.1.0`

安装Head插件（Optional）：

?

1	`.` `/bin/plugin` `install` `mobz` `/elasticsearch-head`

然后编辑ES的配置文件：

?

1	`vi` `config` `/elasticsearch` `.yml`

修改以下配置项：

?

1

2

3

4

5

6

7

cluster.name=es_cluster

node.name=node0

path.data= /tmp/elasticsearch/data

path.logs= /tmp/elasticsearch/logs

#当前hostname或IP，我这里是centos2

network.host=centos2

network.port=9200

其他的选项保持默认，然后启动ES：

?

1	`.` `/bin/elasticsearch`

可以看到，它跟其他的节点的传输端口为9300，接受HTTP请求的端口为9200。

使用ctrl+C停止。当然，也可以使用后台进程的方式启动ES：

?

1	`.` `/bin/elasticsearch` `&`

然后可以打开页面localhost:9200，将会看到以下内容：

返回展示了配置的cluster_name和name，以及安装的ES的版本等信息。

刚刚安装的head插件，它是一个用浏览器跟ES集群交互的插件，可以查看集群状态、集群的doc内容、执行搜索和普通的Rest请求等。现在也可以使用它打开 localhost:9200/_plugin/head页面来查看ES集群状态：

可以看到，现在，ES集群中没有index，也没有type，因此这两条是空的。

Logstash

Logstash的功能如下：

其实它就是一个 收集器而已，我们需要为它指定Input和Output（当然Input和Output可以为多个）。由于我们需要把Java代码中Log4j的日志输出到ElasticSearch中，因此这里的Input就是Log4j，而Output就是ElasticSearch。

配置Logstash：

?

1 2	`tar` `-zxvf logstash-2.1.1.` `tar` `.gz` `cd` `logstash-2.1.1`

编写配置文件(名字和位置可以随意，这里我放在config目录下，取名为log4j_to_es.conf)：

?

1 2	`mkdir` `config` `vi` `config` `/log4j_to_es` `.conf`

输入以下内容：

?

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

# For detail structure of this file

# Set: https: //www.elastic.co/guide/en/logstash/current/configuration-file-structure.html

input {

# For detail config for log4j as input,

# See: https: //www.elastic.co/guide/en/logstash/current/plugins-inputs-log4j.html

log4j {

mode => "server"

host => "centos2"

port => 4567

}

}

filter {

#Only matched data are send to output.

}

output {

# For detail config for elasticsearch as output,

# See: https: //www.elastic.co/guide/en/logstash/current/plugins-outputs-elasticsearch.html

elasticsearch {

action => "index" #The operation on ES

hosts => "centos2:9200" #ElasticSearch host, can be array.

index => "ec" #The index to write data to, can be any string.

}

}

logstash命令只有2个参数：

因此使用agent来启动它（使用-f指定配置文件）：

?

1	`.` `/bin/logstash` `agent -f config` `/log4j_to_es` `.conf`

到这里，我们已经可以使用Logstash来收集日志并保存到ES中了，下面来看看项目代码。

Java项目

照例先看项目结构图：

pom.xml，很简单，只用到了Log4j库：

?

1

2

3

4

5

< dependency >

< groupId >log4j</ groupId >

< artifactId >log4j</ artifactId >

< version >1.2.17</ version >

</ dependency >

log4j.properties，将Log4j的日志输出到 SocketAppender，因为官网是这么说的：

?

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

log4j.rootLogger=INFO,console

# for package com.demo.elk, log would be sent to socket appender.

log4j.logger.com.demo.elk=DEBUG, socket

# appender socket

log4j.appender.socket=org.apache.log4j.net.SocketAppender

log4j.appender.socket.Port= 4567

log4j.appender.socket.RemoteHost=centos2

log4j.appender.socket.layout=org.apache.log4j.PatternLayout

log4j.appender.socket.layout.ConversionPattern=%d [%-5p] [%l] %m%n

log4j.appender.socket.ReconnectionDelay= 10000

# appender console

log4j.appender.console=org.apache.log4j.ConsoleAppender

log4j.appender.console.target=System.out

log4j.appender.console.layout=org.apache.log4j.PatternLayout

log4j.appender.console.layout.ConversionPattern=%d [%-5p] [%l] %m%n

注意： 这里的端口号需要跟Logstash监听的端口号一致，这里是4567。

Application.java，使用Log4j的LOGGER打印日志即可：

?

1

2

3

4

5

6

7

8

9

10

11

12

13

package com.demo.elk;

import org.apache.log4j.Logger;

public class Application {

private static final Logger LOGGER = Logger.getLogger(Application. class );

public static void main(String[] args) throws Exception {

for ( int i = 0 ; i < 10 ; i++) {

LOGGER.error( "Info log [" + i + "]." );

Thread.sleep( 500 );

}

}

}

用Head插件查看ES状态和内容

运行Application.java，先看看console的输出（当然，这个输出只是为了做验证，不输出到console也可以的）：

再来看看ES的head页面：

切换到Browser标签：

单击某一个文档（doc），则会展示该文档的所有信息：

可以看到，除了基础的message字段是我们的日志内容，Logstash还为我们增加了许多字段。而在 https://www.elastic.co/guide/en/logstash/current/plugins-inputs-log4j.html中也明确说明了这一点：

上面使用了ES的Head插件观察了ES集群的状态和数据，但这只是个简单的用于跟ES交互的页面而已，并不能生成报表或者图表什么的，接下来使用Kibana来执行搜索并生成图表。

Kibana

配置Kibana:

?

1

2

3

tar -zxvf kibana-4.3.0-linux-x86. tar .gz

cd kibana-4.3.0-linux-x86

vi config /kibana .yml

修改以下几项（由于是单机版的，因此host的值也可以使用localhost来代替，这里仅仅作为演示）：

?

1

2

3

4

server.port: 5601

server.host: “centos2”

elasticsearch.url: http: //centos2 :9200

kibana.index: “.kibana”

启动kibana：

?

1	`.` `/bin/kibana`

用浏览器打开该地址：

为了后续使用Kibana，需要配置至少一个Index名字或者Pattern，它用于在分析时确定ES中的Index。这里我输入之前配置的 Index名字applog，Kibana会自动加载该Index下doc的field，并自动选择合适的field用于图标中的时间字段：

点击Create后，可以看到左侧增加了配置的Index名字：

接下来切换到Discover标签上，注意右上角是查询的时间范围，如果没有查找到数据，那么你就可能需要调整这个时间范围了，这里我选择Today：

接下来就能看到ES中的数据了：

执行搜索看看呢：

点击右边的保存按钮，保存该查询为search_all_logs。接下来去Visualize页面，点击新建一个柱状图（Vertical Bar Chart），然后选择刚刚保存的查询search_all_logs，之后，Kibana将生成类似于下图的柱状图（只有10条日志，而且是在同一时间段的，比较丑，但足可以说明问题了：) ）：

你可以在左边设置图形的各项参数，点击Apply Changes按钮，右边的图形将被更新。同理，其他类型的图形都可以实时更新。

点击右边的保存，保存此图，命名为search_all_logs_visual。接下来切换到Dashboard页面：

单击新建按钮，选择刚刚保存的search_all_logs_visual图形，面板上将展示该图：

如果有较多数据，我们可以根据业务需求和关注点在Dashboard页面添加多个图表：柱形图，折线图，地图，饼图等等。当然，我们可以设置更新频率，让图表自动更新：

如果设置的时间间隔够短，就很趋近于实时分析了。

到这里，ELK平台部署和基本的测试已完成。

参考：

http://baidu.blog.51cto.com/71938/1676798

http://blog.csdn.net/cnweike/article/details/33736429

http://my.oschina.net/itblog/blog/547250

已有 0 人发表留言，猛击->> 这里<<-参与讨论

ITeye推荐

—软件人才免语言低担保赴美带薪读研！—

相关 [elk elasticsearch logstash] 推荐：

ELK(ElasticSearch, Logstash, Kibana)搭建实时日志分析平台

- - 编程语言 - ITeye博客

在搜索ELK资料的时候，发现这篇文章比较好，于是摘抄一小段：. 以下内容来自： http://baidu.blog.51cto.com/71938/1676798. 日志主要包括系统日志、应用程序日志和安全日志. 系统运维和开发人员可以通过日志了解服务器软硬件信息、检查配置过程中的错误及错误发生的原因.

使用ELK(Elasticsearch + Logstash + Kibana) 搭建日志集中分析平台实践

- - SegmentFault 最新的文章

Logstash：负责日志的收集，处理和储存. Elasticsearch：负责日志检索和分析. Kibana：负责日志的可视化. 2015年08月31日 - 初稿. 阅读原文 - http://wsgzao.github.io/post/elk/. CentOS 7.x安装ELK(Elasticsearch+Logstash+Kibana) - http://www.chenshake.com/centos-install-7-x-elk-elasticsearchlogstashkibana/.

市面上流行的 ELK 就是 ElasticSearch + Logstash + Kibana 索引收集圖表化

- - SSORC.tw

Elasticsearch 是專門數據儲存、分析、索引. Kibana 是專門 Web 介面，讓 Elasticsearch 內容來圖表化. Logstash 是專門資料收集、過濾、儲存到 Elasticsearch. 現今多出了 Beats 家族，主要是來當作輕量化 Logstash 的角色， Beats 是用 Golang 寫的，佔用資源更少.

开源分布式搜索平台ELK(Elasticsearch+Logstash+Kibana)+Redis+Syslog-ng实现日志实时搜索

- - C1G军火库

ElasticSearch是一个基于Lucene构建的开源，分布式，RESTful搜索引擎. 设计用于云计算中，能够达到实时搜索，稳定，可靠，快速，安装使用方便. 支持通过HTTP使用JSON进行数据索引. logstash是一个应用程序日志、事件的传输、处理、管理和搜索的平台. 你可以用它来统一对应用程序日志进行收集管理，提供 Web 接口用于查询和统计.

Logstash及Elasticsearch 压力测试说明书（十） - 简书

- -

磁盘：SATA磁盘2块，磁盘阵列为RAID1. CPU****：2个4核CPU. 具体参数：Intel(R) Xeon(R) CPU E5405 @ 2.00GHz. 1、 kafka版本：kafka_2.11-0.11.0.3. 2、 kafka集群数量：3. 3、 logstash版本：logstash-5.6.11.

使用logstash同步mysql 多表数据到ElasticSearch实践 - 三度 - 博客园

- -

参考样式即可，具体使用配置参数根据实际情况而定. jdbc_connection_string => "jdbc:mysql://localhost/数据库名". jdbc_driver_library => "mysql-connector-java-5.1.45-bin.jar所在位置". type => "数据库表名1".

[译]elasticsearch mapping

- - an74520的专栏

es的mapping设置很关键，mapping设置不到位可能导致索引重建. 请看下面各个类型介绍^_^. 每一个JSON字段可以被映射到一个特定的核心类型. JSON本身已经为我们提供了一些输入,支持 string, integer/ long, float/ double, boolean, and null..

Elasticsearch as Database - taowen - SegmentFault

- -

【北京上地】滴滴出行基础平台部招聘 Elasticsearch 与 Mysql binlog databus 开发工程师. 内推简历投递给： [email protected]. 推销Elasticsearch. 时间序列数据库的秘密（1）—— 介绍. 时间序列数据库的秘密（2）——索引.

Logstash 参考指南（多个管道） - 风继续吹 - SegmentFault 思否

- -

如果需要在同一进程中运行多个管道，Logstash提供了一种通过名为. pipelines.yml的配置文件完成此操作的方法，这个文件必须放在. path.settings文件夹，并遵循此结构：. 该文件在YAML中格式化并包含一个字典列表，其中每个字典描述一个管道，每个键/值对指定该管道的设置. 这个示例展示了两个不同的管道，它们由ID和配置路径描述，对于第一个管道，.

最快的 Logstash 替代方案 go-stash v1.0.1 发布

- - 开源中国-软件更新资讯

go-stash v1.0.1 现已发布. go-stash是一个高效的从Kafka获取，根据配置的规则进行处理，然后发送到ElasticSearch集群的工具. go-stash有大概logstash 5倍的吞吐性能，并且部署简单，一个可执行文件即可. docker 方式，确保配置文件路径正确. config.yaml示例如下:.