dstat + fluentd + Elasticsearch + kibana でサーバモニタリングする

普段はサーバのメトリクス可視化のためにcloudforecastを使っていますが、某案件用に数秒単位で数十台のサーバのメトリクスを表示したいので、記事タイトルのような構成を作ってみた。

dstatでとった各種値の他に、nginxとmemcachedの情報も合わせて表示させています。

セットアップ

もろもろのセットアップのメモ

監視サーバ

まず、監視サーバにElasticsearchとkibanaをいれる。環境はCentOS6

$ sudo yum install java-1.7.0-openjdk
$ sudo rpm -Uvh https://download.elasticsearch.org/elasticsearch/elasticsearch/elasticsearch-1.x.x.noarch.rpm

Elasticsearchは特に設定なく起動

$ sudo service elasticsearch start

次、kibanaとkibanaをhostingするwebサーバの設定

$ cd /path/to
$ wget https://download.elasticsearch.org/kibana/kibana/kibana-3.x.x.tar.gz
$ tar zxf kibana-3.x.x.tar.gz

して、webサーバのドキュメントルートに、/path/to/kibana-3.x.x を指定。

データをいれ始める前に、Elasticsearchにmappingのヒントを与える

$ curl -XPUT localhost:9200/_template/template_1 -d '
{
   "template" : "logstash-*",
   "mappings" : {
       "dstat": {
           "properties": {
                "host" : { "type" : "string", "index" : "not_analyzed" },
                "value" : {"type" : "double"}
           }
       }
   }
}
'

監視対象サーバの設定

モニタリング対象となるサーバにはfluentdをいれる

$ sudo yum install td-agent

弊社環境だとモリス作成のtd-agentがyum repositoryにあるのでこれを使った。一般的にはtreasuredata社のrepositoryを使うと思う。

pluginを追加

$ sudo /usr/lib64/fluent/ruby/bin/fluent-gem install fluent-plugin-map fluent-plugin-dstat fluent-plugin-elasticsearch

fluent-plugin-elasticsearchのインストールで依存性解決ができなくて失敗することがなんどかあった。

/etc/td-agent/td-agent.confを次のようにしてみた。dstatの情報をそれぞれ別のログにするところは、「dstatをkibanaで可視化＋3.0.0milestone5新機能を参考にさせて頂きました。

<source>
  type exec
  command sh /etc/td-agent/stats.sh
  format tsv
  keys hostname,nginx,memcached
  tag stats
  run_interval 5
</source>

<match stats>
  type copy
  <store>
    type map
    tag  "map.dstat.nginx-req"
    time time
    record {"value" => record["nginx"], "stat" => "nginx-req", "host" => record["hostname"]}
  </store>
  <store>
    type map
    tag  "map.dstat.memcached-incr"
    time time
    record {"value" => record["memcached"], "stat" => "memcached-incr", "host" => record["hostname"]}
  </store>
</match>

<source>
  type dstat
  tag dstat
  option -lcn
  delay 5
</source>

<match dstat>
  type copy
  <store>
    type map
    tag  "map.dstat.loadavg-short"
    time time
    record {"value" => record["dstat"]["load avg"]["1m"], "stat" => "loadavg-short", "host" => record["hostname"]}
  </store>
  <store>
    type map
    tag  "map.dstat.cpu-usr"
    time time
    record {"value" => record["dstat"]["total cpu usage"]["usr"], "stat" => "cpu-usr", "host" => record["hostname"]}
  </store>
  <store>
    type map
    tag  "map.dstat.cpu-sys"
    time time
    record {"value" => record["dstat"]["total cpu usage"]["sys"], "stat" => "cpu-sys", "host" => record["hostname"]}
  </store>
  <store>
    type map
    tag  "map.dstat.cpu-hiq"
    time time
    record {"value" => record["dstat"]["total cpu usage"]["hiq"], "stat" => "cpu-hiq", "host" => record["hostname"]}
  </store>
  <store>
    type map
    tag  "map.dstat.cpu-siq"
    time time
    record {"value" => record["dstat"]["total cpu usage"]["siq"], "stat" => "cpu-siq", "host" => record["hostname"]}
  </store>
  <store>
    type map
    tag  "map.dstat.net-recv"
    time time
    record {"value" => record["dstat"]["net/total"]["recv"], "stat" => "net-recv", "host" => record["hostname"]}
  </store>  
  <store>
    type map
    tag  "map.dstat.net-send"
    time time
    record {"value" => record["dstat"]["net/total"]["send"], "stat" => "net-send", "host" => record["hostname"]}
  </store>  
</match>

<match map.dstat.*>
  type elasticsearch
  type_name       dstat
  host            監視サーバのIP
  port            9200
  logstash_format true
  logstash_prefix logstash
  flush_interval  5s
</match>

nginxとmemcachedの統計情報をとるstats.shは

#!/bin/sh
set -e
HOST=$(hostname)
NREQ=$(curl -s http://localhost/nginx_status|head -3|tail -1|awk '{print $3}')
MREQ=$(echo stats | nc localhost 11211| grep incr_hits | awk '{print $3}')
echo -e "$HOST\t$NREQ\t$MREQ"

のような簡単なshellscriptです。

設定をいれたら、fluentdを起動

$ sudo service td-agent start

kibanaをぽちぽち設定

データが入りはじめたら、kibanaでぽちぽちやって可視化。

nginxのリクエスト数なら、topNクエリを使い、

Histgramグラフの設定で、Transform SeriesのSeconds、Derivativeを両方とも有効にして秒間のリクエスト数に直し、stackグラフにします。

あとはグラフによって、秒で割るかどうか、stackするかどうかを選びつつ可視化して行きます。すると最終的にこんなのが出来上がりました。

あとは本番を待つのみ。。

高速スケーラブル検索エンジン ElasticSearch Server

posted with amazlet at 14.03.28

Rafal Kuc Marek Rogozinski
KADOKAWA/アスキー・メディアワークス
売り上げランキング: 2,398

Amazon.co.jpで詳細を見る

普段はサーバのメトリクス可視化のために[cloudforecast](https://github.com/kazeburo/cloudforecast)を使っていますが、某案件用に数秒単位で数十台のサーバのメトリクスを表示したいので、記事タイトルのような構成を作ってみた。\n\n \n\ndstatでとった各種値の他に、nginxとmemcachedの情報も合わせて表示させています。\n\n## セットアップ\n\nもろもろのセットアップのメモ\n\n### 監視サーバ\n\nまず、監視サーバに[Elasticsearch](http://www.elasticsearch.org/)と[kibana](http://www.elasticsearch.org/overview/kibana/)をいれる。環境はCentOS6\n\n \$ sudo yum install java-1.7.0-openjdk\n \$ sudo rpm -Uvh https://download.elasticsearch.org/elasticsearch/elasticsearch/elasticsearch-1.x.x.noarch.rpm\n\nElasticsearchは特に設定なく起動\n\n \$ sudo service elasticsearch start\n\n次、kibanaとkibanaをhostingするwebサーバの設定\n\n \$ cd /path/to\n \$ wget https://download.elasticsearch.org/kibana/kibana/kibana-3.x.x.tar.gz\n \$ tar zxf kibana-3.x.x.tar.gz\n\nして、webサーバのドキュメントルートに、`/path/to/kibana-3.x.x` を指定。\n\nデータをいれ始める前に、Elasticsearchにmappingのヒントを与える\n\n \$ curl -XPUT localhost:9200/_template/template_1 -d '\n {\n \"template\" : \"logstash-*\",\n \"mappings\" : {\n \"dstat\": {\n \"properties\": {\n \"host\" : { \"type\" : \"string\", \"index\" : \"not_analyzed\" },\n \"value\" : {\"type\" : \"double\"}\n }\n }\n }\n }\n '\n\n### 監視対象サーバの設定\n\nモニタリング対象となるサーバにはfluentdをいれる\n\n \$ sudo yum install td-agent\n\n弊社環境だとモリス作成のtd-agentがyum repositoryにあるのでこれを使った。一般的にはtreasuredata社のrepositoryを使うと思う。\n\npluginを追加\n\n \$ sudo /usr/lib64/fluent/ruby/bin/fluent-gem install fluent-plugin-map fluent-plugin-dstat fluent-plugin-elasticsearch\n\nfluent-plugin-elasticsearchのインストールで依存性解決ができなくて失敗することがなんどかあった。\n\n`/etc/td-agent/td-agent.conf`を次のようにしてみた。dstatの情報をそれぞれ別のログにするところは、「[dstatをkibanaで可視化＋3.0.0milestone5新機能](http://a3no.hatenablog.com/entry/2014/02/16/152419) を参考にさせて頂きました。\n\n \n type exec\n command sh /etc/td-agent/stats.sh\n format tsv\n keys hostname,nginx,memcached\n tag stats\n run_interval 5\n \n \n \n type copy\n \n type map\n tag \"map.dstat.nginx-req\"\n time time\n record {\"value\" => record[\"nginx\"], \"stat\" => \"nginx-req\", \"host\" => record[\"hostname\"]}\n \n \n type map\n tag \"map.dstat.memcached-incr\"\n time time\n record {\"value\" => record[\"memcached\"], \"stat\" => \"memcached-incr\", \"host\" => record[\"hostname\"]}\n \n \n \n \n type dstat\n tag dstat\n option -lcn\n delay 5\n \n \n \n type copy\n \n type map\n tag \"map.dstat.loadavg-short\"\n time time\n record {\"value\" => record[\"dstat\"][\"load avg\"][\"1m\"], \"stat\" => \"loadavg-short\", \"host\" => record[\"hostname\"]}\n \n \n type map\n tag \"map.dstat.cpu-usr\"\n time time\n record {\"value\" => record[\"dstat\"][\"total cpu usage\"][\"usr\"], \"stat\" => \"cpu-usr\", \"host\" => record[\"hostname\"]}\n \n \n type map\n tag \"map.dstat.cpu-sys\"\n time time\n record {\"value\" => record[\"dstat\"][\"total cpu usage\"][\"sys\"], \"stat\" => \"cpu-sys\", \"host\" => record[\"hostname\"]}\n \n \n type map\n tag \"map.dstat.cpu-hiq\"\n time time\n record {\"value\" => record[\"dstat\"][\"total cpu usage\"][\"hiq\"], \"stat\" => \"cpu-hiq\", \"host\" => record[\"hostname\"]}\n \n \n type map\n tag \"map.dstat.cpu-siq\"\n time time\n record {\"value\" => record[\"dstat\"][\"total cpu usage\"][\"siq\"], \"stat\" => \"cpu-siq\", \"host\" => record[\"hostname\"]}\n \n \n type map\n tag \"map.dstat.net-recv\"\n time time\n record {\"value\" => record[\"dstat\"][\"net/total\"][\"recv\"], \"stat\" => \"net-recv\", \"host\" => record[\"hostname\"]}\n \n \n type map\n tag \"map.dstat.net-send\"\n time time\n record {\"value\" => record[\"dstat\"][\"net/total\"][\"send\"], \"stat\" => \"net-send\", \"host\" => record[\"hostname\"]}\n \n \n \n \n type elasticsearch\n type_name dstat\n host 監視サーバのIP\n port 9200\n logstash_format true\n logstash_prefix logstash\n flush_interval 5s\n \n\nnginxとmemcachedの統計情報をとるstats.shは\n\n #!/bin/sh\n set -e\n HOST=\$(hostname)\n NREQ=\$(curl -s http://localhost/nginx_status|head -3|tail -1|awk '{print \$3}')\n MREQ=\$(echo stats | nc localhost 11211| grep incr_hits | awk '{print \$3}')\n echo -e \"\$HOST\\t\$NREQ\\t\$MREQ\"\n\nのような簡単なshellscriptです。\n\n設定をいれたら、fluentdを起動\n\n \$ sudo service td-agent start\n\n\n### kibanaをぽちぽち設定\n\nデータが入りはじめたら、kibanaでぽちぽちやって可視化。\n\nnginxのリクエスト数なら、topNクエリを使い、\n\n \n\nHistgramグラフの設定で、`Transform Series`のSeconds、Derivativeを両方とも有効にして秒間のリクエスト数に直し、stackグラフにします。\n\n \n\nあとはグラフによって、秒で割るかどうか、stackするかどうかを選びつつ可視化して行きます。すると最終的にこんなのが出来上がりました。\n\n\n\nあとは本番を待つのみ。。\n\n\n

$\"高速スケーラブル検索エンジン$

dstat + fluentd + Elasticsearch + kibana でサーバモニタリングする

セットアップ

監視サーバ

監視対象サーバの設定

kibanaをぽちぽち設定

検索

このブログ記事について

月別アーカイブ

ウェブページ

dstat + fluentd + Elasticsearch + kibana でサーバモニタリングする

セットアップ

監視サーバ

監視対象サーバの設定

kibanaをぽちぽち設定

検索

このブログ記事について

月別 アーカイブ

ウェブページ

月別アーカイブ