タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

nagiosに関するdbfireballのブックマーク (4)

  • Nagios と derived でMySQLのスロークエリの量を監視する - blog.nomadscafe.jp

    新しい機能をリリースした際に、MySQLに対して効率的ではないクエリが発行されてしまって、それが積もってサービス全体に影響が出てしまう前に発見してアラートをあげたい。 発見する手立てとしてはCPU使用率やInnoDBのROW OPERATIONSが考えられるところですが、今回はスロークエリが発生した回数を監視することにした。ちなみにいつものことながら対象とするMySQLは4.0系。long_query_timeがオンラインで変更できません。。。はい MySQLのスロークエリが発生した回数は、show status のSlow_queriesという項目でみることができて mysql> show status like 'Slow_queries'; +---------------+-------+ | Variable_name | Value | +---------------+---

  • Nagiosでシステム監視 その1 インストール

    インターネットシステムには障害がつきものです。人為的なミスもあれば、ハードウエアが自然に故障することもあります。これらを事前に想定して防止をすることも重要ですが、障害をなくすことはまず不可能です。 起きてしまった障害の被害を最小限にい止めるため、いかに早くシステム管理者がこれに気づき、正しい対処をすることが重要になります。しかし人力で監視するのは無理があります。 そのため、システムとネットワークを監視するアプリケーションがあります。指定されたホストやサービスを監視し、障害や復旧時に通知します。システムへの負荷は微々たるものですし多少制約があっても使っておいて損はないと考えます。 今回は、システムを監視する、Nagiosサーバをインストールして立ち上げるまでをやってみたいと思います。 オンラインで利用できる監視サービスもありますが、自前でNagiosサーバを立ち上げると、たくさんのホスト

    Nagiosでシステム監視 その1 インストール
  • Blogger

    Google のウェブログ公開ツールを使って、テキスト、写真、動画を共有できます。

  • fluentdでNagiosアラートの集約 « ボーダーレスライフ

    RRDなどにメトリクスを書き込んでグラフを生成している場合、標準的なサーバだとCPUかHDDがボトルネックになって、Nagiosサーバ1台あたり持てるクライアントは、300台〜700台くらいが限度といったところでしょう。 数万台のサーバを管理する様な環境では、Nagiosサーバ単位で情報が分断されてしまうので、関連するシステム(特に他部署が管理している様な)の状況が把握しづらいことがよくあります。 全サーバの状況を横断して検索、リスティングができると、障害時の対応時間を短縮できるし、統計情報の取得ができるとメトリクスdrivenな運用&開発もしやすくなり、プロダクトの質も向上するだろうということでfluentdでやってみました。とは言ってもまだ始まったばかりなのですが、下の図の様な構成で、Nagios上のイベントログをfluentdがtailし、必要なイベントログをfluentd serv

  • 1