Nagios でサーバの状態を監視
常時起動の Ubuntu 10.10 に Nagios のサーバをインストールした。
インストール(サーバ)
apt-get install nagios3 nagios-plugins apache2
グループ nagios がないとインストールがうまくいかなかった。
groupadd nagios
として続きを実行した。
パスワードはインストール時に聞かれる。ユーザ名は /etc/nagios3/htpasswd.users を見るとわかる。
プラグインを追加する。
apt-get install nagios-plugins-extra
このままだとウェブからコマンドを実行できないので、次のように設定する。
/etc/init.d/nagios3 stop dpkg-statoverride --update --add nagios www-data 2710 /var/lib/nagios3/rw dpkg-statoverride --update --add nagios nagios 751 /var/lib/nagios3 /etc/init.d/nagios3 start
設定(サーバ)
ユーザ & グループ
設定する必要があるのかよくわからないが次のようにする。
groupadd nagioscmd usermod -G nagios nagios usermod -G nagioscmd nagios usermod -G nagioscmd apache
設定ファイル
Ubuntu 10.10 の場合、/etc/nagios3 にある。
nagios.cfg
check_external_commands=1
とする。
デーモンの起動(サーバ)
インストールしただけでは Nagios が動いていないので、次のコマンドで起動させる。
/etc/init.d/nagios3 start
ウェブブラウザで http://localhost/nagios3/ にアクセス出来ればとりあえず、OK。
監視するマシンの追加(サーバ)
/etc/nagios3/conf.d 以下のファイルに監視するマシンの設定を書き込む。
nrpe
ウェブサーバやメールサーバのように外部からアクセスして 動いているかチェックできる場合は、 監視されるマシンの設定は不要。 監視されるマシンでコマンドを実行して、情報を送信させるには nrpe-serverが必要。 インストールしたマシンは Ubuntu 10.10。
インストール(監視されるマシン)
監視されるマシンでインストール作業をする。
apt-get install nagios-plugins apt-get install nagios-nrpe-server
LDAP を使用して認証している場合、nagios ユーザが干渉するらしく、うまくインストールできない。 /etc/passwd に以下を追加して解決した。
nagios:x:126:126::/var/lib/nagios:/bin/false
このとき、/etc/group の nagios グループの番号を指定するのと 他のユーザの番号とかぶらないように注意した。
/etc/nagios/nrpe.cfg の allowed_hosts に Nagios のサーバが動いているマシンの IP を書く。
allowed_hosts=***.***.***.***
最後に nagios-nrpe-server を起動する。
/etc/init.d/nagios-nrpe-server start
とする。
インストール(サーバ)
Nagios のサーバで nagios-nrpe-server にアクセスできるように nagios-nrpe-plugins をインストールする。
apt-get install nagios-nrpe-plugins
プラグイン追加(サーバ)
/usr/lib/nagios/plugins/ にプラグインを記述したファイルを保存し、 /etc/nagios-plugins/config/ の中に設定ファイルを追加して、そこにコマンドを書く。
nrpe のコマンドの追加(監視されるマシン)
コマンドを追加する場合は、 /etc/nagios/nrpe.d に設定ファイルを書く。