Nagios 安装及常见错误
一、實驗環境
監控服務器(nagios服務器--192.168.1.100)
CentOS5.4 + nagios-3.2.1 + nagios-plugins-1.4.14 + nrpe-2.12
被監控客戶端(linux客戶端--192.168.1.200)
CentOS5.4 + nagios-plugins-1.4.14 + nrpe-2.12
二、nrpe插件
1、nrpe插件的組成
NRPE總共由兩部分組成:
(1)check_nrpe:它是運行在監控主機上
(2)NRPE daemon:它是運行在遠程的linux主機上(通常就是被監控機)
2、nrpe的工作原理
當Nagios需要監控某個遠程linux主機的服務或者資源情況時
第一步:nagios服務器運行check_nrpe插件,我們要在nagios配置文件中告訴它要檢查什么
第二步:check_nrpe插件會通過SSL連接到遠程的被監控的Linux客戶端上的NRPE daemon
第三步:被監控的Linux客戶端上的NRPE daemon會運行相應的nagios插件來執行檢查本地資源或服務
第四步:被監控的Linux客戶端上的NRPE daemon的NRPE daemon將檢查的結果返回給check_nrpe插件,插件將其遞交給進行nagios做處理
注意:NRPE daemon需要nagios-plugin插件安裝在遠程被監控linux主機上,否則NRPE daemon不能做任何的監控;別外因為它們間的通信是加密的SSL,所以在編譯安裝時都要加上選項:/configure --enable-ssl --with-ssl-lib=/lib/,否則會出錯
三、配置被監控的Linux主機(Linux客戶端)
1、安裝所需的軟件(nagios-plugins、nrpe)
wget http://prdownloads.sourceforge.net/sourceforge/nagiosplug/nagios-plugins-1.4.14.tar.gz
wget http://prdownloads.sourceforge.net/sourceforge/nagios/nrpe-2.12.tar.gz
1)安裝nagios-plugins
#增加一個用戶
useradd nagios
passwd nagios
#解壓并安裝
tar zvxf nagios-plugins-1.4.14.tar.gz && cd nagios-plugins-1.4.14
./configure --with-nagios-user=nagios --with-nagios-group=nagios && make && make install
chown -R nagios:nagios /usr/local/nagios
2)安裝nrpe
tar -zxvf nrpe-2.12.tar.gz && cd nrpe-2.12
./configure --enable-ssl --with-ssl-lib (前提是已經安裝了openssl與openssl-devel)
make all && make install-plugin && make install-daemon && make install-daemon-config
3)配置nrpe
#配置nrpe信息
vi /usr/local/nagios/etc/nrpe.cfg,查找并修改如下一行
allowed_hosts=192.168.1.100,127.0.0.1 ? #注意修改為nagios服務器的IP:192.168.1.100
#配置監控對象
說明:由監控原理可知被監控端做監控,然后將數據傳給監控服務器繪總,設置監控詳細參數主要是設置被監控端的nrpe.cfg文件,可以看到里面監控對象
vi /usr/local/nagios/etc/nrpe.cfg,查找并修改如下一行
command[check_users]=/usr/local/nagios/libexec/check_users -w 5 -c 10
command[check_load]=/usr/local/nagios/libexec/check_load -w 15,10,5 -c 30,25,20
command[check_disk]=/usr/local/nagios/libexec/check_disk -w 10% -c 5%
command[check_zombie_procs]=/usr/local/nagios/libexec/check_procs -w 5 -c 10 -s Z
command[check_total_procs]=/usr/local/nagios/libexec/check_procs -w 500 -c 550
command[check_swap]=/usr/local/nagios/libexec/check_swap -w 20% -c 10%
command[check_ping]=/usr/local/nagios/libexec/check_ping -H 192.168.1.1 -w 100.0,20% -c 500.0,60%
............................................#自已添加.......................................................... ?
#command[check_http]=/usr/local/nagios/libexec/check_http -I 127.0.0.1 -w 10 -c 20
#command[check_ssh]=/usr/local/nagios/libexec/check_ssh -4 127.0.0.1
4)啟動nrpe,并測試
/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d
echo '/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d &> /dev/null' >> /etc/rc.local
netstat -atulnp | grep 'nrpe'
tcp ? ? ? ?0 ? ? ?0 0.0.0.0:5666 ? ? ? ? ? ? ? ?0.0.0.0:* ? ? ? ? ? ? ? ? ? LISTEN ? ? ?3308/nrpe
/usr/local/nagios/libexec/check_nrpe -H localhost
NRPE v2.12
5)nrpe常見故障
錯誤一:/usr/local/nagios/libexec/check_nrpe -H 127.0.0.1
CHECK_NRPE: Error - Could not complete SSL handshake
解析辦法:配置allowed_hosts=192.168.1.100,127.0.0.1,然后kill進程再重啟就OK了
錯誤二:/usr/local/nagios/libexec/check_nrpe -H 127.0.0.1
Connection refused by host
解析辦法:Nrpe進程沒有啟動
四、配置監控服務器(Nagios服務器)
1、安裝所需的軟件(nagios、nagios-plugins、nrpe)
wget http://prdownloads.sourceforge.net/sourceforge/nagios/nagios-3.2.1.tar.gz
wget http://prdownloads.sourceforge.net/sourceforge/nagiosplug/nagios-plugins-1.4.14.tar.gz
wget http://prdownloads.sourceforge.net/sourceforge/nagios/nrpe-2.12.tar.gz
2、安裝nagios與nagios-plugins
1)nagios與nagios-plugins的安裝
查看:http://hi.baidu.com/9812658/blog/item/ae3632edd4f5afe2ce1b3e0e.html
2)安裝nrpe
tar -zxvf nrpe-2.12.tar.gz && cd nrpe-2.12
./configure --enable-ssl --with-ssl-lib (前提是已經安裝了openssl與openssl-devel)
make all && make install-plugin && make install-daemon && make install-daemon-config
3)配置nrpe
#在commands.cfg中定義nrpe這個外部構件
vi /usr/local/nagios/etc/nagios.cfg,打開下面這一行
cfg_file=/usr/local/nagios/etc/objects/commands.cfg
vi /usr/local/nagios/etc/objects/commands.cfg,增加如下一行
#check nrpe
define command{
command_name check_nrpe
command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
}
#配置要監控的linux主機
vi /usr/local/nagios/etc/nagios.cfg,加入如下一行
cfg_file=/usr/local/nagios/etc/objects/mylinux.cfg
touch ?/usr/local/nagios/etc/objects/mylinux.cfg,增加如下內容
define host{
use ? ? ? ? linux-server
host_name ? mylinux
alias ? ? ? mylinux
address ? ? 192.168.1.200
}
define service{
use ? ? ? ? ? ? ? ? generic-service #使用的是/usr/local/nagios /etc/objects/templates.cfg中所定義的
host_name ? ? ? ? ? mylinux
service_description Swap Usage
check_command ? ? ? check_nrpe!check_swap
}
define service{
use ? ? ? ? ? ? ? ? generic-service
host_name ? ? ? ? ? mylinux
service_description Current Load
check_command ? ? ? check_nrpe!check_load
}
define service{
use ? ? ? ? ? ? ? ? generic-service
host_name ? ? ? ? ? mylinux
service_description Partition Usage
check_command ? ? ? check_nrpe!check_disk
}
define service{
use ? ? ? ? ? ? ? ? generic-service
host_name ? ? ? ? ? mylinux
service_description Current Users ?
check_command ? ? ? check_nrpe!check_users
}
define service{
use ? ? ? ? ? ? ? ? generic-service
host_name ? ? ? ? ? mylinux
service_description Total Processes
check_command ? ? ? check_nrpe!check_total_procs
}
define service{
use ? ? ? ? ? ? ? ? generic-service
host_name ? ? ? ? ? mylinux
service_description PING
check_command ? ? ? check_nrpe!check_ping
}
5)啟動nrpc,并測試
/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d
echo '/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d &> /dev/null' >> /etc/rc.local
netstat -atulnp | grep 'nrpe'
tcp ? ? ? ?0 ? ? ?0 0.0.0.0:5666 ? ? ? ? ? ? ? ?0.0.0.0:* ? ? ? ? ? ? ? ? ? LISTEN ? ? ?3308/nrpe
/usr/local/nagios/libexec/check_nrpe -H 192.168.0.6 ? #linux客戶端的IP地址:192.168.0.6
NRPE v2.12
/usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg
service nagios restart
http://nagios_ip_address/nagios
PS:(★)我第一次實驗的時候忘了安裝插件了。nagios監控顯示:
| NRPE: Unable to read output |
進入排錯階段:
[root@domU:/usr/local/nagios/libexec/check_nrpe -H localhost
NRPE v2.8 ? ? ? ? ? ? ? ? ? ? ? ? ? ?———————正常阿??
[root@domU:/usr/local/nagios/libexec/check_nrpe -H localhost -c check_load
NRPE: Unable to read output ? ? ? ? ?———————哦,原來是插件忘了裝了。
安裝后解決問題!希望對大家有所幫助,
轉載于:https://blog.51cto.com/xiajieok/1335150
總結
以上是生活随笔為你收集整理的Nagios 安装及常见错误的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 梦到婆婆怀孕是什么意思
- 下一篇: 梦到女人光头是什么意思