zabbix中mysql连不上的排错_zabbix监控软件的使用排错
在linux系統(tǒng)中,幾乎所有運(yùn)行的服務(wù)都會(huì)產(chǎn)生相對(duì)就的日志(log),所運(yùn)行的程序在出錯(cuò)時(shí)都會(huì)有錯(cuò)誤提示,即使沒(méi)有任何提示也可以通過(guò)“echo $”來(lái)查看運(yùn)行是否成功。使用zabbix已經(jīng)有一段時(shí)間了,整理一下遇到過(guò)的問(wèn)題和解決的方法以。
zabbix的日志存放在/tmp下,服務(wù)器端對(duì)應(yīng)的日志是zabbix_server.log,被監(jiān)控端對(duì)應(yīng)的日志是zabbix_agentd.log.
一,zabbix服務(wù)是否已經(jīng)開(kāi)啟成功查看系統(tǒng)是否已經(jīng)有zabbix進(jìn)程正在運(yùn)行 # ps aux |grep zabbix 查看系統(tǒng)是否已監(jiān)聽(tīng)zabbix server和zabbix agent所使用的10050、10051端口 # netstat -nplut |grep zabbix 如果沒(méi)有,則開(kāi)啟:#/etc/init.d/zabbix_server_ctl start #/etc/init.d/zabbix_agent_ctl start
特別需要注意的是:每次修改完配置文件之后都需要重新啟動(dòng)對(duì)應(yīng)的zabbix server或者zabbix agentd。
部分運(yùn)行腳本在做restart時(shí)無(wú)法關(guān)閉zabbix導(dǎo)致服務(wù)無(wú)法重新啟動(dòng),可用kill的命令把zabbix相關(guān)的進(jìn)程殺掉再啟動(dòng)。
二、zabbix_server.log出現(xiàn)的提示
2009:20121023:193549.354 Sending list of active checks to [192.168.30.3] failed: host [CentOS-3] not found
這是因?yàn)閦abbix_agentd.conf配置文件中的Hostname與web中的主機(jī)名對(duì)應(yīng)。
QQ截圖20151202174616.png (224.1 KB, 下載次數(shù): 4)
2015-12-2 17:47 上傳
三、網(wǎng)頁(yè)中了出現(xiàn)的錯(cuò)誤
(1)
QQ截圖20151202174640.png (117.67 KB, 下載次數(shù): 2)
2015-12-2 17:47 上傳
Get value from agent failed: cannot connect to [[192.168.30.2]:10050]: [111] Connection refused
192.168.30.2是我的zabbix server服務(wù)器,本身也有監(jiān)控自己本身的agent功能。出現(xiàn)這種錯(cuò)誤是因?yàn)橥浽趜abbix服務(wù)器開(kāi)戶zabbix_agentd。在Last 20 issues中也有提示Last 20 issuesHostIssueLast changeAgeAckActions
Zabbix serverServer Zabbix server is unreachable23 Oct 2012 18:42:146m 57sNo-
解決方法:開(kāi)啟zabbix_agentd即可。
(2)
QQ截圖20151202174631.png (64.46 KB, 下載次數(shù): 3)
2015-12-2 17:47 上傳
Get value from agent failed: cannot connect to [[192.168.30.3]:10050]: [113] No route to host
看提示“No route to host”,與網(wǎng)絡(luò)連接有關(guān)。排除的方法如下:
a)查看192.168.30.3這臺(tái)機(jī)器是否已開(kāi)機(jī)
b)在zabbix server端向這臺(tái)機(jī)器ping,看網(wǎng)絡(luò)是否通
c)用telnet 登錄10050和10051端口,看該主機(jī)是否允許這兩個(gè)端口通訊
d)查看iptables防火墻規(guī)則是否攔截10050、10051端口
(3)
QQ截圖20151202174624.png (250.56 KB, 下載次數(shù): 2)
2015-12-2 17:47 上傳
網(wǎng)頁(yè)中不停地有以下紅色提示:
zabbix server is not running: the information displayed may not be current.
zabbix 遇到上面的問(wèn)題
可以從以下幾個(gè)方面入手檢查,當(dāng)然先查日志,如果不想查日志,先檢查下面幾項(xiàng)是否正常
1. selinux是否關(guān)閉。
2. zabbix web目錄下面??$ZBX_SERVER 是否為ip,如果是localhost,ping下localhost是否能解析。
3.查看php的fsockopen模塊是否啟用。
zabbix server is running | No.
查看/tmp/zabbix_server.log和/tmp/zabbix_agent.log無(wú)任何異常。看zabbix_server和zabbix_agent進(jìn)程、端口都正常……幾翻google以后并嘗試,終于得到了解決!
http://www.zabbix.com/forum/showthread.php?t=23878&page=3 這里面有說(shuō)到zabbix受selinux的影響而已有這種錯(cuò)誤提示。
http://www.zabbix.com/forum/showthread.php?t=25321 這里面說(shuō)到了修改hostname為IP的做法。
我具體的做法是:
①查看selinux產(chǎn)生的log,確實(shí)有錯(cuò)誤提示:
#tail -f /var/log/audit/audit.log
type=AVC msg=audit(1351863204.990:32): avc:??denied??{ name_connect } for??pid=1575 comm="httpd" dest=10051 scontext=system_u:system_r:httpd_t:s0 tcontext=system_u:object_r:port_t:s0 tclass=tcp_socket
type=SYSCALL msg=audit(1351863204.990:32): arch=40000003 syscall=102 success=no exit=-13 a0=3 a1=bfd494b0 a2=b76b0ad8 a3=d items=0 ppid=1434 pid=1575 auid=4294967295 uid=48 gid=48 euid=48 suid=48 fsuid=48 egid=48 sgid=48 fsgid=48 tty=(none) ses=4294967295 comm="httpd" exe="/usr/sbin/httpd" subj=system_u:system_r:httpd_t:s0 key=(null)
②然后讓selinux允許它通過(guò)setsebool -P httpd_can_network_connect on
③編輯zabbix.conf.php文件,把$ZBX_SERVER的值改為本機(jī)的IP地址
$ZBX_SERVER??= '192.168.30.2'; #######用IP代替hostname
④OK
四、
tail /tmp/zabbix_server.log??顯示
50952:20141012:195519.884 One child process died (PID:51233,exitcode/signal:255). Exiting ...
表示一個(gè)子進(jìn)程死掉,是一個(gè)zabbix內(nèi)存溢出錯(cuò)誤 (此錯(cuò)誤同樣會(huì)造成上面紅色的閃爍)
更正:vim /etc/zabbix/zabbix_server.conf
CacheSize=512M
修改此值后OK
五、 tail /tmp/zabbix_server.log 顯示
2552:20141012:211700.552 [Z3001] connection to database 'zabbix' failed: [1040] Too many connections
是由于連接到數(shù)據(jù)庫(kù)的數(shù)量比較多,mysql 默認(rèn)的連接數(shù)是100,一般設(shè)置到500~1000比較合適,我們可以調(diào)大這個(gè)值:修改/etc/my.cnf這個(gè)文件,在[mysqld]中新增max_connections=1000
然后重啟mysql和zabbix_server zabbix_agent
用戶自定義腳本監(jiān)控:
a)
有時(shí)候用戶自定義的腳本運(yùn)行的時(shí)間可能比較長(zhǎng),如超過(guò)10秒的20秒的。這時(shí)在執(zhí)行zabbix_agentd -p 或者zabbix_agentd -t時(shí)就可能出現(xiàn)“Alarm clock”,從而得不到想要的結(jié)果。這是因?yàn)閦abbix agentd配置文件中定義Timeout時(shí)間默認(rèn)為3秒,腳本運(yùn)行取結(jié)果的時(shí)間超過(guò)了3秒就會(huì)出現(xiàn)這種情況。
解決方法:編輯配置文件/etc/zabbix/zabbix_agentd.conf,找到"Timeout"把它定義為30秒或小于30秒。
b)
對(duì)a中的情況還需要注意對(duì)zabbix服務(wù)器端的配置,如我自己定義的腳本UserParameter=ping.avgtime,ping 192.168.30.2 -c 10 -w 29 |grep 'avg' |awk -F "/" '{print $5}' 對(duì)192.168.30.2 ping 10取平均值,-w參數(shù)是對(duì)ping限定時(shí)間為29秒
這個(gè)腳本運(yùn)行的大概時(shí)間為10秒左右,此時(shí)在agent端雖然可以用zabbix_agentd -t得到結(jié)果,但是在zabbix服務(wù)器端日志會(huì)不斷的出現(xiàn)
1762:20121023:191941.360 resuming Zabbix agent checks on host [Zabbix server]: connection restored
1761:20121023:191952.149 Zabbix agent item [ping.avgtime] on host [CentOS-3] failed: first network error, wait for 15 seconds
1762:20121023:192010.610 Zabbix agent item [ping.avgtime] on host [CentOS-3] failed: another network error, wait for 15 seconds
1762:20121023:192028.628 Zabbix agent item [ping.avgtime] on host [CentOS-3] failed: another network error, wait for 15 seconds
這樣的錯(cuò)誤日志,并且在web端也沒(méi)有畫出圖來(lái)。
解決方法:
①編輯zabbix服務(wù)器端的配置文件/etc/zabbix/zabbix_server.conf找到"Timeout"把它定義為30秒或小于30秒。
②如果還有類似提示則應(yīng)該是zabbix服務(wù)器的內(nèi)存設(shè)置得太小了,加大服務(wù)器內(nèi)存便可。
總結(jié)
以上是生活随笔為你收集整理的zabbix中mysql连不上的排错_zabbix监控软件的使用排错的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: c语言printf %llo,c++ -
- 下一篇: 腐蚀rust研究台抽奖_中石化青岛安工院