[运维]---linux机器一般监控用到的概念记录
生活随笔
收集整理的這篇文章主要介紹了
[运维]---linux机器一般监控用到的概念记录
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
發(fā)布在linux上的機(jī)器,一般我們需要監(jiān)測各項數(shù)據(jù)來證實服務(wù)器是沒問題的,
如果出現(xiàn)問題,我們也可以通過以下指標(biāo)找到問題的方向
容器指標(biāo)
- 線程數(shù)
-當(dāng)前容器內(nèi)線程總數(shù)(平均到每個核的線程數(shù)) - 進(jìn)程數(shù)
-當(dāng)前容器內(nèi)進(jìn)程總數(shù) - 內(nèi)存分配失敗次數(shù)
-申請內(nèi)存/swap失敗次數(shù) - 句柄數(shù)
-當(dāng)前容器內(nèi)打開的文件句柄數(shù)
-在文件I/O中,要從一個文件讀取數(shù)據(jù),應(yīng)用程序首先要調(diào)用操作系統(tǒng)函數(shù)并傳送文件名,并選一個到該文件的路徑來打開文件。該函數(shù)取回一個順序號,即文件句柄(file handle),該文件句柄對于打開的文件是唯一的識別依據(jù)。要從文件中讀取一塊數(shù)據(jù),應(yīng)用程序需要調(diào)用函數(shù)ReadFile,并將文件句柄在內(nèi)存中的地址和要拷貝的字節(jié)數(shù)傳送給操作系統(tǒng)。當(dāng)完成任務(wù)后,再通過調(diào)用系統(tǒng)函數(shù)來關(guān)閉該文件。 - memory_swap使用量(MB)
-容器的swap使用量(MB)
硬件指標(biāo)
- CPU溫度
- 服務(wù)器功率
- CPU風(fēng)扇(即每分鐘多少轉(zhuǎn))
磁盤指標(biāo)
- 磁盤使用率百分比(%)
- 磁盤負(fù)載百分比(%)(一般1分鐘粒度平均值)
-查看磁盤負(fù)載:
-iostat -x 1 10 查看 %util
-如果沒有iostat 需要yum install sysstat安裝;
-如果 %util 接近 100%,說明產(chǎn)生的I/O請求太多,I/O系統(tǒng)已經(jīng)滿負(fù)荷,該磁盤可能存在瓶頸。 - 磁盤每秒讀取的數(shù)據(jù)量(KB/s)(一般1分鐘粒度平均值)
- 磁盤每秒寫入的數(shù)據(jù)量(KB/s)(一般1分鐘粒度平均值)
- 磁盤每秒讀取次數(shù)(次/s)(一般1分鐘粒度平均值)
- 磁盤每秒寫入次數(shù)(次/s)(一般1分鐘粒度平均值)
系統(tǒng)指標(biāo)
- cpu使用率百分比 (%)
- 內(nèi)存使用率百分比(%)
-容器的內(nèi)存使用率是讀取物理機(jī)cgroup下面的文件的,獲取的是整個容器的內(nèi)存使用率并不是針對某個程序。物理機(jī)內(nèi)存使用率和使用free命令計算結(jié)果是一致的。物理機(jī)和容器兩者內(nèi)存計算數(shù)據(jù)是獨立的。 - 連通性(0 or 1),0為存活,1未不存活
-系統(tǒng)每次檢測時會ping4次,計算得到丟包率。目前不是100%丟包的都算作是存活就(即0),只有100%丟包才會算作不存活(即1) - 系統(tǒng)負(fù)載(1分鐘粒度平均值)
-在Linux系統(tǒng)中,使用uptime或這top命令可以查看當(dāng)前系統(tǒng)的負(fù)載(top可以看到的信息更加詳盡一些)
- swap使用率百分比(%)
-Linux中Swap(即:交換分區(qū)),類似于Windows的虛擬內(nèi)存,就是當(dāng)內(nèi)存不足的時候,把一部分硬盤空間虛擬成內(nèi)存使用,從而解決內(nèi)存容量不足的情況。
網(wǎng)絡(luò)指標(biāo)
- 網(wǎng)絡(luò)入向流量(MB/s)(1分鐘粒度平均值)
- 網(wǎng)絡(luò)出向流量(MB/s)(1分鐘粒度平均值)
- 網(wǎng)絡(luò)入向包速率(packet/s)(1分鐘粒度平均值)
-數(shù)據(jù)包:包(Packet)是TCP/IP協(xié)議通信傳輸中的數(shù)據(jù)單位,一般也稱“數(shù)據(jù)包”。
-TCP/IP協(xié)議是工作在OSI模型第三層(網(wǎng)絡(luò)層)、第四層(傳輸層)上的。 - 網(wǎng)絡(luò)出向包速率(packet/s)(1分鐘粒度平均值)
- 當(dāng)前處于“ESTABLISHED (正在連接)”或者“CLOSE-WAIT (被動關(guān)閉)”狀態(tài)的tcp連接數(shù)
- 主動建立tcp連接頻率,既主動發(fā)送SYN,進(jìn)入“SYN-SENT”狀態(tài)的頻率(次/s)(1分鐘粒度平均值)
- 入向IP報文速率(packet/s)(1分鐘粒度平均值)
- 入向的ip包中,沒有錯誤但是被丟棄的
-丟棄的原因可能有buffer滿了。 - 入向TCP包速率(packet/s)(1分鐘粒度平均值)
- 出向TCP包速率(packet/s)(1分鐘粒度平均值)
- 入向TCP錯誤包頻率(packet/s)(1分鐘粒度平均值)
-TCP是一個可靠的協(xié)議,TCP包的頭部帶有標(biāo)識,通過校驗發(fā)現(xiàn)接收的包是錯誤的,然后將該包進(jìn)行丟棄后返回一個值要求重新進(jìn)行傳送。 - TCP重傳包頻率(packet/s)(1分鐘粒度平均值)
以上指標(biāo)僅供參考,不同的情況使用不同的指標(biāo)才是最合適的.
總結(jié)
以上是生活随笔為你收集整理的[运维]---linux机器一般监控用到的概念记录的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 华为的涉外知识产权工程师_华为法务社招
- 下一篇: iOS零散知识点