當前位置：首頁 > 运维知识 > linux >内容正文

linux

Linux入门之运维（1）系统监控 vmstat top

發布時間：2025/5/22 linux 13 豆豆

生活随笔收集整理的這篇文章主要介紹了 Linux入门之运维（1）系统监控 vmstat top 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

vmstat命令是最常見的Linux/Unix監控工具，可以展現給定時間間隔的服務器的狀態值,包括服務器的CPU使用率，內存使用，虛擬內存交換情況,IO讀寫情況。這個命令是我查看Linux/Unix最喜愛的命令，一個是Linux/Unix都支持，二是相比top，我可以看到整個機器的CPU,內存,IO的使用情況，而不是單單看到各個進程的CPU使用率和內存使用率(使用場景不一樣)。

一般vmstat工具的使用是通過兩個數字參數來完成的，第一個參數是采樣的時間間隔數，單位是秒，第二個參數是采樣的次數，如:

root@ubuntu:~# vmstat 2 1
procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu----
r b swpd free buff cache si so bi bo in cs us sy id wa
1 0 0 3498472 315836 3819540 0 0 0 1 2 0 0 0 100 0

2表示每個兩秒采集一次服務器狀態，1表示只采集一次。

實際上，在應用過程中，我們會在一段時間內一直監控，不想監控直接結束vmstat就行了,例如:

root@ubuntu:~# vmstat 2
procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu----
r b swpd free buff cache si so bi bo in cs us sy id wa
1 0 0 3499840 315836 3819660 0 0 0 1 2 0 0 0 100 0
0 0 0 3499584 315836 3819660 0 0 0 0 88 158 0 0 100 0
0 0 0 3499708 315836 3819660 0 0 0 2 86 162 0 0 100 0
0 0 0 3499708 315836 3819660 0 0 0 10 81 151 0 0 100 0
1 0 0 3499732 315836 3819660 0 0 0 2 83 154 0 0 100 0

這表示vmstat每2秒采集數據，一直采集，直到我結束程序，這里采集了5次數據我就結束了程序。

好了，命令介紹完畢，現在開始實戰講解每個參數的意思。

r?表示運行隊列(就是說多少個進程真的分配到CPU)，我測試的服務器目前CPU比較空閑，沒什么程序在跑，當這個值超過了CPU數目，就會出現CPU瓶頸了。這個也和top的負載有關系，一般負載超過了3就比較高，超過了5就高，超過了10就不正常了，服務器的狀態很危險。top的負載類似每秒的運行隊列。如果運行隊列過大，表示你的CPU很繁忙，一般會造成CPU使用率很高。

b?表示阻塞的進程,這個不多說，進程阻塞，大家懂的。

swpd?虛擬內存已使用的大小，如果大于0，表示你的機器物理內存不足了，如果不是程序內存泄露的原因，那么你該升級內存了或者把耗內存的任務遷移到其他機器。

free?? 空閑的物理內存的大小，我的機器內存總共8G，剩余3415M。

buff?? Linux/Unix系統是用來存儲，目錄里面有什么內容，權限等的緩存，我本機大概占用300多M

cache?cache直接用來記憶我們打開的文件,給文件做緩沖，我本機大概占用300多M(這里是Linux/Unix的聰明之處，把空閑的物理內存的一部分拿來做文件和目錄的緩存，是為了提高程序執行的性能，當程序使用內存時，buffer/cached會很快地被使用。)

si??每秒從磁盤讀入虛擬內存的大小，如果這個值大于0，表示物理內存不夠用或者內存泄露了，要查找耗內存進程解決掉。我的機器內存充裕，一切正常。

so??每秒虛擬內存寫入磁盤的大小，如果這個值大于0，同上。

bi??塊設備每秒接收的塊數量，這里的塊設備是指系統上所有的磁盤和其他塊設備，默認塊大小是1024byte，我本機上沒什么IO操作，所以一直是0，但是我曾在處理拷貝大量數據(2-3T)的機器上看過可以達到140000/s，磁盤寫入速度差不多140M每秒

bo?塊設備每秒發送的塊數量，例如我們讀取文件，bo就要大于0。bi和bo一般都要接近0，不然就是IO過于頻繁，需要調整。

in?每秒CPU的中斷次數，包括時間中斷

cs?每秒上下文切換次數，例如我們調用系統函數，就要進行上下文切換，線程的切換，也要進程上下文切換，這個值要越小越好，太大了，要考慮調低線程或者進程的數目,例如在apache和nginx這種web服務器中，我們一般做性能測試時會進行幾千并發甚至幾萬并發的測試，選擇web服務器的進程可以由進程或者線程的峰值一直下調，壓測，直到cs到一個比較小的值，這個進程和線程數就是比較合適的值了。系統調用也是，每次調用系統函數，我們的代碼就會進入內核空間，導致上下文切換，這個是很耗資源，也要盡量避免頻繁調用系統函數。上下文切換次數過多表示你的CPU大部分浪費在上下文切換，導致CPU干正經事的時間少了，CPU沒有充分利用，是不可取的。

us?用戶CPU時間，我曾經在一個做加密解密很頻繁的服務器上，可以看到us接近100,r運行隊列達到80(機器在做壓力測試，性能表現不佳)。

sy?系統CPU時間，如果太高，表示系統調用時間長，例如是IO操作頻繁。

id??空閑 CPU時間，一般來說，id + us + sy = 100,一般我認為id是空閑CPU使用率，us是用戶CPU使用率，sy是系統CPU使用率。

wt?等待IO CPU時間。

通過輸出參數判斷系統情況

1.如果cache的數值較大，則說明系統緩存了較多的磁盤數據，利于磁盤I/O性能的提升。這個時候，往往bi會相對較小，因為很多讀磁盤的操作都由cache來承擔了。

2.si和so是讀寫SWAP的量，這兩個值如果長期大于0，則表示系統需要經常讀寫交換分區，這會很消耗CPU資源和磁盤I/O性能。這時就要格外關注了，如果確定是系統的物理內存存在瓶頸，那么就需要通過擴容或服務遷移來解決問題。

3.如果free的數值很低，甚至接近0了，也不一定就是系統內存耗盡。要同時看buff和cache的值，大部分情況是buff和cache占用了很多內存資源，這反而是好事，說明系統把空閑內存都利用起來作為緩存，提升系統I/O的性能。而當系統真正需要內存時，buff和cache是可以隨時被系統征調回來的。

4.如果發現bi和bo的值特別大，則說明系統正在進行大量的磁盤讀寫操作。如果是符合預期的還好，如果不是的話，就要去查一查是那一塊磁盤或分區在進行大量讀寫。

5.如果us的數值經常大于50%，則說明用戶進程所占用的CPU時間較多，這或許說明所開發的程序需要進行一定程度的優化了。

6.而sy則是內核所消耗的CPU時間，這個數值不應該很高。如果很高，則說明系統出問題了。

7.如果wa較高，則說明CPU總是在進行I/O等待，這表明磁盤已經成為主要瓶頸，我們可以把磁盤升級為高性能磁盤，也可以查一下程序是否存在大量的隨機讀操作，如果是的話，考慮調整為順序讀或者增加讀緩存。

8.r表示的是正在運行隊列的任務數，如果這個數值總是超過服務器的CPU核數，則說明CPU已經成為性能瓶頸，可以考慮開啟超線程，更換多核心CPU，調整某些進程的NICE優先級等措施。

9.如果你正在運行一個視頻解碼的任務，那么us的數值可能會很高，甚至達到95%以上，這是符合預期的。如果你要運行一個能產生大量隨機數的程序，或者其他包含系統調用的程序，那么sy可能非常高，這也正常。

10.假如你打開了一個大型軟件，如OFFICE，然后過一段時間，你有希望啟動另一個大型游戲，這時候你會發現so數值很高，這表示系統正在將內存里的閑置數據寫入SWAP，這也是正常現象。如果你希望減少SWAP寫入，那么就需要加大內存。

轉載于:https://www.cnblogs.com/Dhouse/p/6596046.html

總結

以上是生活随笔為你收集整理的Linux入门之运维（1）系统监控 vmstat top的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： jquery拓展插件开发
下一篇： win7 64位系统怎么分区 win7系

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

linux

Linux入门之运维（1） 系统监控 vmstat top

通過輸出參數判斷系統情況

總結

Linux入门之运维（1）系统监控 vmstat top