AIX 下磁盘 I/O 性能分析
磁盤的 I/O,顧名思義就是磁盤的輸入輸出。輸入指的是對磁盤寫入數據,輸出指的是從磁盤讀出數據。
我們常見的磁盤類型有 ATA、SATA、FC、SCSI、SAS。這幾種磁盤中,服務器常用的是 SAS 和 FC 磁盤,一些高端存儲也使用 SSD 盤。每一種磁盤的性能是不一樣的。
我們在測試工作中,衡量磁盤 I/O 性能主要參考 IOPS 和吞吐量兩個參數。下面,將介紹一下這兩個參數的含義。
IOPS 與吞吐量的概念
磁盤的 IOPS,也就是在一秒內,磁盤進行多少次 I/O 讀寫。
磁盤的吞吐量,也就是每秒磁盤 I/O 的流量,即磁盤寫入加上讀出的數據的大小。
IOPS 與吞吐量的關系
每秒 I/O 吞吐量= IOPS* 平均 I/O SIZE。從公式可以看出: I/O SIZE 越大,IOPS 越高,那么每秒 I/O 的吞吐量就越高。因此,我們會認為 IOPS 和吞吐量的數值越高越好。實際上,對于一個磁盤來講,這兩個參數均有其最大值,而且這兩個參數也存在著一定的關系。
下圖為各種磁盤的 IOPS 極限值。
表 1. 常見磁盤類型及其 IOPS
注:上表源自維基百科 http://en.wikipedia.org/wiki/IOPS
在 AIX 中,對于同一個磁盤(或者 LUN),隨著每次 I/O 讀寫數據的大小不通,IOPS 的數值也不是固定不變的。例如,每次 I/O 寫入或者讀出的都是連續的大數據塊,此時 IOPS 相對會低一些;在不頻繁換道的情況下,每次寫入或者讀出的數據塊小,相對來講 IOPS 就會高一些。
I/O 讀寫的類型
大體上講,I/O 的類型可以分為:讀 / 寫 I/O、大 / 小塊 I/O、連續 / 隨機 I/O, 順序 / 并發 I/O。在這幾種類型中,我們主要討論一下:大 / 小塊 I/O、連續 / 隨機 I/O, 順序 / 并發 I/O。
大 / 小塊 I/O
這個數值指的是控制器指令中給出的連續讀出扇區數目的多少。如果數目較多,如 64,128 等,我們可以認為是大塊 I/O;反之,如果很小,比如 4,8,我們就會認為是小塊 I/O,實際上,在大塊和小塊 I/O 之間,沒有明確的界限。
連續 / 隨機 I/O
連續 I/O 指的是本次 I/O 給出的初始扇區地址和上一次 I/O 的結束扇區地址是完全連續或者相隔不多的。反之,如果相差很大,則算作一次隨機 I/O
連續 I/O 比隨機 I/O 效率高的原因是:在做連續 I/O 的時候,磁頭幾乎不用換道,或者換道的時間很短;而對于隨機 I/O,如果這個 I/O 很多的話,會導致磁頭不停地換道,造成效率的極大降低。
順序 / 并發 I/O
從概念上講,并發 I/O 就是指向一塊磁盤發出一條 I/O 指令后,不必等待它回應,接著向另外一塊磁盤發 I/O 指令。對于具有條帶性的 RAID(LUN),對其進行的 I/O 操作是并發的,例如:raid 0+1(1+0),raid5 等。反之則為順序 I/O。
磁盤 I/O 性能的監控
監控磁盤的 I/O 性能,我們可以使用 AIX 的系統命令,例如:sar -d, iostat, topas, nmon 等。下面,我將以 nmon 和 topas 為例,講述在系統中如何觀察磁盤 I/O 的性能。
topas
登錄 AIX 操作系統,輸入 topas,然后按 D,會出現如下界面:
在上圖中,TPS 即為磁盤的 IOPS,KBPS 即為磁盤每秒的吞吐量。由于服務器處于空閑的狀態,我們可以看到 IOPS,KBPS 的數據都非常低。
我們使用 dd if 命令向磁盤 hdisk2 發讀 I/O,block 大小為 1MB:
利用 topas 進行監控:
此時,hdisk2 的吞吐量為 163.9M,IOPS 為 655。
我們再啟動一個 dd if,使 hdisk 的 busy 數值達到 100%:
從上圖可以看出,在磁盤 busy 達到 100% 的時候,其吞吐量為 304.1M,IOPS 為 1200。
hdisk2 是本地集成的 SAS 盤,我們可以查出本地集成 SAS 通道的帶寬為 3Gb:
對于 3Gb 的 SAS 通道,304.1M 的磁盤吞吐量已經接近其 I/O 帶寬的峰值了。
需要指出的是,使用 dd if 測量磁盤的帶寬是可行的,但是由此來確定業務 I/O 的 IOPS 和吞吐量是不科學的。因為,dd if 所發起的讀寫僅為順序 I/O 讀寫,在 OLTP 的業務中,這種讀寫是不常見的,而是隨機小 I/O 比較多,因此,測量業務的磁盤 I/O 性能,需要在運行業務的時候進行監控。
nmon
在系統中輸入 nmon,按 d,可以得到如下界面 :
可以得到此時磁盤 hdisk2 吞吐量為 318M。
使用 nmon 收集一個時間段的數據,然后使用 nmon analyzer 進行分析,可以得出更為直接的圖表:
將收集好的 nmon 文件使用 nmon analyzer 進行分析,得出如下報表:
圖 2.nmon 圖表顯示磁盤性能
磁盤 I/O 性能調優
確認磁盤 I/O 存在性能問題
對于隨機負載,當遇到余下情況時,我們那通常認為存在 I/O 性能問題:
對于順序負載,當遇到余下情況時,我們那通常認為存在 I/O 性能問題:
對于一塊磁盤來講,隨著 IOPS 數量的增加,I/O service 也會增加,并且會有一個飽和點,即 IOPS 達到某個點以后,IOPS 再增加將會引起 I/O service time 的顯著增加。
圖 3. 磁盤 IOPS 與 IO service time 關系圖
從經驗上講,我們在測試工作中,我們主要關注 IOPS 和吞吐量以及磁盤的 busy% 這三個數值。如果 IOPS 和吞吐量均很低,磁盤的 busy% 也很低,我們會認為磁盤壓力過小,造成吞吐量和 IOPS 過低;只有在 IOPS 和吞吐量均很低,磁盤的 busy% 很高(接近 100%)的時候,我們才會從磁盤 I/O 方面分析 I/O 性能。
通過調整 AIX 參數改善磁盤 I/O 性能
在 AIX 系統中,有關磁盤 I/O 性能相關的參數我們主要調整的參數如下圖:
圖 4.AIX 常見的磁盤 I/O 性能參數
需要注意的是,下面幾個參數的調整值,只是經驗數值;對于不同的應用,不同的場景,應具體情況具體分析。
調整I/O 隊列長度
queue_depth 是 AIX 一次可以傳送到磁盤設備的命令的數量,把命令放在隊列中再傳送給磁盤可以提高 I/O 性能。AIX 中定義的每個磁盤在 ODM 庫中都有 queue_depth 屬性。這個屬性限制了 AIX 可以傳送到設備的最大命令的數量。
queue_depth 默認數值為 4
將 hdisk2 的隊列長度從 16 調整為 64:
max_transfer 參數
這個參數的含義是,存儲 driver 可以向存儲發的最大的 I/O。通過增加 max_transfer 的數值,我們可以允許 VG 的 LTG 的數值更大。
這個參數我們可以從 64M 調整到 128M。
光纖卡num_cmd_elems參數
如果是通過光纖卡連接的外置存儲,可以考慮調整 num_cmd_elems,這個參數的作用是:controls maximum number of in-flight Ios
這個參數的默認值為 500,我們將其修改為 1000:
光纖卡 max_xfer_size 參數 : attribute also controls a DMA memory area used to hold data for transfer, and at the default is 16 MB. 這個參數是控制 DMA 區域的,用于保持傳輸的數據的的區域,它的默認值是 16MB,可以把這個數值調整成 128MB,這樣光纖卡的帶寬會高一些 .
FSCSI 設備
對于 FSCSI 設備而言,我們可以通過設置參數:dyntrk 和 fc_err_recov 來達到路徑快速切換的目的:This sets the adapters to fast fail over and reduces the amount of time required to select a new data path.
修改完畢以后,榮如下命令進行確認:
總結
在 AIX 下調整磁盤 I/O 性能是一個相對復雜的工作,參數的數值往往是根據環境的變化而不通。這就要求我們在熟悉磁盤 I/O 性能架構的基礎上,靈活調整。
參考資料
學習
- 通過參考 《IBM AIX Version 6.1 Differences Guide》,了解 AIX 的更多信息。
- 通過參考 《AIX 5L Practical Performance Tools and Tuning Guide》,了解 AIX 性能監控的信息。
- “優化 AIX 6.1 的性能”(developerWorks,2008 年 3 月):在本文中,將介紹關于 AIX 6.1 中 CPU、虛擬內存和 I/O(磁盤和網絡)等方面的性能監視和優化的最新更改。實際上,其中的許多更改并沒有對內核進行多少創新,而是更關注于一些輔助的內容,比如對缺省參數進行改進,以便更精確地反映實際的數據處理。還有一些其他的增強,包括唯一的可調參數的文檔說明、受限制的可調參數,以及對某些子系統所做的各種其他改進。您將了解更多有關性能優化方法的信息,而這些內容是任何優化策略所必需的部分。
- “AIX 5L 性能優化”(developerWorks,2007 年 9 月):整個系列文章會從 CPU,內存,硬盤等方面對 AIX 5L 系統的優化工作進行一次詳細的討論。同時會更具許多的具體情況和例子來說明 AIX 上的一些工具和命令的作用以及它們會為管理員日常上的工作提供那些的幫助。同時會介紹一些 AIX 5L 中新增的一些管理和優化方面的新功能,讓您對您的系統有一個更好的了解。
- AIX and UNIX 專區:developerWorks 的“AIX and UNIX 專區”提供了大量與 AIX 系統管理的所有方面相關的信息,您可以利用它們來擴展自己的 UNIX 技能。
- AIX and UNIX 新手入門:訪問“AIX and UNIX 新手入門”頁面可了解更多關于 AIX 和 UNIX 的內容。
- AIX and UNIX 專題匯總:AIX and UNIX 專區已經為您推出了很多的技術專題,為您總結了很多熱門的知識點。我們在后面還會繼續推出很多相關的熱門專題給您,為了方便您的訪問,我們在這里為您把本專區的所有專題進行匯總,讓您更方便的找到您需要的內容。
- AIX and UNIX 下載中心:在這里你可以下載到可以運行在 AIX 或者是 UNIX 系統上的 IBM 服務器軟件以及工具,讓您可以提前免費試用他們的強大功能。
- IBM Systems Magazine for AIX 中文版:本雜志的內容更加關注于趨勢和企業級架構應用方面的內容,同時對于新興的技術、產品、應用方式等也有很深入的探討。IBM Systems Magazine 的內容都是由十分資深的業內人士撰寫的,包括 IBM 的合作伙伴、IBM 的主機工程師以及高級管理人員。所以,從這些內容中,您可以了解到更高層次的應用理念,讓您在選擇和應用 IBM 系統時有一個更好的認識。
總結
以上是生活随笔為你收集整理的AIX 下磁盘 I/O 性能分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 多线程原来是这么简单
- 下一篇: ERP中的合并会计报表