linux消息总线日志,linux – 解密继续mpt2sas系统日志消息
摘要
我在syslog中收到這些神秘的消息,因為我安裝了一些新的硬件,我無法弄清楚問題是什么,如果它是嚴重的,或者該怎么做.
它們來自新的SATA HBA,它們遵循一種模式.我會得到幾條第一條消息,然后是5-30秒之后的第二條消息.它們都是以相同的秒數記錄的blob,每個的確切數量在大約2到35之間變化.條目的出現之間可以是幾分鐘或幾小時.
兩條消息的示例:
Jul 13 06:06:23 durandal kernel: [366918.435596] mpt2sas0: log_info(0x31120303): originator(PL), code(0x12), sub_code(0x0303)
Jul 13 06:06:28 durandal kernel: [366923.145524] mpt2sas0: log_info(0x31110d01): originator(PL), code(0x11), sub_code(0x0d01)
始終為0x31120303,后跟0x31110d01.
mpt2sas是我正在使用的SATA主機總線適配器的驅動程序,但錯誤內容過于神秘.它沒有告訴我問題是什么,它是什么磁盤或端口或它有多嚴重.
硬件
Supermicro X9SCL配備Xeon E3-1220和8GB RAM.
基于LSI SAS2008的Supermicro AOC-USAS2-L8I SAS / SATA HBA連接到Supermicro CSE-M35T-1B磁盤托盤組.它有三個Western Digital WD30EZRX和兩個Segate ST3000DM001插入其中.所有3TB驅動器(實際上完全相同的扇區數).沒有使用端口擴展器.
HBA,磁盤托架和4個驅動器都是新的.其中一個WD30EZRX已經存在了幾個月,沒有任何問題.如果它先前已連接到集成的Intel SATA控制器,請使用此新設置將其移至驅動器托架中.
HBA存在問題需要經常重置并獲得非常糟糕的性能.將固件/ BIOS更新為“第12階段”,這是Supermicro提供的最新版本,并將類型更改為IT(即直通,從集成raid到IR,因為我將使用所有軟件raid):2008IT12.FW.該更新清除了所有早期問題,直到稍后我才開始收到上述消息(見下文).
我添加的前四個磁盤都在第一個SFF-8087端口上(分成4個SATA電纜).我添加的最新磁盤是在另一個端口,如果這很重要.
系統中唯一的其他磁盤包含操作系統,并且是插入集成SATA控制器的較舊的Intel 80GB SSD.
軟件
Ubuntu 11.10(oneiric). Linux 3.0.0-14-server x86_64.使用操作系統附帶的mpt2sas驅動程序.
嘗試使用Linux md和這五個磁盤構建RAID6陣列.開始使用退化的3個磁盤陣列,兩個Segates和一個新的WD驅動器.這很快,并且非常順利,在我進行固件更新后,日志中沒有消息.同時,我仍然在同一控制器的端口0上使用舊的WD磁盤.
將另一個新的WD磁盤添加到陣列中.重建開始,我現在定期在syslog中收到這些消息.我不確定將磁盤添加到陣列需要多長時間,但估計的時間(cat / proc / mdstat)范圍從數千到數萬分鐘,比前3個磁盤長得多.我明白WD磁盤要慢得多;我有不同的型號來減少多磁盤故障的可能性,那是兩個最便宜的3TB型號.
筆記
SMART不會在任何磁盤上報告任何問題.任何磁盤上都沒有記錄錯誤,并且沒有任何故障統計信息接近閾值.
記錄的消息僅在我添加最后一個磁盤后才開始顯示,這表明可能有問題,但我沒有其他任何指向它.
我確實找到了一個header file,似乎對應于來自此驅動程序的日志消息.第一條消息似乎是未列出的“子代碼”0303的中止(代碼12).第二條消息是重置(代碼11),原因也不清楚.如果我能確定0303和0d01的含義,那將非常有用.
我知道5磁盤RAID6中的4個磁盤是不完整的陣列.我計劃在完成第四個磁盤的集成后將舊磁盤的內容復制到陣列,然后將舊磁盤添加到陣列中.
總結
以上是生活随笔為你收集整理的linux消息总线日志,linux – 解密继续mpt2sas系统日志消息的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 模糊匹配查询_必须掌握的6个查询函数应用
- 下一篇: PyQt特殊对话框介绍