Kanekk2さん
集められた情報をもとにお知らせします。
なお、あくまで目安、なので最終的にはログの確認とサポートとの相談が必要です。
コマンド実行における業務影響の注意などはなかったです。
1,Cache SSD
⇒#isi device drive list で確認可能 (Bay1 もしくは2のステータス確認)
参考:504846 : Gen6 nodes report Bay 2 state EMPTY
2,M2 Vault Card
⇒isi_hwmon -f
例:
h600-1# isi_hwmon -f
All FRUs Fault: 0
Battery Backup Unit: 0
CPU Device I2C Segment: 0
CPU Module: 0
CPU and HBA Riser I2C Segment: 0
DIMM0: 0
DIMM1: 0
DIMM2: 0
DIMM3: 0
Drive Interface Board I2C: 0
Drive interface Board: 0
Enclosure (I2C or Midplane Resume Fault): 0
External Fault: 0
Fan0: 0
Fan1: 0
HBA0: 0
HBA0 I2C Segment: 0
HBA1: 0
HBA1 I2C Segment: 0
I2C0: 0
I2C1: 0
I2C2: 0
I2C3: 0
I2C4: 0
I2C5: 0
I2C6: 0
I2C7: 0
Internal M.2: 0
M.2 Vault Card: 0@@<<<<<<<
Non-Transparent Bridge: 0
Slot1-PS0: 0
Slot2-PS1: 0
3、External NIC
4、Internal NIC
⇒Ifconfig で使用されているインターフェース確認(status: active確認)
5、DiMM
⇒isi_hwmon -eにてエラーの確認。
例)エラーがある場合は<<<で出力。
その閾値と交換判断についてはサポートに連絡が必要です。
471888 : DIMM replacement policy for EMC Isilon nodes
(isi_hwmon -e出力結果)
Correctable ECC policy per DIMM limits:
max 500 errors per DIMM rank
reset error counters every 24 hours
ECC count registers
DIMM0-RANK0: 0
DIMM0-RANK1: 0
DIMM1-RANK2: 0
DIMM1-RANK3: 10 <<<
DIMM2-RANK4: 0
DIMM2-RANK5: 0
DIMM3-RANK6: 0
DIMM3-RANK7: 0
6.Node
⇒isi statusで確認可能
(isi status出力結果)
Cluster Name: IsilonX210
Cluster Health: [ ATTN]
Cluster Storage: HDD SSD Storage
Size: 14.3T (16.2T Raw) 0 (0 Raw)
VHS Size: 1.9T
Used: 10.9G (< 1%) 0 (n/a)
Avail: 14.3T (> 99%) 0 (n/a)
Health Throughput (bps) HDD Storage SSD Storage
ID |IP Address |DASR | In Out Total| Used / Size |Used / Size
—+—————+—–+—–+—–+—–+—————–+—————–
1|10.xxx.xx.xxx | OK | 180k| 737k| 917k| 2.8G/ 5.4T(< 1%)| L3: 1.1T
2|10.xxx.xx.xxx |-A– | 6.5k|15.4M|15.4M| 3.9G/ 5.4T(< 1%)| L3: 1.1T
3|10.xxx.xx.xxx | OK | 0|42.3k|42.3k| 4.2G/ 5.4T(< 1%)| L3: 1.1T
—+—————+—–+—–+—–+—–+—————–+—————–
Cluster Totals: | 187k|16.2M|16.4M|10.9G/14.3T(< 1%)| L3: 3.3T
Health Fields: D = Down, A = Attention, S = Smartfailed, R = Read-Only
Critical Events:⇔ここで主なエラーも確認できます。
09/28 01:15 2 External network link ext-2 (igb1) down
Cluster Job Status:
No running jobs.
No paused or waiting jobs.
No failed jobs.
Recent job results:
Time Job Event
————— ————————– ——————————
09/27 22:06:05 SnapshotDelete[125] Succeeded (MEDIUM)
09/27 22:01:19 FSAnalyze[124] Succeeded (LOW)
09/27 22:00:10 SmartPools[123] Succeeded (LOW)
09/27 20:00:30 ShadowStoreProtect[122] Succeeded (LOW)
09/27 04:00:09 ShadowStoreProtect[121] Succeeded (LOW)
09/27 02:00:30 WormQueue[120] Succeeded (LOW)
09/26 22:06:43 SnapshotDelete[119] Succeeded (MEDIUM)
09/26 22:01:34 FSAnalyze[118] Succeeded (LOW)
09/15 10:46:16 Collect[35] Collect[35] Failed