Problemen RAID5 array troubleshooten met Smart Storage Admin (ssacli)

De omgeving van steijvers.com was getroffen door een probleem in met de schijfopslag. Ineens konden de servers niet meer gevonden worden op het raid5 array. Aangezien ik via de Lights-Out poort problemen had om de console in beeld te krijgen, iets met browser updates en compatibiliteit met iLO, en toch de backups voor handen had was de keuze om het array opnieuw aan te maken en de boel terug te halen uit de backup. De fysieke disks waren namelijk healty, enkel de logical disk op het array was stuk.

Deze gehele situatie wijst nog maar eens op het belang van goede backups. Hierdoor was het eenvoudig om alles weer op de rit te krijgen.

Achteraf had ik me meer tijd kunnen besparen, toen ik tijdens het restoren aan het zoeken kwam ik erachter dat bij de het type raid controller (Smart Array P410) een sneller optie bestaat. Verwijder een van de disks voor 10+ seconden, en geef dan via de ESXCLI het onderstaande commando:

/opt/smartstorageadmin/ssacli/bin/ssacli ctrl slot=1 ld 1 modify reenable forced

Hiermee had ik de logicaldrive 1 wederom op status OK kunnen krijgen en waren alle VM’s meteen weer beschikbaar geweest.

Status Raid controller opvragen:

/opt/smartstorageadmin/ssacli/bin/ssacli ctrl slot=1 show status

Status Raid controller opvragen (detailed):

/opt/smartstorageadmin/ssacli/bin/ssacli ctrl slot=1 show detail

Status fysieke disks opvragen:

/opt/smartstorageadmin/ssacli/bin/ssacli ctrl slot=1 pd all show status

Status logical disks opvragen:

/opt/smartstorageadmin/ssacli/bin/ssacli ctrl slot=1 ld all show status

ADU report genereren:

/opt/smartstorageadmin/ssacli/bin/ssacli ctrl all diag file=/
tmp/ADUreport.zip ris=on xml=on zip=on