Amikor az ember egyre több Solaris szerver felett veszi át az uralmat, felmerül az igény arra, hogy minél gyorsabban tudja a napi munkát elvégezni. Ez nálam főként arról szól, hogy egy szerveren, minél gyorsabban le tudjam ellenőrizni a fontosabb állapotokat.
Bevezetés
Akármennyire is rutinos az ember, mindig hibázhat, kihagyhat egy fontosabb komponenst, vagy elnézheti a sok-sok soros kimeneteket.
Ezért vált fontossá, hogy legyen egy olyan „általános” script ami ezt az adminisztrátor helyett megteszi. A script alapvetően nem bonyolult reporting célra készült, ez sosem volt tervem. Csak annyit akartam elérni, hogy egyszerű és félreérthetetlen üzenetek alapján lássa az ember ha valami nincs rendben. Ezek után már tudni fogja a megfelelő adminisztrátor mi fele nézelődjön.
Követelmények
– A script maga KSH alapú, így /bin/ksh megléte szükséges, bár Solaris 10 alatt ez adott.
– A script Solaris 10 SMF, illetve hálózati eszközöket hív meg, a Solaris 9-es rendszereken ezen eszközök nem elérhetőek. A script önmaga el se indul, ha nem Solaris 10-et azonosít.
– A script standard Solaris parancsokat hív meg, viszont ahol tesztelésnél kijött probléma, ott a teljes PATH-al hívtam meg őket.
– A tesztelő parancsok legtöbbje megkívánja a root jogosultságot, így a script ezen verziója csak root-ként futtatható.
Tesztelési Komponensek
A tesztelési részeket a scriptben külön függvényekként írtam meg. Ez már csak azért is fontos, mert a script külön képes azonosítani, hogy egy local zónában vagy egy global hoston fut. Local Zónában nincs értelme a legtöbb tesztelési folyamatnak. Így tetszés szerinti csoportosítást lehetett megvalósítani.
– Fault Management Check:
Lekéri az FMADM faulty kimenetelét. Ha bármilyen event megtalálható itt, figyelmeztet.
– Filesystem check:
ZFS esetén kiírja nekünk a különböző ZFS filesystem-eket, illetve a vfstab-ban található bejegyzéseket ellenőrzi, hogy mountolva is vannak-e.
– SVM check:
Ellenőrzi a metadb-k meglétét és állapotát, illetve a metadevice-k státuszát.
– SAN Multipatching check:
Ellenőrzi a FC HBA portok meglétét, illetve ha van, akkor legalább két port aktív legyen.
– Network check:
Lekéri az /etc/hostname.* interfacek nevét, és megnézni, hogy a konfigurált interfaceken van-e link. Ezen túl ellenörzi a default route meglétét, és hogy egyéb routingoknál használt gateway pingelhető-e.
– Solaris Service check:
Ellenőrzi, hogy az SMF illetve, INET servicek státusza megfelelő-e.
– Zone Check:
Ellenőrzi, hogy az adott gépen van-e local zone, illetve figyelmeztet ha csak configured vagy installed állapotban vannak.
– Email queue check:
Ellenőrzi, van-e felgyűlve kézbesítetlen levél.
– Veritas VxVM check:
Ellenőrzi, hogy van-e installálva Veritas Volume Manager, illetve ha vannak VxVM volume-k, akkor ACTIVE ENABLED az állapotuk.
– Veritas VCS check:
Ellenőrzi, hogy van-e installálva Veritas Cluster Suite. Ha igen, akkor a megfelelő GAB, LLT, HAD komponensek futnak-e és konfiguráltak. Illetve ha vannak Service Group-ok, akkor minden megfelelőképpen aktív-e valahol.
Használat
Egyszerűen csak el kell indítani a scriptet:
# ./health_check.sh
Mindjárt ki is próbálom ,műkxik-e errefele is.Remélem igen mert akkor megspórol egy kis időt nekem.:D Köszkösz
Tökéletesen műkxik.Ahol kipróbáltam kiderült hogy az SAP-s admin accok lockolva vannak vmiért.:D Most nyomozzuk hogy miért is :D
Szuper! :)
Nalunk is sok erdekesseg kiderult!
Jonnek a tovabbi scriptek ;) Varom a visszajelzeseket azokrol is.
MiszterX