Nach dem Ausfall

Durch den Einsatz von bis zu 10 Mitarbeitern konnten die Schäden des Ausfalls vom 27.12. weitgehend wieder behoben werden.
Es bleiben jedoch viele Aufräumarbeiten zu tun.

Im Webbereich hat so auch der Ausfall einer von zwei CPUs auf der info2 die Folge, daß der Umzug der High-Traffik-Domains FAU, RRZE und Techfak vorgezogen werden muss.
Das vorziehen wiederum bedeutet, daß Dinge, die erst in den kommenden Wochen unter geregelten Bedingungen und mit ausführlichen Tests durchgeführt werden sollten, jetzt auf die schnelle geschehen müsseb.
Das ist eigentlich ein Absolutes NoNo für große bedeutende Webauftritte. Aber was ist die Alternative?
Die info2 war bereits vor der ganzen Sache hart am Limit und teilweise auch drüber, wie man an teilweise sehr zähen Seitenaufbauten feststellte.
Die Leistungshalbierung würde somit wahrscheinlich am 8.1. dann ziemlich arg reinhauen.
Aus diesem Grund ist nun erstmal die FAU mit seinen Unterportalen auf die info1 gezogen worden. Das FAU-Portal nutzt glücklicherweise nicht sehr viele interaktive Funktionen, sondern besteht zum größten Teil aus statischen Seiten.
Das funktioniert auch schon. Was noch nicht fertig ist, sind die verschiedenen Libraries und Module.
Diese werden hauptsächlich durch das RRZE-Portal und das Portal der Techfak genutzt. Somit müssen diese erstmal auf der info2 bleiben und -mit Daumen drücken- warten, daß es auf der info1 fertig wird.

Andere Server sind glücklicherweise nicht so betroffen.
Die Solaris-Server info3, info9 und info11 haben die ganze Sache ganz gut weggesteckt.
Weniger Glück hatten da einige HP-Server auf Linux… Zum Glück war das aber nicht im Webbereich 🙂

Was bleibt zu tun:
Die info1 muss fertig gestellt werden.
Damit dies geschehen kann, muss das Paket der Libs und Module auf den Infoservern fertig werden. Damit dies geschehen kann, müssen jedoch wieedr andere Dinge fertiggestellt werden, die wieder von anderen geliefert werden.

Bei einer Frickel-Linuxkiste, die man zu Hause hat, hat man natürlich nicht so ein Aufwand. Allerdings laufen auf solchen Kisten selten mehr als 2 Webauftritte.
Und in der Regel gibt es nur einen einzigen Admin und nur einen einzigen User.
Security auf Filesystemebene ist dort dann auch meist genauso unbekannt, wie das Nutzen von Fileservern, Backups und dezentrale Administration.

Wie war der Spruch: Es gibt viel zu tun, packen wir es an!