Am 24.04.2013 nachmittags gab es einen Netzausfall der Folgen für einige Dienste am RRZE hatte.
Gegen 15:45 Uhr sind zwei Events eingetreten:
1. Großes Spanning-Tree-Durcheinander
2. Crash des primären RRZE-Routers (Reliant)
Da der Crash nicht zum Totalausfall des Routers “Reliant” geführt hat, kann nicht mit Sicherheit gesagt werden, welcher Event jeweils zum anderen geführt hat. Die Netzseite war kurz nach 16 Uhr wieder beruhigt, die letzten spürbaren NetzSchäden ca. 16:20 Uhr behoben. Bei den Diensten dauerte es etwas länger.
Durch den längeren Netzausfall bedingt griffen bei manchen Diensten auch failover Maßnahmen (z.B. eine Übernahme durch andere Server) nicht mehr. So war z.B. der Zugriff auf eine NetApp als Fileserver für die am RRZE gehosteten Webauftritte trotz Redundanzen nicht mehr verfübgar und es musste von Hand eingegriffen werden. Verschiedene Webauftritte waren für eine längere Zeit gestört. Das Problem war dann gegen 17:00 Uhr vollständig behoben.