Meldungen und Artikel

Meldungen und Artikel aus dem RRZE

Inhalt

Störung rzvm9

Der virtuelle Server rzvm9 ist aufgrund eines Firmware-Fehlers ausgefallen.

Betroffen waren die Webangebote vom Sport und der EAM.

Der Fehler trat am Wochenende auf und wurde zwischenzeitlich behoben.

 

Betriebsstörung OTRS am heutigen Mittwoch

Durch Probleme mit dem Datenbank-Server war über die Mittagszeit der Betrieb von OTRS leider nicht so zuverlässig wie gewöhnlich. Durch verschieben von Ressourcen konnte die Serverkapazität für OTRS erweitert werden, so dass bis zum Umzug von OTRS auf einen neuen schnelleren DB-Server wieder wie gewohnt gearbeitet werden kann.

Maximal wurde ein Ticket beschädigt bzw. unvollständig gespeichert. Weitere Nebenwirkungen erwarten wir nicht.

Störung der zentralen Suchmaschine (behoben)

Die zentrale Suchmaschine der Universität ist derzeit aufgrund eines Dateisystemfehlers nicht erreichbar.

An der Fehlerbehebung wird gearbeitet.

Update (28. Juni, 16:00)

Mittlerweile wurde die Suchmaschine auf ein neues Rechnersystem umgezogen und ist wieder voll funktionsfähig.

Störung Webauftritte

Es kommt derzeit bei allen dynamischen Webauftritten zu Problemen.

An der Fehlerbehebung wird gearbeitet.

 

 Update: 18.20 Uhr

Das Problem konnte auf ein zentrales Verwaltungssystem zurückgeführt werde. Da dessen Betreuer am Wochenende nicht greifbar ist, wurde eine temporäre Notlösung vorgenommen, damit die Webauftritte wieder laufen.
Im Verlauf des Montags kann es daher zu einer kurzfristigen Wartung kommen um das Problem vollständig zu beheben.

 

 

Netzausfall legt Universität Erlangen-Nürnberg lahm

Aufgrund eines technischen Fehlers in den Netzwerkkomponenten, welche die RRZE-zentralen Dienste verwalten, kam es gestern ab 14:53 Uhr zu massiven Störungen und länger andauernden Ausfällen.

Trotz Einsatz aller Kräfte konnte die volle Funktionalität erst gegen 20:45 Uhr wieder hergestellt werden.

Ursache war eine schwer zu ermittelnde Fehlfunktion innerhalb der für das dynamische Routing (OSPF) beteiligten Prozesse, die wiederum zu einer gegenseitigen Störung der eigentlich redundant ausgelegten Netzwerkkomponenten führte.
Betroffen waren alle zentralen Server der Universität.

Das RRZE bedauert die Unannehmlichkeiten, die sich durch diesen Ausfall der Netzanbindung ergeben haben.

 

Netzwerkprobleme (3. Update)

Zwischen 14:58 Uhr und 21:50 Uhr kam es zu massiven Netzwerkproblemen. Der Zugriff auf zentrale Server ist stark gestört oder nicht möglich. Die Verbindung in und aus dem Netzwerk der Universität war teilweise nicht möglich.

Update 1 (15:40 Uhr)

Nach aktuellen Stand normalisiert sich die Lage wieder. Die Ursachen für die Störungen sind derzeit noch unklar. Sobald genaueres bekannt ist, werden wir hierzu nochmal berichten.

Trotz Eingrenzung der Problemursache auf zentrale Systeme, kann noch keine Entwarnung gegeben werden.

Update 2 (19:34 Uhr)

Blogdienst und Groupware-Server scheinen derzeit wieder in Betrieb zu gehen. Der zentrale Webcluster und andere zentrale Server sind weiterhin unerreichbar.

Update 3 (21:50 Uhr)

Die Ursache des Ausfalls (Fehler in den OSPF-Prozessen zwischen den Routern reliant und sitak (ipv6 war ebenfalls betroffen)) konnte gefunden und eine Lösung hergestellt werden.
Die Netzwerkverbindungen wurde ab 20:45 Uhr wieder vollständig hergestellt. Davon abhängige Server, darunter der Webcluster und dessen Loadbalancer starteten sich danach wieder. Ab 21:50 Uhr war der zentrale Webcluster wieder erreichbar.

 

 

 

Ausfall zentraler Webcluster

Der zentrale Webcluster der Universität war zwischen gestern abend um 20:02 Uhr und heute früh um 8:22 Uhr ausgefallen.

Der Cluster konnte heute früh wieder neu gestartet werden und läuft seither wieder. Ausgefallen war eine  zentrale Komponente des Filesystems mit beiden redundant ausgelegten Bauteilen.

 

Update 9:30 Uhr:

Ursache für den Ausfall war ein Ausfall des Netzwerks. Dieser wiederum verursachte die Nicht-Erreichbarkeit eines LDAP-Servers der den Zugriff auf Dateien regelt. Der aktive Fileserver des Webclusters erkannte diesen Ausfall, konnte jedoch nicht durch Ausweichmaßnahmen darauf reagieren, da der redundante Ersatzfileserver mangels Netzzugang ebenfalls nicht auf den LDAP-Server zugreifen konnte.
In diesem Zustand blieb das System bis ein manueller Neustart vollzogen werden konnte.

 

 

Störung beim Posterupload (behoben)

Die Anwendung zum Hochladen von Dateien für den Posterausdruck funktioniert seit Freitag nicht mehr korrekt und beendet sich nach Eingabe aller Daten mit einer Fehlermeldung.

Update:
Das Problem wurde am Montag, den 28.3. um 12:11 behoben.

Kurzzeitige Störung beim Zugriff auf das zentrale Blogsystem

Aufgrund eines Fehles im DNS, konnten kurzfristig einige Rechner die Adresse blogs.fau.de nicht auflösen.

Andere Adressen, wie beispielsweise www.blogs.uni-erlangen.de hingegen funktionierten weiter.
Das Blogsystem selbst arbeitet ohne Probleme.

Das Problem wurde schnell entdeckt und konnte daher nach wenigen Minuten behoben werden.