Serverausfall vom 25. bis zum 30. Januar 2020

  • Hej,

    da sind wir wieder!

    In der Nacht von Freitag auf Sonnabend hat sich offenbar eine Festplatte im Radverkehrsforum-Server verabschiedet. Grundsätzlich ist das kein Problem, dafür gibt’s in einem vernünftigen Server ja mindestens zwei Festplatten, deren Inhalte gespiegelt werden. Aus irgendeinem Grunde ließ sich aber mit meinen Fähigkeiten als Software-Entwickler der Inhalt der Datenbank nicht mehr vernünftig rekonstruieren. Tja.

    Das macht ja nichts, dafür hat man ja Backups. Die waren aber auch defekt, denn obwohl ich jeden Tag ein Backup anlegen lasse, waren die defekten Daten natürlich auch im Backup enthalten. Es stellte sich dabei heraus, dass sich der Festplattenschaden wohl schon seit einer längeren Zeit angekündigt hat, erst ein älteres Backup vom 14. Januar ließ sich problemlos wiederherstellen.

    Die restlichen Tage habe ich manuell wieder zusammengesucht. Das dauerte leider eine ganze Weile, weil man für dieses Puzzlespiel einen ordentlichen Internetzugang braucht und sich so etwas nicht in der Bahn zwischen zwei Funklöchern oder in der Mittagspause erledigen lässt.

    Der letzte Beitrag ist von Sonnabendmorgen kurz nach Mitternacht — ich hoffe, es ist jetzt wieder so ziemlich alles da und rekonstruiert. Falls ihr fehlende Beiträge, defekte Dateianhänge oder Bilder oder sonstige Unregelmäßigkeiten bemerkt, schreibt hier bitte eine Nachricht.

    Gute Nacht

    Malte

  • Danke Malte. Und darf ich noch ausdrücklich die Informationspolitik während des Ausfalls loben? Ich fand die kleinen Hinweise sehr beruhigend und viel netter als das sonst übliche "hier ist nichts, es dauert noch".

  • Jetzt scheint es ein Problem mit der Verschlüsslung zu geben http://www.radverkehrsforum.de ist bei mir in Firefox und Chrome als "nicht sicher" makiert.

    wenn Du nur http aufrufst ist die Seite nicht verschlüsselt. Du mussst https nutzen

    Danke für den Hinweis — die Weiterleitung müsste jetzt wieder aktiviert sein, das hatte ich anscheinend vergessen.

  • Lästige Sache: Ich wollte eigentlich heute Nacht mit der gesamten Problematik abschließen und das Forum von seinem temporären Zuhause wieder auf einen anderen Server umziehen. Das geht dank Plesk supereinfach und ist heutzutage nur noch ein Knopfdruck und gar kein Vergleich zu dem früheren Herumgerenne auf mehreren Konsolen und so weiter und so fort.

    Eine spielte allerdings nicht mit: Eine Festplatte des neuen Servers. Auch der hat natürlich zur Sicherheit gleich zwei davon und die eine rauschte mir mitten in der Nacht ab. Kein Witz:

    Ich lasse morgen erstmal die defekte Festplatte austauschen, stelle dann die Spiegelung der Platten wieder her und dann wage ich den Umzug ein zweites Mal.

    Gerne lehnte ich mich zurück und behauptete, für den Notfall hätte ich ja noch Backups, aber nach den letzten Erfahrungen bin ich da so zuversichtlich nicht.

  • Vielen Dank auch von mir fürs Wiederherstellen und Zusammenbauen! Das mit dem kalten Entzug ging mir auch so, man vermisst etwas erst dann, wenn man's mal nicht mehr hat...

    Zitat

    Lästige Sache: Ich wollte eigentlich heute Nacht mit der gesamten Problematik abschließen und das Forum von seinem temporären Zuhause wieder auf einen anderen Server umziehen. Das geht dank Plesk supereinfach und ist heutzutage nur noch ein Knopfdruck und gar kein Vergleich zu dem früheren Herumgerenne auf mehreren Konsolen und so weiter und so fort.

    Eine spielte allerdings nicht mit: Eine Festplatte des neuen Servers. Auch der hat natürlich zur Sicherheit gleich zwei davon und die eine rauschte mir mitten in der Nacht ab. Kein Witz:

    Je nachdem wieviel Zugriff du auf den Server hast bzw. wie er konfiguriert ist: ich kann ZFS als Dateisystem sehr empfehlen. Das ist nicht nur kompletter Software-RAID a la mdadm, sondern hat zusätzlich Fehlererkennung mit Prüfsummenbäumen für jeden einzelnen Block (und soweit möglich, auch automatische Korrektur). Grade bei silent corruption wie hier ist das Gold wert, weil es rechtzeitig erkannt wird und man dementsprechend nicht Backups von kaputten Daten macht. Und auch bei lange gelagerten Backups ist es super, weil man jederzeit sicher sagen kann, dass im Backup alles noch so ist, wie es vor x Jahren war (und die Backups dank block-level-Basis auch sehr schnell durchlaufen).

  • Im Laufe des Donnerstagvormittages wird nun die andere Serverfestplatte ausgetauscht — die hatte in den vergangenen Tagen zarte Anzeichen anstehender Kalamitäten gemeldet und ich möchte das repariert wissen, bevor mir alles um die Ohren fliegt.

    Darum ist das Forum und alle anderen Dienste auf diesem Server am 27. Februar 2020 von 9 Uhr bis mindestens 12 Uhr nicht erreichbar sein.