Krisenmanagement bei 1&1

In der Krise zeigt sich, was der Provider wirklich drauf hat. Krise bei 1&1 war gestern. Und das Krisenmanagement hat sich mit der Internetleitung einen Wettstreit darum geliefert, wer von beiden der größere Totalausfall ist.

Los ging es um kurz vor drei. Fünf von fünf Servern nicht erreichbar. Ein kurzer Check über die serielle Konsole ergab aber, dass es nicht an den Servern lag. Der Twitter-Account @1und1 brauchte dann geschlagene 20 Minuten, um das auch zu bemerken. Die, man sollte annehmen eigentlich genau für einen solchen Fall gedachte, Statusseite status.1und1.de hingegen verkündet auch heute morgen noch, dass alle Systeme funktionieren würden und dies seit dem 4. August so sei.

Ziemlich genau zwei Stunden später waren dann alle Server wieder erreichbar bis kurz vor 20 Uhr. Und hier kommt der Teil, der mich an dieser Geschichte wirklich aufregt. Fehler können immer mal auftreten, da kann man sich noch so gut absichern. Und ich gestehe jedem eine angemessene Zeit zu, dass er diese beheben kann. Wenn man aber um kurz nach fünf mit großen Halali auf Twitter verkündet, dass jetzt wieder alles gut sei, dann sollte man alles daran setzen, dass nicht genau der gleiche Fehler kurz darauf wieder auftritt:


Die Ursache ist bekannt. In anderen Worten:

Scheiße, genau das gleiche wie vorhin. Warum haben wir das nicht einfach vernünftig gefixt?

Und obwohl 1&1 weiß, woran es liegt, brauchen sie erneut über zwei Stunden, um das Problem aus der Welt zu schaffen!
Krisenmanagement und vor allem auch Krisenkommunikation sieht anders aus. Die angesprochene Statusseite hat sich auch beim zweiten Ausfall nicht aktualisiert und der Twitter-Account war eigentlich immer so viel zu spät dran, dass man sich auch den hätte sparen können.

Ich bin Web Developer und arbeite als Lead Developer bei WIBROS. Ich liebe das Internet, Baseball, Softball, Bier und die Farbe orange. Ich hab früher mal zu viel Kaffee getrunken.

Comments (3) Write a comment

  1. Ich war gestern auch davon betroffen, 3 von 3 Severn, die ich bei 1&1 administrieren, waren außer Gefecht gesetzt. Mich persönlich hat es ebenfalls aufgeregt, dass 1&1 nicht in der Lage ist, das ordentlich zu kommunizieren. Bei Twitter verspätet und überhaupt der falsche Platz. Als erstes sollte man das evtl. auf der Homepage von 1&1 kenntlich machen, aber NICHTS.

    PS: Nur meine Monitoring App hat gestern ordentlich funktioniert.

    Reply

  2. “…und hab früher mal zu viel Kaffee getrunken…”
    Auch wenn’s ‘n Kontextbruch ist, hab’ mich weggeschmissen…

    Gruß,
    noRiddle

    Reply

  3. Naja man muss hier auch berücksichtigen, dass 1 & 1 ein riesen Netz zu betreuen hat. Wenn hier mal die Firmware eines Routers streikt und die Routingnetze neu hochgefahren werden müssen, ist das auch nicht vergleichbar mit einem Neustart des heimischen PCs, da die Cluster schritt für schritt zugebucht werden müssen, damit das System nicht gleich wieder kolabiert. Bei mehreren 1000 Servern kann das schon 2 Stunden dauern.

    Reply

Leave a Reply to noRiddle Cancel reply

Required fields are marked *.