5 disastri IT che hanno fermato la rete nel 2012

Ci avviciniamo alla fine dell’anno e come sempre non mancano gli spunti per riflettere su quanto appena avvenuto negli ultimi 12 mesi, per noi è utile capire cosa è avvenuto nel mondo della rete e oggi vogliamo parlarvi dei 5 downtime che nel corso nel 2012 hanno bloccato un numero consistente di siti web e hanno fatto parlare di loro. Il downtime è il termine tecnico che si utilizza per indicare il blocco di un servizio o di parte di esso nell’erogazione online; in questo caso vedremo in particolare i blocchi legati alle piattaforme di cloud computing. Iniziamo!

1. Amazon Web Services, svariati downtime nel corso dell’anno

Si merita la prima posizione, il noto servizio di Amazon AWS, una delle più grandi piattaforme di cloud computing al mondo, ha registrato svariati downtime nel corso del 2012, il più grave è avvenuto nei giorni del 29 e 30 Giugno 2012, quando uno dei data center americani della compagnia ha perso alimentazione e ha riportato così un lungo downtime per diversi clienti. Non solo, l’avvenimento ha bloccato anche il sistema che permette agli utenti di distribuire il carico dei loro sistemi su più regioni, rendendo inutili così le pratiche di ridondanza adottate dai clienti. Tutto questo a sole due settimane da un downtime precedente, decisamente un anno poco favorevole per Amazon, che necessita ancora qualche correzione nelle sue policy di gestione della ridondanza su più data center.

2. GoDaddy, un problema ai DNS oscura 5 milioni di siti web

Proprio così, il 10 Settembre GoDaddy ha visto i propri DNS accusare un lungo downtime che ha coinvolto con se ben 5 milioni di siti web del colosso del webhosting, irraggiungibili per diverse ore. Il problema? Non un attacco esterno come era stato ipotizzato, un errore interno nelle tabelle di routing del provider, un errore scoperto solo dopo ore che nel frattempo ha fatto temere il peggio ai tecnici della compagnia.

3. L’Uragano Sandy a New York, i data center allagati e fermi

Sicuramente uno degli eventi naturali che ha causato i maggiori danni alle aziende di servizi di data center operanti nell’area di New York. Sandy si è abbattuto sulla città allagando interi data center: le conseguenze sono state davvero pesanti per alcune compagnie dal momento che i data center non potevano essere alimentati tramite la rete energetica fissa ma solamente tramite generatori. Molti di loro hanno tenuto acceso i generatori anche per alcuni giorni cercando poi disperatamente rifornimenti di gasolio per evitare lo spegnimento del data center; Datagram, uno dei provider colpiti, ha avuto un fermo totale delle pompe che aspiravano l’acqua dal proprio data center, provocando così un danno ingente anche per i clienti ospitati nel data center.

4. Hosting.com, fatale l’intervento di manutenzione

Per i 1100 clienti di Hosting.com che lo scorso 28 Luglio sono rimasti al buio, è stato fatale un intervento di manutenzione della compagnia sugli UPS del data center. Un errore umano commesso dal vendor degli UPS che durante l’operazione ha tolto corrente all’intero data center, provocando uno spegnimento brusco di tutti i server, con conseguente tempo di recupero nel tornare online per il controllo di tutti i dischi e il check di tutta l’infrastruttura hardware. L’errore umano è uno dei casi più frequenti di downtime, soprattutto quando si parla di alimentazione e networking.

5. Windows Azure si ferma per un bug nel calendario del sistema

Fatale il bug all’interno del sistema di Windows Azure, il cloud computing di Microsoft: il 29 di Febbraio, giorno che si presenta solamente ogni 4 anni, non era stato adeguatamente conteggiato nel sistema. Un downtime di 8 ore e l’impossibilità di accedere alla console di gestione delle applicazioni è stato il prezzo da pagare per questa svista: un errore umano anche in questo caso. Come Google, anche Microsoft accusa spesso errori di questo tipo dovuti a bug nel software di controllo delle piattaforme.

E noi? HostingSolutions.it ha riscontrato un paio di downtime più seri nel corso dell’anno, entrambi risolti nel giro di poche ore e dovuti in entrambi i casi ad un fault non dipendente da noi; questo ha portato però HostingSolutions.it a migliorare i propri sistemi di ridondanza dei dati (l’apertura del nuovo data center di Roma va a garantire maggiormente questo aspetto) e ad aumentare il numero di carriers utilizzati nel nostro data center, per assicurare che in ogni caso tutti i nostri clienti rimangano sempre online sulla rete.