Data center: analisi dei dati e cloud per prevedere i disservizi

Cloud

In un precedente post si è parlato dell’importanza dei piani disaster recovery, necessari a fronteggiare non solo eventi disastrosi (incendi, terremoti etc.) ma anche imprevisti vari (da errori umani a guasti hardware). La strategia verso la quale mira tuttavia l’industria è quella di anticipare l’accadimento di tali situazioni. Indipendentemente dall’efficacia dei piani disaster recovery, le compagnie preferirebbero infatti evitare la gestione delle delicate procedure annesse al ripristino dell’attività lavorativa.

E’ bene ricordare che esistono già alcune soluzioni in grado di aiutare il personale nell’automazione ed il monitoraggio di determinate task di apparati hardware e altri componenti fisici” dell’infrastruttura (cavi di rete, sistema di refrigerazione, impianto elettrico, sistemi di sicurezza anti intrusione etc.):

  • BMS o building management systems, sistema di controllo (hardware) che monitora lo stato delle apparecchiature meccaniche ed elettriche di un edificio;
  • DCIM o data center infrastructure management, approccio che si affida sia a strumenti software che hardware per raccogliere e gestire dati circa l’infrastruttura e controllarne determinate apparecchiature;
  • DMaaS o data center management as a service, approccio basato sul cloud che punta alla manutenzione predittiva. Si tratta di un settore nato di recente e che necessita di ulteriori sperimentazioni.
  • CMMS o computerized maintenance and management software, pensato per automatizzare alcune operazioni legate alla manutenzione della strumentazione del data center. L’adozione del CMMS non è diffusa e le funzionalità variano in base al provider.

Lo scorrere degli anni e l’avanzamento tecnologico non sono riusciti tuttavia a rimpiazzare totalmente determinate pratiche di controllo e manutenzione che, tutt’oggi, si svolgono in modo simile a quanto avveniva alcuni decenni fa. Si tratta di operazioni solitamente costose che richiedono tempo ed espongono l’infrastruttura all’errore umano – sempre presente e tra le principali cause di downtime, affermano gli esperti.

L’approccio MCIM

Data Center Knowledge (DCW) ha intervistato recentemente Michael Dongieux, numero uno di Fulcrum Collaborations, azienda specializzata in una quinta via all’automazione e controllo delle procedure nei data center detta MCIM. La definizione data dalla stessa Fulcrum è “una piattaforma cloud per centralizzare, standardizzare ed automatizzare le operazioni FM (Facilities Management)”. DCW, che ha descritto MCIM come un CMMS evoluto, ha cercato di capire se tale soluzione abbia veramente le potenzialità dichiarate da Dangieux (un mercato da 1 miliardo di dollari).

I punti di forza di MCIM sono essenzialmente due, afferma il CEO:

– l’impiego dell’analisi dati (data science) per rendere più intuitiva la consultazione dei dati. “Nel nostro sistema ogni elemento è correlato. Ma siamo in grado di ottenere ciò [di cui necessitiamo] senza appesantire [l’utente] con la compilazione [di report o altri documenti] che normalmente non compilerebbero”;

– la “cattura” di dati che andrebbero irrimediabilmente persi in altre situazioni. “[L’intuizione è arrivata osservando] gli operatori sul campo – che intraprendevano sessioni di [compilazione di report sull’incidente, di report sui cambiamenti intercorsi, d’esecuzione degli ordini CMMS]; quello di cui avevamo bisogno era nelle loro menti. Il trucco è quindi quello di estrapolare tali informazioni in modo “indolore” e nel momento in cui gli operatori stessi le stanno catturando”.

Ma come funziona esattamente MCIM?

“Quando qualcuno accede ad un report d’incidente, è in grado di associare ogni asset coinvolto nell’incidente e stabilire la causa [del downtime]. Quella informazione è [acquisita ed archiviata automaticamente]. Ciò ci permette di correlare non solo l’ACI (asset condition index) di un particolare componente ma anche, per esempio, di dire che all’85% del suo ciclo di vita previsto [inizierà a manifestare] più di frequente una specifica problematica.

L’idea è sulla carta interessante ma DCW ribatte in chiusura MCIM non rischia di essere messa all’angolo dall’avanzamento delle strumentazioni sviluppate dai vendor, i quali vi affiancheranno evolute soluzioni IoT o DMaaS”?

Michael Dongieux non sembra essere preoccupato. Qualunque sia il livello di sofisticazione raggiunto dalle alternative sulla piazza, ci sarà sempre bisogno di una “componente umana”.  “Ogni responsabile dell’infrastruttura vuole rafforzare la standardizzazione [delle procedure] e la governance. Vuole essere in grado di controllare l’analisi dati e la business intelligence. Vuole sapere quale sia il costo d’utilizzo di determinati strumenti, il loro costo di manutenzione […] e quali siano i margini di miglioramento. Buona parte dei servizi DMaaS si sta focalizzando sui dati generati dalle macchine […]. Le opportunità di miglioramento semplicemente non esistono dal punto di vista delle macchine. Almeno per ora si ha la necessità che lo staff interagisca con la strumentazione. Fin quando non saremo rimpiazzati da robot, avrai sempre bisogno di  far svolgere attività di manutenzione al personale”.

Fonte: 1