Il problema che riguarda la gestione e l’archiviazione sul lungo termine della mole di dati prodotta giornalmente è una questione delicata per l’industria. Privati e piccole aziende, che non necessitano di supporti durevoli, possono tranquillamente affidarsi agli hard disk e beneficiare del sempre più vantaggioso rapporto costo per GB che nell’arco di pochi anni interesserà anche le unità allo stato solido (SSD).
I supporti più utilizzati in ambito enterprise restano i nastri magnetici: oltre ad offrire velocità di lettura superiori agli hard disk e costare meno, sono meno suscettibili allo scorrere del tempo dimostrandosi perfettamente consultabili anche dopo alcuni decenni (in media 30 anni). Gli hard disk meccanici di livello enterprise sono più soggetti a rotture (failure) ed in grado di raggiungere un ciclo vitale non superiore ai 5 anni (sempre in media).
L’ambiziosa ricerca avviata lo scorso anno da Microsoft ha però l’intenzione di rivoluzionare completamente il settore aumentando la densità (elevato spazio di archiviazione in dimensioni ridotte) e la longevità dei supporti destinati all’archiviazione dei dati. La prossima frontiera per lo storage di livello enterprise (ma non solo), come suggerisce il titolo, potrebbe essere il DNA. Perché si è deciso di puntare sull’acido desossiribonucleico? E’ presto detto: il DNA posto all’interno di alcune sfere di silicio e mantenuto ad una temperatura costante di 10° può restare leggibile per 2000 anni – che salgono fino a 2 milioni se si opta per il congelamento.
Tale soluzione scongiura inoltre il rischio di non disporre degli strumenti per la lettura dei supporti di memorizzazione. Tra vent’anni saremo in grado di leggere un semplice DVD o un Blu-ray disc? Probabilmente no… oppure solo ricorrendo all’impiego di appositi “reperti archeologici”come i lettori che trovano attualmente posto in soggiorno – sempre che questi siano in qualche modo compatibili con le TV o più in generale le tecnologie che nel 2038 ci consentiranno di fruire di contenuti multimediali.
D’altra parte “Saremo sempre interessanti alla lettura del DNA ed è per questo che saremo sembra capaci di leggerlo in futuro — in caso contrario avremo un vero problema” ha affermato Karin Strauss (professore associato del Dipartimento di Informatica ed Ingegneria dell’Università di Washington e ricercatore in architetture computer presso Microsoft Research). Lo studio e la mappatura del codice genetico richiederà tempo e resterà a lungo tra i filoni di cerca principali della comunità scientifica.
Stato dei lavori ed arrivo sul mercato
Il progetto Microsoft è stato avviato con l’acquisto di 10 milioni di molecole di DNA fornite da Twist Bioscience. La procedura di archiviazione dei file ha richiesto in primo luogo la conversione dei bit in molecole base del DNA – sono quattro, 00 > Adenina, 01 > Citosina, 10 > Guanina, 11 > Timina – e la loro conseguente sintetizzazione nel corretto ordine. Per questo primo passaggio esistono degli appositi software, afferma Karin. La “traduzione” è stata successivamente inviata agli esperti Twist che si sono occupati di creare le molecole grazie a sofisticate macchine. I supporti sono stati a questo punto rispediti indietro, pronti ad essere letti dai sequenziatori.
E’ interessante sottolineare che il processo di lettura distrugge le molecole, un dettaglio tutt’altro che trascurabile e che potrebbe far dubitare il lettore della reale utilità del DNA come supporto di archiviazione. In realtà, osserva la ricercatrice, è tutto normale perché conforme alle necessità del settore medico e biotecnologico: “Quando sequenzi il DNA non vuoi utilizzarlo [perché lo esporresti ad un rischio di contaminazione]. Ti sbarazzi semplicemente di tutto, inclusi i reagenti”. Il recupero del DNA resta possibile ma meno conveniente della procedura standard di “duplicazione”, già messa in atto nel passaggio di lettura – se non venissero effettuate delle copie le sequenze andrebbero distrutte, come già detto.
Nel processo di copia/incolla i dati possono però corrompersi e restituire degli errori. Ecco perchè i ricercatori stanno mettendo a punto uno strumento integrato di autocorrezione: “Stiamo mettendo a punto il sistema che ci consentirà di smussare [alcune imperfezioni]. Saremo in grado di tollerare un maggior numero di errori, [è questo l’obiettivo che vogliamo raggiungere migliorando i vari processi]. Li renderemo ancora più paralleli, e ciò potrebbe renderli più imperfetti, sia in fase di lettura che scrittura, ma potremo tollerare e compensare [il tutto ricorrendo ad altre soluzioni]. [Avendo] il controllo delle sequenze possiamo codificare i dati in modo che siano più facili da [estrapolare successivamente]”.
L’obiettivo dei ricercatori è quello di automatizzare completamente i vari passaggi della “catena di montaggio” e ridurre l’error correction overhead. In merito al primo punto: se traduzione e lettura lo sono già, gli altri due richiedono ancora lo spostamento fisico delle molecole da una location all’altra (dai laboratori Microsoft a quelli Twist e viceversa). In caso di successo, Karin ipotizza che i data center del futuro saranno caratterizzati da stanze con scaffali di “cassette” (contenenti il DNA) dalle quali alcuni bracci robotici preleveranno i supporti richiesti dagli operatori. Sul secondo punto: attualmente la percentuale è prossima al 15%, un valore tollerabile e non troppo lontano dal 12.5% dell’ECC (Error Correction Code) nei server.
In base a quanto letto, i casi di utilizzo più appropriati all’impiego del DNA saranno quelli inerenti l’archiviazione – dalle cartelle cliniche dei pazienti di un ospedale fino ai fascicoli processuali. Anche l’archiviazione di video e foto potrebbe essere un workload ideale, aggiunge la ricercatrice menzionando la pratica di visionare, in determinate occasioni dell’anno, le foto scattate 12 mesi prima.
E per quanto riguarda il settore consumer? Le “unità d’archivizione su DNA” non arriveranno l’anno prossimo ma nemmeno tra 10 anni. I ricercatori hanno stabilito una precisa roadmap e dispongono di tutti gli strumenti necessari a termine il progetto, conclude Karin.
Fonte: 1