Covid-19/

L'abbiamo scritto nel DNA

Read time: 7 mins

È piccolo, molto piccolo. È una striscia fatta di pezzetti larghi 2,5 nanometri e lunghi 0,3 che si dispiega nelle tre dimensioni avvolgendosi a elica. Ha una struttura che si presta con grande semplicità a una codifica binaria, quella a cui ci ha abituato l’era digitale fatta di computer e di informazione scritta con lunghe sequenze di 1 e di 0. È anche molto leggero e resistente: rimane sostanzialmente inalterato per millenni. Potrebbe diventare il miglior mezzo per risolvere il problema dell’archiviazione dell’enorme quantità d’informazione quotidianamente prodotta nel mondo: libri, immagini, filmati, per non parlare della miriade di dati prodotti nei piccoli e grandi laboratori sparsi per il pianeta o acquisiti dai telescopi a terra e nello spazio. Ci sta tutto. Perché l’informazione vi potrebbe essere immagazzinata con densità enormemente superiore a quella raggiungibile nei media usati oggi per questo scopo. È l’acido desossiribonucleico, il DNA, il materiale biologico che contiene le informazioni genetiche ereditarie che sono alla base dello sviluppo e della struttura degli organismi viventi.

La prima volta che ho sentito parlare di DNA è stato nel 1962, a tavola. Mio padre (un ricercatore medico che nella prima fase della sua attività scientifica si occupava di genetica e microbiologia) commentò l’assegnazione del premio Nobel di quell’anno per la medicina a Watson, Crick e Wilkins, per la loro scoperta della struttura molecolare del DNA (avvenuta circa dieci anni prima), e mi spiegò cos’avevano trovato. Ricordo della struttura a doppia elica, formata da una sequenza di quattro basi (adenina, citosina, guanina e timina) che si associano a due a due come a formare i pioli di una lunga scala attorcigliata e che si ripetono in un ordine da cui dipende la natura e il funzionamento degli esseri viventi. L’ordine con cui si alternano queste basi codifica infatti l’informazione genetica di ogni organismo vivente conosciuto, nonché le istruzioni per il loro sviluppo. L’informazione genetica è duplicata prima della divisione cellulare, attraverso il processo di replicazione del DNA, che evita la perdita di informazione nel passaggio tra diverse generazioni cellulari.

Poi, per molto tempo, di DNA non ho più avuto modo di sentir parlare – se si eccettuano le lezioni di biologia al liceo e qualche articolo di divulgazione scientifica – fino a quando, negli anni ’80 del secolo scorso, fu inventata una tecnica per analizzarlo e sequenziarlo. Poiché vi sono alcuni tratti del DNA che sono unici per ogni individuo, ci si rese conto che poteva essere utilizzato come “impronta genetica” ed esplose quindi il suo utilizzo in medicina forense. La “prova del DNA” diventò rapidamente un’espressione famigliare cui i media davano frequente risalto. Ancor più risalto glielo diede il progetto di sequenziamento del genoma umano, iniziato nel 1990, e la “genomania” che ne derivò negli anni successivi, quando sui media leggevamo di come ogni aspetto del nostro carattere potesse essere in qualche modo connesso a qualcuna di quelle particolari porzioni del DNA – i geni – che venivano man mano mappati. La realtà si è poi mostrata molto più complessa. Quando nel 2003 il progetto Genoma Umano fu dichiarato concluso, i geni identificati risultarono in numero molto inferiore (circa 23.000) di quanto ci si aspettava, e si calcolò che essi costituivano solo qualche percento del DNA di una cellula. Sorprese il fatto che fossero di poco superiori, in numero, a quelli che caratterizzano forme di vita molto più semplici come per esempio il moscerino della frutta o un verme. Diventava dunque difficile spiegare, sulla sola base del numero di geni, la complessità dell’organismo umano rispetto ad altre forme di vita ben più semplici. Solo recentemente si è rivalutato il ruolo del restante 95% e più del DNA, che era stato frettolosamente classificato come “DNA spazzatura” semplicemente perché non se ne era capita la funzione, e si è rivolta l’attenzione non tanto al numero di geni ma a come questi vengono attivati e disattivati e, più in generale, a come interagiscono.

Tutto questo ora lo sappiamo, e c’è ancora moltissimo da imparare “leggendo” quanto codificato nel DNA. Ma il DNA lo si può anche “scrivere” e scrivendolo in maniera opportuna vi si può registrare l’informazione. Immaginiamo di far corrispondere ad adenina e citosina uno “0” e a guanina e timina un “1”. Poi mettiamo in fila le basi alternandole secondo il codice che intendiamo registrare. Formeremo un pezzetto di DNA sintetico che, una volta letto, ci restituirà l’informazione codificata. È quello che hanno fatto Church, Gao e Kosuri, (Science, 2012, v. 337, n. 6102, p. 1628) che, con un metodo ingegnoso, hanno scritto un intero libro di 53.000 parole, corredato da 11 figure, dimostrando la fattibilità di registrare nel DNA grandi quantità d’informazione (5 megabit nel loro caso, quasi un fattore mille volte meglio del meglio fatto precedentemente da altri ricercatori). Per rendere il processo di scrittura pratico ed evitare di produrre sequenze eccessivamente lunghe, Church e collaboratori hanno scritto (con ragionevole ridondanza) una moltitudine di brevi sequenze registrando su ognuna anche la posizione che questa doveva avere per poter poi permettere la ricostruzione ordinata del libro. Un po’ come dire che del libro venivano scritte separatamente tutte le righe e che all’inizio di ogni riga veniva scritto il suo numero d’ordine così da poterle facilmente disporre dalla prima all’ultima quando sarebbe venuto il momento di ricomporre l’intero testo.

I numeri che Church, Gao e Kosuri presentano per mostrare come il DNA abbia le caratteristiche per diventare il mezzo privilegiato per l’archiviazione dei dati del futuro, sono impressionanti. La densità (teorica) d’informazione che un grammo di DNA può arrivare a contenere è di 455 exabyte. Un exabyte equivale a un milione di terabyte, la capacità dei dischi medio-grandi attualmente installati nei personal computer, equivalente al contenuto di oltre 200 DVD completamente scritti. Anche rimanendo alcuni ordini di grandezza al di sotto di questo valore massimo, avremmo un mezzo che, per quanto riguarda la densità di informazione, non avrebbe rivali. Se vogliamo esprimere la densità in termini di byte per unità di volume fisico, i dischi rigidi e le memorie flash attualmente in commercio sono circa un milione di volte meno efficienti, anche perché in questi casi la scrittura dei dati è limitata alla superficie, mentre con il DNA si sfrutta il volume. Il DNA inoltre è estremamente stabile (leggiamo quello di organismi vissuti migliaia di anni fa, che risulta integro e ben conservato) e la sua struttura biologica (è così da milioni di anni) fa sì che le modalità di lettura e scrittura rimarranno costanti e disponibili nel futuro.

Perché allora questa tecnica non ha ancora preso piede? Perché oggi è lenta e costosa. Church e i suoi collaboratori hanno impiegato diversi giorni per scrivere il loro libro sotto forma di DNA sintetico e le apparecchiature necessarie sono care e ingombranti. Church nota esplicitamente come il costo dei processi di sintesi e del sequenziamento del DNA stiano diminuendo molto velocemente, il primo di un fattore 5 all’anno, il secondo addirittura di un fattore 12, mentre i costi relativi ai processi di archiviazione magnetica calino solo di un fattore 1,6 all’anno. Il DNA ha ancora tanto da insegnare a genetisti e biologi, e conserva ancora molti segreti riguardo al suo ruolo e funzioni. Il suo studio è estremamente importante e sta portando a sviluppare nuove metodologie di sequenziamento, sempre più veloci, efficienti ed economiche. Church fa anche notare che stanno comparendo sul mercato i primi apparecchi palmari per il sequenziamento. È ragionevole prevedere che l’utilizzo del DNA come memoria di massa possa incentivare e velocizzare ulteriormente questi processi di miniaturizzazione e riduzione dei costi. Abbiamo già assistito a un fenomeno simile con il laser. Negli anni ’60 del secolo scorso i laser avevano dimensioni, complessità e costi tali da poter essere utilizzati solo nei laboratori di ricerca. Oggi, ma oramai da molti anni, un laser costa pochi centesimi e trova posto in una penna, che possiamo usare come puntatore durante le conferenze, o in un minuscolo lettore di DVD, che decodifica un film e ce lo fa guardare mentre siamo in viaggio.

Il Large SynopticSurveyTelescope (LSST) inizierà le osservazioni del cielo all’inizio della prossima decade. Ogni notte accumulerà qualcosa come 30 terabyte di dati, circa 10 petabyte all’anno. Il Large Hadron Collider (LHC), nei periodi di funzionamento tra gennaio 2010 e dicembre 2012 ha già accumulato 60 petabyte di dati utili. Tra una decina d’anni entrerà in funzione lo Square Kilometer Array (SKA, v. “le Stelle” n. 64, pp. 34-39), il radiotelescopio più grande e potente mai costruito e composto da migliaia di antenne, per una superficie totale di circa un chilometro quadrato. Con un tasso previsto di produzione di dati dell’ordine del migliaio di petabyte al giorno, SKA sarà anche il più gigantesco generatore di informazione scientifica che l’uomo dovrà gestire. Fa dunque una certa impressione pensare che un archivio off-line e perenne di tutti i dati che questi strumenti acquisiranno nella loro vita utile potrà essere memorizzato in pochi grammi di DNA. Una volta l’espressione: “ce l’ho scritto nel DNA” era un modo di dire comune per spiegare che una qualche nostra caratteristica è profondamente radicata in noi. Presto assumerà anche il suo significato letterale, che diventerà altrettanto comune.

Tratto da Le Stelle n° 118, maggio 2013

Aiuta Scienza in Rete a crescere. Il lavoro della redazione, soprattutto in questi momenti di emergenza, è enorme. Attualmente il giornale è interamente sostenuto dall'Editore Zadig, che non ricava alcun utile da questa attività, se non il piacere di fare giornalismo scientifico rigoroso, tempestivo e indipendente. Con il tuo contributo possiamo garantire un futuro a Scienza in Rete.

E' possibile inviare i contributi attraverso Paypal cliccando sul pulsante qui sopra. Questa forma di pagamento è garantita da Paypal.

Oppure attraverso bonifico bancario (IBAN: IT78X0311101614000000002939 intestato a Zadig srl - UBI SCPA - Agenzia di Milano, Piazzale Susa 2)

altri articoli

Pollution and Covid. Two vague clues don't make an evidence

In these days, newspapers and television programs (and the web, of course) are giving space to a statement by the Italian Society of Environmental Medicine (SIMA) announcing important discoveries on the link between airborne particulate matter and Coronavirus, even describing them as important for the decisions to be taken in the coming weeks.