Innanzitutto, cominciamo con le basi. Tutti gli esseri viventi hanno un genoma.
I genomi sono fatti di DNA. Ciascuna delle vostre cellule ha una copia del vostro genoma al suo interno. Si può pensare che sia come un manuale di istruzioni o un libro di ricette. Il genoma contiene tutte le istruzioni o "ricette" di cui il vostro corpo ha bisogno per funzionare e avere l'aspetto che ha.
Il genoma umano è scritto in una serie di 3 miliardi di basi di DNA di quattro tipi diversi. Ogni base può essere rappresentata da una delle quattro "lettere" dell'"alfabeto" del DNA. La maggior parte del vostro DNA sarà uguale a quello di qualsiasi altra persona. Ma piccole differenze nell'ortografia o nella sequenza di queste lettere in migliaia di geni del vostro genoma spiegano, in parte, ciò che vi rende unici.
Anche i virus hanno un genoma. Il genoma di un virus può essere costituito da DNA o da una molecola simile chiamata RNA. Rispetto al vostro genoma, il genoma di un virus è minuscolo. Ad esempio, i coronavirus come quello che causa il COVID-19 hanno un genoma di RNA lungo circa 30.000 lettere (100.000 volte più piccolo del genoma umano). Il genoma dell'influenza o virus influenzale è ancora più corto, con circa 13.500 lettere di RNA.
Non tutti i virus fanno ammalare le persone. Ma i genomi di quelli che lo fanno hanno tutte le istruzioni necessarie per infettare le nostre cellule, creare altre copie di se stessi e diffondersi. Piccole differenze in queste istruzioni possono far sì che virus diversi o varianti o ceppi diversi dello stesso virus abbiano un aspetto diverso e agiscano in modi diversi. Gli scienziati possono imparare molto su un virus studiando il suo genoma.
La sequenza del genoma di un virus è la sequenza o l'ordine delle basi o delle lettere che compongono il materiale genetico di un virus, o il suo genoma. Se si scrivesse
la sequenza del genoma di un particolare coronavirus, sarebbe una serie di circa 30.000 lettere. Il segreto è trovarle nell'ordine giusto in cui si trovano in un determinato virus.
Nel caso dell'RNA, gli scienziati usano le lettere A, C, G e U, che stanno per ciascuna delle quattro basi dell'RNA: adenina, citosina, guanina e uracile. Lo stesso vale per il DNA, con la differenza che al posto dell'uracile c'è la T di timina. Il processo che gli scienziati utilizzano per capire il giusto ordine delle lettere in un determinato campione di virus si chiama sequenziamento del genoma.
Cosa ci dice il sequenziamento del genoma del virus?
I virus e i genomi dei virus cambiano continuamente. Il motivo è che le cellule a volte commettono errori.
Quando il genoma virale viene copiato all'interno di una cellula infetta, a volte si verifica un "errore di battitura". Nella maggior parte dei casi, questi errori di ortografia non fanno molta differenza. Ma a volte possono cambiare l'aspetto o l'azione di un virus in modi che si rivelano importanti. Nessuno sa da dove provenga esattamente il virus che causa la COVID-19. Ma probabilmente è nato da un coronavirus di un altro animale, ad esempio un pipistrello, che per errore si è trasformato in un modo che gli ha permesso di infettare le persone.
Grazie al sequenziamento del genoma, gli scienziati hanno trovato questo nuovo coronavirus umano subito dopo la sua comparsa nelle persone. All'inizio, si sapeva che in Cina le persone si erano improvvisamente ammalate con sintomi respiratori. Gli scienziati hanno quindi sequenziato il genoma di un campione virale prelevato da una persona che lavorava in un mercato da cui si pensava potesse provenire. Confrontando la sequenza dell'RNA con altre sequenze di genomi virali ottenute da studi precedenti, hanno capito subito che si trattava di un coronavirus mai visto prima nelle persone.
Anche se si trattava di un virus nuovo per l'uomo, si sapeva subito molto su di lui in base al suo genoma. Questo perché gli scienziati avevano studiato coronavirus correlati che avevano causato precedenti epidemie nelle persone. Grazie a questi studi, conoscevano alcune parti importanti del genoma del coronavirus, tra cui il gene che codifica quella che gli scienziati chiamano la sua proteina spike.
Sapevano che lo spike sarebbe stato importante per il virus per infettare le nostre cellule. Sapevano anche che poteva essere un bersaglio utile per vaccini o altri trattamenti. Tutto questo si è saputo subito dopo la scoperta del coronavirus, perché si è potuto sequenziare il suo genoma e confrontarlo con altri genomi virali.
Il sequenziamento del genoma può quindi rivelare molte cose utili.
Può identificare un nuovo virus o dire che tipo di virus sta facendo ammalare qualcuno. Può fornire agli scienziati idee su come un virus potrebbe farci ammalare in base ai suoi geni e alle proteine che codificano, nonché sui modi per cercare di fermarlo. Quando un virus si diffonde da una persona all'altra in tutto il mondo, gli scienziati possono usare le sequenze del genoma per seguirne i movimenti e le eventuali modifiche.
Qual è lo scopo del sequenziamento del genoma del virus COVID-19 e dell'influenza?
Gli scienziati seguono i virus dell'influenza da decenni. Li usano per confrontare i virus attuali con quelli del passato. Sulla base delle sequenze del genoma, cercano importanti differenze nel modo in cui alcuni geni sono scritti. Alcuni cambiamenti non fanno molta differenza. Ma altri influenzano la facilità con cui un virus si diffonde da una persona all'altra o quanto fa ammalare le persone.
Ogni anno, gli scienziati utilizzano le sequenze del genoma dell'influenza per decidere cosa includere nei vaccini antinfluenzali. Poiché questi virus esistono da molto tempo e cambiano continuamente, è possibile trovare versioni leggermente diverse anche in campioni provenienti da una stessa persona affetta da influenza. In un anno normale, gli scienziati sequenziano migliaia di virus influenzali per tenersi informati e aiutarli a prendere decisioni di salute pubblica.
Nella pandemia COVID-19, il sequenziamento del genoma è stato importante. Le sequenze del genoma aiutano gli scienziati a tracciare il modo in cui il coronavirus si sta diffondendo e come sta cambiando. Possono anche studiare le sequenze del genoma per capire quali cambiamenti sono degni di preoccupazione e quali probabilmente non lo sono.
Per esempio, uno studio condotto a Boston ha utilizzato circa 800 genomi virali per vedere come il coronavirus si stava diffondendo in quel luogo all'inizio. In base a minuscoli cambiamenti nei genomi, si è potuto capire che il coronavirus era arrivato nell'area di Boston decine di volte, provenendo dall'Europa e da alcune parti degli Stati Uniti. I ricercatori hanno anche potuto capire che una singola conferenza aveva portato a migliaia di infezioni a Boston e in altri luoghi del mondo.
Gli scienziati continuano a sequenziare il coronavirus che causa il COVID-19 per capire come si muove e individuare le nuove varianti che si presentano. Questo processo è chiamato sorveglianza genomica.
La sorveglianza genomica comporta il sequenziamento di molti campioni. Scopre nuove varianti, ovvero genomi virali che presentano una o più mutazioni.
Alcune varianti che compaiono scompaiono o non fanno alcuna differenza. Quando i cambiamenti nel genoma sembrano essere preoccupanti, gli scienziati li classificano come "varianti di interesse" o "varianti di preoccupazione". Probabilmente conoscete le varianti del coronavirus come Delta o Omicron.
Uno dei motivi per cui gli scienziati si sono preoccupati fin dall'inizio di Omicron è che questa variante presenta circa 50 errori di battitura o mutazioni nel suo genoma. Molte di queste mutazioni sono anche nella proteina spike, che è la parte del virus che i vaccini e il nostro sistema immunitario usano per attaccarlo.
A causa di questi cambiamenti, Omicron si diffonde più velocemente del coronavirus originale che causa la COVID-19. Gli scienziati prevedono che continueranno ad apparire nuove varianti. Continuando il sequenziamento del genoma e la sorveglianza, possono cercare di tenere sotto controllo il virus. Gli scienziati possono usare il sequenziamento del genoma per identificare e tracciare qualsiasi virus a cui sono interessati.
Come avviene il sequenziamento del genoma del virus?
Il sequenziamento del genoma è oggi molto più facile ed economico di un tempo. Anche i genomi virali sono più facili da sequenziare rispetto al genoma umano a causa delle loro piccole dimensioni. Ecco le fasi principali:
Estrazione
. Gli scienziati estraggono l'RNA o il DNA da un campione contenente un virus.
Preparazione del campione
. Gli scienziati preparano il campione. Ad esempio, potrebbero dover tagliare l'RNA o il DNA in pezzi più piccoli o aggiungere alcuni frammenti alle estremità. Le fasi specifiche dipendono dal tipo di macchina che gli scienziati stanno utilizzando.
Sequenziamento
. Gli scienziati inseriscono il campione in una macchina per il sequenziamento. La macchina legge i segnali che indicano l'ordine delle basi o delle lettere nel DNA o nell'RNA.
Analisi
. Le macchine si ritroveranno con molte stringhe di lettere che non coprono singolarmente l'intero genoma. Utilizzeranno i computer per mettere insieme il tutto in una sequenza completa del genoma e identificare eventuali differenze nella nuova sequenza rispetto ad altre.