Il farmaco che avete preso questa mattina ha percorso un lungo tragitto per arrivare dal laboratorio alla vostra confezione di pillole. Prima c'è una lunga ricerca di laboratorio. Poi, la sperimentazione sugli animali. Ma prima che un farmaco possa essere approvato per l'uso, deve essere testato sugli esseri umani, in un processo costoso e complesso noto come sperimentazione clinica.
Le basi
Nella sua forma più semplice, uno studio clinico si svolge in questo modo: I ricercatori reclutano pazienti affetti dalla malattia a cui è destinato il farmaco sperimentale. I volontari vengono divisi a caso in due gruppi. Un gruppo riceve il farmaco sperimentale; l'altro, chiamato gruppo di controllo, riceve un placebo (un trattamento che sembra identico al farmaco in sperimentazione, ma non ha alcun effetto). Se i pazienti che ricevono il farmaco attivo mostrano maggiori miglioramenti rispetto a quelli che ricevono il placebo, è la prova che il farmaco è efficace.
Una delle parti più impegnative della progettazione di una sperimentazione è trovare un numero sufficiente di volontari che soddisfino i criteri esatti dello studio. I medici potrebbero non conoscere le sperimentazioni che potrebbero essere adatte ai loro pazienti e i pazienti disposti a iscriversi potrebbero non avere le caratteristiche necessarie per una determinata sperimentazione. Ma l'intelligenza artificiale potrebbe rendere questo lavoro molto più semplice.
Incontra il tuo gemello
I gemelli digitali sono modelli informatici che simulano oggetti o sistemi del mondo reale. Il loro comportamento è praticamente identico, dal punto di vista statistico, a quello delle loro controparti fisiche. La NASA ha usato un gemello digitale della navicella Apollo 13 per aiutare a effettuare le riparazioni dopo l'esplosione di un serbatoio di ossigeno, lasciando gli ingegneri sulla Terra impegnati a effettuare le riparazioni da 200.000 miglia di distanza.
Con un numero sufficiente di dati, gli scienziati possono creare gemelli digitali di persone, utilizzando l'apprendimento automatico, un tipo di intelligenza artificiale in cui i programmi imparano da grandi quantità di dati piuttosto che essere programmati specificamente per il compito da svolgere. I gemelli digitali dei pazienti in fase di sperimentazione clinica vengono creati addestrando modelli di apprendimento automatico sui dati dei pazienti provenienti da studi clinici precedenti e dalle cartelle cliniche dei singoli pazienti. Il modello prevede l'andamento della salute del paziente nel corso della sperimentazione se gli viene somministrato un placebo, creando in sostanza un gruppo di controllo simulato per un determinato paziente.
Ecco come funzionerebbe: Una persona, chiamiamola Sally, viene assegnata al gruppo che riceve il farmaco attivo. Il gemello digitale di Sally (il modello computerizzato) è nel gruppo di controllo. Prevede cosa accadrebbe se Sally non ricevesse il trattamento. La differenza tra la risposta di Sally al farmaco e la previsione del modello sulla risposta di Sally se avesse assunto il placebo sarebbe una stima dell'efficacia del trattamento per Sally.
I gemelli digitali vengono creati anche per i pazienti del gruppo di controllo. Confrontando le previsioni di ciò che accadrebbe ai gemelli digitali che ricevono il placebo con gli esseri umani che hanno effettivamente ricevuto il placebo, i ricercatori possono individuare eventuali problemi nel modello e renderlo più accurato.
La sostituzione o l'aumento dei gruppi di controllo con gemelli digitali potrebbe aiutare i pazienti volontari e i ricercatori. La maggior parte delle persone che si uniscono a una sperimentazione lo fanno nella speranza di ricevere un nuovo farmaco che potrebbe aiutarli quando i farmaci già approvati hanno fallito. Ma c'è il 50% di possibilità che vengano inseriti nel gruppo di controllo e che non ricevano il trattamento sperimentale. Sostituendo i gruppi di controllo con i gemelli digitali, un maggior numero di persone potrebbe avere accesso ai farmaci sperimentali.
L'inaspettato
La tecnologia può essere promettente, ma non è ancora molto diffusa, forse per una buona ragione. Daniel Neill, PhD, è un esperto di apprendimento automatico, comprese le sue applicazioni in campo sanitario, presso la New York University. Sottolinea che i modelli di apprendimento automatico dipendono dalla disponibilità di molti dati, e può essere difficile ottenere dati di alta qualità sulle persone. Le informazioni su cose come la dieta e l'esercizio fisico sono spesso autodichiarate e le persone non sono sempre oneste. Tendono a sovrastimare la quantità di esercizio fisico che fanno e a sottostimare la quantità di cibo spazzatura che mangiano, dice.
Anche considerare eventi avversi rari potrebbe essere un problema, aggiunge. "Molto probabilmente si tratta di eventi che non sono stati presi in considerazione nel gruppo di controllo". Per esempio, qualcuno potrebbe avere una reazione negativa inaspettata a un farmaco.
Ma la preoccupazione maggiore di Neill è che il modello predittivo rifletta quello che lui chiama "business as usual". Supponiamo che un evento imprevisto di grande portata, come ad esempio la pandemia COVID-19, modifichi i modelli di comportamento di tutti e le persone si ammalino. "Questo è un aspetto di cui i modelli di controllo non tengono conto", spiega. Questi eventi imprevisti, non considerati nel gruppo di controllo, potrebbero alterare l'esito della sperimentazione.
Eric Topol, fondatore e direttore dello Scripps Research Translational Institute ed esperto nell'uso delle tecnologie digitali nell'assistenza sanitaria, ritiene che l'idea sia ottima, ma non ancora pronta per la prima serata. "Non credo che gli studi clinici cambieranno a breve termine, perché questo richiede più livelli di dati oltre alle cartelle cliniche, come la sequenza del genoma, il microbioma intestinale, i dati ambientali e così via". Topol prevede che ci vorranno anni prima di poter effettuare studi su larga scala utilizzando l'IA, in particolare per più di una malattia. (Topol è anche caporedattore di Medscape, il sito web gemello di Doctor).
Raccogliere un numero sufficiente di dati di qualità è una sfida, afferma Charles Fisher, PhD, fondatore e CEO di Unlearn.AI, una start-up pioniera dei gemelli digitali per gli studi clinici. Ma, dice, affrontare questo tipo di problema fa parte degli obiettivi a lungo termine dell'azienda.
Due delle preoccupazioni più comunemente citate riguardo ai modelli di apprendimento automatico - la privacy e le distorsioni - sono già state prese in considerazione, afferma Fisher. "La privacy è facile. Lavoriamo solo con dati già anonimizzati".
Per quanto riguarda i pregiudizi, il problema non è risolto, ma è irrilevante, almeno per l'esito della sperimentazione, secondo Fisher. Un problema ben documentato degli strumenti di apprendimento automatico è che possono essere addestrati su set di dati distorti, ad esempio quelli che sottorappresentano un particolare gruppo. Tuttavia, secondo Fisher, poiché gli studi sono randomizzati, i risultati sono insensibili alle distorsioni dei dati. La sperimentazione misura l'effetto del farmaco in esame sulle persone che ne fanno parte sulla base di un confronto con i controlli, e regola il modello in modo che corrisponda maggiormente ai controlli reali. Secondo Fisher, quindi, anche se la scelta dei soggetti per la sperimentazione è distorta e il set di dati originale è distorto, "siamo in grado di progettare le sperimentazioni in modo che siano insensibili a tale distorsione".
Neill non lo trova convincente. È possibile eliminare i pregiudizi in uno studio randomizzato in senso stretto, aggiustando il modello per stimare correttamente l'effetto del trattamento per la popolazione in studio, ma si reintrodurranno tali pregiudizi quando si cercherà di generalizzare oltre lo studio. Unlearn.AI "non sta confrontando individui trattati con controlli", dice Neill. "Sta confrontando gli individui trattati con le stime basate su modelli di quello che sarebbe stato l'esito dell'individuo se fosse stato nel gruppo di controllo. Eventuali errori in questi modelli o eventi che non riescono ad anticipare possono portare a distorsioni sistematiche, cioè a stime eccessive o insufficienti dell'effetto del trattamento".
Ma unlearn.AI sta andando avanti. Sta già collaborando con le aziende farmaceutiche per progettare sperimentazioni su malattie neurologiche come l'Alzheimer, il Parkinson e la sclerosi multipla. Su queste malattie ci sono più dati che su molte altre, quindi erano un buon punto di partenza. Fisher sostiene che l'approccio potrebbe essere applicato a tutte le malattie, accorciando notevolmente i tempi di immissione sul mercato di nuovi farmaci.
Se questa tecnologia si rivelerà utile, questi fratelli invisibili potrebbero portare benefici sia ai pazienti che ai ricercatori.