AlphaFold rivoluziona la biologia nello studio delle proteine

AlphaFold

Condividi:

Condividi su facebook
Condividi su twitter
Condividi su linkedin
Condividi su whatsapp
Condividi su telegram

L’intelligenza artificiale non finisce mai di stupire: in ogni settore in cui viene applicata, i risultati riescono sempre ad andare oltre le aspettative. In questi giorni ne abbiamo avuto l’ennesima dimostrazione: grazie ad AlphaFold, la comprensione della struttura delle proteine è più immediata.

Ma cos’è AlphaFold? E perché lo studio delle proteine è così importante oggi? Scopriamolo insieme.

AlphaFold, DeepMind e Google

AlphaFold è un progetto di DeepMind, azienda inglese operativa nel mondo dell’intelligenza artificiale dal 2010 e appartenente all’ecosistema Google dal 2014.

Tra i primi progetti di successo di questa azienda, ci sono un programma in grado di giocare a 49 giochi Atari da zero e il famoso AlphaGo, il primo programma in grado di battere il campione del mondo di Go.

Revisione di una partita di Go giocata tra AlphaGo e il giocatore professionista Lee Sedol. Fotografia: Lee Jin-man/AP

Successivamente DeepMind ha elaborato programmi in grado di diagnosticare malattie degli occhi o di garantire risparmi energetici per i data centers.

Il problema della struttura delle proteine che AlphaFold cerca di risolvere

La comprensione della struttura 3D delle proteine è una delle sfide più importanti della biologia degli ultimi cinquant’anni.

Le proteine sono grandi molecole complesse, costituite da catene di amminoacidi: la funzione di ciascuna proteina dipende proprio dalla sua struttura.

Proprio per questo motivo, la comprensione della loro conformazione e del cosiddetto ripiegamento su sé stessa, equivale a conoscerne le caratteristiche.

Solitamente, una proteina ha dimensioni comprese tra uno e cento nanometri: la difficoltà principale nell’analisi della struttura sta proprio nelle dimensioni.

A partire dagli anni Cinquanta, tramite diverse tecnologie, è stato possibile studiare le proteine, ma solo in termini bidimensionali.

Così, già dagli anni Ottanta, la comunità scientifica si rese conto che era necessario determinare la struttura a partire dalle catene di amminoacidi che compongono la proteina

Questo procedimento poteva essere svolto dai computer.

CASP: una competizione scientifica per stimolare la ricerca

Negli anni Novanta, il biologo computazionale John Moult dell’Università del Maryland fondò, con altri ricercatori, il Critical Assessment of Structure Prediction (CASP).

Questa iniziativa aveva lo scopo di far competere ogni due anni i più importanti centri di ricerca.

L’oggetto della sfida è quello di prevedere una struttura proteica, già nota attraverso i classici metodi sperimentali.

Ed è proprio in questo contesto che si colloca AlphaFold: nel 2018 DeepMind aveva partecipato al CASP ottenendo discreti risultati.

Il progetto del 2018 utilizzava tecniche di deep learning su dataset molto grandi, al fine di prevedere le distanze tra le coppie di amminoacidi.

Le informazioni ottenute dall’algoritmo servivano poi a modellare le proteine oggetto della competizione.


I risultati non troppo soddisfacenti hanno suggerito che l’approccio alla soluzione del problema doveva essere diverso.

Il cambio di approccio di AplhaFold e il successo

I ricercatori di AlphaFold capirono di dover dare più importanza alle informazioni note sui processi fisici e geometrici che regolano il ripiegamento delle proteine.

Attraverso queste informazioni, sarebbe stato possibile determinare la loro forma finale.

Un’altra intuizione è stata quella di costruire l’intelligenza artificiale in modo da prevedere la forma di singole parti delle proteine, mettendo in secondo piano le relazioni tra gli amminoacidi.

Tutti questi dati sono stati utilizzati per addestrare delle complesse reti neurali.

Grazie a questi accorgimenti, al CASP del 2020 AlphaFold ha ottenuto un punteggio di accuratezza media di 92,4 su 100: un grande successo se si considerano i risultati degli anni precedenti.

L’evoluzione dell’accuratezza dei modelli nel tempo. Fonte: DeepMind

Anche per le previsioni di proteine più complesse, è stato raggiunto un punteggio medio di 87,0.

In più, oltre ad avere un alto livello di accuratezza nelle predizioni, l’intelligenza artificiale di AlphaFold si è dimostrata veloce

Per esempio ha impiegato circa mezz’ora per determinare la struttura di una proteina batterica, il cui studio decennale non aveva portato a risultati rilevanti.

Due esempi di predizione di proteine. Fonte: DeepMind

L’impatto sul futuro

Il sistema ideato da AlphaFold ha migliorato notevolmente i suoi risultati rispetto al 2018 e questa tecnologia potrebbe rappresentare un importante strumento per la ricerca futura.

Infatti, i dati ottenuti in laboratorio su una certa proteina potrebbero garantire la ricostruzione della sua struttura in tempi brevi.

Dunque anche a livello di tempistiche di ricerca, l’approccio di AlphaFold potrebbe sveltire notevolmente il raggiungimento di importanti scoperte biologiche negli anni.

Essendoci migliaia di proteine, il perfezionamento di AlphaFold potrebbe avere un impatto anche sulla medicina.

Infatti sarebbe possibile comprendere meglio alcune caratteristiche del nostro organismo e soprattutto di alcune malattie, con particolare riferimento a quelle degenerative e ai tumori.

Ancora una volta l’intelligenza artificiale è sinonimo di progresso tecnologico e scientifico.

Fonte: https://deepmind.com/

Condividi su facebook
Condividi su twitter
Condividi su linkedin
Condividi su whatsapp
Condividi su telegram
Edoardo Di Toma

Edoardo Di Toma

Junior Data Scientist in Vedrai S.p.A. e laureato in Management e Finanza. Ho completato il master in Data Science e Intelligenza Artificiale di Talent Garden Innovation School. Oltre che di data science, sono appassionato di musica, boardgames, calcio e tanto altro.

Iscriviti
Notificami
guest
0 Commenti
Inline Feedback
Vedi tutti i commenti
Neuragate