Create nuove proteine per riscrivere il genoma


Utilizzando strumenti di intelligenza artificiale generativa, ricercatori sono riusciti a disegnare e convalidare in laboratorio proteine sintetiche capaci di modificare il genoma umano con efficienza superiore rispetto alle proteine naturali

dna stress editing dell'RNA ely lilly

I ricercatori di Integra Therapeutics, in collaborazione con l’Universitat Pompeu Fabra (UPF) e il Center for Genomic Regulation (CRG), hanno compiuto un passo decisivo nel campo dell’editing genetico: utilizzando strumenti di intelligenza artificiale generativa, sono riusciti a disegnare e convalidare in laboratorio proteine sintetiche capaci di modificare il genoma umano con efficienza superiore rispetto alle proteine naturali.

Questo lavoro, descritto su Nature Biotechnology, apre nuove prospettive per terapie geniche e cellulari avanzate, in particolare per il trattamento del cancro e delle malattie rare.

Le trasposasi PiggyBac rappresentano oggi una delle tecnologie più promettenti per il “gene writing”: sono versatili, efficienti e capaci di trasferire grandi quantità di DNA, caratteristiche che le rendono ideali per lo sviluppo di nuove terapie avanzate.

Cosa sono le trasposasi PiggyBac
Le trasposasi PiggyBac sono enzimi naturali appartenenti alla grande famiglia delle trasposasi, proteine in grado di spostare segmenti di DNA (i cosiddetti trasposoni) all’interno del genoma. Il sistema PiggyBac è stato scoperto originariamente in un insetto (la falena del cavolo, Trichoplusia ni) negli anni ’80.

Il suo meccanismo è chiamato “cut-and-paste” (taglia e incolla): la trasposasi riconosce sequenze specifiche nel Dna, taglia il trasposone e lo reinserisce in un’altra posizione genomica. La particolarità di PiggyBac è che inserisce sequenze in siti definiti dal motivo TTAA, senza lasciare “cicatrici” genetiche (scarless excision).

A cosa servono le trasposasi PiggyBac
Le trasposasi PiggyBac si sono affermate come strumenti fondamentali in biotecnologia e terapia genica grazie alla loro capacità di inserire in modo stabile geni terapeutici nel DNA delle cellule. A differenza di altri vettori, come i retrovirus, riescono a trasportare sequenze molto grandi, un vantaggio cruciale quando si tratta di inserire geni complessi.

Questa caratteristica le rende particolarmente utili nelle terapie cellulari, ad esempio nella produzione di cellule CAR-T, dove permettono di introdurre i recettori artificiali senza ricorrere a virus, riducendo costi e aumentando la sicurezza.

PiggyBac trova applicazione anche nella ricerca di base, dove viene impiegata per creare modelli cellulari o animali e studiare meglio il funzionamento dei geni e l’origine delle malattie. Inoltre, combinata con tecnologie come CRISPR-Cas9, può essere indirizzata con maggiore precisione verso siti specifici del genoma, aprendo la strada a piattaforme di gene editing sempre più sofisticate, come la FiCAT.

Esplorare la biodiversità genomica
Per iniziare, il team ha condotto un’analisi su vasta scala: sono state esplorate oltre 31.000 genomici eucariotici, alla ricerca di sequenze che codificassero trasposasi PiggyBac finora non catalogate. Il risultato è stato sorprendente: più di 13.000 nuove sequenze PiggyBac sono state identificate.

Tra queste, attraverso test in cellule umane coltivate, i ricercatori hanno scoperto 10 trasposasi attive, alcune con livelli di attività comparabili a quelli delle versioni già ottimizzate in laboratorio. In un caso, uno dei nuovi enzimi ha mostrato alta attività in cellule T primarie umane — un risultato cruciale, perché le cellule T sono un target chiave per le immunoterapie oncologiche.

Questo dimostra che la natura stessa possiede una ricchezza funzionale ancora poco esplorata, che può servire come base per sviluppi innovativi nel gene editing.

Superare la natura: design con AI generativa
La parte più rivoluzionaria dello studio è l’uso di un modello di linguaggio per proteine (pLLM, protein large language model). Questo modello è stato addestrato con le ~13.000 nuove sequenze PiggyBac scoperte per generare varianti del tutto nuove con attività potenziata.

L’approccio ha permesso di ottenere varianti sintetiche capaci di superare l’efficienza degli enzimi naturali ottimizzati. Alcune di queste proteine “IA-designate” sono risultate compatibili anche con tecnologie di editing avanzate, come la piattaforma FiCAT di Integra, che combina la precisione di Cas9 con la capacità di trasferimento di DNA delle trasposasi.

Come ha spiegato il Dr. Marc Güell, analogamente a come ChatGPT può generare testi nuovi aprendosi a possibilità creative, i modelli pLLM apprendono la “grammatica interna” delle proteine (modelli, vincoli strutturali e sequenziali) e la usano per generare molecole che mantengono integrità funzionale e strutturale.

Validazione sperimentale e risultati notevoli
Tra le varianti generate, alcune si sono distinte per attività molto elevata. Una di queste, denominata seq3277 o “Mega-PiggyBac”, ha mostrato una significativa capacità di escissione del trasposone e integrazione non target all’interno del genoma.

Ulteriori test hanno dimostrato che queste varianti sintetiche possono funzionare nel contesto di sistemi complessi, come l’integrazione diretta assistita da Cas9 (usando il sistema FiCAT), e sono applicabili anche in cellule modello murine.

In alcuni casi, le varianti AI-generate hanno dimostrato un’efficienza due volte superiore rispetto a versioni “naturali” esistenti quando integrate con strumenti di targeting.

Questi successi convalidano l’approccio che combina esplorazione della biodiversità naturale e generazione de novo tramite AI, accelerando la scoperta e l’ottimizzazione di strumenti per la manipolazione del genoma.

Implicazioni per la terapia genica e biotecnologia
La capacità di inserire sequenze di DNA grandi e complesse, in modo specifico e sicuro, è una delle sfide centrali delle terapie avanzate. Le trasposasi PiggyBac rappresentano uno degli strumenti più promettenti, ma il loro uso è stato limitato dalla scarsità di varianti naturali con efficienza e precisione adeguate.

Grazie al lavoro di Integra e dei suoi partner, oggi possiamo ampliare il “catalogo” degli enzimi utili al gene writing — non solo riprendendo elementi naturali non ancora caratterizzati, ma inventando varianti sintetiche potenziate che l’evoluzione naturale non ha mai esplorato. Questo può accelerare lo sviluppo di terapie cellulari (es. CAR-T), editing genico mirato, correzione di malattie ereditarie e molto altro.

Integra, che ha come mission quella di sviluppare tecnologie di “gene writing” (scrittura del gene), integra nella sua piattaforma FiCAT sia moduli basati su CRISPR-Cas che trasposasi PiggyBac modificate, per un metodo più preciso, stabile ed efficiente di inserimento genico.