El material genètic que tenim tots els organismes sobre la Terra es basa en el llenguatge codificat pels àcids nucleics. Hi ha diferents nivells d’interpretació d’aquesta informació genètica: tenim l’ADN, on està emmagatzemada la informació genètica heretable; l’ARN, que són còpies temporals d’aquesta informació, sigui codificant per a proteïnes o no codificant; les proteïnes, que executen la funció; tenim un codi genètic, que permet passar d’àcids nucleics a proteïnes, i tenim mecanismes de regulació d’aquesta informació. Però aquesta modularitat a nivell molecular, després esdevé molt més complexa quan parlem d’escales o nivells d’actuació, perquè les molècules actuen a nivell de vies metabòliques o de senyalització, que actuen dins i fora de les cèl·lules, cèl·lules molt diverses que conformen un organisme, que és sobre el que actua la selecció natural. És molt difícil mirar una seqüència d’ADN, identificar-ne un canvi o mutació i saber què implica a nivell d’organisme, si aquella mutació —encara que sigui una única mutació— serà letal o si no tindrà gairebé cap efecte. No n’hi ha prou amb llegir el llenguatge de l’ADN, cal entendre’n la llengua, la sintaxi, la gramàtica i els ordres de magnitud de complexitat i d’actuació d’aquesta informació dins del seu context. El context de tot el genoma i el context de tot l’organisme. Els genetistes fa anys que analitzem l’ADN, dissenyant eines bioinformàtiques cada vegada més ràpides per a comprendre i analitzar grans quantitats de seqüències d’ADN, però encara ens és molt difícil predir funcions (quina és la funció precisa d’una seqüència d’ADN acabada d’identificar), o quin és l’efecte d’una mutació o canvi a nivell de l’organisme, i encara més difícil és dissenyar noves seqüències que tinguin funcions noves. Podem fer enginyeria genètica d’allò que coneixem, i enganxar peces d’ADN, podem canviar una lletra per una altra, que ja sabem què fa i com ho fa, però no sabem dissenyar de novo.
Però, ves per on, Evo sí que ho sap fer. Qui és Evo? De fet, hauríem de preguntar: què és Evo? Evo és un programa d’intel·ligència artificial únic —de moment— fundacional (que vol dir que pot servir per a moltes coses) i que es basa en models grans de llenguatge (LLM), com ho és ChatGPT, que poden llegir, comprendre i generar tots tipus de text. Evo ha sigut entrenat amb 2,7 milions de genomes de procariotes (bacteris, bacteriòfags i plasmidis). A partir de la comparació de tots aquests milions de genomes (estem parlant de 300.000 milions de nucleòtids!), Evo ha après a extreure’n la informació bàsica, on estan els gens i com han anat canviant evolutivament a les diferents espècies (i, per tant, inferir quines parts dels gens són importants i quines poden variar), ha après a descobrir si una seqüència és reguladora, codificadora de proteïnes, o produeix ARN no codificant (com ara l’ARN ribosomal o l’ARN de transferència), però, a més a més, ha après a interpretar tant l’ADN com l’efecte de les mutacions o canvis a tots els nivells, i predir quin serà el seu efecte sobre l'ARN, la proteïna i, finalment, sobre l’organisme, en aquest cas, bacteris. Fins ara, això no era possible a aquest nivell, perquè els costos computacionals dels programes dissenyats no eren assumibles, la unitat de comparació de seqüència (anomenada token) implicava fragments més llargs de seqüència. En canvi, aquests científics han aconseguit usar mètodes que permeten analitzar nucleòtid a nucleòtid l’ADN i comparar-ne el context, per a comprendre'n la funció. I li han ensenyat no només a entendre i predir, sinó també a generar noves seqüències que, segons el seu aprenentatge, infereix que poden funcionar millor que les que realment existeixen en éssers vius. Això era impensable!
Per exemple, per a comprovar el poder d’anàlisi i de generació, els investigadors li han demanat a Evo de generar un sistema d’edició genètica, el sistema CRISPR/Cas9, una mena de bisturí molecular amb GPS que permet tallar i enganxar ADN generant combinacions a la carta. Una tècnica que ha revolucionat l’enginyeria genètica en els últims anys. Evo ha estudiat 70.000 seqüències d’ADN bacterià que tenen sistemes CRISPR, per tal d’inspirar-se i dissenyar nous sistemes CRISPR, tenint en compte que ha de dissenyar conjuntament la part de bisturí (proteïna) i la part del GPS (un ARN guia). I ha aconseguit generar nous sistemes CRISPR que no existeixen a la natura, però que funcionen igual de bé al laboratori. Els científics diuen que Evo també ha al·lucinat, és a dir, que també ha proposat combinacions que no funcionen, però n’ha proposat que funcionen igual o millor que les que han necessitat milions d’anys d’evolució dins dels bacteris. Em sembla increïble!
Bioèticament, s’obre una capsa de Pandora que, fins ara, semblava llunyana i inaccessible, gairebé ciència-ficció
Els científics també han comprovat que poden generar nous ADNs mòbils o transposons, que també són funcionals, fet que demostra la potència predictiva i de disseny del sistema. I fins i tot li han demanat de generar el genoma d’un nou bacteri, des de zero, dissenyant-ne tots els gens. Evo ha generat gens molt semblants als bacterians, però diferents, ja que no existeixen a la natura, són generats per la intel·ligència artificial entrenada. Tanmateix, aquest “genoma fals” no és viable, perquè Evo ha generat gens que són potencialment rellevants, però n’ha dissenyat altres que no són importants. O sigui, que no ha estat capaç de dissenyar —encara— el genoma complet d’un nou bacteri que no ha existit mai, però algun dia s’aconseguirà. Llavors es podria pensar a sintetitzar tot el genoma de forma sintètica i comprovar si podria ser viable: biologia sintètica a les portes de crear noves espècies.
Els genomes eucariotes, com ara els nostres, són força més complexos que els bacterians, però Evo és només el primer model d’IA amb aquesta tecnologia, així que en els anys vinents segur que sorgiran moltes millores i podran usar-se per a comprendre, predir i potser dissenyar gens eucariotes millorats. Aquesta és una fita que revolucionarà la biologia tal com l’entenem. Fins ara hem descrit els organismes, ara podem entendre totalment com són.
Ara bé, aquests models d’IA són disruptors, i Evo o altres sistemes d’IA com ell poden tenir un doble ús i poden plantejar molts problemes bioètics. D’una banda, seran absolutament crucials per a comprovar com ha funcionat l’evolució de gens, genomes i espècies, permetrà investigar la causa de moltes malalties, desenvolupar nous tractaments i abordar una quantitat inimaginable de problemes biomèdics i biotecnològics pels quals no teníem solució, però alhora es pot emprar de manera maliciosa, per exemple, generant nous virus, molt més patogènics i virulents dels que existeixen. Per això, els investigadors que han creat Evo només van utilitzar seqüències de bacteris i bacteriòfags i no li van proporcionar per a entrenar cap seqüència de virus eucariota (nosaltres som eucariotes) o que pugui infectar-nos. Malgrat que la major part de la recerca en IA es fa en empreses privades, els creadors d’Evo creuen en el bé comú i que la ciència avançarà si els científics som transparents, per això, tots els seus algoritmes han sigut dipositats públicament i són accessibles.
Això no obsta perquè, bioèticament, s’obri una capsa de Pandora que, fins ara, semblava llunyana i inaccessible, gairebé ciència-ficció. Cal realment arremangar-se i pensar molt profundament què volem fer amb aquestes eines d’IA, tan poderoses que no només saben llegir l’ADN, sinó que entenen la seva semàntica a tots els nivells biològics i, per això, poden generar nous textos d’ADN amb significats biològics impensables… Terra ignota.