La estructura 3D del genoma humano confunde a los modelos de IA

La compleja coreografía tridimensional del ADN —potenciadores, bucles, condensados— no se parece a un programa lineal. Los algoritmos entrenados en secuencias se topan con una realidad física que cambia en cada célula, según expertos de Harvard y Edimburgo.

El genoma humano no es un código limpio. Es una maraña física, tridimensional y cambiante que, según un reciente artículo de Quanta Magazine, podría confundir a los modelos de inteligencia artificial diseñados para interpretarlo. La idea, respaldada por investigadoras como Karen Adelman (Harvard) y Wendy Bickmore (Universidad de Edimburgo), sacude la visión lineal del ADN que ha dominado la biología molecular desde los años cincuenta.

El espejismo del código lineal

Desde que Francis Crick y James Watson desentrañaron la doble hélice, la metáfora del ADN como ‘manual de instrucciones’ caló hondo. Pero apenas el 2% del genoma humano codifica proteínas. El resto, durante décadas tachado de ‘ADN basura’, alberga una complejísima maquinaria de regulación que decide qué genes se encienden, cuándo y en qué tipo de célula. ‘Nuestro genoma no es lo que diseñaríamos si nos sentáramos a dibujarlo’, explicó Adelman.

Publicidad

En bacterias, la regulación es binaria: un factor de transcripción abre o cierra un gen. En humanos, la lógica es ‘Y’: múltiples señales deben coincidir para que un gen se active. Esa sutil combinatoria permite a nuestras células — músculo, neurona, piel — especializarse a partir del mismo material genético. Pero también vuelve el sistema increíblemente difícil de predecir.

Potenciadores, bucles y condensados: la coreografía tridimensional

Los genes no se regulan solos. Dependen de potenciadores, fragmentos de ADN que pueden estar a millones de letras de distancia y que, mediante enormes bucles de cromatina, se aproximan físicamente a su diana. La responsable de extrudir esos bucles es una proteína motora llamada cohesina. ‘Es como un ovillo de lana que una máquina va enrollando y desenrollando sin parar’, ilustra Bickmore. En cada célula, la maraña se reordena de manera distinta.

Los potenciadores no actúan en solitario. Forman centros de transcripción, condensados moleculares donde decenas de proteínas se agrupan débilmente para decidir el destino de un gen. ‘Es un comité, no un interruptor’, dice Bickmore. Además, el genoma se empaqueta en dominios topológicos (TADs) que mantienen grupos de genes coregulados, como barrios donde las casas se pintan del mismo color. Las marcas epigenéticas añaden otra capa: pequeños grupos químicos sobre las histonas —las proteínas que envuelven el ADN— que anotan el genoma sin cambiar la secuencia y se heredan de una célula a otra.

ADN 3D

Por qué los modelos de IA no pueden con esta complejidad

Los grandes modelos de lenguaje (LLM) y las redes neuronales profundas han irrumpido en la genómica con promesas de descifrar el código de la vida. Evo 2, Genos, AlphaGenome y otros ‘modelos fundacionales’ se entrenan con cantidades ingentes de secuencias de ADN para predecir cómo una mutación afectará al riesgo de enfermedad o a la expresión génica. Son cajas negras que, en teoría, sustituyen la comprensión por la correlación. El problema, señala el análisis de Quanta, es que el genoma no es una cadena de texto que se pliega dócilmente a un modelo de Markov.

La estructura 3D rompe la linealidad que la IA asume. Un potenciador puede saltar sobre otros genes para activar uno concreto; el mismo tramo de ADN puede estar silenciado o activado dependiendo de si la cromatina está compactada o laxa. Y todo esto cambia de una célula a otra, incluso entre dos fibroblastos idénticos. La IA procesa promedios, no singularidades dinámicas. Por eso, como advierte Bickmore, ’25 años después del Proyecto Genoma Humano, aún no sabemos dónde están todos los potenciadores ni qué genes controlan’.

El genoma no es un programa. Es una maraña física que cambia en cada célula. La IA que lo lee como un texto lineal se enfrenta a un problema de dimensionalidad.

Esto no significa que los modelos sean inútiles. Pueden identificar patrones que los biólogos pasaríamos por alto y acelerar el descubrimiento de fármacos. Pero un modelo que solo ve secuencias se parece a un crítico literario que juzgara una novela contando letras y no leyendo las frases. Además, algunos algoritmos incorporan ya datos de interacciones 3D (Hi-C) para mejorar sus predicciones. Aun así, la esperanza de que una IA nos entregue algún día ‘la fórmula de la vida’ choca con la realidad de un genoma que se desordena a propósito.

El trabajo de laboratorios como los de Adelman y Bickmore sugiere que entender la regulación génica exigirá no solo más datos, sino también nuevos marcos conceptuales. Quizá necesitemos una IA que modele sistemas dinámicos fuera del equilibrio, en lugar de clasificar secuencias. Mientras tanto, la humildad es la única certeza.

🔬 Ficha del Descubrimiento

  • Qué se ha descubierto: La estructura tridimensional del genoma añade un nivel de complejidad que los modelos de inteligencia artificial actuales, basados en secuencias lineales, no pueden capturar.
  • Dónde: Investigación de los laboratorios de Karen Adelman (Harvard Medical School) y Wendy Bickmore (Universidad de Edimburgo), entre otros.
  • Institución responsable: Síntesis divulgativa publicada por Quanta Magazine en junio de 2026, basada en estudios revisados por pares.
  • Cuándo: Publicación el 18 de junio de 2026.
  • Impacto a futuro: Obligará a replantear los modelos fundacionales de genómica para incorporar la dinámica 3D y la regulación combinatoria, abriendo una nueva frontera en la interpretación del genoma.

Publicidad