El genoma al descubierto: no está totalmente secuenciado

«Los científicos dicen que el genoma humano está completo«, anunció a bombo y platillo el New York Times en 2003. «El genoma humano«, proclamaron las revistas Science y Nature en idénticas líneas de cobertura que revelan el logro histórico.

Peeeero…, había un pequeño problema.

«La cuestión es que, siendo fieles a la verdad, la secuencia ‘terminada’ no está terminada totalmente», ha advertido Eric Lander, quien dirigió el laboratorio del Instituto Whitehead que descifró más del genoma en el Proyecto Genoma Humano, financiado por el gobierno de EEUU, que cualquier otro. «Siempre digo que ‘terminado’ es un término que solo se puede aplicar en arte

«Es decir la verdad al afirmar que el genoma humano no ha sido completamente secuenciado», ha afirmado Craig Venter, otra luminaria genómica, del STAT.

«El genoma humano no ha sido completamente secuenciado y tampoco lo ha sido ningún otro genoma de mamíferos que yo sepa», dijo George Church, bioingeniero de la Escuela de Medicina de la Universidad de Harvard, quien realizó importantes avances en la tecnología de secuenciación.

Lo que los expertos saben, sin embargo, no ha sido bien interpretado o entendido por el resto de los mortales, que dan por sentado que cada A, T, C y G que compone el ADN de los 23 pares de cromosomas humanos ha sido completamente resuelto. Cuando los científicos terminaron el primer borrador del genoma humano, en 2001, y de nuevo cuando tuvieron la versión final en 2003, nadie mintió, exactamente. Las preguntas frecuentes de los Institutos Nacionales de Salud se refieren a la «conclusión esencial» de la secuencia y a la pregunta «¿Está el genoma humano completamente secuenciado?», Responden, «Sí», con la advertencia de que es «tan completa como puede ser” dada la tecnología de la que disponemos actualmente.

DC1FDvqXkAA0nBO Merca2.es

Quizás nadie prestó mucha atención ya que a las secuencias que llevaba todo esto, parecían no importar. Pero ahora parece que pueden desempeñar un papel muy importante en investigaciones como el cáncer y el autismo.

«Muchas personas en las décadas de 1980 y 1990 (cuando el Proyecto del Genoma Humano comenzaba) pensaban que estas regiones no funcionaban», dijo Karen Miga, bióloga molecular de la Universidad de California en Santa Cruz. «Algunas de ellas, llamados regiones satélites, se comportan mal en algunas formas de cáncer, dijo,» así que significa que algo importante está pasando en esas regiones”.

Miga los considera como lo que el explorador Livingstone hizo en Africa, terra incognita, cuya inaccesibilidad parece una afrenta personal. Secuenciar a los no secuenciados, dijo, «es la última frontera en la genética humana y la genómica».

Iglesia también ha estado trabajando en ese punto, mencionándolo en la reunión de mayo sobre el esfuerzo para sintetizar genomas, y en la reunión del fin de semana pasado de la Sociedad Internacional para la Investigación de Células Madre. La mayoría de las regiones no secuenciadas, dijo, «tienen alguna conexión con el envejecimiento y la aneuploidía» (un número anormal de cromosomas como lo que ocurre en el síndrome de Down). Church estima que entre 4 y 9 por ciento del genoma humano no se ha secuenciado. Miga piensa que es 8 por ciento.

Genome Merca2.es
NEW YORK – AUGUST 15: (FILE PHOTO) A visitor views a digital representation of the human genome August 15, 2001 at the American Museum of Natural History in New York City. Fifty Years ago James Watson and Francis Crick published an account of the DNA double helix in the science journal Nature. (Photo by Mario Tama/Getty Images)

La razón de estas lagunas es que las máquinas de secuenciación de ADN no leen los genomas como los humanos leemos libros, desde la primera palabra hasta la última. En lugar de eso, primero cortan al azar copias de los 23 pares de cromosomas, que suman unos 3 mil millones de «letras», por lo que las máquinas no se sobrecargan. Los trozos resultantes contienen desde 1.000 letras (durante el Proyecto Genoma Humano) hasta unos pocos cientos (en las máquinas de secuenciación más avanzadas de hoy en día). Los trozos se superponen. Las computadoras coinciden con los solapamientos, ensamblando los trozos en la secuencia correcta.

Eso es entre difícil e imposible de hacer si los trozos contienen porciones de segmentos repetitivos, tales como TTAATATTAATATTAATA, o TTAATA tres veces. «El problema es que cuando tienes las mismas palabras exactas, es difícil de montar«, dijo Lander, como si las piezas del rompecabezas mostraran el mismo vacío.

En 2004, el proyecto del genoma informó que había 341 lagunas en la secuencia. La mayoría de las lagunas, 250, están en la parte principal de cada cromosoma, donde los genes hacen las proteínas que crean la vida. Estos vacíos son pequeños. Solo unas pocas lagunas, 33 en el último recuento, se encuentran en o cerca del centrómero de cada cromosoma (donde las dos partes de un cromosoma se conectan) y los telómeros (las tapas al final de los cromosomas), pero estos 33 son 10 veces más largos que el total las 250 lagunas.

Evan Eichler, de la Universidad de Washington, dijo que cada cromosoma tiene elementos repetitivos que desafían secuencias, hay que pensar en ellos como tartamudeos del ADN, incluyendo un infame que tiene 171 letras de largo y se repite de extremo a extremo en miles de letras.

Al comienzo del Proyecto Genoma Humano, dijo Lander, ahora director del Broad Institute of MIT y Harvard, «quedó muy claro que estas secuencias altamente repetitivas no serían manejables con la tecnología existente. No fue una causa de un gran tedio en ese momento», ya que él y otros líderes del proyecto esperaban que la próxima generación de científicos encontraran una solución.

secuenciacion Merca2.es

Pero eso no ha sucedido realmente, en parte porque no ha habido mucha motivación para mapear estas regiones. «Estoy entre agnóstico y un poco escéptico de que estos bits serán importantes para las enfermedades, pero tal vez estoy diciendo eso porque no podemos leerlos», dijo Lander.

A medida que la nueva tecnología de secuenciación ha comenzado a permitir a los científicos a mirar en territorios no escrutados, sin embargo, han visto que «estas regiones difíciles de secuenciar con frecuencia tienen genes importantes«, dijo Michael Hunkapiller, presidente y director general de Pacific Biosciences, que hace secuenciadores de ADN. (En 1998, Hunkapiller reclutó a Venter a su nueva compañía, Celera Genomics, para competir en el proyecto de genoma respaldado por el gobierno.)

La «razón de ser» de PacBio es aumentar la longitud de los segmentos de ADN que se pueden leer y ensamblar, dijo Hunkapiller. Más largo tiene un efecto como la ampliación de piezas de un rompecabezas; a pesar de que las piezas todavía contienen una gran cantidad de vació, el mayor tamaño hace que sea más probable que también contendrá algo suficientemente nuevo para hacer el montaje más fácil. La máxima lectura de ADN de PacBio es ahora de unas 60.000 cartas, dijo Hunkapiller, y un promedio de 15.000.

Con esas lecturas tan largas, dijo Lander, «podrías atravesar muchas de estas desagradables regiones [no secuenciadas]».

«¡Terminar la secuencia!» No se ha convertido en un grito de guerra, pero tal vez debería serlo, dijo Venter, «Sería el último en afirmar que no tenemos que preocuparnos por estas regiones no secuenciadas».