Hito científico: terminaron de decodificar un genoma humano completo
Si bien se encontraba casi completo desde hace décadas, los científicos aseguran que, finalmente, lograron terminar de decodificar el genoma humano, el conjunto de instrucciones para construir y mantener a un ser humano.
Ese plan genético, según declararon los participantes del estudio publicado este jueves en la revista Science, quedó ensamblado en forma completa. Un equipo internacional describió la primera secuenciación de un genoma humano completo. El esfuerzo anterior, celebrado en todo el mundo, estaba incompleto porque las tecnologías de secuenciación de ADN de la época no podían leer ciertas partes del mismo. Incluso después de las actualizaciones, faltaba alrededor del 8% del genoma.
“Algunos de los genes que nos hacen únicamente humanos estaban en realidad en esta ‘materia oscura del genoma’ y se pasaron por alto por completo”, dijo Evan Eichler, investigador de la Universidad de Washington que participó en el esfuerzo actual y en el Proyecto Genoma Humano original. “Tomó más de 20 años, pero finalmente lo logramos”, subrayó.
Muchos, incluidos los propios alumnos de Eichler, pensaron que ya se había terminado. “Estaba enseñándoles y me dijeron: ‘Espera un momento. ¿No es esta como la sexta vez que han declarado la victoria? Dije: ‘No, esta vez realmente, ¡realmente lo hicimos!
Los científicos dijeron que esta imagen completa del genoma le dará a la humanidad una mayor comprensión de nuestra evolución y biología, al mismo tiempo que abrirá la puerta a descubrimientos médicos en áreas como el envejecimiento, las enfermedades neurodegenerativas, el cáncer y las enfermedades cardíacas.
“Simplemente estamos ampliando nuestras oportunidades para comprender las enfermedades humanas”, dijo Karen Miga, autora de uno de los seis estudios publicados el jueves.
La investigación culmina décadas de trabajo. El primer borrador del genoma humano fue anunciado en una ceremonia en la Casa Blanca en 2000 por los líderes de dos entidades competidoras: un proyecto internacional financiado con fondos públicos dirigido por una agencia de los Institutos Nacionales de Salud de EE. UU. y una empresa privada, Celera Genomics, con sede en Maryland.
“El consorcio de telómeros a telómeros (T2T) ha terminado la primera secuencia verdaderamente completa de 3.055 mil millones de pares de bases (bp) de un genoma humano, lo que representa la mayor mejora del genoma de referencia humano desde su lanzamiento inicial”, escribieron en junio pasado los científicos, en un artículo publicado en el servidor de investigaciones bioRxiv, ya que hasta entonces no estaba revisado por pares, lo que finalmente ocurrió ahora.
El nuevo genoma es un salto adelante, según dijeron en ese momento los investigadores, que fue posible gracias a las nuevas tecnologías de secuenciación de ADN desarrolladas por dos empresas del sector privado: la californiana Pacific Biosciences, también conocida como PacBio, y la británica Oxford Nanopore. Sus tecnologías para leer el ADN tienen ventajas muy específicas sobre las herramientas que durante mucho tiempo se han considerado las fundamentales para los investigadores.
“Este 8% del genoma no se ha pasado por alto por su falta de importancia, sino por limitaciones tecnológicas”, escribieron los investigadores. “La secuenciación de lectura larga de alta precisión finalmente ha eliminado esta barrera tecnológica, lo que permite estudios completos de la variación genómica en todo el genoma humano. Dichos estudios requerirán necesariamente un genoma de referencia humano completo y preciso, lo que en última instancia impulsará la adopción del conjunto T2T-CHM13 que se presenta aquí”.
El genoma humano está formado por alrededor de 3.100 millones de subunidades de ADN, pares de bases químicas conocidas por las letras A, C, G y T. Los genes son cadenas de estos pares con letras que contienen instrucciones para fabricar proteínas, los componentes básicos de la vida. Los humanos tenemos unos 30.000 genes, organizados en 23 grupos llamados cromosomas que se encuentran en el núcleo de cada célula.
Hasta ahora “brechas grandes y persistentes que han estado en nuestro mapa, y estas brechas caen en regiones bastante importantes”, dijo Miga.
Miga, investigadora de genómica de la Universidad de California-Santa Cruz, trabajó con Adam Phillippy del Instituto Nacional de Investigación del Genoma Humano para organizar el equipo de científicos para comenzar de cero con un nuevo genoma con el objetivo de secuenciarlo todo, incluso, piezas perdidas. El grupo, denominado así por las secciones en los extremos de los cromosomas, llamados telómeros, se conoce como el consorcio Telómero a Telómero, o T2T.
Su trabajo agrega nueva información genética al genoma humano, corrige errores previos y revela largos tramos de ADN que se sabe que juegan un papel importante tanto en la evolución como en la enfermedad. El año pasado se publicó una versión de la investigación antes de ser revisada por colegas científicos.
“Diría que esta es una gran mejora del Proyecto Genoma Humano”, que duplica su impacto, dijo el genetista Ting Wang de la Facultad de Medicina de la Universidad de Washington en St. Louis, que no participó en la investigación.
Eichler dijo que algunos científicos solían pensar que las áreas desconocidas contenían “basura”. Pero “algunos de nosotros siempre creímos que había oro en esas colinas”, dijo.
Resulta que el oro incluye muchos genes importantes, dijo, como los esenciales para hacer que el cerebro de una persona sea más grande que el de un chimpancé, con más neuronas y conexiones.
Para encontrar tales genes, los científicos necesitaban nuevas formas de leer el lenguaje genético críptico de la vida. Leer genes requiere cortar las hebras de ADN en pedazos de cientos a miles de letras. Las máquinas secuenciadoras leen las letras de cada pieza y los científicos intentan poner las piezas en el orden correcto. Eso es especialmente difícil en áreas donde las letras se repiten.
Los científicos dijeron que algunas áreas eran ilegibles antes de las mejoras en las máquinas de secuenciación de genes que ahora les permiten, por ejemplo, leer con precisión un millón de letras de ADN a la vez. Eso permite a los científicos ver genes con áreas repetidas como cadenas más largas en lugar de fragmentos que luego tuvieron que juntar.
Los investigadores también tuvieron que superar otro desafío: la mayoría de las células contienen genomas tanto de la madre como del padre, lo que confunde los intentos de ensamblar las piezas correctamente. Los investigadores de T2T solucionaron esto utilizando una línea celular de una “mola hidatiforme completa”, un óvulo fertilizado anormal que no contiene tejido fetal y que tiene dos copias del ADN del padre y ninguna de la madre.
El siguiente paso será mapear más genomas, incluidos los que incluyen colecciones de genes de ambos padres. Este esfuerzo no mapeó uno de los 23 cromosomas que se encuentran en los hombres, llamado cromosoma Y, porque el lunar contenía solo una X.
Wang dijo que está trabajando con el grupo T2T en el Consorcio de referencia del pangenoma humano, que está tratando de generar genomas de “referencia” o plantilla para 350 personas que representan la amplitud de la diversidad humana.
“Ahora tenemos un genoma correcto y tenemos que hacer muchos, muchos más”, dijo Eichler. “Este es el comienzo de algo realmente fantástico para el campo de la genética humana”.
En otro destacado avance de la genética, en febrero pasado científicos de la Universidad de Oxford crearon el primer árbol genealógico de la humanidad. “El trasfondo teórico de las genealogías de todo el genoma, que describen cómo hemos heredado genes de nuestros antepasados, se ha desarrollado durante las últimas tres décadas”, explicó Anthony Wilder Wohns, investigador postdoctoral en el Instituto Broad del MIT y Harvard, ex estudiante de doctorado en el Big Data Institute (BDI) de la Universidad de Oxford y autor principal de la investigación-. Sin embargo, estimar realmente esta estructura es un problema estadístico tremendamente difícil”.
Las dificultades asociadas con la combinación de enormes conjuntos de datos de un gran número de bases diferentes han sido una gran barrera para este esfuerzo de investigación, hasta ahora. Wilder Wohns, otro de los autores principales de este nuevo estudio realizado durante su tiempo en el BDI, informó sobre “un método novedoso para combinar fácilmente millones de secuencias genómicas de poblaciones antiguas y modernas”.
Junto con sus colegas, Wohns utilizó este método para crear un “primer borrador” del árbol genealógico de la humanidad. “Ideamos un algoritmo novedoso que deduce relaciones genéticas sin necesidad de comparar cada secuencia de ADN entre sí y lo combinamos con otro algoritmo que coloca fechas en ancestros comunes al tratar a toda la ascendencia como una sola red -explicó-. Además, al estimar toda la genealogía de la humanidad, pudimos crear algoritmos que nos permitieron usar todo el genoma para estimar cuándo y, por primera vez, dónde vivieron nuestros antepasados”.