Blog de biogea Blog de biogea

La historia del conocimiento del genoma

Inicio

El estudio de nuestro genoma no es tan reciente como algunos piensan; muchos investigadores, a lo largo de siglos, han contribuido a construir su conocimiento, en una historia de eventos que permitieron sentar las bases para lo que ahora llamamos el estudio del genoma humano.
El estado actual de nuestro conocimiento acerca de la molécula que controla el funcionamiento de nuestras células nos permite saber la cantidad de genes que nos conforman y, más recientemente, la forma en que está organizado nuestro material genético. Si bien falta todavía mucha investigación para llegar a conocer con precisión cómo se regula su funcionamiento, lo cierto es que el avance es notable.

Leeuwenhoek
Hasta el momento en que los trabajos perdidos de Mendel fueron redescubiertos (1900) e introducidos en la literatura del mundo científico, nadie sabía de qué estaban hechos los genes, pero tales escritos inyectaron una gran energía a la investigación. Algunos eventos relevantes que desembocaron en la información que actualmente conocemos sobre nuestro genoma son: en 1683, Leeuwenhoek descubrió las bacterias; y el ácido desoxirribonucleico (ADN) surgió a la luz, a principios del siglo XX.
Durante la primera parte del siglo XX, la presencia de las cuatro letras (nucleótidos) que forman el ADN parecía carecer de la complejidad necesaria para codificar la gran cantidad de información presente en el genoma; por ello los científicos, originalmente, rechazaron la idea de que el ADN pudiese ser la fuente de la información genética. De modo que fue toda una sorpresa el que experimentos realizados en los años cuarentas pusieran los reflectores sobre el ADN, mostrándolo como la molécula depositaria de la información genética.
En la década de los cincuentas, el descubrimiento de los secretos en torno a la replicación del ADN y su transcripción, vía el arreglo (apareamiento) de nucleótidos —también llamados bases nitrogenadas, porque son compuestos químicos que contienen nitrógeno en su estructura—, respondió algunas de las interrogantes acerca de cómo la información genética puede ser copiada y transmitida de célula a célula y de generación en generación. Para 1961, el descubrimiento del funcionamiento del código genético resolvió el problema sobre la forma en que 20 aminoácidos utilizan un código de sólo cuatro letras, para formar diferentes tipos de proteínas.
La invención de la técnica de secuenciación del ADN —que consiste en leer el orden de las letras químicas que componen la molécula— así como de las técnicas de clonación (procesos que posibilitan la separación de genes individuales del resto del genoma, y que éstos se repliquen en muchas copias idénticas) condujeron, en los años setentas, a conocer las primeras secuencias de los genes humanos, lo que fue un gran logro en ese tiempo.
En los años ochentas, la técnica de Reacción en Cadena de la Polimerasa hizo viable el estudio del ADN, sin necesidad de clonarlo previamente, y la creación de los cromosomas artificiales facilitó la clonación de enormes piezas de ADN, miles de veces más grandes que las primeras piezas clonadas en los años setentas.
La planeación del Proyecto del Genoma Humano se comenzó durante la década de los ochentas y se inició oficialmente en 1990, cuando ya se contaba con el apoyo de la robótica y las computadoras de alta velocidad, todo lo cual permitió la obtención de grandes cantidades de datos de secuenciación en un solo experimento. El resultado es que, actualmente, se puede tener acceso a las secuencias de nuestros genes, porque éstas se encuentran públicamente disponibles en una base de datos llamada GenBank, en el Centro Nacional para la Información Biotecnológica (NCBI, por sus siglas en inglés), de la Librería Nacional de Medicina de los Estados Unidos de América.
El Proyecto del Genoma Humano fue planeado para tener una duración de 15 años, pero los avances tecnológicos permitieron realizarlo en sólo 13; así, los resultados fueron publicados en abril de 2003, y ello significó la culminación de un esfuerzo realizado por un equipo internacional, compuesto por 20 grupos de investigación de los Estados Unidos, el Reino Unido, Japón, Francia, Alemania y China.
¿Que encontramos en nuestro material genético?
Al hablar de la secuenciación del ADN, nos referimos al orden en el que se encuentran los elementos que componen la molécula, los cuales son los nucleótidos adenina, guanina, timina y citocina. Cuando se conoce este orden, es posible hacer mapas para ubicar la localización de los diferentes genes en nuestros cromosomas. Conviene recordar que el genoma humano está ordenado en 23 cromosomas, que contienen aproximadamente tres billones de bases nitrogenadas, por lo que su secuenciación y análisis representó un desafío de gran magnitud.
Los resultados del proyecto de la secuenciación del genoma humano revelaron que hay, probablemente, 20,500 genes en nuestro genoma; cifra que se considera es la base de las instrucciones heredables para el desarrollo y función de un ser humano. Un hallazgo sorprendente fue que el número de genes contabilizados resultó ser notablemente menor al previamente estimado, el cual fluctuaba entre 50,000 y 140,000.
De manera significativa, el análisis reveló que cerca de 50% de nuestro genoma contiene secuencias repetitivas (fragmentos de ADN, cuyo orden de bases nitrogenadas se repite cada determinado espacio, en un cromosoma) que no codifican para ninguna proteína, por lo cual, la función de estos segmentos de ADN aún es desconocida; así mismo, dicho análisis dejó ver que la longitud promedio de un gen que se expresa es de, aproximadamente, 3,000 bases. Aún más, a partir de esta información, los científicos pudieron detectar que de persona a persona hay una similitud de 99.9% en su secuencia de ADN; incluso, se logró identificar más fácilmente genes candidatos (aquellos que pueden ser relacionados con la presencia de enfermedades); sin embargo, también se encontró que la función de la mitad de los genes de nuestro genoma todavía no se conoce.Proyecto ENCODE

Una vez terminada la secuenciación de nuestro genoma, se hizo necesario conocer su organización para entender cómo se regula la expresión de nuestros genes; de esta manera nació el proyecto de la Enciclopedia de los elementos del ADN (The Encyclopedia of DNA Elements, ENCODE, por su acrónimo en inglés), y con ello, la siguiente fase del estudio del genoma.
El proyecto ENCODE nació en 2003, y su objetivo fue catalogar las secuencias (fragmentos) de ADN con una función ya identificada, además de conocer cuándo y en cuáles células las secuencias se encuentran activas, cómo se regulan sus funciones, y cómo son leídas por la maquinaria celular.
El proyecto fue realizado por un consorcio de 32 grupos de investigación, con la participación de más de 440 científicos, quienes aplicaron 24 diferentes tipos de experimentos sobre la molécula de ADN. En total, el equipo realizó 1,648 experimentos en cerca de 147 diferentes tipos de células, cuyos resultados fueron publicados en septiembre de 2012.
Los científicos aislaron y secuenciaron las moléculas de ácido ribonucleico (ARN) que se trascribieron del ADN, e identificaron los sitios de unión de más o menos 120 factores de transcripción. También ubicaron sitios en el genoma en donde se unió el grupo químico metilo (grupo químico considerado como una marca que indica las áreas en las cuales los genes no se están expresando). Así mismo, investigaron los patrones de las modificaciones químicas de unas proteínas llamadas histonas —que se unen y ayudan a empaquetar el ADN en los cromosomas y señalan regiones en donde la expresión de genes se está realizando o no; es decir, regiones que producen o no proteínas encargadas de regular una función celular—.
Después de una fase piloto, iniciada en 2003, a partir de la cual se analizó sólo 1% del genoma, para determinar cuáles técnicas podrían aplicarse en el estudio del genoma completo, los científicos del proyecto ENCODE comenzaron a aplicar los métodos de análisis seleccionados en el genoma completo, durante el año 2007.
El proyecto piloto inicial transformó la visión de los biólogos del genoma; por ejemplo, se encontró que si, por una parte, sólo una pequeña cantidad del ADN genera ARN mensajeros —que codifican para (producen) proteínas—, por otra, una gran cantidad del genoma transcribe (produce) moléculas de ARN que no codifican para (producen) proteínas; también se halló que algunas de estas moléculas —como ahora se sabe— son reguladores importantes para controlar la expresión de genes.
Esta segunda fase de análisis del genoma ha concluido y los resultados se publicaron en 30 artículos científicos en las revistas Nature, Genoma Research y Genome Biology. Entre ellos se aborda un hallazgo: de manera contraria a lo que anteriormente constituía una consideración más o menos extendida, respecto de que gran parte del ADN parecía no tener función alguna, los resultados del proyecto concluyeron con la asignación de una función a, aproximadamente, 80% del genoma. Uno de sus descubrimientos permitió encontrar más de 70,000 promotores (sitios en el ADN adyacentes a los genes, en los cuales se unen las proteínas que controlan su expresión), aproximadamente 400,000 regiones potenciadoras (enhancers) de la expresión genética (secuencias de ADN que regulan la expresión de genes distantes). Los promotores y las regiones potenciadoras, por controlar la expresión de los genes, fueron denominados regiones reguladoras de la expresión genética; las cuales se encontraron en 125 diferentes tipos de células, y casi 2.9 millones de ellas fueron ubicadas; un tercio se encontró en un solo tipo de célula y 3,700 en todos los tipos celulares, lo que sugiere la existencia de diferencias importantes en la forma como se regula la expresión de genes de célula a célula, porque no se encontraron todas las regiones reguladoras en todos los tipos de células.
De esta manera, las vastas zonas del ADN que, anteriormente, se suponía no contenían genes, ahora se sabe que están pobladas con cientos de miles de regiones que contribuyen a la regulación de la expresión genética, y que diferentes células usan diferentes combinaciones de dichas regiones, para contribuir a la biología única de la célula. Esta riqueza presente en las regiones responsables de regular la expresión genética podría explicar cómo es que, relativamente pocos genes que codifican para proteínas, pueden dar lugar a la complejidad necesaria para crear un ser humano, y que, si bien el genoma humano es el mismo en todas las células humanas, aparentemente, no se usa de la misma manera en todas ellas.

Genoma y enfermedades genéticas

La información obtenida del análisis del genoma ayuda también a los investigadores a entender más sobre las enfermedades genéticas. Por ejemplo, desde hace tiempo se conoce que en el genoma existen variaciones, ubicadas en la molécula de ADN, asociadas con riesgos de enfermedades, pero ahora se sabe también que casi 90% de estas variaciones se encuentran en regiones que no codifican para proteínas, por lo tanto, hasta ahora se desconoce cómo ellas podrían causar una enfermedad genética, puesto que la información del proyecto ENCODE reveló que muchas de estas variaciones se encuentran en las regiones que regulan la expresión genética.
Los datos obtenidos hasta ahora iluminan algunas partes oscuras del genoma, permitiéndonos entender cómo las variaciones genéticas afectan las características del humano y propician la presencia de enfermedades.
¿Y ahora que sigue?

El proyecto está lejos de terminar, de acuerdo con los investigadores de ENCODE, pues consideran que aún los esfuerzos para conocer la organización y función del genoma están a la mitad del camino, y que, probablemente, su caracterización detallada sólo ha alcanzado 10%; no obstante, se calcula que una tercera fase del análisis proveerá información más detallada sobre el genoma.
Los investigadores podrían pasar años analizando los datos obtenidos hasta ahora por el proyecto ENCODE; sin embargo, dado que los resultados se han generado a partir de experimentos realizados en sólo unos pocos tipos diferentes de células, resulta difícil considerar cuántos tipos de ellas deben ser analizados para obtener información concluyente sobre la función del ADN.
En este sentido, la mayoría de los experimentos se ha realizado en células utilizadas como modelos de investigación en laboratorio y, por lo mismo, tienen propiedades diferentes de las células normales, porque han sido manipuladas genéticamente. Por ejemplo, las células más estudiadas son unas llamadas HeLa y GM12878; las primeras tuvieron su origen en una biopsia de cáncer cervical hace más de 50 años, y contienen muchas modificaciones en su genoma; por otro lado, las GM12878 provienen de células sanguíneas, que fueron inducidas a reproducirse mediante el uso de un virus; de modo que, los resultados obtenidos de los experimentos con estas células no se podrían comparar con lo que sucede en células normales.
Debido a lo anterior, los investigadores del proyecto ENCODE planean hacer ahora experimentos en células tomadas directamente de una persona, aunque, desafortunadamente, muchas de estas células no se pueden dividir en el laboratorio, y la obtención de material suficiente representa un problema complicado de resolver; además de que es difícil tomar muestras de algunos tejidos, como el cerebro.
De acuerdo con los investigadores del proyecto ENCODE, éste no tiene un tiempo definido de conclusión, pues al parecer, esto se definirá cuando la acumulación de información sea suficiente para conocer la forma en que las secuencias de ADN regulan la función del genoma.

Bibliohemerografía

◂ Holmes, K. V., L. Enjuanes (2003). “Virology. The SARS Coronavirus: a Postgenomic Era”. Science. 300:1377-8.
◂ Maher, B. (2012). “The Human Encyclopedia”. Nature 484:46-48.
◂ Richards, J. E., R. S. Hawley (2011). The Human Genome. A User´s Guide. (Third Edition). Elsevier Inc. London NW1 7BY, U. K.
◂ Richards, J. E., R. S. Hawley (2011). The Human Genome: How the Sequence Enables Genome wide Studies: 405-452.
◂ Seemungal, D., G. Newton (2001). “Encyclopedia of Genetics”. Human Genome Project: 980–981

Autores

Ernesto García Pineda es Doctor en Biotecnología de Plantas, por el Departamento de Ingeniería Genética, Cinvestav-IPN, campus Guanajuato. Actualmente, es Profesor investigador titular, en el Instituto de Investigaciones Químico Biológicas, de la UMSNH. Ha publicado 26 artículos en revistas nacionales e internacionales y es miembro del SNI, nivel I. Su área de investigación es: Mecanismos de defensa en plantas. C. e.: egpineda@umich.mx
Elda Castro Mercado es Maestra en Biología Experimental, por el Instituto de Investigaciones Químico Biológicas de la UMSNH. Ha presentado sus trabajos de investigación en congresos nacionales e internacionales, y ha publicado 15 artículos en revistas nacionales e internacionales.

¿Vulnera este post tus derechos? Pincha aquí.

Creado: 24/11/2015 18:05

Relacionado

Blog de biogea

Convivencia entre el Homo sapiens y el neandertal

Ilustración: Raziel MéndezComparando el genoma del neandertal con los genomas completos de cinco seres humanos actuales de distintas regiones, se ha descubierto que los europeos y los asiáticos tienen genes que provienen de esa especie, pero los africanos no. Esto sugiere que los Homo sapiens sí se aparearon con los neandertales en la época en que ambas especies coincidieron en el Medio Oriente.Lo ...

Blog de biogea

El genoma del lince desvela una fragilidad de siglos

Dic 2016El lince ibérico es la especie con menor diversidad genética que se conoce, menos que el orangután de Borneo, el leopardo de las nieves e incluso homínidos extintos como los neandertales. Así lo desvela hoy un equipo de 50 científicos de 10 instituciones de España y otros países que ha secuenciado y analizado el primer genoma completo de esta especie. Su diagnóstico es que el Lynx pardinus ...

Blog de biogea

Las tentaciones de editar nuestro genoma

Miguel Ángel CevallosNuevas técnicas permiten producir en un tiempo récord y a menor costo todo tipo de mutaciones en las plantas y animales que se usan como modelos en la investigación. ¿Deberíamos aplicarlas también a los seres humanos para prevenir o curar enfermedades genéticas?Una de las características de la ciencia que más me entusiasman es que uno nunca sabe por dónde va a saltar la liebre ...

Blog de biogea

Información genómica fluye como datos en internet

2016Gracias a unas etiquetas presentes en los genes, la información que estos contienen fluye en un sentido determinado. Curiosamente, en la comunicación en Internet sucede del mismo modo, reveló un nuevo estudio.Este hallazgo, realizado por especialistas del Centro Nacional de Investigaciones Oncológicas (CNIO), en España, ayudará a comprender las consecuencias genéticas de nuestras propias activ ...

Noticias de Canarias

Final al misterio: Los pobladores canarios fueron bereberes.

Uno de los mayores misterios de Canarias se ha resuelto gracias al estudio de un ADN antiguo que enmarca el origen de la población de las Islas Canarias: los primeros pobladores de Canarias eran de origen bereber.Esto ha confirmado los estudios durante muchas décadas acerca del origen africanos de los aborígenes de Canarias.El genoma del norte de África está directamente relacionado con el genoma ...

Blog de biogea

CRISPR la herramienta de edición de ADN declarada por 'Science' como el hito científico del 2015

Quienes escriben suelen confesar que pasan casi más tiempo corrigiendo sus obras que escribiéndolas. Que ese es el momento crucial y singular.Los biólogos admiran el ADN, un libro de instrucciones de aparente sencillez e infinita complejidad. No escribieron nada de él, pero sueñan con editarlo. Ellos también querían su momento singular. Y, posiblemente, acaba de llegar.La herramienta que puede cam ...

Blog de biogea

Edición genética: el primer paso para trasplantes de órganos de cerdos a humanos

Oct 2015Incluso en España, el país líder en trasplante de órganos, hay siempre más demanda que oferta de ese material vital, y el problema es aún peor en otros países. El cerdo se considera una de las fuentes más prometedoras de órganos, pero las investigaciones están paradas por un grave problema: su genoma contiene docenas de retrovirus que pueden activarse e infectar al receptor del trasplante. ...

Blog de biogea

Alargan la vida de ratones gracias a la reprogramación celular

Dic 2016Científicos del Instituto Salk de Estudios Biológicos en California (EU) han conseguido, en ratones con progeria –una enfermedad genética que provoca el envejecimiento prematuro–, aumentar su esperanza de vida desde una media de 18 semanas a 24, lo que supone un 30 por ciento más.El hallazgo, publicado en la revista Cell, muestra cómo los investigadores han revertido los signos del envejec ...

Blog de biogea

Nueva herramienta para filtrar datos ayuda a identificar mutaciones patogénicas

Una nueva herramienta diseñada para ayudar a los genetistas de diferenciar entre las mutaciones patogénicas e inofensivas, ya está disponible en la Internet.La fracción de los genes que codifican proteínas se llama el exoma, y el análisis de todo el genoma ha revelado que mientras que el ADN de un paciente con una enfermedad monogénica contiene cerca de 20.000 variaciones, sólo una o dos están cau ...

Blog de biogea

Debate bioético sobre los edición genética de la linea germinal en humanos

2015Si alguien había encontrado una forma de crear un bebé modificado genéticamente, supuse que George Church lo sabría.En su laberíntico laboratorio del campus de la facultad de medicina de la Universidad de Harvard (EEUU) puedes encontrarte con investigadores dotando a la bacteria E. Coli de un nuevo código genético jamás encontrado en la naturaleza. En otra esquina, otros están planeando usar l ...