lunes, 1 de abril de 2019

Descifrando el genoma humano - Cristian Suárez Cabrera

Descifrando el genoma humano: la Piedra Rosetta de la biología.




A lo largo de nuestras vidas, siempre hay frases que se nos quedan grabadas en la mente en momentos determinados, que nos hacen reflexionar y que no olvidamos con el paso del tiempo. Un profesor y amigo me dijo una vez “las enfermedades no leen los libros”. Efectivamente, la naturaleza no lee los libros, pero nosotros debemos aprender a leer su lenguaje. Nuestros conocimientos en el campo de la medicina y la biología han ido evolucionando a lo largo de los siglos, rompiendo dogmas con nuevos hallazgos que no han dejado de sorprendernos. El código genético se abrió al ser humano como un nuevo idioma, una fuente inmensa de información que, desde su descubrimiento, no ha dejado de plantear retos tanto científicos como éticos. A día de hoy, los investigadores seguimos intentando entender su lenguaje y seguimos fascinándonos con todo lo que queda por descubrir. Pero para entender mejor estas palabras, empecemos por los cimientos ¿Qué es el ADN?

Descubrimiento del ADN: las primeras piezas del rompecabezas.
A pesar de la creencia popular, Watson y Crick no descubrieron el ADN en la década de los 50. Ellos harían su contribución al conocimiento de esta molécula 80 años más tarde. Fue en 1869 cuando Friedrich Miescher1, con el fin de extraer e identificar diferentes proteínas a partir de glóbulos blancos procedentes de restos de pus de desechos quirúrgicos, aisló unas moléculas ácidas y ricas en fosfatos presentes en el núcleo de estas células, las cuales poseían características diferentes a cualquier proteína. Miescher denominó a estas moléculas “nucleínas”, término que sería sustituido décadas más tarde por “ácidos nucleicos” [1]. Sin embargo, pasaron más de 50 años antes de que el descubrimiento de Miescher fuera apreciado por la comunidad científica. A pesar de ello, otros científicos, como Phoebus Levene2, continuaron investigando la naturaleza química de estas moléculas. Levene hizo grandes contribuciones en la caracterización de los ácidos nucleicos, siendo el primero en describir en 1919 los tres componentes principales (un grupo fosfato, un azúcar y una base nitrogenada) de las piezas básicas que conforman los ácidos nucleicos: los nucleótidos (Fig. 1) [2].


Fig.1. Componentes de un nucleótido.


Como Levene describió, los nucleótidos que conforman el ADN pueden estar compuestos por cuatro bases nitrogenadas diferentes (adenina [A], guanina [G], citosina [C] y timina [T]). Sin embargo, Levene propuso que estos nucleótidos presentaban siempre el mismo patrón de distribución, estando unidos entre ellos siempre en el mismo orden. Como hoy sabemos, esta hipótesis fue desechada, ya que las múltiples combinaciones posibles de estos 4 tipos de nucleótidos sustentan la base del código genético. Fue Erwin Chargaff3, en 1950, quien demostró que los nucleótidos no se distribuían siempre en el mismo orden como había propuesto Levene y que, a pesar de estar presentes en todos los organismos manteniendo ciertas propiedades comunes, la proporción entre ellos variaba en las distintas especies. Además, Chargaff observó que la cantidad de adeninas era siempre muy similar a la cantidad de timinas, y que lo mismo ocurría con las guaninas y citosinas entre sí, estableciendo así la denominada “ley de Chargaff” y sentando una base vital para el posterior trabajo de Watson y Crick (entre otros) respecto a la estructura tridimensional del ADN [3].

Estructura tridimensional del ADN.
En 1952, en el King’s college de Londres, Rosalind Franklin4 y Maurice Wilkins5 obtuvieron las primeras imágenes de calidad del ADN por medio de la cristalografía de rayos X6. Wilkins mostró una de las fotos de la molécula de ADN tomadas por Franklin a James Watson7 sin su consentimiento (Fig.2), lo cual lo puso sobre la pista para llevar a cabo la descripción del modelo de doble hélice del ADN. De forma paralela, el químico y bioquímico Linus Pauling8 formuló su propia propuesta con respecto a la estructura tridimensional del ADN, la cual, aunque incorrecta, ayudó a la elaboración del modelo actualmente aceptado.


Fig.2. Foto 51 de Rosalind Franklin de la estructura del ADN tomada por cristalografía de rayos X.

Sustentados en estas bases, James Watson y Francis Crick9 emplearon recortes de cartón para representar los componentes químicos individuales de las cuatro bases nitrogenadas, así como de los demás componentes de los nucleótidos, jugando con sus configuraciones atómicas hasta que encontraron una perfecta complementariedad entre la adenina y la timina y entre la citosina y la guanina. Así, estos dos investigadores postularon la estructura en doble hélice de la molécula de ADN, publicando sus hallazgos el 25 de abril de 1953 en la revista Nature [4]. De esta manera, se demostró que el ADN está formado por una doble cadena de nucleótidos, dando lugar a un “efecto espejo” entre ambas cadenas y cumpliendo así la ley de Chargaff (A=T y C=G) (Fig. 3). En 1962, Wilkins, Watson y Crick recibieron el Premio Nobel de Fisiología o Medicina por sus estudios sobre la estructura y funcionalidad del ADN, mientras que Franklin falleció en 1958 sin el debido reconocimiento de su trabajo. Sin embargo, a la brillante química y cristalógrafa se le han otorgado numerosos reconocimientos póstumos por sus estudios pioneros, incluyendo la descripción de la estructura del ADN.


Fig.3. Doble cadena de nucleótidos que conforman el ADN. Se observa como la adenina se una a la timina y la citosina a la guanina.

Así pues, el descubrimiento del ADN, de sus componentes y de su estructura supuso una larga carrera que marcó un antes y un después en el mundo de la biología. Pero ¿qué información se esconde dentro de las moléculas de ADN y cómo está codificada?

El código genético.
Como ya hemos visto, las diferencias que existen entre los distintos tipos de nucleótidos que conforman el ADN radican en las cuatro bases nitrogenadas. El orden en el que se disponen estas bases nitrogenadas crea un código, un lenguaje cifrado, pero ¿cómo solo 4 letras pueden conformar un idioma tan complejo? Quizás las matemáticas nos puedan arrojar luz sobre esta pregunta. Pensemos en una cadena de 10 nucleótidos, ¿cuántas combinaciones posibles de estas 4 bases nitrogenadas se podrían dar en una cadena de 10 nucleótidos? Inicialmente podría parecer que no demasiadas ¿no? Pues existen 1.048.576 de combinaciones posibles, más de un millón de opciones en solo 10 nucleótidos. Pues bien, dado que se estima que el ADN del genoma humano tiene poco más de 3 mil millones de nucleótidos, las posibilidades que se abren ante nosotros son casi ilimitadas.
De esta manera, el ADN contiene la información necesaria para que cada organismo, cada célula, pueda sintetizar todas las proteínas necesarias en una amplia serie de procesos vitales. Al igual que los ácidos nucleicos, las proteínas también están formadas por piezas básicas, por unidades fundamentales: los aminoácidos. Existen 20 aminoácidos esenciales para la vida, cuyas combinaciones dan lugar a múltiples proteínas con innumerables funciones necesarias para el correcto funcionamiento del organismo. Ahora bien, la pregunta lógica que se nos plantea a continuación es: ¿De qué manera el ADN codifica la información necesaria para sintetizar las proteínas?
Tras la presentación del modelo tridimensional de la molécula de ADN, se comenzó a estudiar en profundidad el proceso de traducción de las proteínas. En este momento, ya se sabía que a partir del ADN podía sintetizarse otro tipo de molécula formada por ácidos nucleicos, el ARN, mediante un proceso llamado transcripción del ADN. A diferencia del ADN, el ARN está formado por una única cadena de ácidos nucleicos y, aunque también está compuesto por 4 bases nitrogenadas, en su estructura la timina es sustituida por una molécula de uracilo. Las moléculas de ARN portan la información necesaria para que se lleve a cabo el proceso de síntesis proteica, denominado traducción del ARN.
En 1953, el físico teórico ruso George Gamow10 quedó fascinado tras leer el trabajo de Watson y Crick y, emocionado, se puso en contacto con ellos inmediatamente para discutir sus ideas sobre tan asombroso descubrimiento. Fue así como, tras una serie de encuentros y con un desbordante espíritu de colaboración, Watson y Gamow fundaron “el club de la corbata del ARN”. Este club multidisciplinar estaba conformado por 20 miembros (uno por cada aminoácido esencial) y tenía como objetivo averiguar la conexión entre los aminoácidos y el código genético.
Gamow dedujo matemáticamente que, para poder codificar 20 aminoácidos, el número mínimo de nucleótidos necesarios era de 3. Tras la confirmación de esta hipótesis por parte de una serie de experimentos llevados a cabo por Francis Crick y Sydney Brenner11, entre otros, empezaron a determinarse las correspondencias entre aminoácido y codón (término acuñado por Sydney para el conjunto de 3 nucleótidos que codifica para un aminoácido). Marshall Warren Nirenberg12 y Philip Leder13 fueron capaces de determinar la traducción de 54 codones y, posteriormente, Har Gobind Khorana14 completó el código. De esto se deduce que existen 64 posibles combinaciones de 3 nucleótidos (codones) que darían lugar a la síntesis de los 20 aminoácidos, aunque realmente 3 de estos codones no codifican aminoácidos, si no que indican sitios de parada, es decir, señales para finalizar la traducción de las proteínas (Fig. 4) [5].


Fig.4. Mapa conceptual de las 64 posibles combinaciones de un triplete de nucleótidos (codón) que dan lugar a la codificación de los aminoácidos.


La multiplicación de la información genética.
El descubrimiento de la estructura tridimensional del ADN también contribuyó a comprender mejor su mecanismo de replicación, es decir, la manera en la que las células generan copias idénticas de su ADN para que la información genética se transmita de una célula madre a las células hijas. ¿Cómo funciona este proceso? Como ya hemos visto, el ADN está formado por dos cadenas o hebras unidas entre sí a través de las bases nitrogenadas, formando una estructura similar a una cremallera. Esta cremallera se abre por el centro, permitiendo a la maquinaria celular ir sintetizando dos nuevas cadenas a partir de cada una de las mitades de la molécula original, funcionando así cada una de ellas como molde o plantilla para crear una nueva. De esta manera, cada nueva doble hebra tendrá una mitad de la cadena original y una mitad de nueva síntesis (Fig. 5).


Fig.5. Esquema de la replicación del ADN.

Sin embargo, la habilidad para “leer” las moléculas de ADN se retrasó en el tiempo. A este procedimiento se le conoce como secuenciación, dado que consiste en conocer la secuencia exacta de los nucleótidos que conforman el ADN, determinando la posición de cada uno de ellos en un orden preciso. Los métodos utilizados para secuenciar los aminoácidos que conforman las proteínas no eran aplicables para esta molécula, dado que el ADN es una estructura mucho más larga y está formada por unidades muy parecidas entre sí, haciendo mucho más difícil la distinción de cada una de ellas de una manera precisa. Por tanto, era necesario el desarrollo de nuevas tácticas que permitieran conocer las secuencias exactas del ADN.
Aunque en la década de los 70 se hicieron algunos avances en las técnicas de secuenciación del ADN, el método desarrollado por Frederick Sanger15 en 1977 supuso un punto de inflexión en esta materia, siendo la metodología más ampliamente usada para secuenciar durante al menos 40 años y obteniendo el Premio Nobel en 1980 gracias a esta innovación. Aunque posteriormente otros métodos han sido descritos y actualmente el primer puesto del pódium está ocupado por técnicas más sofisticadas, el método de Sanger se sigue usando de forma ampliamente generalizada en proyectos de pequeña escala [6].
De esta manera, el conocimiento de los mecanismos de replicación del ADN y el desarrollo de técnicas de secuenciación, entre otros, permitieron que en 1983 Kary Mullis16 desarrollara los primeros esbozos de lo que se convertiría en una de las técnicas más revolucionarias de la biología molecular: La reacción en cadena de la polimerasa o PCR (de sus siglas en inglés “Polymerase Chain Reaction”). Esta técnica aprovecha la estructura de doble cadena del ADN para llevar a cabo una amplificación masiva de una zona de interés en el genoma. Empleando dos pequeños fragmentos de ADN que flanqueen la zona que nos interesa amplificar, siendo cada uno de estos fragmentos complementarios a una de las dos cadenas. Además, estos fragmentos funcionan como una señal de inicio de la replicación permitiendo duplicar las cadenas de ADN de forma artificial en el laboratorio.
Ahora bien, ¿Qué ocurre si este procedimiento se lleva cabo de forma repetitiva y cíclica? Que podremos copiar este segmento de ADN de interés una y otra vez, obteniendo muchos millones a partir de una única molécula de ADN en poco tiempo y consiguiendo finalmente una cantidad muy elevada del mismo (Fig. 6). Este sistema abrió una ventana para obtener mucho material genético a partir de una pequeña cantidad inicial ADN, dando lugar a una gigantesca fuente de información de todo el genoma de múltiples especies animales y vegetales, y abriendo innumerables posibilidades futuras [7].


Fig.6. Esquema de la reacción en cadena de la polimerasa (PCR).


La herencia genética: transfiriendo la información.
Curiosamente, ya se tenía constancia de la herencia del material genético antes de desentrañar la composición y estructura del ADN. Alrededor de 1860 (unos años antes de que Friedrich Miescher aislara la molécula de ADN), Gregor Mendel17 describió que había ciertos “caracteres” que se transmitían a la descendencia en una proporción constante. Observando y cruzando diferentes variedades de plantas de guisantes que diferían en su color y en la rugosidad de su superficie, determinó que algunos de estos caracteres eran predominantes (conocidos como dominantes) sobre los otros (conocidos como recesivos) y que los porcentajes de plantas verdes, amarillas, lisas o rugosas, mantenían siempre la misma relación entre sí. Así, Mendel observó que el color amarillo era dominante sobre el verde y la superficie lisa sobre la rugosa (Fig. 7). De esta manera, el 1865, este monje de origen checo postuló las conocidas como “leyes de Mendel”, explicando cómo estos “caracteres” se transmitían a la descendencia. Lo que Mendel nunca llegó a saber, es que lo que él denominaba “caracteres” era el reflejo directo de la combinación de los genes aportados por cada uno de los progenitores. Llegados a este punto hay que preguntarse ¿Qué es un gen? Un gen es una secuencia de ADN que es capaz de codificar una molécula que ejerza una función en la célula (ya sea ARN o una proteína). De esta manera, recibimos una copia de cada gen de nuestra madre y otra de nuestro padre, siendo la combinación de ambos lo que determina cómo seremos [8].


Fig.7. Esquema mostrando los principios básicos de la herencia mendeliana.


Proyecto genoma humano.
Dada la clara importancia médica y social de descifrar el código genético humano, a mitad de los años 80 empezaron a ponerse en marcha diversos proyectos con el objetivo de secuenciar y mapear el genoma humano. Con estos antecedentes, en 1990 se fundó el Proyecto Genoma Humano (PGH). Este proyecto internacional, integrado por 20 grupos de investigación de diferentes países, así como por empresas privadas, presentaba dos objetivos principales: determinar la posición de todos nucleótidos que conforman el ADN humano (secuenciación) y localizar la posición de cada gen en cada uno de los 23 pares de cromosomas presentes en las células humanas (mapeo genético). Aunque se estableció un plazo de 15 años para la realización de este proyecto, el 6 de abril del año 2000 se anunció públicamente la terminación del primer borrador del genoma humano, y en 2003, tras varias publicaciones, fue declarado esencialmente completo, dos años antes de la fecha prevista [9].
Desentrañar el conocimiento encerrado en las moléculas de ADN humano ha supuesto grandes ventajas al desarrollo médico y tecnológico en los últimos años, pero también ha planteado diversas consecuencias de carácter ético. Para los investigadores, estos avances supusieron un beneficio tangible, dado que permitieron desarrollar bases de datos en plataformas web, abriendo nuevas vías en sus investigaciones, pudiendo examinar el trabajo de otros científicos en su campo, sobre un determinado gen, sobre su estructura, sobre sus interacciones y funciones, y su implicación en el desarrollo normal del organismo o en la aparición de enfermedades. Este hecho ha permitido un avance vertiginoso en las investigaciones biomédicas a nivel mundial en las dos últimas décadas. Además, gracias al PGH, se ha podido profundizar en el estudio de enfermedades hereditarias, tales como el Alzheimer, la enfermedad de Huntington o el síndrome de Marfan, entre muchas otras. El conocimiento de las bases moleculares de este tipo de enfermedades permite realizar un diagnóstico precoz gracias al cual se pueden tomar medidas preventivas contra la enfermedad o incluso llevar a cabo diagnósticos prenatales para detectar anormalidades en el desarrollo del feto antes del nacimiento.
Son muchas las áreas de investigación biomédica que se han beneficiado del PGH. En oncología, poder secuenciar el genoma de un amplio abanico de tumores ha permitido identificar las vías moleculares de muchos tipos de cáncer, dando lugar al desarrollo de tratamientos más personalizados y dirigidos, evitando de esta manera, en la medida de lo posible, la gran cantidad de efectos secundarios que originan los tratamientos basados en quimioterapia convencional. Esta medicina personalizada se ha hecho extensible a muchos campos, permitiendo refinar los tratamientos farmacológicos y desarrollando fármacos que actúen de una manera dirigida según las diversas alteraciones en la secuencia del ADN de determinados genes en los pacientes. En esta misma vía, gracias al PGH, se ha desarrollado lo que se conoce como terapia génica, la cual supone la posibilidad de curar enfermedades de origen genético mediante la modificación directa del ADN del paciente, ya sea introduciendo una copia sana del gen afectado a sus células o directamente modificando la secuencia aberrante de su genoma.
Asimismo, se han realizado grandes avances en el área de la medicina preventiva, es decir, el estudio de un gen o conjunto de genes que pueden predecir la posible aparición de enfermedades que aún no se han desarrollado en el paciente. Sin embargo, aunque en primera instancia esto supone una ventaja para los pacientes, también ha despertado una gran controversia social desde un punto de vista ético, dado que saber de antemano que determinadas poblaciones o individuos tienen más probabilidad de desarrollar ciertas enfermedades puede dar lugar a la discriminación y rechazo social, así como una desventaja a la hora de conseguir trabajo o un seguro de vida, entre otros. Por ello, ha sido necesario el desarrollo de unos principios éticos que permiten regular estos conocimientos y garantizar la privacidad y dignidad individual, protegiendo la información genética de los pacientes. Además, es necesario potenciar la educación y concienciación de la sociedad en lo que concierne a la información genética, resaltando sus ventajas para el individuo y para la sociedad y clarificando sus derechos de privacidad y decisión individual.

ADN: pasado, presente y futuro.
Como hemos visto a lo largo de este capítulo, desde el descubrimiento del ADN hasta la actualidad han tenido lugar una gran serie de acontecimientos que han revolucionado tanto la manera de pensar de los científicos como la investigación y práctica biomédica. Durante estas décadas, la información que guarda el código genético ha sido minuciosamente estudiada y ha ido revelando un entramado más complejo de lo que inicialmente se creía. Por ejemplo, al principio se pensaba que solo presentaban verdadera relevancia aquellas regiones del ADN que codificaban para la síntesis de proteínas, considerándose la inmensa mayoría del genoma ADN basura. Hoy día se sabe que este pensamiento estaba muy alejado de la realidad y que existen innumerables secuencias de ADN que no codifican proteínas que tienen importantísimas funciones tanto reguladoras como estructurales, así como muchísimos factores que alteran los patrones de expresión de los genes en los distintos tejidos y entre diferentes individuos, dando lugar a múltiples resultados posibles a partir de un mismo gen que no presenta mutaciones. Por ello, no debemos olvidar tener siempre la mente abierta a nuevas posibilidades, nuevos enfoques y descubrimientos. Los avances en la investigación sobre el genoma humano han sido como una lanzadera que nos ha permitido llegar a un nuevo universo antes desconocido, pero aún quedan muchas galaxias por descubrir. El ADN, el genoma, aún no nos ha revelado todos sus secretos, y su amplia complejidad garantiza que aún nos queda mucho por aprender. Ningún buen lector que se precie considera que ya ha leído lo suficiente, y del mismo modo, nosotros seguiremos leyendo y aprendiendo todo lo que el ADN esté dispuesto a revelarnos. El código genético promete ser un “bestseller” y nosotros aún no hemos terminado el prólogo.

Referencias:
[1] Wolf, G. 2003. Friedrich Miescher: The man who discovered DNA. Chemical Heritage 21, 10-11, 37–41.
[2] Levene, P. A. 1919. The structure of yeast nucleic acid. IV. Ammonia hydrolysis. Journal of Biological Chemistry 40, 415–424.
[3] Chargaff, E. 1950. Chemical specificity of nucleic acids and mechanism of their enzymatic degradation. Experientia 6, 201–209.
[4] Watson, J. D., & Crick, F. H. C. 1953. A structure for deoxyribose nucleic acid. Nature 171, 737–738.
[5] Kay L. 2000. Who Wrote the Book of Life?: A History of the Genetic Code. Stanford University Press. ISBN 9780804734172.
[6] Heather, J.M., & Chain, B. 2016.The sequence of sequencers: The history of sequencing DNA. Genomics. 107(1): 1–8.
[7] Templeton, N.S. 1992. The polymerase chain reaction. History, methods, and applications. DiagnMolPathol.1(1):58-72.
[8] Miko, I. 2008. Gregor Mendel and the principles of inheritance. Nature Education 1(1):134.
[9] Chial, H. 2008. DNA sequencing technologies key to the Human Genome Project.  Nature Education 1(1):219.

Cristian Suárez Cabrera
Licenciado en Veterinaria.
Doctor en Bioquímica, Biología molecular y Biomedicina.
Investigador postdoctoral de la Unidad de Oncología Molecular del Centro de Investigaciones Energéticas, Medioambientales y Tecnológicas (CIEMAT).

Notas:
1 Friedrich Miescher (1844-1895), biólogo y médico suizo. Profesor y rector de la Universidad de Basilea.
2 Phoebus Levene (1869-1940), bioquímico y químico ruso.
3 Erwin Chargaff (1905-2002), bioquímico y químico austriaco. Profesor en la Universidad de Columbia.
4 Rosalind Franklin (1920-1958), química y cristalógrafa inglesa.
5 Maurice Wilkins (1916-2004), físico originario de Nueva Zelanda. Ganador del Premio Nobel de Fisiología o Medicina en 1962. Trabajó en el Proyecto Manhattan.
6 Técnica que se usa de manera experimental para el estudio de la estructura de distintos materiales basada en el fenómeno de difracción de los rayos X por sólidos en estado cristalino.
7 James Dewey Watson (1928- hasta la actualidad), biólogo estadounidense. Ganador del premio Nobel de Fisiología o Medicina en 1962.
8 Linus Pauling (1901-1994), químico y bioquímico estadounidense. Ganador del Premio Nobel de Química en 1954 y Premio Nobel de la Paz en 1962.
9 Francis Crick (1916-2004), físico, biólogo molecular y neurocientífico británico. Ganador del premio Nobel de Fisiología o Medicina en 1962.
10 George Gamow (1904-1968), físico y astrónomo ruso.
11 Sydney Brenner (1927-hasta la actualidad), biólogo sudafricano galardonado con el Premio Nobel de Fisiología o Medicina de 2002.
12 Marshall Warren Nirenberg (1927-2010), bioquímico y genetista estadounidense. Ganador del premio Nobel de Fisiología o Medicina en 1968.
13 Philip Leder (1934-hasta la actualidad), genetista estadounidense. Ganador del premio Nobel de Fisiología o Medicina en 1962.
14 Har Gobind Khorana (1922-2011), biólogo molecular indo-estadounidense de ascendencia panyabí. Premio Nobel de Fisiología o Medicina en 1968.
15 Frederick Sanger (1918-2013), un bioquímico británico dos veces laureado con el Premio Nobel de Química (1958 y 1980).
16 Kary Mullis (1944-hasta la actualidad), es un bioquímico, autor y conferenciante estadounidense. Comparte el Premio Nobel de Química de 1993 con Michael Smith.
17 Gregor Mendel (1822-1884), monje agustino católico y naturalista.

No hay comentarios:

Publicar un comentario