Descifrando el genoma
humano: la Piedra Rosetta de la biología.
A lo
largo de nuestras vidas, siempre hay frases que se nos quedan grabadas en la
mente en momentos determinados, que nos hacen reflexionar y que no olvidamos
con el paso del tiempo. Un profesor y amigo me dijo una vez “las enfermedades
no leen los libros”. Efectivamente, la naturaleza no lee los libros, pero
nosotros debemos aprender a leer su lenguaje. Nuestros conocimientos en el
campo de la medicina y la biología han ido evolucionando a lo largo de los
siglos, rompiendo dogmas con nuevos hallazgos que no han dejado de
sorprendernos. El código genético se abrió al ser humano como un nuevo idioma,
una fuente inmensa de información que, desde su descubrimiento, no ha dejado de
plantear retos tanto científicos como éticos. A día de hoy, los investigadores
seguimos intentando entender su lenguaje y seguimos fascinándonos con todo lo
que queda por descubrir. Pero para entender mejor estas palabras, empecemos por
los cimientos ¿Qué es el ADN?
Descubrimiento del ADN: las primeras piezas
del rompecabezas.
A pesar
de la creencia popular, Watson y Crick no descubrieron el ADN en la década de
los 50. Ellos harían su contribución al conocimiento de esta molécula 80 años
más tarde. Fue en 1869 cuando Friedrich Miescher1, con el fin de
extraer e identificar diferentes proteínas a partir de glóbulos blancos
procedentes de restos de pus de desechos quirúrgicos, aisló unas moléculas
ácidas y ricas en fosfatos presentes en el núcleo de estas células, las cuales
poseían características diferentes a cualquier proteína. Miescher denominó a
estas moléculas “nucleínas”, término que sería sustituido décadas más tarde por
“ácidos nucleicos” [1]. Sin embargo, pasaron más de 50 años antes de que el descubrimiento
de Miescher fuera apreciado por la comunidad científica. A pesar de ello, otros
científicos, como Phoebus Levene2, continuaron investigando la
naturaleza química de estas moléculas. Levene hizo grandes contribuciones en la
caracterización de los ácidos nucleicos, siendo el primero en describir en 1919
los tres componentes principales (un grupo fosfato, un azúcar y una base
nitrogenada) de las piezas básicas que conforman los ácidos nucleicos: los
nucleótidos (Fig. 1) [2].
Como
Levene describió, los nucleótidos que conforman el ADN pueden estar compuestos
por cuatro bases nitrogenadas diferentes (adenina [A], guanina [G], citosina
[C] y timina [T]). Sin embargo, Levene propuso que estos nucleótidos
presentaban siempre el mismo patrón de distribución, estando unidos entre ellos
siempre en el mismo orden. Como hoy sabemos, esta hipótesis fue desechada, ya
que las múltiples combinaciones posibles de estos 4 tipos de nucleótidos
sustentan la base del código genético. Fue Erwin Chargaff3, en 1950,
quien demostró que los nucleótidos no se distribuían siempre en el mismo orden
como había propuesto Levene y que, a pesar de estar presentes en todos los
organismos manteniendo ciertas propiedades comunes, la proporción entre ellos
variaba en las distintas especies. Además, Chargaff observó que la cantidad de
adeninas era siempre muy similar a la cantidad de timinas, y que lo mismo
ocurría con las guaninas y citosinas entre sí, estableciendo así la denominada
“ley de Chargaff” y sentando una base vital para el posterior trabajo de Watson
y Crick (entre otros) respecto a la estructura tridimensional del ADN [3].
Estructura tridimensional del ADN.
En
1952, en el King’s college de Londres, Rosalind Franklin4 y Maurice
Wilkins5 obtuvieron las primeras imágenes de calidad del ADN por
medio de la cristalografía de rayos X6. Wilkins mostró una de las
fotos de la molécula de ADN tomadas por Franklin a James Watson7 sin
su consentimiento (Fig.2), lo cual lo puso sobre la pista para llevar a cabo la
descripción del modelo de doble hélice del ADN. De forma paralela, el químico y
bioquímico Linus Pauling8 formuló su propia propuesta con respecto a
la estructura tridimensional del ADN, la cual, aunque incorrecta, ayudó a la
elaboración del modelo actualmente aceptado.
Sustentados
en estas bases, James Watson y Francis Crick9 emplearon recortes de
cartón para representar los componentes químicos individuales de las cuatro
bases nitrogenadas, así como de los demás componentes de los nucleótidos,
jugando con sus configuraciones atómicas hasta que encontraron una perfecta
complementariedad entre la adenina y la timina y entre la citosina y la
guanina. Así, estos dos investigadores postularon la estructura en doble hélice
de la molécula de ADN, publicando sus hallazgos el 25 de abril de 1953 en la
revista Nature [4]. De esta manera,
se demostró que el ADN está formado por una doble cadena de nucleótidos, dando
lugar a un “efecto espejo” entre ambas cadenas y cumpliendo así la ley de
Chargaff (A=T y C=G) (Fig. 3). En 1962, Wilkins, Watson y Crick recibieron el
Premio Nobel de Fisiología o Medicina por sus estudios sobre la estructura y
funcionalidad del ADN, mientras que Franklin falleció en 1958 sin el debido
reconocimiento de su trabajo. Sin embargo, a la brillante química y cristalógrafa
se le han otorgado numerosos reconocimientos póstumos por sus estudios
pioneros, incluyendo la descripción de la estructura del ADN.
Fig.3. Doble cadena de nucleótidos que conforman el ADN. Se observa como la adenina se una a la timina y la citosina a la guanina.
Así
pues, el descubrimiento del ADN, de sus componentes y de su estructura supuso
una larga carrera que marcó un antes y un después en el mundo de la biología.
Pero ¿qué información se esconde dentro de las moléculas de ADN y cómo está
codificada?
El código genético.
Como ya
hemos visto, las diferencias que existen entre los distintos tipos de
nucleótidos que conforman el ADN radican en las cuatro bases nitrogenadas. El
orden en el que se disponen estas bases nitrogenadas crea un código, un
lenguaje cifrado, pero ¿cómo solo 4 letras pueden conformar un idioma tan
complejo? Quizás las matemáticas nos puedan arrojar luz sobre esta pregunta.
Pensemos en una cadena de 10 nucleótidos, ¿cuántas combinaciones posibles de
estas 4 bases nitrogenadas se podrían dar en una cadena de 10 nucleótidos?
Inicialmente podría parecer que no demasiadas ¿no? Pues existen 1.048.576 de
combinaciones posibles, más de un millón de opciones en solo 10 nucleótidos.
Pues bien, dado que se estima que el ADN del genoma humano tiene poco más de 3
mil millones de nucleótidos, las posibilidades que se abren ante nosotros son
casi ilimitadas.
De
esta manera, el ADN contiene la información necesaria para que cada organismo,
cada célula, pueda sintetizar todas las proteínas necesarias en una amplia
serie de procesos vitales. Al igual que los ácidos nucleicos, las proteínas
también están formadas por piezas básicas, por unidades fundamentales: los
aminoácidos. Existen 20 aminoácidos esenciales para la vida, cuyas
combinaciones dan lugar a múltiples proteínas con innumerables funciones
necesarias para el correcto funcionamiento del organismo. Ahora bien, la
pregunta lógica que se nos plantea a continuación es: ¿De qué manera el ADN
codifica la información necesaria para sintetizar las proteínas?
Tras
la presentación del modelo tridimensional de la molécula de ADN, se comenzó a
estudiar en profundidad el proceso de traducción de las proteínas. En este
momento, ya se sabía que a partir del ADN podía sintetizarse otro tipo de
molécula formada por ácidos nucleicos, el ARN, mediante un proceso llamado
transcripción del ADN. A diferencia del ADN, el ARN está formado por una única
cadena de ácidos nucleicos y, aunque también está compuesto por 4 bases
nitrogenadas, en su estructura la timina es sustituida por una molécula de
uracilo. Las moléculas de ARN portan la información necesaria para que se lleve
a cabo el proceso de síntesis proteica, denominado traducción del ARN.
En
1953, el físico teórico ruso George Gamow10 quedó fascinado tras
leer el trabajo de Watson y Crick y, emocionado, se puso en contacto con ellos
inmediatamente para discutir sus ideas sobre tan asombroso descubrimiento. Fue
así como, tras una serie de encuentros y con un desbordante espíritu de
colaboración, Watson y Gamow fundaron “el club de la corbata del ARN”. Este
club multidisciplinar estaba conformado por 20 miembros (uno por cada aminoácido
esencial) y tenía como objetivo averiguar la conexión entre los aminoácidos y
el código genético.
Gamow
dedujo matemáticamente que, para poder codificar 20 aminoácidos, el número
mínimo de nucleótidos necesarios era de 3. Tras la confirmación de esta
hipótesis por parte de una serie de experimentos llevados a cabo por Francis
Crick y Sydney Brenner11, entre otros, empezaron a determinarse las
correspondencias entre aminoácido y codón (término acuñado por Sydney para el
conjunto de 3 nucleótidos que codifica para un aminoácido). Marshall Warren
Nirenberg12 y Philip Leder13 fueron capaces de determinar
la traducción de 54 codones y, posteriormente, Har Gobind Khorana14
completó el código. De esto se deduce que existen 64 posibles combinaciones de
3 nucleótidos (codones) que darían lugar a la síntesis de los 20 aminoácidos,
aunque realmente 3 de estos codones no codifican aminoácidos, si no que indican
sitios de parada, es decir, señales para finalizar la traducción de las
proteínas (Fig. 4) [5].
Fig.4. Mapa conceptual
de las 64 posibles combinaciones de un triplete de nucleótidos (codón) que dan
lugar a la codificación de los aminoácidos.
La multiplicación de la información genética.
El
descubrimiento de la estructura tridimensional del ADN también contribuyó a
comprender mejor su mecanismo de replicación, es decir, la manera en la que las
células generan copias idénticas de su ADN para que la información genética se
transmita de una célula madre a las células hijas. ¿Cómo funciona este proceso?
Como ya hemos visto, el ADN está formado por dos cadenas o hebras unidas entre
sí a través de las bases nitrogenadas, formando una estructura similar a una
cremallera. Esta cremallera se abre por el centro, permitiendo a la maquinaria
celular ir sintetizando dos nuevas cadenas a partir de cada una de las mitades
de la molécula original, funcionando así cada una de ellas como molde o
plantilla para crear una nueva. De esta manera, cada nueva doble hebra tendrá
una mitad de la cadena original y una mitad de nueva síntesis (Fig. 5).
Sin
embargo, la habilidad para “leer” las moléculas de ADN se retrasó en el tiempo.
A este procedimiento se le conoce como secuenciación, dado que consiste en
conocer la secuencia exacta de los nucleótidos que conforman el ADN, determinando
la posición de cada uno de ellos en un orden preciso. Los métodos utilizados
para secuenciar los aminoácidos que conforman las proteínas no eran aplicables
para esta molécula, dado que el ADN es una estructura mucho más larga y está
formada por unidades muy parecidas entre sí, haciendo mucho más difícil la
distinción de cada una de ellas de una manera precisa. Por tanto, era necesario
el desarrollo de nuevas tácticas que permitieran conocer las secuencias exactas
del ADN.
Aunque
en la década de los 70 se hicieron algunos avances en las técnicas de
secuenciación del ADN, el método desarrollado por Frederick Sanger15
en 1977 supuso un punto de inflexión en esta materia, siendo la metodología más
ampliamente usada para secuenciar durante al menos 40 años y obteniendo el
Premio Nobel en 1980 gracias a esta innovación. Aunque posteriormente otros
métodos han sido descritos y actualmente el primer puesto del pódium está
ocupado por técnicas más sofisticadas, el método de Sanger se sigue usando de
forma ampliamente generalizada en proyectos de pequeña escala [6].
De
esta manera, el conocimiento de los mecanismos de replicación del ADN y el
desarrollo de técnicas de secuenciación, entre otros, permitieron que en 1983
Kary Mullis16 desarrollara los primeros esbozos de lo que se
convertiría en una de las técnicas más revolucionarias de la biología
molecular: La reacción en cadena de la polimerasa o PCR (de sus siglas en
inglés “Polymerase Chain Reaction”).
Esta técnica aprovecha la estructura de doble cadena del ADN para llevar a cabo
una amplificación masiva de una zona de interés en el genoma. Empleando dos
pequeños fragmentos de ADN que flanqueen la zona que nos interesa amplificar,
siendo cada uno de estos fragmentos complementarios a una de las dos cadenas.
Además, estos fragmentos funcionan como una señal de inicio de la replicación
permitiendo duplicar las cadenas de ADN de forma artificial en el laboratorio.
Ahora
bien, ¿Qué ocurre si este procedimiento se lleva cabo de forma repetitiva y
cíclica? Que podremos copiar este segmento de ADN de interés una y otra vez,
obteniendo muchos millones a partir de una única molécula de ADN en poco tiempo
y consiguiendo finalmente una cantidad muy elevada del mismo (Fig. 6). Este
sistema abrió una ventana para obtener mucho material genético a partir de una
pequeña cantidad inicial ADN, dando lugar a una gigantesca fuente de
información de todo el genoma de múltiples especies animales y vegetales, y
abriendo innumerables posibilidades futuras [7].
La herencia genética: transfiriendo la
información.
Curiosamente,
ya se tenía constancia de la herencia del material genético antes de
desentrañar la composición y estructura del ADN. Alrededor de 1860 (unos años
antes de que Friedrich Miescher aislara la molécula de ADN), Gregor Mendel17
describió que había ciertos “caracteres” que se transmitían a la descendencia
en una proporción constante. Observando y cruzando diferentes variedades de
plantas de guisantes que diferían en su color y en la rugosidad de su
superficie, determinó que algunos de estos caracteres eran predominantes
(conocidos como dominantes) sobre los otros (conocidos como recesivos) y que
los porcentajes de plantas verdes, amarillas, lisas o rugosas, mantenían
siempre la misma relación entre sí. Así, Mendel observó que el color amarillo
era dominante sobre el verde y la superficie lisa sobre la rugosa (Fig. 7). De
esta manera, el 1865, este monje de origen checo postuló las conocidas como
“leyes de Mendel”, explicando cómo estos “caracteres” se transmitían a la
descendencia. Lo que Mendel nunca llegó a saber, es que lo que él denominaba
“caracteres” era el reflejo directo de la combinación de los genes aportados
por cada uno de los progenitores. Llegados a este punto hay que preguntarse
¿Qué es un gen? Un gen es una secuencia de ADN que es capaz de codificar una
molécula que ejerza una función en la célula (ya sea ARN o una proteína). De
esta manera, recibimos una copia de cada gen de nuestra madre y otra de nuestro
padre, siendo la combinación de ambos lo que determina cómo seremos [8].
Proyecto genoma humano.
Dada la
clara importancia médica y social de descifrar el código genético humano, a
mitad de los años 80 empezaron a ponerse en marcha diversos proyectos con el
objetivo de secuenciar y mapear el genoma humano. Con estos antecedentes, en
1990 se fundó el Proyecto Genoma Humano (PGH). Este proyecto internacional,
integrado por 20 grupos de investigación de diferentes países, así como por
empresas privadas, presentaba dos objetivos principales: determinar la posición
de todos nucleótidos que conforman el ADN humano (secuenciación) y localizar la
posición de cada gen en cada uno de los 23 pares de cromosomas presentes en las
células humanas (mapeo genético). Aunque se estableció un plazo de 15 años para
la realización de este proyecto, el 6 de abril del año 2000 se anunció
públicamente la terminación del primer borrador del genoma humano, y en 2003,
tras varias publicaciones, fue declarado esencialmente completo, dos años antes
de la fecha prevista [9].
Desentrañar
el conocimiento encerrado en las moléculas de ADN humano ha supuesto grandes
ventajas al desarrollo médico y tecnológico en los últimos años, pero también
ha planteado diversas consecuencias de carácter ético. Para los investigadores,
estos avances supusieron un beneficio tangible, dado que permitieron desarrollar
bases de datos en plataformas web, abriendo nuevas vías en sus investigaciones,
pudiendo examinar el trabajo de otros científicos en su campo, sobre un
determinado gen, sobre su estructura, sobre sus interacciones y funciones, y su
implicación en el desarrollo normal del organismo o en la aparición de
enfermedades. Este hecho ha permitido un avance vertiginoso en las
investigaciones biomédicas a nivel mundial en las dos últimas décadas. Además,
gracias al PGH, se ha podido profundizar en el estudio de enfermedades
hereditarias, tales como el Alzheimer, la enfermedad de Huntington o el
síndrome de Marfan, entre muchas otras. El conocimiento de las bases
moleculares de este tipo de enfermedades permite realizar un diagnóstico precoz
gracias al cual se pueden tomar medidas preventivas contra la enfermedad o
incluso llevar a cabo diagnósticos prenatales para detectar anormalidades en el
desarrollo del feto antes del nacimiento.
Son
muchas las áreas de investigación biomédica que se han beneficiado del PGH. En
oncología, poder secuenciar el genoma de un amplio abanico de tumores ha
permitido identificar las vías moleculares de muchos tipos de cáncer, dando
lugar al desarrollo de tratamientos más personalizados y dirigidos, evitando de
esta manera, en la medida de lo posible, la gran cantidad de efectos
secundarios que originan los tratamientos basados en quimioterapia
convencional. Esta medicina personalizada se ha hecho extensible a muchos
campos, permitiendo refinar los tratamientos farmacológicos y desarrollando
fármacos que actúen de una manera dirigida según las diversas alteraciones en
la secuencia del ADN de determinados genes en los pacientes. En esta misma vía,
gracias al PGH, se ha desarrollado lo que se conoce como terapia génica, la
cual supone la posibilidad de curar enfermedades de origen genético mediante la
modificación directa del ADN del paciente, ya sea introduciendo una copia sana
del gen afectado a sus células o directamente modificando la secuencia
aberrante de su genoma.
Asimismo,
se han realizado grandes avances en el área de la medicina preventiva, es
decir, el estudio de un gen o conjunto de genes que pueden predecir la posible
aparición de enfermedades que aún no se han desarrollado en el paciente. Sin
embargo, aunque en primera instancia esto supone una ventaja para los
pacientes, también ha despertado una gran controversia social desde un punto de
vista ético, dado que saber de antemano que determinadas poblaciones o
individuos tienen más probabilidad de desarrollar ciertas enfermedades puede
dar lugar a la discriminación y rechazo social, así como una desventaja a la
hora de conseguir trabajo o un seguro de vida, entre otros. Por ello, ha sido
necesario el desarrollo de unos principios éticos que permiten regular estos
conocimientos y garantizar la privacidad y dignidad individual, protegiendo la
información genética de los pacientes. Además, es necesario potenciar la
educación y concienciación de la sociedad en lo que concierne a la información
genética, resaltando sus ventajas para el individuo y para la sociedad y
clarificando sus derechos de privacidad y decisión individual.
ADN: pasado, presente y futuro.
Como
hemos visto a lo largo de este capítulo, desde el descubrimiento del ADN hasta
la actualidad han tenido lugar una gran serie de acontecimientos que han
revolucionado tanto la manera de pensar de los científicos como la
investigación y práctica biomédica. Durante estas décadas, la información que
guarda el código genético ha sido minuciosamente estudiada y ha ido revelando un
entramado más complejo de lo que inicialmente se creía. Por ejemplo, al
principio se pensaba que solo presentaban verdadera relevancia aquellas
regiones del ADN que codificaban para la síntesis de proteínas, considerándose
la inmensa mayoría del genoma ADN basura. Hoy día se sabe que este pensamiento
estaba muy alejado de la realidad y que existen innumerables secuencias de ADN
que no codifican proteínas que tienen importantísimas funciones tanto reguladoras
como estructurales, así como muchísimos factores que alteran los patrones de
expresión de los genes en los distintos tejidos y entre diferentes individuos,
dando lugar a múltiples resultados posibles a partir de un mismo gen que no
presenta mutaciones. Por ello, no debemos olvidar tener siempre la mente
abierta a nuevas posibilidades, nuevos enfoques y descubrimientos. Los avances
en la investigación sobre el genoma humano han sido como una lanzadera que nos
ha permitido llegar a un nuevo universo antes desconocido, pero aún quedan
muchas galaxias por descubrir. El ADN, el genoma, aún no nos ha revelado todos
sus secretos, y su amplia complejidad garantiza que aún nos queda mucho por
aprender. Ningún buen lector que se precie considera que ya ha leído lo
suficiente, y del mismo modo, nosotros seguiremos leyendo y aprendiendo todo lo
que el ADN esté dispuesto a revelarnos. El código genético promete ser un “bestseller” y nosotros aún no hemos
terminado el prólogo.
Referencias:
[1] Wolf, G. 2003. Friedrich Miescher: The man who discovered DNA. Chemical Heritage 21, 10-11, 37–41.
[2] Levene, P. A. 1919. The structure of yeast nucleic acid. IV. Ammonia
hydrolysis. Journal of Biological Chemistry 40, 415–424.
[3] Chargaff, E. 1950. Chemical specificity of nucleic acids and
mechanism of their enzymatic degradation. Experientia
6, 201–209.
[4] Watson, J. D.,
& Crick, F. H. C. 1953. A structure for deoxyribose nucleic acid. Nature 171, 737–738.
[5] Kay L. 2000. Who
Wrote the Book of Life?: A History of the Genetic Code. Stanford University Press. ISBN 9780804734172.
[6] Heather, J.M.,
& Chain, B. 2016.The sequence of sequencers: The history of sequencing DNA.
Genomics. 107(1): 1–8.
[7] Templeton, N.S.
1992. The polymerase chain reaction. History, methods, and applications. DiagnMolPathol.1(1):58-72.
[8] Miko, I. 2008.
Gregor Mendel and the principles of inheritance. Nature Education 1(1):134.
[9] Chial, H. 2008.
DNA sequencing technologies key to the Human Genome Project. Nature
Education 1(1):219.
Licenciado en Veterinaria.
Doctor en Bioquímica, Biología
molecular y Biomedicina.
Investigador postdoctoral de la
Unidad de Oncología Molecular del Centro de Investigaciones Energéticas,
Medioambientales y Tecnológicas (CIEMAT).
Notas:
1 Friedrich Miescher
(1844-1895), biólogo y médico suizo. Profesor y rector de la Universidad de
Basilea.
2 Phoebus Levene
(1869-1940), bioquímico y químico ruso.
3 Erwin Chargaff
(1905-2002), bioquímico y químico austriaco. Profesor en la Universidad de
Columbia.
4 Rosalind Franklin
(1920-1958), química y cristalógrafa inglesa.
5 Maurice Wilkins
(1916-2004), físico originario de Nueva Zelanda. Ganador del Premio Nobel de
Fisiología o Medicina en 1962. Trabajó en el Proyecto Manhattan.
6 Técnica que se usa de
manera experimental para el estudio de la estructura de distintos materiales
basada en el fenómeno de difracción de los rayos X por sólidos en estado
cristalino.
7 James Dewey Watson
(1928- hasta la actualidad), biólogo estadounidense. Ganador del premio Nobel
de Fisiología o Medicina en 1962.
8 Linus Pauling
(1901-1994), químico y bioquímico estadounidense. Ganador del Premio Nobel de
Química en 1954 y Premio Nobel de la Paz en 1962.
9 Francis Crick
(1916-2004), físico, biólogo molecular y neurocientífico británico. Ganador del
premio Nobel de Fisiología o Medicina en 1962.
10 George Gamow
(1904-1968), físico y astrónomo ruso.
11 Sydney Brenner
(1927-hasta la actualidad), biólogo sudafricano galardonado con el Premio Nobel
de Fisiología o Medicina de 2002.
12 Marshall Warren
Nirenberg (1927-2010), bioquímico y genetista estadounidense. Ganador del
premio Nobel de Fisiología o Medicina en 1968.
13 Philip Leder
(1934-hasta la actualidad), genetista estadounidense. Ganador del premio Nobel
de Fisiología o Medicina en 1962.
14 Har Gobind Khorana
(1922-2011), biólogo molecular indo-estadounidense de ascendencia panyabí.
Premio Nobel de Fisiología o Medicina en 1968.
15 Frederick Sanger
(1918-2013), un bioquímico británico dos veces laureado con el Premio Nobel de
Química (1958 y 1980).
16 Kary Mullis (1944-hasta
la actualidad), es un bioquímico, autor y conferenciante estadounidense.
Comparte el Premio Nobel de Química de 1993 con Michael Smith.
17 Gregor Mendel
(1822-1884), monje agustino católico y naturalista.
No hay comentarios:
Publicar un comentario