En el
siglo XVII se cimentó la fructífera simbiosis científica entre la física y las
matemáticas que ha posibilitado muchos de los grandes avances científicos y
tecnológicos de la humanidad, como por ejemplo, el desarrollo en el siglo XX de
la teoría de la relatividad que permite los cálculos para llegar a la Luna y
más allá, para dominar la energía nuclear o, por citar algo más cotidiano, para
desarrollar e implementar el sistema de posicionamiento global, conocido por
GPS.
Dicha
influencia recíproca llega a ser tan profunda que algunos grandes matemáticos, como
por ejemplo V. I. Arnold (1937-2010), consideran que las matemáticas forman
parte de la física y por consecuencia braman1 contra la tendencia,
que apareció ya a mediados del siglo XX, de obviar la física en los estudios de
matemáticas. Personalmente podría estar de acuerdo con muchas de sus
consideraciones, pero, poco a poco, las diatribas de Arnold van perdiendo
fuerza ya que la biología está comiendo terreno a la física en el papel de
inspirador de las matemáticas y estoy seguro de que estimulará la creación de
ámbitos matemáticos completamente nuevos. En ese sentido, tal y como dice Joel
E. Cohen en su famoso ensayo2, se puede afirmar que la biología será
la nueva física de las matemáticas y las matemáticas el nuevo microscopio de la
biología. De esa interacción entre matemáticas y biología surge la disciplina
científica conocida como biomatemática o biología matemática de cuyo pasado,
presente y futuro trataremos en este capítulo.
Definición de la biomatemática.
Hay
muchas definiciones de la misma, casi todas coincidentes en lo esencial - la
biología matemática o biomatemática es un área científica que estudia los
procesos biológicos utilizando técnicas y modelos matemáticos-. Como muy
acertadamente se precisa en la versión francesa3 de Wikipedia, que
traduzco a continuación:
La biomatemática es una ciencia altamente multidisciplinar
que el matemático, informático o biólogo no puede desarrollar por sí solo. Para
nacer y vivir, esta disciplina requiere equipos interdisciplinares impulsados
por el sentido de lo concreto. Lo abstracto (las matemáticas y sus teoremas) no
son más que un medio para lograr una mejor comprensión de los fenómenos
biológicos.
Delimitar
el campo de actuación de la biomatemática es muy complicado ya que tiene
interacciones con muchos otros campos, como biología de poblaciones,
fisiología, genómica, farmacología, biología de sistemas, etc. De hecho, en
este capítulo veremos varios ejemplos de ello.
Aunque
los importantísimos y vertiginosos avances de estos primeros años del siglo XXI
en las ciencias biológicas, propiciados fundamentalmente por la capacidad de
secuenciación del genoma, estén dando impulso y relevancia a la biomatemática, esta
disciplina no es una recién llegada al mundo de la ciencia, sino que lleva
varios siglos entre nosotros.
Primeras evidencias de la utilidad de las
matemáticas en biología.
La “Society
for Mathematical Biology” considera4 como nacimiento de la biomatemática la publicación en 1917
del libro “On Growth and Form” de D'Arcy Wentworth Thompson (1860-1948) y a su
autor como el primer biomatemático, pero hay numerosos casos anteriores de
aplicaciones de las matemáticas al estudio y descubrimiento de fenómenos
biológicos.
Entre
ellos podemos destacar como primer ejemplo un descubrimiento espectacular en el
que las matemáticas aportan la prueba más convincente. Aconteció el 17 de abril
de 1616 cuando William Harvey (1578-1657) presentó por primera vez a los
miembros del Royal College su descubrimiento de que la sangre,
bombeada por el corazón, circulaba por las venas y arterias y que no se
generaba ininterrumpidamente en el hígado, a partir de los alimentos, como se
había sostenido desde Galeno durante casi 1500 años. Uno de sus argumentos
principales consistió en calcular el volumen de sangre expelido cada hora por
el ventrículo izquierdo ~ 27 litros/hora y de ahí deducir que, si la sangre se
generase en el hígado, la masa expulsada diariamente por una persona sería de
500Kg.
Ya
en la segunda mitad del siglo XVIII, aparece lo que podríamos considerar el
primer uso de las matemáticas en epidemiología cuando Daniel Bernoulli
(1700-1782) desarrolla un modelo teórico5 para expresar la
proporción de individuos susceptibles de una infección endémica en términos de
la fuerza de la infección y la esperanza de vida. El principal objetivo6
de Bernoulli era calcular la tabla de vida ajustada si se eliminara la viruela
como causa de muerte.
Aportaciones matemáticas a la teoría
evolutiva y genética de poblaciones.
A
principios del siglo XVIII, por razones fundamentalmente económicas, surge el
interés por el estudio de la demografía y en particular por la dinámica de las poblaciones
humanas. En 1748, Leonhard Euler (1707-783) en su tratado “Introductio in
analysis infinitorum” propone un modelo de crecimiento geométrico como modelo
de crecimiento de la población humana. En 1798 Thomas Robert Malthus
(1766-1834) advierte en su tratado “An essay on the principle of Population” de
los obstáculos para que el crecimiento de la población humana fuese geométrico
debido a que llegaría un momento en que la tierra no daría suficiente comida
para alimentar a la población. Esa idea de Malthus dio lugar al desarrollo por
Verhulst (1804-1849) en 1938 de la ecuación logística e influyó7
poderosamente en Darwin (1809-1882) para llegar a la idea de la selección
natural como principio para el origen de las especies, como así reconoce el
propio Darwin en su autobiografía.
Matemáticas en el descubrimiento indirecto de
la existencia de los genes.
Pero si
algo destaca en la aplicación del método científico y las matemáticas (esta vez
representadas por la estadística en su versión más elemental) en la ciencia
biológica anterior al siglo XX, son los trabajos de Gregor Mendel (1822-1884)
que marcan el nacimiento de la genética. Del análisis detallado de sus
resultados experimentales, perfectamente diseñados y realizados, Mendel deduce
tres leyes que constituyen la base teórica de la genética y que pueden ser
comparados, por su importancia, a las leyes de Newton.
La
conclusión de Mendel, totalmente contraria a las creencias de su tiempo, de que
los caracteres hereditarios son discretos (genes) y no continuos, es una de las
más importantes contribuciones de la Matemática a la biología. De hecho es una demostración
de la capacidad y utilidad de las matemáticas como instrumento para deducir, a
partir de resultados experimentales, propiedades de lo que no se puede observar
directamente y, por lo tanto, generar nuevas hipótesis de trabajo que guíen la
investigación y experimentación de biología. Esta capacidad de las matemáticas
para ver lo que se esconde detrás de los datos está siendo, en estos comienzos
del siglo XXI, crucial para el aprovechamiento de la ingente cantidad de datos
que se están generando de forma continua y a ritmo acelerado en los numerosos
laboratorios de investigación dispersos por el mundo Se puede afirmar, sin
temor a pecar de exagerados, que las matemáticas son el nuevo microscopio de la
biología tal y como titulaba Joel E. Cohen en su ensayo anteriormente citado.
El
siglo XX comienza con el redescubrimiento, en 1900, de los trabajos de Mendel y
sus conclusiones sobre la transmisión de los caracteres hereditarios, que se
pueden resumir en lo que hoy conocemos como las leyes de Mendel.
En
1922 Sir Ronald Aylmer Fisher (1890-1962), considerado como el padre de la
estadística moderna, que desarrolló gran parte de su labor inspirado o buscando
soluciones para problemas de índole genético, biológico y de la agricultura,
publica su tratado “The Genetical Theory of Natural Selection”. Con este
tratado, en el que con un gran
fundamento matemático se combinan las leyes de Mendel con la teoría
de la selección natural de Charles Darwin, Fisher demuestra que
el mendelismo valida el darwinismo.
Fig.2. Sir Ronald
Aylmer Fisher. Fuente: https://commons.wikimedia.org/wiki/File:Youngronaldfisher2.JPG
Otros
muchos matemáticos y biólogos siguieron desarrollando la idea y en 1942 Julian Huxley
(1887-1975) en su tratado “Evolution: The Modern Synthesis” acuña el nombre de
la teoría biológica “The Modern Synthesis”
que dominó el pensamiento y la investigación en biología hasta el último cuarto
del pasado siglo XX. En un cierto sentido, se puede ver un paralelismo entre la
Síntesis Moderna y las leyes de Newton de la física. Actualmente se sabe que la
teoría no es completamente correcta.
Matemáticas del desarrollo. Las ecuaciones de
reacción difusión.
A nivel
multicelular hay muchos campos en los que los modelos matemáticos están
ayudando a la comprensión de los problemas biológicos. Cabe citar por ejemplo
el caso de la oncología o del estudio del cerebro humano. Pero entre ellos me
quiero fijar en un caso especial: el de la biología del desarrollo. Uno de los
grandes desafíos de la biomatemática es proporcionar una descripción matemática
del desarrollo biológico. Un caso particular sería dar un modelo matemático del
crecimiento de un embrión. Uno de los primeros intentos en este sentido se debe
a A. Turing (1912-1954) que en su artículo “The Chemical Basis of
Morphogenesis” publicado en 1950, propone un modelo que explica la formación de
patrones en el crecimiento del embrión. Su modelo original consiste en suponer
la existencia de dos especies moleculares, que llamó morfogenes, que estarían
sometidas a procesos de difusión y reacción en el tejido embrionario lo que
según él daría lugar a la aparición de patrones periódicos en dicho tejido.
Turing es consciente de que el modelo está en estado muy primitivo y advierte
al comienzo de su artículo que el modelo es una simplificación y una
idealización y por lo tanto una falsificación. El modelo propuesto tuvo una
influencia muy grande en numerosos campos científicos, tanto para explicar las
formaciones de patrones en reacciones químicas, como en la formación de
galaxias e incluso en la aparición de “puntos calientes” en la difusión del
crimen en las ciudades. Sin embargo, se ha cuestionado mucho la validez del
modelo en el campo para el que fue creado. Pero el tiempo le va dando la razón
a Turing y cada vez aparecen más ejemplos de aplicación de las ecuaciones de
reacción difusión para explicar patrones de desarrollo como el hecho de que
tengamos cinco dedos, las rayas de los tigres o de las cebras. Es evidente que
a medida que profundizamos en el conocimiento de los mecanismos moleculares
podremos hacer modelos que se ajusten mejor, pero hay que reconocer una vez más
la capacidad de A. Turing que, partiendo de una información muy poco precisa y
escasa, fue capaz de vislumbrar los mecanismos que dirigen la formación de
patrones en el desarrollo embrionario.
Matemáticas para comprender la complejidad de
la célula.
Si en
la naturaleza muerta la unidad fundamental es el átomo, en la naturaleza viva
(excluidos los virus que se encuentran en tierra de nadie) la unidad básica es
la célula, ya que todo organismo vivo está constituido por una o más células.
En el interior de toda célula está su genoma (molécula o moléculas de ADN que
contienen todo su material genético).
La
secuenciación (determinación de la sucesión de nucleótidos que forman las
cadenas de ADN) del genoma humano, a principios de siglo XXI, cincuenta años
después de la publicación del artículo en el que James Watson y Francis Crick
–premiados con el Nobel en 1962– describían la estructura de doble hélice del
ADN, ha dado lugar a una inmensa revolución científica en el campo de la
biología y las matemáticas han jugado y están jugando en ello un papel
esencial.
Para
secuenciar el ADN hay que romper varias copias de la misma molécula
aleatoriamente en millones de trozos que luego se secuencian en los
secuenciadores automáticos. Para ensamblar dichos trozos se utilizan algoritmos
muy complejos basados en teoría de grafos. El concepto de grafo, actualmente
ubícuo en matemáticas y en muchas disciplinas científicas, fue introducido por
L. Euler (1707-1783) unos 250 años antes de su uso en biología, para resolver
un divertimento: el problema de los siete puentes de Königsberg. Poco a poco,
los grafos han ido ganando presencia en matemáticas y actualmente es objeto de
numerosos artículos de investigación y probablemente sean los objetos
matemáticos más utilizados, sobre todo para intentar entender la estructura de
los sistemas complejos. Volveremos a hablar un poco más de ellos en breve.
El
genoma de una célula contiene, entre otras informaciones, su código genético,
es decir la secuencia de todos sus genes, pero no llega con conocerlo para
comprender el funcionamiento celular. La célula es un sistema muy complejo y
dinámico en el que conviven numerosas moléculas químicas que están
transformando e interaccionando entre ellas de manera continua. En el interior
de una célula e incluso en su membrana hay millones de proteínas de diversos
tipos que realizan la mayor parte de las funciones celulares. Por ello, el
siguiente paso, una vez descifrado el genoma de un organismo, es conocer su
proteoma, es decir, “el catálogo de sus proteínas”.
Uno
de los organismos unicelulares más estudiados es la levadura (Saccharomyces cerevisiae).
Su proteoma se estima que consta de unas 5.858 proteínas diferentes8.
El número de copias de cada una de esas proteínas presentes en la levadura en
un momento determinado es muy variable y depende de muchos factores externos e
internos, pero se estima9 que en términos medios, una célula de
levadura contiene 4,2 x 107 moléculas de proteínas.
El
proteoma humano es mucho más extenso. El análisis del genoma humano permite
predecir, utilizando algoritmos basados en modelos de probabilidad, la
existencia de unos 20.300 genes que codifican proteínas. A día de hoy (febrero
2019) hay evidencia10, porque se han encontrado, de 17.694 (87,2%)
de ellas, por lo que todavía quedan unas 2.000 que se ocultan a los
instrumentos, bien porque están mal predichas, bien porque su expresión está
restringida a circunstancias excepcionales que no somos capaces de recrear en
los laboratorios o bien porque sus propiedades biofísicas y químicas no son
compatibles con la tecnología de detección existente. El número de copias de
cada una de esas proteínas en los 230 tipos de células diferentes que hay en el
cuerpo humano es muy variable y cambia continuamente en función de las
circunstancias con las que se enfrenta la célula en todo momento, pero se
estima que en una célula humana el número medio11 de proteínas es
cercano a 109.
Décadas
de investigación en biología celular, biología molecular, bioquímica, biología
estructural y biofísica, junto con el uso de técnicas bioinformáticas y grandes
recursos informáticos, ha permitido crear grandes bases de datos, como por
ejemplo UniProt12, que contienen un compendio del conocimiento de
dichas proteínas y sus funciones individuales. A este respecto y debido a que
la función de una proteína depende de su estructura tridimensional, uno de los
grandes problemas (físico, matemático y computacional), aún sin resolver, es
conseguir un algoritmo de predicción de la estructura tridimensional de una
proteína a partir de la lista de sus aminoácidos. Se trata de un gran problema
de optimización global, que aparentemente la proteína resuelve mediante la
solución de problemas más pequeños de optimización local13.
Una célula no es solo un conjunto de genes y
proteínas. La biología de Sistemas.
Si bien
esa lista de proteínas proporciona un catálogo de los componentes individuales
de una célula, no basta para entender el funcionamiento de una célula de la
misma forma que la lista de las partes de un avión no nos aporta conocimiento
sobre su funcionamiento. Necesitamos tener un plano detallado del avión para
saber cómo se reúnen y trabajan conjuntamente todas esas partes. De manera
análoga necesitamos dibujar un diagrama exhaustivo de redes genéticas y sus
interacciones bioquímicas para entender cómo los genes y proteínas trabajan
conjuntamente, porque las proteínas rara vez actúan solas. Las propiedades biológicas
de una proteína dependen de su interacción con otras moléculas, en particular
con otras proteínas. Las proteínas de una célula forman parte de diferentes
“maquinarias moleculares” (pathways) que realizan una o varias funciones. Los
grafos (¡una vez más!) o “redes” son los objetos matemáticos que se están
utilizando como modelos “primitivos” de esas máquinas moleculares. Se llama
Interactoma a la red de interacciones entre las proteínas de un organismo.
El
estudio matemático de las propiedades del Interactoma, como por ejemplo la
centralidad de sus vértices, la modularidad o la existencia de subredes
pequeñas (motivos) sobrerepresentados frente a un modelo aleatorio, está
aportando información sobre los mecanismos moleculares que rigen la relación entre
el genotipo “lista de genes de un organismo” y el fenotipo “expresión física de
un organismo” además de generar hipótesis de trabajo para el desarrollo de
nuevas investigaciones.
Fig.5. Interacciones del
gen TP53, El antígeno tumoral p53; actúa como un supresor tumoral en muchos
tipos tumorales; induce la parada del crecimiento o apoptosis en función de las
circunstancias fisiológicas o de la célula. Fuente: STRING
Pero
el Interactoma no es más que un mapa de carreteras, su estructura nos puede
ayudar a entender los procesos, pero no nos permite predecir ni controlar un
sistema biológico. Por ello, a partir de pequeñas subredes del Interactoma, se
están desarrollando modelos matemáticos, generalmente sistemas de ecuaciones
diferenciales, que permitan entender el comportamiento de un conjunto pequeño
de genes y su dinámica. Este tipo de modelización se enmarca en una disciplina
emergente que se denomina biología de Sistemas.
Los
instrumentos matemáticos que se utilizan para desarrollar los modelos en dicha
disciplina van desde las redes booleanas a los sistemas
de ecuaciones diferenciales estocásticas (ver figura anterior). El avance es
lento, fruto de un trabajo colectivo que se desarrolla en laboratorios
dispersos por el mundo, pero que tienen un objetivo común: hacer un modelo de
todos los procesos biológicos que ocurren en una célula. Pero no podemos caer
en la ingenuidad de pensar que los modelos van a ser perfectos. Como decía
Turing, los modelos serán siempre simplificaciones de la realidad, es decir
falsificaciones, pero poco a poco los iremos modificando y completando para que
al menos sean útiles. Por ejemplo, útiles para saber cómo intervenir, detener o
controlar el crecimiento de un tumor.
Fig.6. Espectro de
diversos enfoques de modelado computacional. Fuente: TRENDS in Biotechnology
Vol.21 No.6 June 2003
La
tarea es ingente, fuera del alcance de la tecnología y de las matemáticas que
se conocen actualmente, probablemente utópico, pero alcanzar dicho objetivo es
una de las grandes fuerzas impulsoras de la investigación en biología
molecular. Los avances de este proceso cooperativo se pueden ver en varias
bases de datos como por ejemplo, STRING14 para el mapa de
interacciones, KEGG15 como base de datos de mapas de pequeñas redes
llamadas “pathways” que realizan funciones específicas o BIOMODELS16,
una base de datos del EBI (European Bioinformatic Institute) que contiene
información detallada sobre los modelos matemáticos que se van desarrollando.
¿Veremos
algún día un modelo matemático completo de un organismo superior, y podremos
simular en el ordenador la repercusión de la modificación de uno de sus genes o
el efecto de un medicamento? ¿Podremos simular el efecto del intercambio de
genes entre especies tal y como nos muestran en una de las películas de Spiderman?
Sinceramente creo que sería posible a muy largo plazo, un siglo o dos, mientras
tanto espero que los aprendices de brujo no se dediquen, como ya ha hecho algún
investigador insensato, a la modificación de genes en humanos u otras especies
superiores sin conocer las consecuencias de lo que hacen.
Conclusiones.
La
interacción entre la biología y las matemáticas no ha hecho más que empezar. La
biología afronta una edad de oro que la convierte en la ciencia por excelencia
de este siglo XXI y los venideros. La instrumentación científica que tienen a
su disposición los investigadores del campo produce ingentes cantidades de
información que tiene que ser analizada, clasificada y compartida a través de
grandes bases de datos. Los modelos matemáticos que se desarrollan a partir de
los datos sirven para generar nuevas hipótesis que se comprueban en los
laboratorios cuyos resultados se reanalizan para ir afinando los modelos
matemáticos. El objetivo final de toda esta investigación es ser capaces de
predecir el desarrollo de un proceso biológico (como puede ser el crecimiento
tumoral) y en aprender a controlarlo. Este trabajo de modelización implica a
numerosas subdisciplinas de las matemáticas pero no puede ser realizado por
matemáticos aislados en sus despachos y alejados del resto de los
investigadores sino que tienen que ser fruto de un trabajo cooperativo e
interdisciplinar. En mi opinión no es esperable la aparición de grandes teorías
ni teoremas como así pasa en la física, sino que asistiremos a modelos cada vez
más complejos y probablemente personalizados cuyas predicciones necesitaran de
la computación en ordenadores cada vez más sofisticados. Probablemente la
biomatemática aporte a la comunidad matemática problemas interesantes para ser
estudiados teóricamente, pero ese no es el objetivo final de la misma.
Antonio Gómez Tato
Doctor
en Matemáticas. Profesor Titular del departamento de Matemáticas de la
Universidad de Santiago de Compostela.
Notas:
2 “Mathematics Is Biology’s Next Microscope, Only Better;
Biology Is Mathematics’ Nest Physics, Only Better” Plos Biology 2004
3 De façon précise les biomathématiques sont constituées
par l'ensemble des méthodes et techniques mathématiques, numériques et
informatiques qui permettent d'étudier et de modéliser les phénomènes
et processus biologiques. Il s'agit donc bien d'une science
fortement pluridisciplinaire que le mathématicien seul (ou le biologiste
seul) est incapable de développer. Pour naître et vivre cette discipline exige
des équipes interdisciplinaires mues par le sens du concret. L'abstrait n'est
qu'un moyen pour parvenir à une meilleure compréhension des phénomènes
biologiques. Les biomathématique sont des débouchés tant pratiques que
théoriques dans de nombreux domaines comme la biologie des populations,
la physiologie, la génomique, la pharmacologie, etc. https://fr.wikipedia.org/wiki/Biomath%C3%A9matique
(visitada el 16 de enero de 2019)
5 Bernoulli, D. Mém. Math. Phys. Acad. R. Sci.
Paris 1– 45 (1766)
7 También influyeron en la política demográfica China con
resultados catastróficos.
8 Saccharomyces Genome Database: https://www.yeastgenome.org/
9 Cell Syst. 2018 Feb 28;6(2):192-205.e3. doi:
10.1016/j.cels.2017.12.004. Epub 2018 Jan 17.
Unification
of Protein Abundance Datasets Yields a Quantitative Saccharomyces cerevisiae
Proteome. Ho B, Baryshnikova A, Brown GW.(https://www.ncbi.nlm.nih.gov/pubmed/29361465)
11 What is the total number of protein molecules per cell
volume? A call to rethink some published values Ron Milo Bioessays. 2013.
(https://www.ncbi.nlm.nih.gov/pubmed/24114984)
12 UniProt: https://www.uniprot.org/
13 Annu Rev Biophys. 2008 Jun 9; 37: 289–316. The Protein
Folding Problem Ken A. Dill, S. Banu Ozkan, M. Scott
Shell and Thomas R. Weikl.
14 STRING: https://string-db.org/
No hay comentarios:
Publicar un comentario