Y UN GRAN PASO PARA LA HUMANIDAD: Biomatemática

Biomatemática: la “evolución natural” de las matemáticas.

Descarga capítulo pdf.

En el siglo XVII se cimentó la fructífera simbiosis científica entre la física y las matemáticas que ha posibilitado muchos de los grandes avances científicos y tecnológicos de la humanidad, como por ejemplo, el desarrollo en el siglo XX de la teoría de la relatividad que permite los cálculos para llegar a la Luna y más allá, para dominar la energía nuclear o, por citar algo más cotidiano, para desarrollar e implementar el sistema de posicionamiento global, conocido por GPS.

Dicha influencia recíproca llega a ser tan profunda que algunos grandes matemáticos, como por ejemplo V. I. Arnold (1937-2010), consideran que las matemáticas forman parte de la física y por consecuencia braman¹ contra la tendencia, que apareció ya a mediados del siglo XX, de obviar la física en los estudios de matemáticas. Personalmente podría estar de acuerdo con muchas de sus consideraciones, pero, poco a poco, las diatribas de Arnold van perdiendo fuerza ya que la biología está comiendo terreno a la física en el papel de inspirador de las matemáticas y estoy seguro de que estimulará la creación de ámbitos matemáticos completamente nuevos. En ese sentido, tal y como dice Joel E. Cohen en su famoso ensayo², se puede afirmar que la biología será la nueva física de las matemáticas y las matemáticas el nuevo microscopio de la biología. De esa interacción entre matemáticas y biología surge la disciplina científica conocida como biomatemática o biología matemática de cuyo pasado, presente y futuro trataremos en este capítulo.

Definición de la biomatemática.

Hay muchas definiciones de la misma, casi todas coincidentes en lo esencial - la biología matemática o biomatemática es un área científica que estudia los procesos biológicos utilizando técnicas y modelos matemáticos-. Como muy acertadamente se precisa en la versión francesa³ de Wikipedia, que traduzco a continuación:

La biomatemática es una ciencia altamente multidisciplinar que el matemático, informático o biólogo no puede desarrollar por sí solo. Para nacer y vivir, esta disciplina requiere equipos interdisciplinares impulsados por el sentido de lo concreto. Lo abstracto (las matemáticas y sus teoremas) no son más que un medio para lograr una mejor comprensión de los fenómenos biológicos.

Delimitar el campo de actuación de la biomatemática es muy complicado ya que tiene interacciones con muchos otros campos, como biología de poblaciones, fisiología, genómica, farmacología, biología de sistemas, etc. De hecho, en este capítulo veremos varios ejemplos de ello.

Aunque los importantísimos y vertiginosos avances de estos primeros años del siglo XXI en las ciencias biológicas, propiciados fundamentalmente por la capacidad de secuenciación del genoma, estén dando impulso y relevancia a la biomatemática, esta disciplina no es una recién llegada al mundo de la ciencia, sino que lleva varios siglos entre nosotros.

Primeras evidencias de la utilidad de las matemáticas en biología.

La “Society for Mathematical Biology” considera⁴ como nacimiento de la biomatemática la publicación en 1917 del libro “On Growth and Form” de D'Arcy Wentworth Thompson (1860-1948) y a su autor como el primer biomatemático, pero hay numerosos casos anteriores de aplicaciones de las matemáticas al estudio y descubrimiento de fenómenos biológicos.

Entre ellos podemos destacar como primer ejemplo un descubrimiento espectacular en el que las matemáticas aportan la prueba más convincente. Aconteció el 17 de abril de 1616 cuando William Harvey (1578-1657) presentó por primera vez a los miembros del Royal College su descubrimiento de que la sangre, bombeada por el corazón, circulaba por las venas y arterias y que no se generaba ininterrumpidamente en el hígado, a partir de los alimentos, como se había sostenido desde Galeno durante casi 1500 años. Uno de sus argumentos principales consistió en calcular el volumen de sangre expelido cada hora por el ventrículo izquierdo ~ 27 litros/hora y de ahí deducir que, si la sangre se generase en el hígado, la masa expulsada diariamente por una persona sería de 500Kg.

Ya en la segunda mitad del siglo XVIII, aparece lo que podríamos considerar el primer uso de las matemáticas en epidemiología cuando Daniel Bernoulli (1700-1782) desarrolla un modelo teórico⁵ para expresar la proporción de individuos susceptibles de una infección endémica en términos de la fuerza de la infección y la esperanza de vida. El principal objetivo⁶ de Bernoulli era calcular la tabla de vida ajustada si se eliminara la viruela como causa de muerte.

Aportaciones matemáticas a la teoría evolutiva y genética de poblaciones.

A principios del siglo XVIII, por razones fundamentalmente económicas, surge el interés por el estudio de la demografía y en particular por la dinámica de las poblaciones humanas. En 1748, Leonhard Euler (1707-783) en su tratado “Introductio in analysis infinitorum” propone un modelo de crecimiento geométrico como modelo de crecimiento de la población humana. En 1798 Thomas Robert Malthus (1766-1834) advierte en su tratado “An essay on the principle of Population” de los obstáculos para que el crecimiento de la población humana fuese geométrico debido a que llegaría un momento en que la tierra no daría suficiente comida para alimentar a la población. Esa idea de Malthus dio lugar al desarrollo por Verhulst (1804-1849) en 1938 de la ecuación logística e influyó⁷ poderosamente en Darwin (1809-1882) para llegar a la idea de la selección natural como principio para el origen de las especies, como así reconoce el propio Darwin en su autobiografía.

Matemáticas en el descubrimiento indirecto de la existencia de los genes.

Pero si algo destaca en la aplicación del método científico y las matemáticas (esta vez representadas por la estadística en su versión más elemental) en la ciencia biológica anterior al siglo XX, son los trabajos de Gregor Mendel (1822-1884) que marcan el nacimiento de la genética. Del análisis detallado de sus resultados experimentales, perfectamente diseñados y realizados, Mendel deduce tres leyes que constituyen la base teórica de la genética y que pueden ser comparados, por su importancia, a las leyes de Newton.

Fig.1. Gregor Mendel. Fuente: https://commons.wikimedia.org/wiki/File:Gregor_Mendel.png

La conclusión de Mendel, totalmente contraria a las creencias de su tiempo, de que los caracteres hereditarios son discretos (genes) y no continuos, es una de las más importantes contribuciones de la Matemática a la biología. De hecho es una demostración de la capacidad y utilidad de las matemáticas como instrumento para deducir, a partir de resultados experimentales, propiedades de lo que no se puede observar directamente y, por lo tanto, generar nuevas hipótesis de trabajo que guíen la investigación y experimentación de biología. Esta capacidad de las matemáticas para ver lo que se esconde detrás de los datos está siendo, en estos comienzos del siglo XXI, crucial para el aprovechamiento de la ingente cantidad de datos que se están generando de forma continua y a ritmo acelerado en los numerosos laboratorios de investigación dispersos por el mundo Se puede afirmar, sin temor a pecar de exagerados, que las matemáticas son el nuevo microscopio de la biología tal y como titulaba Joel E. Cohen en su ensayo anteriormente citado.

El siglo XX comienza con el redescubrimiento, en 1900, de los trabajos de Mendel y sus conclusiones sobre la transmisión de los caracteres hereditarios, que se pueden resumir en lo que hoy conocemos como las leyes de Mendel.

En 1922 Sir Ronald Aylmer Fisher (1890-1962), considerado como el padre de la estadística moderna, que desarrolló gran parte de su labor inspirado o buscando soluciones para problemas de índole genético, biológico y de la agricultura, publica su tratado “The Genetical Theory of Natural Selection”. Con este tratado, en el que con un gran fundamento matemático se combinan las leyes de Mendel con la teoría de la selección natural de Charles Darwin, Fisher demuestra que el mendelismo valida el darwinismo.

Fig.2. Sir Ronald Aylmer Fisher. Fuente: https://commons.wikimedia.org/wiki/File:Youngronaldfisher2.JPG

Otros muchos matemáticos y biólogos siguieron desarrollando la idea y en 1942 Julian Huxley (1887-1975) en su tratado “Evolution: The Modern Synthesis” acuña el nombre de la teoría biológica “The Modern Synthesis” que dominó el pensamiento y la investigación en biología hasta el último cuarto del pasado siglo XX. En un cierto sentido, se puede ver un paralelismo entre la Síntesis Moderna y las leyes de Newton de la física. Actualmente se sabe que la teoría no es completamente correcta.

Matemáticas del desarrollo. Las ecuaciones de reacción difusión.

A nivel multicelular hay muchos campos en los que los modelos matemáticos están ayudando a la comprensión de los problemas biológicos. Cabe citar por ejemplo el caso de la oncología o del estudio del cerebro humano. Pero entre ellos me quiero fijar en un caso especial: el de la biología del desarrollo. Uno de los grandes desafíos de la biomatemática es proporcionar una descripción matemática del desarrollo biológico. Un caso particular sería dar un modelo matemático del crecimiento de un embrión. Uno de los primeros intentos en este sentido se debe a A. Turing (1912-1954) que en su artículo “The Chemical Basis of Morphogenesis” publicado en 1950, propone un modelo que explica la formación de patrones en el crecimiento del embrión. Su modelo original consiste en suponer la existencia de dos especies moleculares, que llamó morfogenes, que estarían sometidas a procesos de difusión y reacción en el tejido embrionario lo que según él daría lugar a la aparición de patrones periódicos en dicho tejido. Turing es consciente de que el modelo está en estado muy primitivo y advierte al comienzo de su artículo que el modelo es una simplificación y una idealización y por lo tanto una falsificación. El modelo propuesto tuvo una influencia muy grande en numerosos campos científicos, tanto para explicar las formaciones de patrones en reacciones químicas, como en la formación de galaxias e incluso en la aparición de “puntos calientes” en la difusión del crimen en las ciudades. Sin embargo, se ha cuestionado mucho la validez del modelo en el campo para el que fue creado. Pero el tiempo le va dando la razón a Turing y cada vez aparecen más ejemplos de aplicación de las ecuaciones de reacción difusión para explicar patrones de desarrollo como el hecho de que tengamos cinco dedos, las rayas de los tigres o de las cebras. Es evidente que a medida que profundizamos en el conocimiento de los mecanismos moleculares podremos hacer modelos que se ajusten mejor, pero hay que reconocer una vez más la capacidad de A. Turing que, partiendo de una información muy poco precisa y escasa, fue capaz de vislumbrar los mecanismos que dirigen la formación de patrones en el desarrollo embrionario.

Fig.3. Alan Turing. Fuente: https://commons.wikimedia.org/wiki/File:Alan_Turing_Aged_16.jpg

Matemáticas para comprender la complejidad de la célula.

Si en la naturaleza muerta la unidad fundamental es el átomo, en la naturaleza viva (excluidos los virus que se encuentran en tierra de nadie) la unidad básica es la célula, ya que todo organismo vivo está constituido por una o más células. En el interior de toda célula está su genoma (molécula o moléculas de ADN que contienen todo su material genético).

La secuenciación (determinación de la sucesión de nucleótidos que forman las cadenas de ADN) del genoma humano, a principios de siglo XXI, cincuenta años después de la publicación del artículo en el que James Watson y Francis Crick –premiados con el Nobel en 1962– describían la estructura de doble hélice del ADN, ha dado lugar a una inmensa revolución científica en el campo de la biología y las matemáticas han jugado y están jugando en ello un papel esencial.

Para secuenciar el ADN hay que romper varias copias de la misma molécula aleatoriamente en millones de trozos que luego se secuencian en los secuenciadores automáticos. Para ensamblar dichos trozos se utilizan algoritmos muy complejos basados en teoría de grafos. El concepto de grafo, actualmente ubícuo en matemáticas y en muchas disciplinas científicas, fue introducido por L. Euler (1707-1783) unos 250 años antes de su uso en biología, para resolver un divertimento: el problema de los siete puentes de Königsberg. Poco a poco, los grafos han ido ganando presencia en matemáticas y actualmente es objeto de numerosos artículos de investigación y probablemente sean los objetos matemáticos más utilizados, sobre todo para intentar entender la estructura de los sistemas complejos. Volveremos a hablar un poco más de ellos en breve.

Fig.4. Leonhard Euler. Fuente: https://commons.wikimedia.org/wiki/File:Leonhard_Euler.jpg

El genoma de una célula contiene, entre otras informaciones, su código genético, es decir la secuencia de todos sus genes, pero no llega con conocerlo para comprender el funcionamiento celular. La célula es un sistema muy complejo y dinámico en el que conviven numerosas moléculas químicas que están transformando e interaccionando entre ellas de manera continua. En el interior de una célula e incluso en su membrana hay millones de proteínas de diversos tipos que realizan la mayor parte de las funciones celulares. Por ello, el siguiente paso, una vez descifrado el genoma de un organismo, es conocer su proteoma, es decir, “el catálogo de sus proteínas”.

Uno de los organismos unicelulares más estudiados es la levadura (Saccharomyces cerevisiae). Su proteoma se estima que consta de unas 5.858 proteínas diferentes⁸. El número de copias de cada una de esas proteínas presentes en la levadura en un momento determinado es muy variable y depende de muchos factores externos e internos, pero se estima⁹ que en términos medios, una célula de levadura contiene 4,2 x 10⁷ moléculas de proteínas.

El proteoma humano es mucho más extenso. El análisis del genoma humano permite predecir, utilizando algoritmos basados en modelos de probabilidad, la existencia de unos 20.300 genes que codifican proteínas. A día de hoy (febrero 2019) hay evidencia¹⁰, porque se han encontrado, de 17.694 (87,2%) de ellas, por lo que todavía quedan unas 2.000 que se ocultan a los instrumentos, bien porque están mal predichas, bien porque su expresión está restringida a circunstancias excepcionales que no somos capaces de recrear en los laboratorios o bien porque sus propiedades biofísicas y químicas no son compatibles con la tecnología de detección existente. El número de copias de cada una de esas proteínas en los 230 tipos de células diferentes que hay en el cuerpo humano es muy variable y cambia continuamente en función de las circunstancias con las que se enfrenta la célula en todo momento, pero se estima que en una célula humana el número medio¹¹ de proteínas es cercano a 10⁹.

Décadas de investigación en biología celular, biología molecular, bioquímica, biología estructural y biofísica, junto con el uso de técnicas bioinformáticas y grandes recursos informáticos, ha permitido crear grandes bases de datos, como por ejemplo UniProt¹², que contienen un compendio del conocimiento de dichas proteínas y sus funciones individuales. A este respecto y debido a que la función de una proteína depende de su estructura tridimensional, uno de los grandes problemas (físico, matemático y computacional), aún sin resolver, es conseguir un algoritmo de predicción de la estructura tridimensional de una proteína a partir de la lista de sus aminoácidos. Se trata de un gran problema de optimización global, que aparentemente la proteína resuelve mediante la solución de problemas más pequeños de optimización local¹³.

Una célula no es solo un conjunto de genes y proteínas. La biología de Sistemas.

Si bien esa lista de proteínas proporciona un catálogo de los componentes individuales de una célula, no basta para entender el funcionamiento de una célula de la misma forma que la lista de las partes de un avión no nos aporta conocimiento sobre su funcionamiento. Necesitamos tener un plano detallado del avión para saber cómo se reúnen y trabajan conjuntamente todas esas partes. De manera análoga necesitamos dibujar un diagrama exhaustivo de redes genéticas y sus interacciones bioquímicas para entender cómo los genes y proteínas trabajan conjuntamente, porque las proteínas rara vez actúan solas. Las propiedades biológicas de una proteína dependen de su interacción con otras moléculas, en particular con otras proteínas. Las proteínas de una célula forman parte de diferentes “maquinarias moleculares” (pathways) que realizan una o varias funciones. Los grafos (¡una vez más!) o “redes” son los objetos matemáticos que se están utilizando como modelos “primitivos” de esas máquinas moleculares. Se llama Interactoma a la red de interacciones entre las proteínas de un organismo.

El estudio matemático de las propiedades del Interactoma, como por ejemplo la centralidad de sus vértices, la modularidad o la existencia de subredes pequeñas (motivos) sobrerepresentados frente a un modelo aleatorio, está aportando información sobre los mecanismos moleculares que rigen la relación entre el genotipo “lista de genes de un organismo” y el fenotipo “expresión física de un organismo” además de generar hipótesis de trabajo para el desarrollo de nuevas investigaciones.

Fig.5. Interacciones del gen TP53, El antígeno tumoral p53; actúa como un supresor tumoral en muchos tipos tumorales; induce la parada del crecimiento o apoptosis en función de las circunstancias fisiológicas o de la célula. Fuente: STRING

Pero el Interactoma no es más que un mapa de carreteras, su estructura nos puede ayudar a entender los procesos, pero no nos permite predecir ni controlar un sistema biológico. Por ello, a partir de pequeñas subredes del Interactoma, se están desarrollando modelos matemáticos, generalmente sistemas de ecuaciones diferenciales, que permitan entender el comportamiento de un conjunto pequeño de genes y su dinámica. Este tipo de modelización se enmarca en una disciplina emergente que se denomina biología de Sistemas.

Los instrumentos matemáticos que se utilizan para desarrollar los modelos en dicha disciplina van desde las redes booleanas a los sistemas de ecuaciones diferenciales estocásticas (ver figura anterior). El avance es lento, fruto de un trabajo colectivo que se desarrolla en laboratorios dispersos por el mundo, pero que tienen un objetivo común: hacer un modelo de todos los procesos biológicos que ocurren en una célula. Pero no podemos caer en la ingenuidad de pensar que los modelos van a ser perfectos. Como decía Turing, los modelos serán siempre simplificaciones de la realidad, es decir falsificaciones, pero poco a poco los iremos modificando y completando para que al menos sean útiles. Por ejemplo, útiles para saber cómo intervenir, detener o controlar el crecimiento de un tumor.

Fig.6. Espectro de diversos enfoques de modelado computacional. Fuente: TRENDS in Biotechnology Vol.21 No.6 June 2003

La tarea es ingente, fuera del alcance de la tecnología y de las matemáticas que se conocen actualmente, probablemente utópico, pero alcanzar dicho objetivo es una de las grandes fuerzas impulsoras de la investigación en biología molecular. Los avances de este proceso cooperativo se pueden ver en varias bases de datos como por ejemplo, STRING¹⁴ para el mapa de interacciones, KEGG¹⁵ como base de datos de mapas de pequeñas redes llamadas “pathways” que realizan funciones específicas o BIOMODELS¹⁶, una base de datos del EBI (European Bioinformatic Institute) que contiene información detallada sobre los modelos matemáticos que se van desarrollando.

¿Veremos algún día un modelo matemático completo de un organismo superior, y podremos simular en el ordenador la repercusión de la modificación de uno de sus genes o el efecto de un medicamento? ¿Podremos simular el efecto del intercambio de genes entre especies tal y como nos muestran en una de las películas de Spiderman? Sinceramente creo que sería posible a muy largo plazo, un siglo o dos, mientras tanto espero que los aprendices de brujo no se dediquen, como ya ha hecho algún investigador insensato, a la modificación de genes en humanos u otras especies superiores sin conocer las consecuencias de lo que hacen.

Fig.7. Modelo del operon Lac, propuesto por Yildirim y Mackey en el año 2003.

Conclusiones.

La interacción entre la biología y las matemáticas no ha hecho más que empezar. La biología afronta una edad de oro que la convierte en la ciencia por excelencia de este siglo XXI y los venideros. La instrumentación científica que tienen a su disposición los investigadores del campo produce ingentes cantidades de información que tiene que ser analizada, clasificada y compartida a través de grandes bases de datos. Los modelos matemáticos que se desarrollan a partir de los datos sirven para generar nuevas hipótesis que se comprueban en los laboratorios cuyos resultados se reanalizan para ir afinando los modelos matemáticos. El objetivo final de toda esta investigación es ser capaces de predecir el desarrollo de un proceso biológico (como puede ser el crecimiento tumoral) y en aprender a controlarlo. Este trabajo de modelización implica a numerosas subdisciplinas de las matemáticas pero no puede ser realizado por matemáticos aislados en sus despachos y alejados del resto de los investigadores sino que tienen que ser fruto de un trabajo cooperativo e interdisciplinar. En mi opinión no es esperable la aparición de grandes teorías ni teoremas como así pasa en la física, sino que asistiremos a modelos cada vez más complejos y probablemente personalizados cuyas predicciones necesitaran de la computación en ordenadores cada vez más sofisticados. Probablemente la biomatemática aporte a la comunidad matemática problemas interesantes para ser estudiados teóricamente, pero ese no es el objetivo final de la misma.

Antonio Gómez Tato

Doctor en Matemáticas. Profesor Titular del departamento de Matemáticas de la Universidad de Santiago de Compostela.

Notas:

¹ web: https://www.uni-muenster.de/Physik.TP/~munsteg/arnold.html

² “Mathematics Is Biology’s Next Microscope, Only Better; Biology Is Mathematics’ Nest Physics, Only Better” Plos Biology 2004

³ De façon précise les biomathématiques sont constituées par l'ensemble des méthodes et techniques mathématiques, numériques et informatiques qui permettent d'étudier et de modéliser les phénomènes et processus biologiques. Il s'agit donc bien d'une science fortement pluridisciplinaire que le mathématicien seul (ou le biologiste seul) est incapable de développer. Pour naître et vivre cette discipline exige des équipes interdisciplinaires mues par le sens du concret. L'abstrait n'est qu'un moyen pour parvenir à une meilleure compréhension des phénomènes biologiques. Les biomathématique sont des débouchés tant pratiques que théoriques dans de nombreux domaines comme la biologie des populations, la physiologie, la génomique, la pharmacologie, etc. https://fr.wikipedia.org/wiki/Biomath%C3%A9matique (visitada el 16 de enero de 2019)

⁴ https://www.smb.org/history-of-the-society/

⁵ Bernoulli, D. Mém. Math. Phys. Acad. R. Sci. Paris 1– 45 (1766)

⁶ https://www.nature.com/articles/35046270

⁷ También influyeron en la política demográfica China con resultados catastróficos.

⁸ Saccharomyces Genome Database: https://www.yeastgenome.org/

⁹ Cell Syst. 2018 Feb 28;6(2):192-205.e3. doi: 10.1016/j.cels.2017.12.004. Epub 2018 Jan 17.

Unification of Protein Abundance Datasets Yields a Quantitative Saccharomyces cerevisiae Proteome. Ho B, Baryshnikova A, Brown GW.(https://www.ncbi.nlm.nih.gov/pubmed/29361465)

¹⁰ https://www.nextprot.org

¹¹ What is the total number of protein molecules per cell volume? A call to rethink some published values Ron Milo Bioessays. 2013. (https://www.ncbi.nlm.nih.gov/pubmed/24114984)

¹² UniProt: https://www.uniprot.org/

¹³ Annu Rev Biophys. 2008 Jun 9; 37: 289–316. The Protein Folding Problem Ken A. Dill, S. Banu Ozkan, M. Scott Shell and Thomas R. Weikl.

(https://doi.org/10.1146/annurev.biophys.37.092707.153558)

¹⁴ STRING: https://string-db.org/

¹⁵ KEGG: https://www.genome.jp/kegg/pathway.html

¹⁶ BIOMODELS: http://www.ebi.ac.uk/biomodels/