Los químicos han soñado durante mucho tiempo con comprender y dominar completamente las herramientas químicas de la vida: las proteínas. Este sueño está ahora a nuestro alcance. Demis Hassabis y John Jumper han utilizado con éxito la inteligencia artificial para predecir la estructura de casi todas las proteínas conocidas. Por otro lado, David Baker ha aprendido a manipular los componentes básicos de la vida y a crear proteínas completamente nuevas, abriendo un potencial enorme con sus descubrimientos.

Premio Nobel de Química 2024. Créditos: Nobel Foundation.

La maravilla de la química de la vida se debe a las proteínas, que actúan como brillantes herramientas químicas. Están formadas por 20 aminoácidos que pueden combinarse de innumerables maneras. Usando la información del ADN como modelo, los aminoácidos se unen en nuestras células para formar largas cadenas.

Luego ocurre la magia: la cadena de aminoácidos se retuerce y pliega en una estructura tridimensional única. Esta estructura es la que confiere a las proteínas su función. Algunas se convierten en bloques de construcción que forman músculos, cuernos o plumas, mientras que otras se transforman en hormonas o anticuerpos. Muchas proteínas actúan como enzimas, catalizando las reacciones químicas de la vida con precisión asombrosa. También son esenciales las proteínas en las superficies de las células, funcionando como canales de comunicación entre la célula y su entorno.

Es difícil exagerar el potencial que encierran estos 20 aminoácidos, los componentes básicos de la vida. El Premio Nobel de Química 2024 se centra en comprenderlos y dominarlos en un nivel completamente nuevo. La mitad del premio se otorgó a Demis Hassabis y John Jumper, quienes utilizaron inteligencia artificial para resolver un problema que los químicos habían enfrentado durante más de 50 años: predecir la estructura tridimensional de una proteína a partir de su secuencia de aminoácidos. Esto les permitió predecir la estructura de casi 200 millones de proteínas conocidas.

El premio también fue concedido a David Baker, quien desarrolló métodos informáticos para crear proteínas que no existían previamente y que, en muchos casos, tienen funciones completamente nuevas.

El Premio Nobel de Química 2024 reconoce dos descubrimientos diferentes pero estrechamente relacionados. Para entender los desafíos superados por los galardonados de este año, debemos remontarnos a los albores de la bioquímica moderna.

Desde el siglo XIX, los químicos sabían que las proteínas son esenciales para los procesos vitales, pero no fue hasta la década de 1950 que las herramientas químicas se hicieron lo suficientemente precisas para estudiar las proteínas en detalle. Los investigadores de Cambridge, John Kendrew y Max Perutz, realizaron un descubrimiento revolucionario a finales de esa década, utilizando la cristalografía de rayos X para presentar los primeros modelos tridimensionales de proteínas. Por este logro, recibieron el Premio Nobel de Química en 1962.

Posteriormente, investigadores utilizaron principalmente la cristalografía de rayos X para generar imágenes de aproximadamente 200,000 proteínas diferentes, sentando las bases para el Premio Nobel de Química 2024.

Un acertijo: ¿cómo encuentra una proteína su estructura única? Otro descubrimiento temprano fue realizado por el científico estadounidense Christian Anfinsen. Mediante trucos químicos, logró que una proteína se desdoblara y luego se volviera a doblar. Observó que la proteína adoptaba exactamente la misma forma cada vez. En 1961, concluyó que la estructura tridimensional de una proteína está totalmente determinada por la secuencia de aminoácidos que la componen. Esto le valió el Premio Nobel de Química en 1972.

Sin embargo, la lógica de Anfinsen contenía una paradoja, señalada por Cyrus Levinthal en 1969. Calculó que una proteína con solo 100 aminoácidos podría, en teoría, asumir al menos 10^47 estructuras tridimensionales diferentes. Si la cadena de aminoácidos se plegara al azar, se necesitaría más tiempo que la edad del universo para encontrar la estructura correcta. En una célula, esto ocurre en milisegundos. Entonces, ¿cómo se pliega realmente la cadena de aminoácidos?

El descubrimiento de Anfinsen y la paradoja de Levinthal sugirieron que el plegamiento es un proceso predeterminado y que toda la información necesaria está presente en la secuencia de aminoácidos.

Los descubrimientos previos llevaron a una conclusión decisiva: si los químicos conocieran la secuencia de aminoácidos de una proteína, podrían predecir su estructura tridimensional, ahorrando el tiempo y esfuerzo de la cristalografía de rayos X. En 1994, para acelerar este avance, los investigadores iniciaron el proyecto CASP (Evaluación Crítica de la Predicción de la Estructura de las Proteínas), convirtiéndolo en una competencia bienal. Los participantes debían predecir estructuras basadas en secuencias de aminoácidos, sin conocer las estructuras reales previamente determinadas.

El progreso en la precisión de las predicciones fue lento hasta 2018, cuando Demis Hassabis, maestro de ajedrez, neurocientífico y pionero en inteligencia artificial, se unió al campo. Su trayectoria es notable: comenzó a jugar ajedrez a los cuatro años, alcanzando el nivel de maestro a los 13. En la adolescencia, se destacó como programador y desarrollador de juegos. Luego, se dedicó a la neurociencia, realizando descubrimientos revolucionarios que aplicó para mejorar las redes neuronales en IA. En 2010, cofundó DeepMind, desarrollando modelos de IA para juegos de mesa. DeepMind fue adquirida por Google en 2014, y en 2016, lograron vencer al campeón mundial de Go, considerado un hito en la IA.

Tras este logro, Hassabis se enfocó en problemas de mayor impacto para la humanidad, inscribiéndose en CASP 13 en 2018. Su modelo de IA, AlphaFold, alcanzó una precisión del 60%, sorprendiendo a muchos. Aunque no era suficiente, su equipo continuó desarrollando AlphaFold. El avance decisivo vino de John Jumper, un miembro relativamente nuevo del equipo, que tenía ideas cruciales para mejorar el modelo de IA.

John Jumper acepta el gran desafío de la bioquímica

La fascinación de John Jumper por el universo lo llevó a estudiar física y matemáticas. Sin embargo, en 2008, cuando comenzó a trabajar en una empresa que utilizaba supercomputadoras para simular proteínas y su dinámica, se dio cuenta de que el conocimiento de la física podía ayudar a resolver problemas médicos. Este nuevo interés por las proteínas lo acompañó cuando, en 2011, inició su doctorado en física teórica. Para ahorrar capacidad informática, que era escasa en la universidad, comenzó a desarrollar métodos más simples e ingeniosos para simular la dinámica de las proteínas.

Pronto se enfrentó al gran desafío de la bioquímica. En 2017, tras finalizar su doctorado, escuchó rumores de que Google DeepMind había comenzado, en secreto, a predecir las estructuras de las proteínas. Jumper envió una solicitud de empleo, y su experiencia en simulación de proteínas le permitió aportar ideas creativas para mejorar AlphaFold. Tras demostrar su valía, fue ascendido, y junto a Hassabis, codirigió el trabajo que reformó fundamentalmente el modelo de IA.

Resultados sorprendentes con un modelo de IA reformado

La nueva versión, AlphaFold2, se inspiró en el conocimiento de Jumper sobre las proteínas. El equipo también comenzó a utilizar las redes neuronales llamadas transformadores, la innovación detrás del enorme avance reciente en IA. Estas redes pueden encontrar patrones en grandes cantidades de datos de manera más flexible y eficiente, enfocándose en los objetivos clave.

El equipo entrenó AlphaFold2 con la vasta información disponible en bases de datos sobre estructuras de proteínas y secuencias de aminoácidos conocidas. La nueva arquitectura de IA comenzó a ofrecer buenos resultados a tiempo para la decimocuarta competencia CASP.

En 2020, cuando los organizadores de CASP evaluaron los resultados, comprendieron que el desafío de 50 años de la bioquímica había terminado. En la mayoría de los casos, AlphaFold2 funcionó casi tan bien como la cristalografía de rayos X, lo cual fue asombroso. Cuando uno de los fundadores de CASP, John Moult, dio por finalizada la competencia el 4 de diciembre de 2020, se preguntó: ¿y ahora qué?

Volveremos a ello. Ahora vamos a retroceder en el tiempo y arrojar luz sobre otro participante del CASP. La otra mitad del Premio Nobel de Química 2024, que trata sobre el arte de crear nuevas proteínas desde cero.

Un libro de texto sobre la célula hace que David Baker cambie de rumbo 

Cuando David Baker comenzó a estudiar en la Universidad de Harvard, eligió filosofía y ciencias sociales. En 2020, cuando los organizadores de CASP evaluaron los resultados, comprendieron que el desafío de 50 años de la bioquímica había terminado. En la mayoría de los casos, AlphaFold2 funcionó casi tan bien como la cristalografía de rayos X, lo cual fue asombroso. Cuando uno de los fundadores de CASP, John Moult, dio por finalizada la competencia el 4 de diciembre de 2020, se preguntó: ¿y ahora qué? 

Sin embargo, durante un curso de biología evolutiva se encontró con la primera edición del ya clásico libro de texto "Molecular Biology of the Cell" (Biología molecular de la célula), lo que le hizo cambiar de rumbo en la vida. Empezó a investigar la biología celular y, con el tiempo, se fascinó por las estructuras de las proteínas. Cuando, en 1993, empezó a trabajar como jefe de grupo en la Universidad de Washington en Seattle, se enfrentó al gran reto de la bioquímica. Mediante ingeniosos experimentos, comenzó a estudiar cómo se pliegan las proteínas. Esto le proporcionó conocimientos que se llevó consigo cuando, a finales de los años 90, empezó a desarrollar un software informático que pudiera predecir las estructuras de las proteínas: Rosetta. 

Baker debutó en el concurso CASP en 1998 utilizando Rosetta y, en comparación con otros participantes, obtuvo muy buenos resultados. Este éxito dio lugar a una nueva idea: que el equipo de David Baker podría utilizar el software a la inversa. En lugar de introducir secuencias de aminoácidos en Rosetta y obtener estructuras de proteínas, deberían poder introducir una estructura de proteína deseada y obtener sugerencias para su secuencia de aminoácidos, lo que les permitiría crear proteínas completamente nuevas. 

Baker se convierte en constructor de proteínas 

El campo del diseño de proteínas, en el que los investigadores crean proteínas a medida con nuevas funciones, comenzó a tomar impulso a fines de la década de 1990. En muchos casos, los investigadores modificaron proteínas existentes para que pudieran hacer cosas como descomponer sustancias peligrosas o funcionar como herramientas en la industria de fabricación de productos químicos. 

Sin embargo, la variedad de proteínas naturales es limitada. Para aumentar el potencial de obtener proteínas con funciones completamente nuevas, el grupo de investigación de Baker quería crearlas desde cero. Como dijo Baker, “si quieres construir un avión, no empiezas modificando un pájaro, sino que entiendes los primeros principios de la aerodinámica y construyes máquinas voladoras a partir de esos principios”. 

Una proteína única ve la luz del día 

El campo en el que se construyen proteínas completamente nuevas se llama novo. El grupo de investigación diseñó una proteína con una estructura completamente nueva y luego Rosetta calculó qué tipo de secuencia de aminoácidos podría dar como resultado la proteína deseada. Para ello, Rosetta buscó en una base de datos todas las estructuras proteínicas conocidas y buscó fragmentos cortos de proteínas que tuvieran similitudes con la estructura deseada. Utilizando el conocimiento fundamental del panorama energético de las proteínas, Rosetta optimizó estos fragmentos y propuso una secuencia de aminoácidos. 

Para investigar el éxito del software, el grupo de investigación de Baker introdujo el gen de la secuencia de aminoácidos propuesta en bacterias que producían la proteína deseada. Luego, determinaron la estructura de la proteína mediante cristalografía de rayos X. Resultó que Rosetta realmente podía construir proteínas. La proteína que los investigadores desarrollaron, Top7, tenía casi exactamente la estructura que habían diseñado.

Espectaculares Creaciones del Laboratorio de Baker

Top7 fue un descubrimiento inesperado para los investigadores en el diseño de proteínas. Anteriormente, la creación de proteínas novo solo permitía imitar estructuras existentes. Sin embargo, la estructura única de Top7, con sus 93 aminoácidos, no tenía precedente en la naturaleza, siendo la más grande jamás producida mediante este enfoque.

La variedad de proteínas naturales es limitada. Con el objetivo de crear proteínas con funciones completamente nuevas, el grupo de investigación de Baker decidió diseñarlas desde cero. 

El campo del diseño de proteínas novo ha ganado impulso desde fines de la década de 1990. Los investigadores comenzaron modificando proteínas existentes para realizar tareas específicas, como descomponer sustancias peligrosas o actuar como herramientas en la industria química. David Baker debutó en el concurso CASP en 1998 utilizando Rosetta, y su éxito inspiró una nueva idea: utilizar el software a la inversa para diseñar proteínas completamente nuevas a partir de estructuras deseadas.

En 2003, Baker publicó su descubrimiento y el código de Rosetta, permitiendo a la comunidad científica global continuar desarrollando el software y encontrando nuevas aplicaciones. Este fue solo el comienzo de un desarrollo extraordinario, con numerosas proteínas espectaculares creadas en su laboratorio.

Un Desarrollo Vertiginoso en Beneficio de la Humanidad


El trabajo que antes tomaba años ahora se completa en minutos gracias a avances como AlphaFold2. Demis Hassabis y John Jumper calcularon la estructura de todas las proteínas humanas y predijeron la estructura de prácticamente todas las 200 millones de proteínas descubiertas. Google DeepMind hizo público el código de AlphaFold2, convirtiéndose en una herramienta invaluable para los investigadores. Para octubre de 2024, más de dos millones de personas en 190 países lo habían utilizado.

AlphaFold2 no es perfecto, pero estima la precisión de sus predicciones, lo que ayuda a los investigadores a evaluar su fiabilidad. Después de la competición CASP 2020, David Baker incorporó un modelo de IA basado en transformadores a Rosetta, facilitando aún más el diseño de proteínas de novo.

La capacidad de visualizar y crear proteínas con nuevas funciones ha revolucionado la biotecnología. Este avance permite desarrollar nanomateriales, medicamentos específicos, vacunas, sensores y una industria química más ecológica, entre otras aplicaciones que benefician a la humanidad.

Créditos:

Nobel Foundation.