Predicción de plegado de proteínas e intelinecia artificial (deep learning)
Las proteínas son los principales efectores de las células. Gracias a ellas tiene lugar el metabolismo para formar y deshacer moléculas y obtener energía. Son estructuras muy complejas y singulares, cada una cuenta con una secuencia de aminoácidos única que permitirá las funciones de la enzima. A la secuencia de aminoácidos le llamamos la estructura primaria de la proteína. Sin embargo, las proteínas no son cadenas de aminoácidos, sino que estos se pliegan sobre sí mismos para dar lugar a una estructura tridimensional. Las relaciones entre los aminoácidos y sus cargas eléctricas será lo que permita el plegamiento de las proteínas. La conformación espacial que toman se denomina estructura secundaria. Lee también sobre la estructura terciaria y cuaternaria.
Durante mucho tiempo la ciencia ha tratado de observar estas estructuras 3D para poder hacerse una idea del funcionamiento de las proteínas, con quién podía interaccionar o donde se localizaba. La superficie de una proteína tiene un rol diferente que aquellas secuencias de aminoácidos que se encuentran en bolsillos o en el interior de la molécula. Por lo que saber que aminoácidos estaban en una región y cuales en otros parece interesante si no vital para conocer cómo actúan y cómo podemos actuar sobre ellas.
Uno de los problemas de la investigación de la forma de las proteínas es que estas son sensibles a los cambios en su medio ambiente,lo que en la naturaleza le permite funcionar y reaccionar cuando las condiciones lo requieren. Para extraer y purificar las proteínas en orden de poder observar su estructura se estaba alterando justamente lo que se quería ver. La cristalización de proteínas sin desnaturalizarlas es una ciencia complicada que requiere gran cantidad de ensayo y error. Muchas proteínas que se han conseguido describir han necesitado años de investigación.
Con la introducción de las técnicas informáticas se ha implementado varios softwares que son capaces de hacer predicciones sobre el plegado de las proteínas basándose en la cadena de aminoácidos y el comportamiento conocido de secuencias similares en sus bases de datos. Hasta no hace mucho, el año 2020, la capacidad de estos programas era limitado. El plegamiento de las proteínas requiere no solo los aminoácidos más cercanos sino en ocasiones las interacciones de cientos de ellos. En este aspecto es como predecir el tiempo meteorológico con cien díasotal vez un año de antelación.
El programa AlphaFold de inteligencia artificial y aprendizaje profundo de DeepMind, filial de Google, batió de nuevo todos los récords sobre predicción al puntuar un 87 sobre 100 en el último concurso de programas de este tipo en el plegado de proteínas. El programa se valió de la base de datos pública que se ha ido creando desde los años de 1960 cuando se empezó a estudiar el tema. En la actualidad más de 170.000 proteínas tienen su forma tridimensional en la base de datos. Estas estructuras han sido comprobadas con otros métodos y han permitido a la IA aprender cómo se pliegan las proteínas y enfrentarse a cadenas de aminoácidos desconocidas y predecir con bastante aproximación el resultado. Como muestra de la mejora del aprendizaje de esta IA en 2018 el mismo software puntuó un 60 sobre 100 y ya se consideró un gran avance. Si bien es verdad que las bases de datos de proteínas van creciendo año a año con nuevas incorporaciones observadas en laboratorios, se espera que para la próxima edición del concurso en 2022 su puntuación haya mejorado cualitativamente.
Poder hacer predicciones fiables del pegado de las proteínas permitirá diseñar experimentos para mejorar fármacos de todo tipo.