La inteligencia artificial (IA) se está desarrollando a un ritmo rápido, pero sus principios de funcionamiento internos suelen ser vagos y de naturaleza "caja negra", lo que hace imposible ver el proceso para llegar a conclusiones. Sin embargo, el profesor Jürgen Bajorath, experto en informática química de la Universidad de Bonn, y su equipo lograron un gran avance. Han diseñado una técnica que puede revelar el funcionamiento de algunos sistemas de inteligencia artificial utilizados en la investigación farmacéutica.

Sorprendentemente, sus resultados mostraron que estos modelos de IA se basaban principalmente en recordar datos existentes en lugar de aprender interacciones químicas específicas para predecir la eficacia de un fármaco. Los resultados de su investigación se publicaron recientemente en Nature Machine Intelligence.

¿Qué molécula de fármaco es más eficaz? Los investigadores buscan desesperadamente sustancias activas eficaces para combatir la enfermedad. Estos compuestos suelen acoplarse a proteínas, a menudo enzimas o receptores, que desencadenan una cascada específica de efectos fisiológicos.

En algunos casos, determinadas moléculas también pueden prevenir reacciones adversas en el organismo, como una inflamación excesiva. Debido a la gran variedad de compuestos existentes, a primera vista esta investigación puede parecer como buscar una aguja en un pajar. Por lo tanto, el descubrimiento de fármacos intenta utilizar modelos científicos para predecir qué moléculas se acoplarán mejor y se unirán fuertemente a las proteínas diana correspondientes. Estos posibles fármacos candidatos se investigan con más detalle en estudios experimentales.

Proporciones relativas de bordes en gráficos de interacción proteína-ligando: determinación de seis predicciones GNN para diferentes subregiones de afinidad. Las barras de colores comparan la proporción promedio de proteínas, ligandos y bordes de interacción entre los 25 bordes superiores para cada predicción determinada mediante EdgeSHAPer. Fuente de la imagen: A.Mastropietro y J.Bajorath

A medida que se desarrolla la inteligencia artificial, las aplicaciones de aprendizaje automático se utilizan cada vez más en la investigación de descubrimiento de fármacos. Entre ellas, las "Graph Neural Networks" (GNN) brindan múltiples oportunidades para este tipo de aplicaciones. Por ejemplo, son adecuados para predecir la fuerza de unión de una determinada molécula a una proteína objetivo. Para ello, los modelos GNN se entrenan utilizando gráficos que representan complejos formados entre proteínas y compuestos (ligandos).

Los gráficos generalmente constan de nodos que representan objetos y bordes que representan relaciones entre nodos. En las representaciones gráficas de complejos proteína-ligando, los bordes conectan solo nodos de proteína o ligando, que representan sus estructuras respectivamente, o conectan nodos de proteína y ligando, que representan interacciones específicas entre proteína y ligando.

El profesor Jürgen Bajorath dijo: "La forma en que GNN obtiene resultados de predicción es como una caja negra a la que no podemos asomarnos". Este profesor del Instituto LIMES de la Universidad de Bonn y del Centro Internacional de Tecnología de la Información de Bonn-Aquisgrán (B-IT) e investigadores de quimioinformática del Instituto Lamar de Aprendizaje Automático e Inteligencia Artificial de Bonn, junto con colegas de la Universidad Sapienza de Roma, analizaron en detalle si las redes neuronales gráficas realmente pueden aprender las interacciones entre proteínas y ligandos y así predecir la fuerza de unión de las sustancias activas a las proteínas diana.

¿Cómo funcionan las aplicaciones de IA?

Los investigadores analizaron un total de seis arquitecturas de redes neuronales gráficas diferentes utilizando un método "EdgeSHAPer" especialmente desarrollado y un método de comparación conceptualmente diferente. Estos programas informáticos "detallan" si el GNN aprendió las interacciones más importantes entre el compuesto y la proteína, prediciendo la potencia del ligando, como los investigadores pretendían y esperaban, o si la IA llegó a sus predicciones de otras maneras.

Profesor Dr. Jürgen Bajorath - del Instituto LIMES de la Universidad de Bonn, el Centro Internacional de Tecnología de la Información Bonn-Aachen (B-IT) y el Instituto Lamar de Aprendizaje Automático e Inteligencia Artificial. Fuente: Universidad de Bonn

"Los GNN dependen mucho de los datos con los que se entrenan", dijo Andrea Mastropietro, primer autor del estudio y estudiante de doctorado en la Universidad Sapienza de Roma.

Los científicos entrenaron seis GNN con patrones extraídos de las estructuras de complejos proteína-ligando cuyos modos de acción y la fuerza de unión del compuesto a la proteína objetivo se conocían experimentalmente. Luego, el GNN entrenado se prueba en otros compuestos. El análisis posterior de EdgeSHAPer nos permitió comprender cómo el GNN produjo predicciones aparentemente prometedoras.

El profesor Bajorath explicó: "Si los GNN logran el efecto deseado, entonces necesitan aprender la interacción entre el compuesto y la proteína objetivo y determinar el resultado previsto priorizando interacciones específicas. Sin embargo, según el análisis del equipo de investigación, estos seis GNN básicamente no lograron hacer esto. La mayoría de los GNN solo han resuelto una serie de interacciones proteína-fármaco, enfocándose principalmente en ligandos. Para predecir la fuerza de unión de una molécula a una proteína objetivo, los modelos principalmente 'memorizan' los químicamente similares moléculas que encontraron durante el entrenamiento y sus datos de unión, independientemente de la proteína objetivo. Estas similitudes químicas aprendidas determinan esencialmente los resultados de la predicción".

Los científicos creen que esto recuerda en gran medida al "efecto Smart Hans". Este efecto se refiere a un caballo que puede contar. La frecuencia con la que Hans golpeaba su casco debería haber mostrado el resultado del cálculo. Pero más tarde se supo que el caballo no estaba calculando en absoluto, sino que infería el resultado esperado basándose en diferencias sutiles en las expresiones faciales y gestos de su compañero.

¿Qué significan estos hallazgos para la investigación sobre el descubrimiento de fármacos? El quimioinformático dijo: "En general, el aprendizaje de las interacciones químicas entre sustancias activas y proteínas por parte de GNN es insostenible. Sus predicciones están en gran medida sobreestimadas, porque se pueden hacer predicciones de la misma calidad utilizando conocimiento químico y métodos más simples. Sin embargo, esta investigación también brinda oportunidades para la inteligencia artificial. Entre los modelos examinados por GNN, dos modelos mostraron una tendencia clara de que aprenden más interacciones a medida que aumenta la potencia del compuesto de prueba". Vale la pena echar un vistazo más de cerca aquí. Quizás modificando las técnicas de representación y entrenamiento, estos GNN puedan mejorarse aún más en la dirección deseada. Sin embargo, la suposición de que se pueden aprender cantidades físicas a partir de gráficos moleculares generalmente debe tratarse con cautela. La inteligencia artificial no es magia negra. "

Más luz en la oscuridad de la inteligencia artificial

De hecho, en su opinión, los lanzamientos públicos anteriores de EdgeSHAPer y otras herramientas de análisis especialmente desarrolladas son formas prometedoras de revelar la caja negra de los modelos de IA. El trabajo actual de su equipo se centra en GNN y nuevos "modelos de lenguaje químico".

"El desarrollo de métodos para explicar las predicciones de modelos complejos es un área importante de la investigación en inteligencia artificial. También existen métodos para otras arquitecturas de red, como los modelos de lenguaje, que ayudan a comprender mejor cómo el aprendizaje automático alcanza sus resultados". Espera que el Instituto Lamar también logre pronto resultados interesantes en el campo de la "inteligencia artificial explicable".

Referencia: "Características de aprendizaje de redes neuronales gráficas para predecir la afinidad de ligandos de proteínas" por Andrea Mastropietro, Giuseppe Pasculli y Jürgen Bajorath, 13 de noviembre de 2023, "Nature - Machine Intelligence".

DOI:10.1038/s42256-023-00756-9

Fuente compilada: ScitechDaily