Project Title
Assisting in-silico antibacterial peptide design support by transfer learning with foundational models, protein language models, and generative learning methods
Partner Organisations
Principal Investigator
Investigador principal
Status
Vigente
Start Date
April 1, 2025
End Date
March 31, 2028
Project type
Investigación
Funding amount
15600000
Funding currency
CLP
Funder
ANID
Code
11250295
Main organization
Description
Los péptidos son pequeñas macromoléculas de caracter proteico que han demostrado ser de gran relevancia terapéutica en los últimos años gracias a sus propiedades farmacológicas y farmacodinámicas. El diseño de fármacos basados en péptidos presenta ventajas con respecto a los métodos tracionales, incluyendo una baja toxicidad, una baja tendencia a provocar inmunogenecidad y una alta estabilidad. Sin embargo, diferentes desafíos se enmarcan en el diseño de péptidos, incluyendo una baja vida media y problemas de especificidad, siendo necesario mecanismos de ingeniería de proteínas para asegurar su correcto funcionamiento. Recientes avances en inteligencia artificial han fomentado su aplicación a técnicas de ingeniería de proteínas. Métodos como el machine learning-assisted directed evolution y los métodos basados en datos han demostrado ser eficientes en identificar y optimizar propiedades de las proteínas. No obstante, los recursos computacionales necesarios para una emulación eficiente de los landscape mutacionales, junto con diferentes recursos experimentales hace inviable una simulación completa del espacio latente. Estrategias basados en métodos generativos han fomentando su versatilidad en el diseño de proteínas, demostrando ser útiles en diferentes aplicaciones, siendo empleados para el descubrimiento de péptidos antimicrobianos y con actividad terapéutica. A pesar de su éxito, no existen estrategias que combinen el aprendizaje adquirido durante la clasificación e identificación funcional con el aprendizaje de generación, siendo los métodos de aprendizaje por GAN los de común uso. Recientemente, los métodos basados en diffusion han fomentado una gran utilidad en aprendizaje de generación, conviritiéndose en métodos relevantes para el diseño de péptidos. Sin embargo, la evaluación de toxicidad e imunogenecidad, junto con diferentes propiedades faramcodinámicas y farmacocinéticas, así como también el problema de trabajar con set de datos Low-N en funciones complejas de detectar, junto con la propensión de presentar actividades moonlighting son desafíos que a la fecha no se han resueltos y que presentan grandes complicaciones para diseñar péptidos vía IA. En este proyecto, se busca la integración de métodos de machine learning para asistir el diseño de péptidos con actividad terapéutica. Primero, estrategias de transfer learning combinados con Foundational models y protein language models serán empleados para construir modelos de clasificación binaria de actividades biolíogicas de péptidos. Luego, basados en las mismas estrategias, modelos predictivos de propiedades farmacológicas serán entrenados. Una vez los modelos predictivos sean desarrollados, diferentes estrategias de aprendizaje generativo serán exploradas, incluyendo variational autoencoder, generative adversarial network y diffusion models combinado con aprendizaje por contraste. Cada método será explorado con diferentes actividades y se evaluará en términos de generación, capacidad de adaptación y reconstrucción., seleccionando las mejores estrategias en función de la respuesta de interés. Finalmente, los métodos de clasificación y de generación se ejecutarán para simular espacios latentes de péptidos con actividad terapéutica y se aplicará estrategias de aprendizaje por refuerzo para el ajuste de parámetros del aprendizaje generativo en función de los modelos de clasificación, fomentando reglas para péptidos terapeúticos con actividad moonlighting y orientado hacia la generación de péptidos con índices de toxicidad e inmunogenecidad bajos, así como también una baja concentración de IC50 y una vida media deseable. Se espera que al finalizar el proyecto, se cuente con un prototipo de diseño asistido de péptidos que acelere el descubrimiento de drogas, siendo un soporte para los métodos actuales de diseño.
los gastos de operación se resumen a continuación:
- 12.000.000 serán para pago de publicaciones
- 7.800.000 serán destinados a inscripción en congresos, visitas externas, viáticos.
los gastos de operación se resumen a continuación:
- 12.000.000 serán para pago de publicaciones
- 7.800.000 serán destinados a inscripción en congresos, visitas externas, viáticos.