Blog sobre Machine Learning

Uso de Inteligencia Artificial para el descubrimiento de moléculas

¿Hasta dónde llegará el Machine Learning en la ciencia?

El profesor asistente Connor Coley está desarrollando herramientas que podrían predecir el comportamiento molecular y aprender tanto de los éxitos como de los errores


El poder descubrir una droga, material o cualquier cosa nueva requiere un conocimiento previo de comprensión de moléculas. Es un proceso largo y requiere bastante mano de obra y incluso con la ayuda de un químico no hay garantía de éxito. Connor Coley busca cambiar esa dinámica. El profesor Henri Slezynger del departamento de Ingeniería Química del MIT, trata de desarrollar herramientas computacionales para predecir el comportamiento molecular y aprender de los éxitos y errores.


Es un enfoque intuitivo y todavía tiene obstáculos, pero Coley dice que esta plataforma autónoma tiene un enorme potencial para rehacer el proceso de descubrimiento. Se abriría un depósito de moléculas sin explotar nunca antes imaginadas. Se pueden hacer sugerencias desde el principio, ofreciendo un comienzo en ejecución y acortando la línea de tiempo general desde la idea hasta el resultado. El capital humano ya no sería un impedimento, puesto que los científicos se liberarían de tener que monitorear cada paso y poder así abordar preguntas más importantes que antes no podían. “Esto nos permitiría aumentar nuestra productividad y escalar el proceso de descubrimiento de manera mucho más eficiente”, dice.


Jugando al detective



Las moléculas presentan un par de desafíos. Se necesitan tiempo para averiguarlo y hay muchos de ellos. Coley cita estimaciones de que hay 1020 a 1060 que son pequeñas y biológicamente relevantes, pero se han sintetizado y probado menos de 109 . Para cerrar esa brecha y acelerar el proceso, su grupo ha estado trabajando en técnicas computacionales que aprenden a correlacionar estructuras moleculares con sus funciones.


Una de las herramientas es la optimización guiada, que evaluaría una molécula en varias dimensiones y determinaría cuál tendrá las mejores propiedades para una tarea determinada. El objetivo es que el modelo haga mejores predicciones a medida que se ejecuta a través de una técnica llamada aprendizaje activo. Coley dice que se podría reducir la cantidad de experimentos necesarios para que un nuevo hipotético fármaco pase de las etapas iniciales a los ensayos clínicos “Por orden de magnitud”.


Todavía existen limitaciones inherentes. La optimización guiada se basa en modelos que están disponibles actualmente y, las moléculas, a diferencia de las imágenes, no son numéricas ni estáticas. Sus formas cambian en función de factores como el medio ambiente y la temperatura. Coley busca tener en cuenta esos elementos, para que la herramienta pueda aprender patrones. El resultado sería “una comprensión más matizada de lo que significa tener una estructura molecular y la mejor manera de capturar eso como una entrada para estos modelos de aprendizaje automático . "


Un cuello de botella, como él lo llama, es tener buenos casos de prueba para comparar el rendimiento. Por ejemplo, dos moléculas que son imágenes especulares pueden comportarse de manera diferente en diferentes entornos, uno de los cuales es el cuerpo humano, pero muchos conjuntos de datos no muestran eso. El desarrollo de nuevos algoritmos y modelos requiere tener tareas y objetivos específicos, y está trabajando en la creación de puntos de referencia sintéticos que serían controlados pero que aún reflejarían aplicaciones reales.


Más que seleccionar moléculas, Coley también está trabajando en herramientas que generarían nuevas estructuras. El método típico es que un científico diseñe modelos de propiedades y realice una consulta. Lo que sale es una predicción de la función molecular, pero solo para la molécula que se solicitó. Coley dice que los nuevos enfoques permiten pedirle al modelo que presente nuevas ideas y estructuras que tengan un buen conjunto de propiedades, aunque no se haya consultado específicamente. En esencia, "invierte" el proceso.


El potencial es enorme, no obstante los modelos siguen siendo insuficientes en cuanto a datos. Según Coley se podrían necesitar más de 100.000 suposiciones par descubrir una buena molécula y agrega que su deseo es descubrir moléculas en circuito cerrado. Para lograr este objetivo, es esencial obligar a la generación a cumplir las reglas de la química sintética. De lo contrario podría llevar meses probar lo propuesto en el modelo. En el nuevo enfoque, sería capaz de "comprobar la calidad" y proponer tanto moléculas como vías. También quiere llegar al punto en que los modelos comprendan la variabilidad y la incertidumbre de las situaciones del mundo real. Juntas, estas capacidades reducirían la dependencia de la intuición humana, dando a los químicos una ventaja y el tiempo para asumir tareas de mayor nivel.


La ventaja de los errores



Una limitación de la mejora de cualquier modelo basado en datos es que depende de la literatura disponible. A Coley le gustaría abrir eso a través de un esfuerzo de colaboración que codirige, Open Reaction Database. Sería impulsado por la comunidad, centrado en la química sintética y alentaría a los investigadores a compartir experimentos que no han funcionado y que normalmente no se publicarían. Esa no es la solicitud habitual, y supondría un cambio de mentalidad en el campo de la química, pero Coley dice que hay un valor en mirar lo que no fueron "éxitos". “Agrega riqueza a los datos que tenemos”, dice.


Ese es el tema principal de su trabajo. El modelo computacional se basaría en los últimos 100 años de química y terminaría siendo una plataforma que sigue aprendiendo. El objetivo general es automatizar completamente el proceso de investigación. Los modelos y la robótica podían elegir las soluciones y mezclas y realizar el calentamiento, la agitación y la purificación, y cualquier producto que se elaborara podría retroalimentarse y ser el comienzo del próximo experimento. "Eso podría ser enormemente habilitante en términos de nuestra capacidad para producir, probar y descubrir nueva materia química de manera eficiente", dice Coley.


Y el resultado final es que las restricciones al descubrimiento se reducirían a la disponibilidad de plataformas, no a la disponibilidad de tiempo, una cuestión de capital más que de recursos humanos. La pieza que falta es diseñar un enfoque computacional que pueda identificar nuevas estructuras y tener una mejor oportunidad desde el principio del éxito. En realidad, no se trata de automatización. Ese enfoque pasa por pasos de una manera prescrita. Lo que Coley quiere es ese componente adicional de poder generar ideas, probar hipótesis, responder a las sorpresas y adaptarse en consecuencia. “Mi objetivo es alcanzar ese nivel total de autonomía”, dice.

¿Quieres aplicar soluciones de Machine Learning e Inteligencia Artificial en tu negocio? Déjanos un mensaje y te responderemos ASAP.



Este artículo ha sido elaborado tomando el MIT como fuente

Pub: , Mod: 30/09/2021, Por: 

 5(75 )



 

Pídenos presupuesto para desarrollar tu proyecto de Machine Learning e Inteligencia Artificial en Barcelona

Confía en nosotros, estamos a tu disposición para crear proyectos de Machine Learning

captcha security