Uso del aprendizaje automático para mejorar la evaluación de la toxicidad de las sustancias químicas
Los químicos adoptan un nuevo enfoque para analizar las sustancias químicas
Computer-generated image
Según los investigadores, el uso del aprendizaje automático puede mejorar enormemente la evaluación del peligro de las moléculas, tanto en el desarrollo de nuevas sustancias químicas como en la evaluación de las existentes. La importancia de este último aspecto queda ilustrada por el hecho de que las agencias químicas europeas y estadounidenses tienen una lista de aproximadamente 800.000 sustancias químicas que se han desarrollado a lo largo de los años pero de las que se sabe poco o nada sobre su destino o toxicidad en el medio ambiente.
Dado que una evaluación experimental del destino y la toxicidad de las sustancias químicas requiere mucho tiempo, esfuerzo y recursos, ya se utilizan enfoques de modelización para predecir los indicadores de peligro. En concreto, se suele aplicar la modelización de la relación cuantitativa estructura-actividad (QSAR), que relaciona características moleculares como la disposición atómica y la estructura tridimensional con propiedades fisicoquímicas y actividad biológica. A partir de los resultados de la modelización (o de los datos medidos, si se dispone de ellos), los expertos clasifican una molécula en categorías, tal como se definen, por ejemplo, en el Sistema Globalmente Armonizado de Clasificación y Etiquetado de Productos Químicos (SGA). En función de las categorías, las moléculas se someten a más investigación, a un seguimiento más activo y, en última instancia, a legislación.
Sin embargo, este proceso tiene inconvenientes inherentes, en gran parte debidos a las limitaciones de los modelos QSAR. A menudo se basan en conjuntos de entrenamiento muy homogéneos y asumen una relación estructura-actividad lineal para hacer extrapolaciones. Como resultado, muchas sustancias químicas no están bien representadas por los modelos QSAR existentes y su uso puede conducir a errores de predicción sustanciales y a una clasificación errónea de las sustancias químicas.
Saltarse la predicción QSAR
En el artículo publicado en Environmental Science & Technology, el Dr. Saer Samanipour y sus coautores proponen una estrategia de evaluación alternativa que omite por completo la fase de predicción QSAR. Samanipour, analista medioambiental del Instituto Van 't Hoff de Ciencias Moleculares de la Universidad de Ámsterdam, se asoció con la Dra. Antonia Praetorius, química medioambiental del Instituto de Biodiversidad y Dinámica de Ecosistemas de la misma universidad. Junto con colegas de la Universidad de Queensland y el Instituto Noruego de Investigación del Agua, desarrollaron una estrategia basada en el aprendizaje automático para la clasificación directa de la toxicidad acuática aguda de sustancias químicas a partir de descriptores moleculares.
El modelo se desarrolló y probó a partir de 907 datos obtenidos experimentalmente sobre toxicidad aguda en peces (valores LC50 de 96 h). El nuevo modelo omite la predicción explícita de un valor de toxicidad (CL50 96h) para cada sustancia química, pero clasifica directamente cada sustancia química en una serie de categorías de toxicidad predefinidas. Estas categorías pueden estar definidas, por ejemplo, por normativas específicas o sistemas de normalización, como se demuestra en el artículo con las categorías del SGA para el peligro acuático agudo. El modelo explicó en torno al 90% de la varianza de los datos utilizados en el conjunto de entrenamiento y alrededor del 80% para los datos del conjunto de prueba.
Predicciones más precisas
Esta estrategia de clasificación directa dio como resultado una disminución de cinco veces en la categorización incorrecta en comparación con una estrategia basada en un modelo de regresión QSAR. Posteriormente, los investigadores ampliaron su estrategia para predecir las categorías de toxicidad de un gran conjunto de 32.000 sustancias químicas.
Demuestran que su enfoque de clasificación directa da lugar a predicciones de mayor precisión porque los conjuntos de datos experimentales de diferentes fuentes y para diferentes familias químicas pueden agruparse para generar conjuntos de entrenamiento más amplios. Puede adaptarse a distintas categorías predefinidas, tal como prescriben diversas normativas internacionales y sistemas de clasificación o etiquetado. En el futuro, el método de clasificación directa también puede ampliarse a otras categorías de peligro (por ejemplo, toxicidad crónica), así como al destino en el medio ambiente (por ejemplo, movilidad o persistencia), y muestra un gran potencial para mejorar las herramientas in silico de evaluación de peligros y riesgos químicos.
Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática. El artículo original en Inglés se puede encontrar aquí.