La inteligencia artificial "lee" y "comprende" los trabajos de investigación

Investigadores de una startup entrenan una red neuronal para reconocer fórmulas químicas a partir de documentos de investigación

17.02.2022 - Rusia

Investigadores de Syntelly -una startup originada en Skoltech-, la Universidad Estatal Lomonosov de Moscú y la Universidad Sirius han desarrollado una solución basada en redes neuronales para el reconocimiento automático de fórmulas químicas en escaneos de documentos de investigación. El estudio se ha publicado en Chemistry-Methods, una revista científica de la Sociedad Europea de Química.

La humanidad está entrando en la era de la inteligencia artificial. La química también se verá transformada por los modernos métodos de aprendizaje profundo, que invariablemente requieren grandes cantidades de datos cualitativos para el entrenamiento de las redes neuronales.

La buena noticia es que los datos químicos "envejecen bien". Incluso si un determinado compuesto se sintetizó originalmente hace 100 años, la información sobre su estructura, propiedades y formas de síntesis sigue siendo relevante en la actualidad. Incluso en nuestra época de digitalización universal, puede ocurrir que un químico orgánico recurra a un artículo original de una revista o a una tesis de una colección de la biblioteca -publicada ya a principios del siglo XX, por ejemplo, en alemán- para obtener información sobre una molécula poco estudiada.

Una técnica de IA "descodifica" imágenes de microscopio, superando un límite fundamental

"Hemos dado una prueba de concepto y demostrado cómo utilizar la IA para mejorar significativamente las imágenes de AFM, pero este trabajo es sólo el principio"

Leer noticia

La mala noticia es que no existe una forma estándar aceptada de presentar las fórmulas químicas. Los químicos acostumbran a utilizar muchos trucos en forma de notación abreviada para los grupos químicos conocidos. Por ejemplo, los posibles nombres de un grupo tert-butílico son "tBu", "t-Bu" y "tert-Bu". Para empeorar las cosas, los químicos suelen utilizar una plantilla con diferentes "marcadores de posición" (R1, R2, etc.) para referirse a muchos compuestos similares, pero esos símbolos marcadores de posición pueden definirse en cualquier parte: en la propia figura, en el texto del artículo o en los suplementos. Por no mencionar que los estilos de dibujo varían entre las revistas y evolucionan con el tiempo, los hábitos personales de los químicos difieren y las convenciones cambian. Como resultado, incluso un químico experto se encuentra a veces perdido tratando de dar sentido a un "rompecabezas" que ha encontrado en algún artículo. Para un algoritmo informático, la tarea parece insuperable.

Sin embargo, cuando lo abordaron, los investigadores ya tenían experiencia en abordar problemas similares con Transformer, una red neuronal propuesta originalmente por Google para la traducción automática. En lugar de traducir texto entre idiomas, el equipo utilizó esta potente herramienta para convertir la imagen de una molécula o una plantilla molecular en su representación textual. Dicha representación se denomina Functional-Group-SMILES.

Para auténtica sorpresa de los investigadores, la red neuronal demostró ser capaz de aprender casi cualquier cosa siempre que el estilo de representación pertinente estuviera representado en los datos de entrenamiento. Sin embargo, Transformer necesita decenas de millones de ejemplos para entrenarse, y recopilar a mano tantas fórmulas químicas de los artículos de investigación es imposible. Así que, en lugar de eso, el equipo adoptó otro enfoque y creó un generador de datos que produce ejemplos de plantillas moleculares combinando fragmentos de moléculas y estilos de representación seleccionados al azar.

"Nuestro estudio es una buena demostración del actual cambio de paradigma en el reconocimiento óptico de estructuras químicas. Mientras que las investigaciones anteriores se centraban en el reconocimiento de estructuras moleculares per se, ahora que disponemos de las capacidades únicas de Transformer y redes similares, podemos dedicarnos a crear generadores de muestras artificiales que imiten la mayoría de los estilos existentes de representación de plantillas moleculares. Nuestro algoritmo combina moléculas, grupos funcionales, fuentes, estilos, incluso defectos de impresión, introduce trozos de moléculas adicionales, fragmentos abstractos, etc. Incluso a un químico le cuesta decir si la molécula ha salido directamente de un papel real o del generador", dijo el investigador principal del estudio, Sergey Sosnin, que es el director general de Syntelly, una startup fundada en Skoltech.

Los autores del estudio esperan que su método constituya un paso importante hacia un sistema de inteligencia artificial que sea capaz de "leer" y "comprender" documentos de investigación en la medida en que lo haría un químico altamente cualificado.

Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática. El artículo original en Inglés se puede encontrar aquí.

Publicación original

Ivan Khokhlov et al.; "Image2SMILES: Transformer-Based Molecular Optical Recognition Engine"; Chemistry - Methods; 2022

https://www.quimica.es/noticias/1174826/la-inteligencia-artificial-lee-y-comprende-los-trabajos-de-investigacion.html

Publicación original

Ivan Khokhlov et al.; "Image2SMILES: Transformer-Based Molecular Optical Recognition Engine"; Chemistry - Methods; 2022

Temas

redes neuronales inteligencia artificial aprendizaje profundo

Ver todos

Organizaciones

Skolkovo Institute of Science and Technology

Syntelly

Algo está pasando en la industria química ...

Así es el verdadero espíritu pionero: Muchas start-ups innovadoras están aportando ideas frescas, savia nueva y espíritu emprendedor para cambiar el mundo del mañana a mejor. Sumérjase en el mundo de estas jóvenes empresas y aproveche la oportunidad de ponerse en contacto con los fundadores.

Descubra nuevas empresas ahora

Más del departamento ciencias Suscribirse al boletín

Reciba la química en su bandeja de entrada

La inteligencia artificial "lee" y "comprende" los trabajos de investigación

Investigadores de una startup entrenan una red neuronal para reconocer fórmulas químicas a partir de documentos de investigación

Una técnica de IA "descodifica" imágenes de microscopio, superando un límite fundamental

Publicación original

Por qué la inteligencia artificial no existe realmente todavía

Más noticias del departamento ciencias

Nuevo método para detectar nanoplásticos en fluidos corporales

Nuevo método de síntesis no tóxico del "material milagroso" MXeno

Una batería fluida que puede adoptar cualquier forma

Eliminación y almacenamiento de CO₂: ¿Qué opciones son viables y deseables?

Los científicos logran un gran avance en la alineación láser de imágenes macromoleculares de una sola partícula

Predicción de la energía cinética de sistemas cuánticos moleculares mediante inteligencia artificial

Las partículas rodantes hacen más fluidas las suspensiones

un robot de código abierto impreso en 3D ofrece una solución accesible para la síntesis de materiales

Importantes avances en el análisis químico de líquidos

De la basura al tesoro: un nuevo método regenera eficazmente las baterías gastadas de óxido de litio y cobalto

Un chatbot abre la química computacional a los no expertos

¿Qué potencial de innovación ofrece el uso del grafeno para las baterías de iones de litio?

Plásticos sostenibles con retardantes de llama para aplicaciones de circuito cerrado

Cómo esconde el agua su secreto cuántico

Basuras marinas: qué pueden hacer los plásticos biodegradables para resolver el problema

Tintas elásticas para electrónica integrada en textiles

Cómo eliminar definitivamente el dióxido de carbono

Un nuevo estudio revela que los polímeros con rellenos defectuosos aumentan la transferencia de calor en los plásticos

¿Cómo puede beneficiarse la ciencia de la IA?

El "truco" de la deformación mejora la eficiencia de las células solares de perovskita

Reciba la química en su bandeja de entrada

Noticias más leídas

Las aves respiran plásticos peligrosos, y nosotros también

Tsunami en un vaso de agua

Basta con hacer una foto para determinar la composición química

Un problema de hace 150 años resuelto con IA

Primicia mundial: la planta de producción "Mannheim 001" produce combustible marino a partir de aguas residuales y electricidad

Fotosíntesis artificial: los químicos imitan a las plantas

Avance científico en química

Una nueva química verde extrae valiosos compuestos de residuos vegetales

Uso de pilas para producir peróxido de hidrógeno a partir del aire para aplicaciones industriales

Descifrada la estructura del agua supercrítica

Los catalizadores autooptimizados facilitan la separación de agua para la producción ecológica de hidrógeno

Baterías autorregenerativas: el futuro del almacenamiento de energía duradero y seguro

Más noticias de nuestros otros portales

Esperanza para los enfermos de cáncer: agente activo contra la metástasis

10 cosas que no sabías sobre el café

Ajo silvestre: la confusión a menudo conduce a la intoxicación

Pequeñas cantidades de regaliz elevan la tensión arterial

¿Peróxido de hidrógeno como objetivo en la lucha contra el cáncer?

No todas las fresas son iguales

Microbio del año 2023: Bacillus subtilis - para la salud y la tecnología

Kirin Holdings presenta la "Cuchara Eléctrica de Sal" con una innovadora tecnología de sabor

El virus de la gripe y su influencia en las células madre de la sangre y la coagulación

Conservación, encurtido y fermentación: Cómo conservar la fruta y la verdura durante mucho tiempo

Los investigadores encuentran que el alimento favorito de una enigmática bacteria intestinal

10 años de La Voz de los Niños: la historia del éxito de HARIBO

De la tienda de patatas fritas a la parada en boxes

El hígado procesa el aceite de coco de forma diferente al aceite de colza

¿Cómo envejece el sistema inmunitario?

Lo que el consumidor busca en el café

El hedonismo conduce a la felicidad

Sabor 100% natural y 100% refrescante: Corona Cero - con 0,0% de alcohol

La naturaleza alivia el dolor físico: se reducen las señales relacionadas con el dolor en el cerebro

El chocolate MrBeast llega a Alemania

Algo está pasando en la industria química ...