Aprendizaje profundo a pesar de los datos dispersos
El grupo de investigación de la DFG se centra en la evaluación de datos de procesos químicos
TUK/Koziel
Buscar millones de imágenes en fracciones de segundo para una palabra clave como "playa" o utilizar el reconocimiento de voz para que se reproduzca una canción en su servicio de streaming. Esto es posible gracias al aprendizaje profundo, un subcampo de la inteligencia artificial. Con la ayuda de grandes cantidades de datos, los algoritmos aprenden; clasifican, ordenan y filtran los datos. La tecnología se utiliza en muchos ámbitos, como la medicina, la agricultura o la robótica.
Sin embargo, este no ha sido el caso de los procesos de la industria química. "Aquí hay muchos menos datos que, por ejemplo, en una búsqueda de imágenes en la web; en algunos casos no hay datos en absoluto o las empresas no los ponen a disposición", dice el profesor Dr. Marius Kloft, que dirige el Departamento de Sistemas Inteligentes y el Grupo de Trabajo de Aprendizaje Automático de la TU Kaiserslautern y es el portavoz del nuevo grupo de investigación de la DFG. "Además, a menudo todos los datos también tienen el mismo aspecto, lo que hace que el aprendizaje aquí sea mucho más difícil". Por ejemplo, en una planta química, el mismo proceso se realiza siempre en las mismas condiciones durante un largo periodo de tiempo, como la conversión de materias primas en productos. Así, los sensores miden siempre la misma temperatura, presión, etc.
Es precisamente en estos ámbitos donde el nuevo grupo de investigación quiere, sin embargo, aplicar los métodos de Deep Learning. El grupo se beneficia del hecho de ser interdisciplinario. De lo contrario, el desarrollo de estos nuevos métodos no sería posible. Además del informático Kloft y de la profesora de informática Dra. Heike Leitte, participan en el TUK el profesor de ingeniería de procesos Dr. Hans Hasse y el profesor junior Dr. Fabian Jirasek, que investiga el aprendizaje automático en la ingeniería de procesos, y la profesora junior Dra. Sophie Fellenz, que también trabaja en el aprendizaje automático. Lo especial de Fellenz y Jirasek es que la Fundación Carl Zeiss financia sus cátedras junior en tándem con 1,5 millones de euros; su objetivo común es aunar el aprendizaje automático con la modelización física. El nuevo grupo de investigación de la DFG también se beneficia de ello. Como parte de una beca Mercator, también participará en el proyecto el profesor de informática Dr. Stephan Mandt, de la Universidad de California en Irvine, cuya investigación incluye aplicaciones del aprendizaje automático en las ciencias naturales.
"Para nosotros, la atención se centra menos en el número de datos y más en la calidad de los mismos", continúa Kloft. El equipo está adoptando dos enfoques. En primer lugar, lleva a cabo procesos químicos en el propio laboratorio para recoger datos experimentales y, en segundo lugar, también genera datos sintéticos. "Todos los experimentos son complejos y costosos. Nuestra principal preocupación es, por tanto, recoger los datos adecuados, es decir, aquellos de los que los métodos de aprendizaje profundo pueden aprender más", añade Jirasek. Para ello, se utiliza una planta de destilación por lotes en el campus de Kaiserslautern para recoger datos de procesos dinámicos. Además, en el socio del proyecto, la Universidad Técnica de Múnich, funciona una planta de producción continua de combustibles sintéticos a escala piloto en el emplazamiento de Straubing.
"Estas plantas están equipadas con diversos sensores para registrar una amplia gama de datos, como la presión y la temperatura, pero también vídeos del funcionamiento interno o la composición de las mezclas utilizadas", continúa el profesor junior.
Además de los datos del laboratorio, se generan otros con la ayuda de simulaciones físicas y métodos de inteligencia artificial. Un reto especial es hacerlos lo más realistas posible. "Estamos aplicando dos enfoques al respecto", explica el profesor junior Fellenz. "Por un lado, estamos desarrollando métodos para aprender el estilo de los datos experimentales y luego transferirlo a los datos de simulación". Ya existen estos métodos para cambiar la tonalidad de los textos. En el grupo de investigación se están aplicando ahora a los datos de series temporales de procesos químicos, que pueden entenderse como datos secuenciales al igual que las palabras de un texto. "Por otro lado, incorporamos leyes físicas, por ejemplo de la termodinámica, directamente a nuestros modelos, de modo que también podemos generar datos realistas de áreas en las que no tenemos mediciones", continúa el informático.
El objetivo para los próximos cuatro años es utilizar los nuevos métodos de aprendizaje profundo para detectar anomalías o errores en las plantas químicas en una fase temprana, pero también para identificar las contramedidas adecuadas. Esto tiene una gran importancia práctica, ya que cada fallo de una planta es, como mínimo, costoso y, en el peor de los casos, representa un peligro para las personas y el medio ambiente.
Hay numerosos ejemplos de ello, como en 2013, cuando se produjo una explosión en una planta química en Geismar (Luisiana), en Estados Unidos, que mató a una persona e hirió a muchas. La causa fue un fallo en un intercambiador de calor. "Especialmente en este tipo de plantas, las anomalías en el proceso pueden tener consecuencias nefastas", continúa Kloft. Los métodos de aprendizaje profundo podrían ayudar aquí a detectar automáticamente estos fallos para emitir un mensaje de advertencia a tiempo. "Nuestros detectores de anomalías deberían ser mucho más sensibles que las técnicas convencionales gracias al Deep Learning".
El objetivo del trabajo es también explicar la información, visualizarla y presentarla con claridad. Debe ser rápido y fácil de entender para que los profesionales de la industria química puedan utilizar estos métodos y responder a las recomendaciones adecuadas de la tecnología. El equipo también trabajará en la verificación de sus métodos. Se utilizarán métodos matemáticos para verificar que los algoritmos funcionan correctamente. Kloft continúa: "Con nuestro trabajo, estamos generando un conjunto de datos completamente nuevo que también pondremos a disposición de otros".
El Profesor Dr. Werner R. Thiel, Vicepresidente de Investigación y Tecnología de TUK, subraya la importancia del nuevo grupo de investigación de la DFG: "Hemos podido sentar las bases de este éxito con nuestras dos cátedras junior en tándem financiadas por la Fundación Carl Zeiss. De este modo, aportamos nuestra experiencia en informática e ingeniería de procesos al proyecto. Sin esta combinación, este proyecto no sería posible. Esta es una ventaja de nuestro lugar de investigación, que es interdisciplinario en muchas áreas. Ahora está dando sus frutos de nuevo. Felicito calurosamente a todos los participantes".
El Ministro de Ciencia de Renania-Palatinado, Clemens Hoch, también se felicita: "Estoy muy satisfecho con el éxito de los investigadores de Kaiserslautern y sus socios de cooperación de Oldenburg y Straubing. El grupo de investigación financiado por la DFG es una prueba de la fuerza investigadora de la UT en este campo de gran actualidad y encaja perfectamente en la estrategia estatal de IA. Este proyecto vuelve a demostrar claramente que la tecnología clave de la inteligencia artificial puede contribuir de forma positiva a mejorar el rendimiento en una amplia gama de disciplinas y aplicaciones científicas. Por tanto, estoy muy satisfecho de que en Renania-Palatinado podamos considerarnos afortunados por tener en nuestras instituciones a investigadores punteros en IA, como el profesor Kloft y sus colegas, cuyos proyectos innovadores están desarrollando nuevas posibilidades de uso de la inteligencia artificial en Renania-Palatinado y más allá."
El objetivo a largo plazo del grupo de investigación es desarrollar métodos para el funcionamiento autónomo de las plantas de la industria química. Con su trabajo, el grupo también quiere hacer avanzar la simulación de procesos en la ingeniería de procesos mediante el desarrollo de nuevos tipos de herramientas y la integración en ellas de tipos de datos que actualmente ni siquiera se tienen en cuenta.
Además de los grupos de trabajo de la TU Kaiserslautern, participan en el proyecto los equipos del Dr. Michael Bortz del Instituto Fraunhofer de Matemática Industrial ITWM de Kaiserslautern, el profesor Dr. Jakob Burger de la TU Munich y el profesor Dr. Daniel Neider de la Universidad de Oldenburg. El profesor Dr. Stephan Mandt, de la Universidad de California en Irvine, también participa como becario Mercator.
Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática. El artículo original en Alemán se puede encontrar aquí.