Hacia nuevas células solares con aprendizaje activo
Para hacer frente a la miríada de posibilidades de moléculas candidatas, la máquina decide por sí misma qué datos necesita
© Kunkel/FHI
¿Cómo puedo prepararme para algo que aún no conozco? Científicos del Instituto Fritz Haber de Berlín y de la Universidad Técnica de Múnich han abordado esta cuestión casi filosófica en el contexto del aprendizaje automático. Aprender no es más que aprovechar la experiencia previa. Para enfrentarse a una nueva situación, es necesario haber tratado antes situaciones más o menos similares. En el aprendizaje automático, esto significa que un algoritmo de aprendizaje tiene que haber sido expuesto a datos más o menos similares. Pero ¿qué podemos hacer si hay una cantidad casi infinita de posibilidades, de modo que es sencillamente imposible generar datos que cubran todas las situaciones?
Este problema se plantea a menudo cuando se trata de un número infinito de posibles moléculas candidatas. Los semiconductores orgánicos permiten importantes tecnologías futuras, como las células solares portátiles o las pantallas enrollables. Para estas aplicaciones, es necesario descubrir moléculas orgánicas mejoradas, que son las que componen estos materiales. En este tipo de tareas se utilizan cada vez más métodos de aprendizaje automático, mientras se entrena con datos procedentes de simulaciones informáticas o experimentos. Sin embargo, se calcula que el número de pequeñas moléculas orgánicas potencialmente posibles es del orden de 1033. Este abrumador número de posibilidades hace prácticamente imposible generar datos suficientes para reflejar una diversidad material tan grande. Además, muchas de esas moléculas ni siquiera son adecuadas para los semiconductores orgánicos. En esencia, se está buscando la proverbial aguja en un pajar.
En su trabajo, publicado recientemente en Nature Communications, el equipo en torno al profesor Karsten Reuter, director del Departamento de Teoría del Instituto Fritz-Haber, abordó este problema utilizando el llamado aprendizaje activo. En lugar de aprender de los datos existentes, el algoritmo de aprendizaje automático decide por sí mismo qué datos necesita realmente para aprender sobre el problema. Los científicos realizan primero simulaciones con algunas moléculas pequeñas y obtienen datos relacionados con la conductividad eléctrica de las moléculas, una medida de su utilidad a la hora de estudiar posibles materiales para células solares. A partir de estos datos, el algoritmo decide si pequeñas modificaciones de estas moléculas podrían dar lugar a propiedades útiles o si es incierto debido a la falta de datos similares. En ambos casos, solicita automáticamente nuevas simulaciones, se perfecciona con los nuevos datos generados, considera nuevas moléculas y repite este procedimiento. En su trabajo, los científicos muestran cómo se pueden identificar de forma eficiente moléculas nuevas y prometedoras de esta manera, mientras el algoritmo continúa su exploración en el vasto espacio molecular, incluso ahora, en este mismo momento. Cada semana se proponen nuevas moléculas que podrían dar paso a la próxima generación de células solares y el algoritmo sigue mejorando.
Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática. El artículo original en Inglés se puede encontrar aquí.