Cómo el aprendizaje automático puede ayudar a predecir las propiedades espectrales de los materiales
Éste es el caso de las funciones de Koopmans, un enfoque prometedor para ampliar la potencia de la teoría del funcional de la densidad de modo que pueda utilizarse para predecir las propiedades espectrales de los materiales (como qué frecuencias de luz absorbe un material), y no sólo su estado básico (como las posiciones óptimas de los átomos en ese material). La precisión de los funcionales de Koopmans depende de encontrar los "parámetros de apantallamiento" adecuados para el sistema que se está estudiando. "Se pueden interpretar los parámetros de apantallamiento como el grado en que el resto de electrones de un sistema reaccionan a la adición o eliminación de un electrón", explica Edward Linscott, postdoctorando en el Centro de Computación Científica, Teoría y Datos del Instituto Paul Scherrer, y miembro de MARVEL. El término "apantallamiento" se refiere al hecho de que los otros electrones ocultan -o en otras palabras, apantallan- la adición del nuevo electrón a alguien que esté observando el sistema desde el exterior. Linscott continúa: "Y este apantallamiento electrónico -el proceso de añadir o quitar un electrón del sistema- es precisamente el proceso físico que nos interesa cuando hablamos de propiedades espectrales. Por ejemplo, en las células solares, al incidir la luz sobre un material fotovoltaico, expulsamos electrones de él y generamos una corriente eléctrica". La teoría funcional de la densidad es muy mala para describir este tipo de procesos, y los parámetros de cribado nos indican hasta qué punto nos falla una aproximación DFT y la intensidad de la corrección que debemos aplicar para redimir correctamente la situación", explica Linscott.
El inconveniente de los cálculos funcionales de Koopmans es que llevan mucho más tiempo que sus homólogos de DFT, sobre todo por el coste de tener que calcular los parámetros de cribado. Pero un nuevo artículo publicado en npj Computational Materials demuestra que incluso un simple modelo de aprendizaje automático, entrenado con una modesta cantidad de datos, puede reducir significativamente el tiempo necesario para calcular los parámetros de cribado en el algoritmo de Koopmans. El artículo es obra de Yannick Schubert, de la Universidad de Zúrich -que inició el proyecto como su tesis de máster-, Sandra Luber (supervisora de doctorado de Yannick en la UZH), el director de MARVEL, Nicola Marzari, y el propio Linscott.
Los autores eligieron dos materiales específicos para su estudio: el agua líquida y la perovskita de haluro CsSnI3. "Representan el tipo de sistemas para los que pensamos que podríamos sacar el máximo partido del aprendizaje automático", explica Linscott. "El agua líquida es naturalmente desordenada y está fuera de la zona de confort de los científicos acostumbrados a trabajar con cristales prístinos. Mientras tanto, la perovskita de haluro es un material prometedor para su uso en células solares, para las que es importante calcular cómo cambia con la temperatura". Modelizar las propiedades espectrales de estos sistemas con los funcionales de Koopmans requeriría cálculos sobre muchas copias del mismo sistema químico con distintas posiciones atómicas. Este proceso puede hacerse mucho más rápido entrenando un modelo de aprendizaje automático en un subconjunto de estas copias y, a continuación, utilizando este modelo para predecir los parámetros de cribado de las copias restantes.
Cuando los investigadores se pusieron manos a la obra, la pregunta era: ¿qué tipo de modelo de aprendizaje automático funcionaría, entre las muchas opciones que ofrece el campo? Resultó que un modelo sencillo, llamado ridge regression, serviría. "Teníamos una hoja de ruta de redes cada vez más sofisticadas que íbamos a probar, y no sabíamos desde el principio si iba a funcionar o si íbamos a ser capaces de generar suficientes datos", dice Linscott. "Para nuestra sorpresa, el modelo más sencillo con muy pocos datos funcionó bien. El modelo que obtuvimos no se parece en nada a los sofisticados modelos de aprendizaje automático que nos rodean hoy en día, pero era suficiente para calcular con precisión los parámetros de cribado".
Aunque la red en sí es sencilla, los científicos lo atribuyen en parte al cuidadoso trabajo que dedicaron a la construcción de los "descriptores", que son objetos matemáticos que deben encapsular la física relevante del sistema y se introducen en el modelo de aprendizaje automático.
Aunque sería posible ampliar el método y hacerlo más potente con una red más compleja y más datos de entrenamiento, Linscott afirma que el siguiente paso será aprovechar al máximo el método tal y como es ahora y utilizarlo para estudiar las propiedades espectrales dependientes de la temperatura de materiales interesantes.
Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática. El artículo original en Inglés se puede encontrar aquí.