Hacia una ciencia reproducible con Jupyter Notebooks
Computed using Ubermag by Martin Lang, Marijan Beg and Hans Fangohr
En el caso de las publicaciones, el principio científico de reproducibilidad exige que los estudios y procesos se documenten y archiven a un nivel tal que puedan repetirse posteriormente, tanto por los autores originales como por otros investigadores interesados. Técnicamente, esto debería ser posible en el caso de las etapas basadas en software. Sin embargo, en la práctica la reproducibilidad no suele darse, por multitud de razones.
Ahora, investigadores del Reino Unido, Francia, Noruega y Alemania -dirigidos por Hans Fangohr, de la nueva unidad de Ciencia Computacional del MPSD- han publicado soluciones prácticas para este reto sobre la base del proyecto de investigación OpenDreamKit. Recomiendan flujos de trabajo reproducibles que incluyan el uso de software de código abierto y la provisión de capacidades computacionales complejas a través de interfaces de comando de alto nivel fáciles de usar para los investigadores. Esto permite a los científicos dirigir la investigación a través de cuadernos electrónicos que registran automáticamente cada paso que se ha dado.
Uno de los resultados de código abierto de este trabajo es el entorno de simulación Ubermag para el magnetismo a nanoescala. El software de simulación de bajo nivel, que ha sido optimizado para obtener un alto rendimiento de ejecución, es difícil de utilizar directamente, y los investigadores desarrollaron una interfaz Python de alto nivel para manejar las simulaciones con mucha más facilidad. El entorno Ubermag cuenta con capacidades de visualización que proporcionan información visual inmediata sobre los resultados de la simulación y se integran de forma natural en el cuaderno Jupyter. Con este conjunto de herramientas, un estudio de simulación puede ser dirigido desde el cuaderno Jupyter, que combina los comentarios narrativos del investigador con los comandos para ejecutar la simulación, seguidos inmediatamente por los resultados obtenidos. El cuaderno ha sido diseñado para poder registrar y archivar este documento rico y ejecutable, lo que supone un salto adelante para la reproducibilidad del estudio.
"Para mejorar la reproducibilidad en la ciencia, no basta con proporcionar herramientas o flujos de trabajo que hagan más reproducibles los resultados. Estas herramientas también deben encajar en el enfoque científico de los investigadores e, idealmente, conducir a una mejor experiencia de investigación, para que los nuevos métodos sean aceptados y adoptados ampliamente", afirma Hans Fangohr, autor coordinador de la publicación.
La reproducibilidad atrae cada vez más la atención de los investigadores, los consejos de investigación y las editoriales. "Un aspecto adicional del debate es que la reproducibilidad conduce a la reutilización", explica Fangohr. Si todos los pasos de un análisis de datos están documentados y archivados, idealmente en un guión (potencialmente largo) ejecutable por ordenador, de modo que puedan repetirse automáticamente con sólo pulsar un botón, resulta mucho más fácil tomar un estudio de este tipo y ampliarlo".
"En la actualidad, no es raro que los estudiantes de doctorado dediquen meses o años a reproducir primero los resultados publicados como línea de base, antes de poder ampliar el trabajo con adiciones novedosas como segundo paso. Con los flujos de trabajo y los métodos propuestos aquí, podemos reducir ese tiempo a horas o minutos, haciendo que nuestra actividad de investigación colectiva sea mucho más eficiente."
Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática. El artículo original en Inglés se puede encontrar aquí.