Autora: Anna Schoch
25 de marzo de 2017
La Spring School sobre «Análisis estadístico de datos de percepción remota hiperespectral y de alta dimensión usando R», que tuvo lugar en Jena del 13 al 17 de marzo de 2017, fue organizada por el grupo GIScience, liderado por el Profesor Alexander Brenning y dos investigadores de su grupo: Patrick Schratz y el Dr. Jannes Münchow.
El curso reunió a un grupo diverso de 28 investigadores (e.g. geocientíficos, forestales, estudios ambientales) pertenecientes a diferentes niveles científicos (estudiantes de posgrado, doctorados, postdoctorados, profesores) de todo el mundo (Chile, Perú, Turquía y Bosnia-Herzegovina). En total, en el evento participaron ocho alemanes y 16 no alemanes (20 varones, 8 mujeres). Durante cinco días los participantes fueron introducidos al marco teórico de los datos de teledetección hiperespectral y aprendieron, gracias a varias sesiones prácticas, cómo analizar e ilustrar los datos espaciales en R. La Spring School se organizó dentro del proyecto LIFE Healthy Forest y fue apoyada por el Michael Stifel Center Jena.
En este post se ofrece una rápida contextualización de las muchas, muchas cosas que aprendimos durante esta intensa “semana de estadísticas espaciales y R”.
Participantes y organizadores de la Spring School en “Análisis estadístico de datos de teledetección hiperespectral y de alta dimensión usando R” en Jena, © H. Petschko.
Día 1
Durante el primer día del curso, los participantes recibieron una introducción teórica a los datos de teledetección hiperespectral, con ejemplos que se centraban en la aplicación de datos hiperespectrales en la investigación forestal.
Marco Peña, de la Universidad Alberto Hurtado de Chile, impartió una clase sobre «Introducción a la teledetección hiperespectral» que ayudó a los asistentes a nivelar sus conocimientos. Esta presentación fue seguida por una charla sobre aplicaciones hiperespectrales ejemplificada en un estudio sobre bosques en el bosque de Bialowieza, en el este de Polonia, realizado por Aneta Modzelewska del Instituto de Investigación Forestal de Varsovia. La última charla del primer día fue a cargo del Dr. Henning Buddenbaum (Universidad de Trier) sobre la «Detección remota hiperespectral para medir los parámetros bioquímicos de las hojas en los bosques». El Dr. Buddenbaum participa en el Grupo Asesor Científico – Bosques y Ecosistemas Naturales en la misión EnMAP, una misión alemana de satélites hiperespectrales que tiene como objetivo la monitorización y la caracterización del medioambiente terrestre global.
Conferencia del Profesor A. Brenning en “Aprendizaje estadístico y automático en teledetección”, © H. Petschko
Día 2
El segundo día estuvo dedicado a talleres prácticos de R. En una primera sesión de Patrick Schratz, aprendimos sobre su «debe saber» respecto a las características de R (Rmarkdown, cómo usar apply y sus hermanos, pipe operator). A continuación tuvieron lugar dos sesiones que se centraron en el uso de R como un SIG. El Dr. Jannes Münchow desarrolló el paquete RQGIS, una interfaz entre R y QGIS que permite al usuario acceder a algoritmos QGIS dentro de R. Después tuvimos una presentación sobre el paquete de R mapview a cargo de su creador, el Dr. Tim Appelhans. Mapview es una herramienta gráfica interactiva de tipo GIS directamente accesible desde RStudio (o desde el navegador web, si no se usa RStudio). Es especialmente útil si se desea realizar una comprobación visual rápidamente si un determinado análisis ha producido resultados razonables.
Resolviendo problemas de R con el Dr. Jannes Münchow, © H. Petschko
Día 3
El tercer día comenzó con una conferencia y una sesión práctica sobre «Aprendizaje de máquinas y estadística en teledetección» por parte del Prof. Alexander Brenning, centrado en el análisis discriminante, máquinas de soporte vectorial (support vector machine) y selvas aleatorias (random forest). Un breve resumen de estos métodos de modelado estadístico y la aplicación en R (incluyendo un tutorial completo) se puede consultar aquí. Por la tarde, el Dr. Thomas Bocklitz presentó una perspectiva muy diferente sobre la aplicación del análisis de datos espectrales en histopatología. Posteriormente, los participantes tuvieron la oportunidad de discutir su propia investigación referente a técnicas de modelado espacial o problemas de R con el grupo y los expertos del grupo GIScience de Jena.
Sesiones abiertas durante el tercer día de la Spring School para discutir los proyectos de investigación de los participantes. © H. Petschko
Día 4
El cuarto día, Patrick Schratz presentó brevemente el paquete hsdar desarrollado por el Dr. Lukas Lehnert de la Universidad de Marburg, que puede usarse para procesar y analizar datos hiperespectrales en R. En su segunda session, el Prof. Brenning se centró en la evaluación de la exactitud del modelo (métodos de validación no espaciales y espaciales, importancia de predictores utilizando el paquete sperrorest y abordando la alta dimensionalidad en la regresión lineal.
Discutiendo los modelos de muestreo con el Prof. A. Brenning. © H. Petschko
Introducción al procesamiento paralelo en R con Patrick Schratz, © H. Petschko
Día 5 (excursión al bosque de Turingia).
El último día visitamos un centro de monitorización y un lugar dañado por un tornado en el bosque de Turingia en 2016 (ver imagenes a continuación) junto con tres expertos de la autoridad oficial de «ThüringenForst”. En conclusión, la Spring School fue un gran evento con muchas sesiones de R prácticas y fructíferas, durante las cuales los participantes pudieron aprender trucos útiles para R, cómo utilizar R como un SIG y sobre todo aprendizaje estadísticos y de máquinas en R. Esperemos que haya más «escuelas» como ésta en el futuro (tal vez incluso con un enfoque temático sobre geomorfología o peligros naturales).
Daños de tornado en el bosque de Turingia en Alemania en septiembre de 2016, © P. Schratz