El aprendizaje automático desempeñará un papel cada vez más importante en la previsión meteorológica: el enfoque híbrido

El aprendizaje automático puede mejorar los cálculos en la predicción del tiempo añadiendo componentes o sustituyendo algunas partes del proceso físico y tradicional. Esto es lo que se llama el enfoque "híbrido".

Foto de la directora del ECMWF Florence Rabier. ECMWF

El aprendizaje automático desempeñará un papel cada vez más importante en la predicción numérica del tiempo, pero las técnicas de predicción basadas en la física seguirán siendo importantes, afirmó en una entrevista la directora general del ECMWF, Florence Rabier.

Explicó que el ECMWF (European Centre for Medium-Range Weather Forecasts/ Centro Europeo para la Predicción a Medio Plazo) está adoptando actualmente un enfoque triple: el uso del aprendizaje automático para potenciar las técnicas tradicionales, el desarrollo de un modelo de predicción basado únicamente en el aprendizaje automático y un uso experimental del aprendizaje automático en observaciones meteorológicas para construir un sistema de predicción. A más largo plazo, empezaremos a investigar el diseño de un modelo básico para el tiempo y el clima.

El aprendizaje automático desempeñará un papel cada vez más importante en la previsión meteorológica: el enfoque híbrido. ECMWF

El aprendizaje automático ha entrado en el campo de la predicción numérica del tiempo en los últimos años. ¿Por qué es importante para el ECMWF?

Las aplicaciones de la inteligencia artificial y el aprendizaje automático (IA/ML) se han expandido drásticamente en todos los campos en los últimos tiempos. El aprendizaje automático utiliza una gran cantidad de datos para producir resultados, y el ECMWF se basa en datos: utilizamos una gran cantidad de datos (decenas de millones de observaciones meteorológicas por día) y generamos una gran cantidad de datos al producir análisis y pronósticos meteorológicos de alta resolución.

Tradicionalmente, utilizamos métodos basados en la física para nuestros cálculos en el Sistema Integrado de Pronóstico (IFS). Este es el caso de la predicción numérica del tiempo (NWP), los reanálisis del clima pasado y la composición atmosférica. Todos los cálculos requieren una gran potencia de procesamiento para producir predicciones de alta calidad, basadas en la descripción precisa de los procesos físicos.

El aprendizaje automático puede mejorar nuestros cálculos añadiendo componentes o sustituyendo algunas partes del proceso. Esto es lo que llamamos el enfoque "híbrido". En cambio, el aprendizaje automático también puede sustituir por completo el modelo completo, con un coste informático mucho menor. Además, la IA y el aprendizaje automático abren algunas vías en otras actividades en las que participamos, como las previsiones de inundaciones, las previsiones de peligro de incendios, el seguimiento de las observaciones, la gestión de la supercomputadora o la mejora de la experiencia del usuario.

Gráfico del sistema de observación de la Tierra.ECMWF

El aprendizaje automático es muy adecuado para la previsión meteorológica debido a la gran cantidad de datos que se utilizan para determinar las mejores condiciones iniciales posibles y producir previsiones globales.

¿Cómo funciona el enfoque híbrido?

El aprendizaje automático se puede utilizar para estimar mejor algunos componentes de la predicción numérica del tiempo y para estimar el error del modelo. Esto es válido para el proceso de establecer las mejores condiciones iniciales posibles para los pronósticos, denominado asimilación de datos, pero también para los pronósticos mismos.

Algunos aspectos del sistema terrestre, como el hielo marino, la nieve, el suelo y la vegetación, son difíciles de modelar a partir de la física pura, por lo que, en la práctica, el modelado puede ser bastante empírico. En tales casos, existe un gran potencial para dejar que las observaciones definan cada vez más los modelos. Como hemos demostrado para la asimilación del hielo marino , es más probable que logremos los mejores resultados combinando cuidadosamente la física conocida con componentes empíricos y de aprendizaje automático, en lugar de descartar por completo los modelos físicos.

También existen algunos errores predecibles de los modelos que podemos estimar y eliminar de la asimilación de datos y de los pronósticos posteriores mediante el uso del aprendizaje automático. Los reanálisis meteorológicos y climáticos también pueden beneficiarse del aprendizaje automático. Por ejemplo, para el próximo reanálisis del ECMWF, ERA6, se aplicará un método de corrección de errores de modelos de aprendizaje automático desarrollado para el período a partir de 2006, que es rico en observaciones satelitales, a períodos anteriores con escasez de datos.

Corrección de tendencia constante vs corrección de tendencia dependiente del tiempo. Esta animación ilustra las correcciones variables de las tendencias de temperatura cerca de la superficie por hora, establecidas por aprendizaje automático, que se aplicarán en el sistema de asimilación de datos a partir de 2025, en comparación con las correcciones de tendencia constante. La corrección de tendencia constante incluye pequeños cambios por cada ventana de asimilación de 12 horas. (Serie temporal cortesía de Patrick Laloyaux, ECMWF)

¿Qué tipo de avances se han logrado en un sistema de pronóstico basado puramente en ML?

En los últimos 18 meses hemos logrado enormes avances en la creación de un sistema de este tipo, denominado Sistema de Predicción de Inteligencia Artificial (AIFS, por sus siglas en inglés). Este sistema es el resultado de decisiones de nuestros Estados miembros en materia de inversiones, de la motivación y dedicación de nuestro personal y de esfuerzos de colaboración con los socios. El AIFS utiliza los reanálisis climáticos de Copernicus y los análisis meteorológicos para la formación, y se basa en las condiciones iniciales del IFS, por lo que no está totalmente divorciado de las técnicas tradicionales, pero realiza previsiones basándose únicamente en el aprendizaje automático.

Este año hemos reducido el espaciado de la cuadrícula del AIFS de 100 a 28 km , y seguirá reduciéndose. Esto se compara con el espaciado de cuadrícula de 9 km actual para el IFS. También hemos construido un primer sistema de conjunto AIFS , en el que se realizan una serie de pronósticos ligeramente diferentes para cada momento en el futuro para explorar los posibles escenarios y, de este modo, permitir la estimación de la incertidumbre. Estos pronósticos se han agregado a nuestra página web de gráficos y están disponibles como datos abiertos .

Estamos estudiando escalas temporales subestacionales, de hasta 46 días de antelación, y la incorporación de varios componentes del sistema terrestre. También hay planes para realizar previsiones AIFS de hidrología y composición atmosférica. Estamos colaborando en un proyecto piloto de aprendizaje automático del ECMWF con Estados miembros y cooperantes , y estamos participando en una iniciativa de inteligencia artificial de EUMETNET. Esto nos ayudará a comparar diferentes enfoques, en diferentes escalas temporales y resoluciones. La colaboración con nuestros Estados miembros y cooperantes también es clave para el desarrollo de una plataforma llamada Anemoi, que permitirá a los usuarios construir sus propios modelos de aprendizaje automático.

CRPS para temperatura de 850 hPa para IFS ENS y AIFS ENS. La puntuación de probabilidad clasificada continua(CRPS – cuanto menor, mejor) mide la calidad de los pronósticos de conjunto. Aquí lo mostramos para la temperatura de 850 hPa, con resultados para el conjunto IFS (IFS ENS – rojo) y para el conjunto experimental AIFS (AIFS ENS – azul). Los puntajes se agregan para las zonas extratropicales del hemisferio norte y un período de aproximadamente cinco meses.

¿Cuál es el estado del uso de ML solo en observaciones?

Durante el último año, hemos puesto en marcha un enfoque radicalmente nuevo para la predicción meteorológica: la producción de pronósticos meteorológicos directamente a partir de observaciones. La asimilación de datos basada en la física se basa en algunos supuestos, como un conocimiento perfecto de los errores del modelo y de la observación, y de la relación entre el modelo y las observaciones. El nuevo enfoque intenta evitar estos aspectos de la asimilación de datos convencional.

Esto significa que no es necesario mapear las observaciones a una cuadrícula fina de parámetros no medidos. También abre la posibilidad de explotar el contenido de información de nuevas y emocionantes observaciones. Este proyecto AI-DOP (Predicción de Observación Directa con Inteligencia Artificial) involucra una red neuronal entrenada para predecir observaciones futuras a partir de largos registros históricos de observaciones pasadas.

En este nuevo enfoque, utilizamos de manera eficaz las observaciones para predecir estados futuros de la atmósfera a partir de los conocimientos adquiridos directamente a partir de las propias observaciones. Los primeros resultados son muy prometedores, pero este enfoque todavía es experimental.

Mediciones IASI previstas y observadas en AI-DOP. Un ejemplo de predicción de observaciones futuras con AI-DOP. Mostramos las temperaturas de brillo del canal de la ventana infrarroja (en Kelvin), medidas por el Interferómetro de Sondeo Atmosférico Infrarrojo (IASI), predichas con uno y cuatro días de antelación. La columna de la izquierda muestra los valores predichos y la columna de la derecha las radiancias reales medidas con uno y cuatro días de antelación. Este canal es muy sensible a las estructuras de las nubes atmosféricas, y podemos ver que AI-DOP produce predicciones muy plausibles de la evolución de los patrones meteorológicos a gran escala, aunque están bastante suavizadas con el sistema experimental actual de baja resolución. Los rectángulos resaltan algunos de los patrones meteorológicos más llamativos que se predicen bien.

¿Qué nos depara el futuro?

En 2025, el sistema de conjuntos AIFS estará operativo como complemento del IFS. Se seguirá trabajando para mejorar aún más el modelado ML y aumentar la resolución espacial, avanzando hacia los 9 km. Más allá del rango medio, se desarrollarán enfoques híbridos y basados en datos para sistemas de pronóstico subestacional y estacional. En 2026 se desarrollará un AIFS operativo para estas escalas de tiempo.

En el marco de la iniciativa Destination Earth de la UE, se ampliará el alcance del AIFS para capturar los procesos oceánicos, de hielo marino, terrestres, hidrológicos y de olas. El ECMWF también podría contribuir con su amplia experiencia y recursos para apoyar las fábricas de inteligencia artificial de la Comisión Europea. En el marco de los servicios Copernicus de la UE, se explorarán un modelo híbrido y un modelo AIFS de composición atmosférica, así como métodos basados en aprendizaje automático para reducir la escala del reanálisis global ERA5 a las regiones europeas y árticas. Se seguirá utilizando directamente las observaciones en el desarrollo de modelos de aprendizaje automático.

En colaboración con socios de toda la comunidad meteorológica europea, también estamos planeando desarrollar un modelo básico para el tiempo y el clima para 2027, utilizando una gran variedad de datos y con la posibilidad de adaptarse a una amplia gama de tareas. Por ejemplo, funcionará como una herramienta de pronóstico, reducción de escala y posprocesamiento. Se aplicará en sectores como el clima, el agua, la energía, la salud y la seguridad alimentaria.

¿Siempre habrá un papel para un sistema de pronóstico basado en la física?

El ECMWF se esfuerza por estar a la vanguardia de los avances en IA/ML, junto con la Infraestructura Meteorológica Europea, para apoyar el objetivo permanente de una previsión meteorológica líder en el mundo. Esto no significa que renunciemos a las previsiones basadas en la física. Gran parte del trabajo actual se centra en la mejor manera de combinar ambas para obtener los mejores resultados posibles.

Por ejemplo, estamos planeando desarrollar pequeños conjuntos de mayor resolución del modelo basado en la física para complementar la producción actual con un espaciado de cuadrícula de 9 km. Esto será útil por sí mismo, pero también ayudará a entrenar modelos basados en datos, que también alcanzarán una resolución mayor.

De lo que he descrito se desprende que en el futuro el modelado basado en la física seguirá teniendo un papel que desempeñar, ya que servirá para afianzar el sistema, incluso si una parte cada vez mayor de la producción operativa se realiza con métodos basados en datos.

Esta entrada se publicó en Entrevistas en 10 Sep 2024 por Francisco Martín León