Analysis-Ready, Cloud Optimized (ARCO) ERA5 es la quinta generación de reanálisis atmosférico del Centro Europeo de Previsiones Meteorológicas a Medio Plazo Medio (ECMWM), que proporciona estimaciones por hora de una gran cantidad de variables climáticas atmosféricas, terrestres y oceánicas. El Programa de conjunto de datos públicos de Google Cloud aloja datos ERA5 desde 1940 hasta mayo de 2023, abarcan la Tierra en una cuadrícula de 30 km y resuelve la atmósfera con 137 niveles desde la superficie hasta una altura de 80 km
Un reanálisis es la “imagen más completa posible actualmente del clima del pasado”. Los reanálisis se crean a partir de la asimilación de una amplia gama de fuentes de datos a través de modelos numéricos de predicción del clima (NWP). Las variables meteorológicas valiosas para la tierra y la atmósfera se transfirieron y se convirtieron de datos grib a Zarr (sin otras modificaciones) para mostrar una versión optimizada para la nube de ERA5. Además, se proporciona una base de código abierto para mostrar la procedencia de los datos y demostrar los flujos de trabajo de investigación comunes. Este conjunto de datos incluye archivos sin procesar (grib) y optimizados para la nube (zarr).
Casos de uso
Los datos de ERA5 se pueden usar en muchas aplicaciones diferentes, incluidas las siguientes:
- Entrenamiento de modelos de AA que predicen el impacto del clima en diferentes fenómenos
- Entrenamiento y evaluación los modelos de AA que predicen el clima
- Cálculos de climatologías, el clima promedio de una región durante un período determinado
- Visualización y estudio de eventos meteorológicos históricos, como el huracán Sandy
Gracias a la política de datos abiertos de los Servicios de Cambio Climático y Vigilancia Atmosférica de Copernicus y ECMWF, este conjunto de datos está disponible de forma gratuita como parte del programa de conjuntos de datos públicos de Google Cloud. Consulta la información sobre las licencias a continuación.
Estructura del conjunto de datos
El conjunto de datos ERA5 se almacena en tres subdirectorios principales: raw/
, co/
y ar/
. raw/
contiene datos de origen transferidos desde ECMWF. co/
contiene una versión "optimizada para la nube": Estos datos se convierten directamente en un formato optimizado para la nube (Zarr) en su cuadrícula nativa sin más procesamiento. ar/
, o "listo de análisis", contiene un conjunto de datos listo para el AA. Esta versión del corpus se encuentra en una cuadrícula de latitud y longitud normal, y unifica los datos atmosféricos y de la superficie en un solo Zarr.
Datos optimizados para la nube
Nuestro corpus optimizado para la nube incluye cinco conjuntos de datos de Zarr independientes, que se encuentran en el bucket de Cloud Storage gcp-public-data-arco-era5
:
- Humedad a nivel de modelo: las variables relacionadas con la humedad y la proporción de mezcla de ozono en los niveles de modelo.
- Viento a nivel de modelo: la divergencia, vorticidad, la temperatura y la velocidad vertical en los niveles de modelo.
- Superficie de nivel único: el geopotencial de superficie y el logaritmo de presión en la superficie del modelo.
- Previsión de un solo nivel: 21 variables relacionadas con la radiación solar/de onda larga en la superficie, la cantidad y el tipo de precipitaciones, y la profundidad de las nevadas y el contenido de agua.
- Reanálisis de un solo nivel: 38 variables relacionadas con la humedad/temperatura del suelo, los vientos cerca de la superficie, la temperatura y la humedad cerca de la superficie, el vapor de agua en columna total y la condensación de nubes, la nubosidad total y la presión a nivel del mar.
Para obtener más información sobre qué variables se incluyen con cada conjunto de datos, consulta los notebooks de ejemplo de Jupyter en el repositorio de GitHub.
Datos listos para el análisis
El corpus listo para analizar de Google Cloud es un Zarr que abarca los años 1959 a 2022.
Puedes encontrar la versión más reciente de los datos en el bucket de Cloud Storage gcp-public-data-arco-era5
:
- Niveles de presión completa de 1959-2022: 31 variables de nivel de presión y superficie (para los 37 niveles de presión) a una resolución de latitud/longitud de 0.25°/0.25°, organizadas en fragmentos de 1 hora.
Acceso a los datos
En el siguiente fragmento de código, se carga el conjunto de datos listo para el análisis y se muestra un resumen del conjunto de datos:
import xarray era5 = xarray.open_zarr( "gs://gcp-public-data-arco-era5/ar/1959-2022-full_37-1h-0p25deg-chunk-1.zarr-v2", chunks={'time': 48}, consolidated=True, ) era5
Para obtener más ejemplos con los datos de ARCO-ERA5 en Python, consulta los notebooks de ejemplo de Jupyter.
Acerca del conjunto de datos
Fuente del conjunto de datos: ECMWF: se genera con la información del Almacén de Datos Climáticos del Servicio de Cambio Climático de Copernicus (C3S).
Categoría: ciencia atmosférica, asimilación de datos, clima, optimizado para la nube, metodología, reanálisis, clima, investigación y ciencia.
Uso: el uso de los datos de ERA5 es gratuito, mundial, no exclusivo, libre de regalías y perpetuo. Todos los usuarios de los productos Copernicus deben proporcionar una atribución clara y visible al programa Copernicus. Ni la Comisión Europea ni el ECMWF son responsables del uso que se pueda hacer de la información de Copernicus o los datos que contenga. Si deseas obtener más información sobre el uso, consulta la Licencia para usar productos Copernicus.
Frecuencia de actualización: El conjunto de datos ERA5 no se actualiza en el programa de conjunto de datos públicos de Google Cloud. El programa proporciona datos de ERA5 que abarcan desde 1940 hasta mayo de 2023.
Formato: Los archivos sin procesar están en formato .grib
y NetCDF, y los archivos procesados, en .zarr
.
Ubicación de Cloud Storage: los datos se almacenan en el bucket gcp-public-data-arco-era5
, que se encuentra en la región us-central1
.
Hoja de ruta del conjunto de datos: Los planes de desarrollo para este conjunto de datos de Google Cloud están disponibles en el repositorio de ERA5.