Dati ERA5

ERA5 è la quinta generazione dell'European Centre for Medium-Range Weather Forecasts (ECMWF) per la rianalisi atmosferica e fornisce stime orarie di un numero elevato di variabili climatiche atmosferiche, terrestri e oceaniche. Il programma per i set di dati pubblici di Google Cloud ospita dati ERA5 dal 1940 a maggio 2023, coprendo la Terra su una griglia di 30 km e risolve l'atmosfera utilizzando 137 livelli dalla superficie fino a un'altezza di 80 km.

Una rianalisi è "il quadro più completo attualmente possibile delle condizioni meteorologiche e del clima passato". Le analisi vengono create dall'assimilazione di un'ampia gamma di origini di dati tramite modelli di previsione meteorologica numerica (NWP). Le variabili meteorologiche importanti per terra e atmosfera sono state importate e convertite dai dati di grib a Zarr (senza altre modifiche) per rendere visibile una versione di ERA5 ottimizzata per il cloud. Inoltre, viene fornito un code base open source per mostrare la provenienza dei dati e dimostrare flussi di lavoro di ricerca comuni. Questo set di dati include file non elaborati (grib) e ottimizzati per il cloud (zarr).

Casi d'uso

I dati ERA5 possono essere utilizzati in molte applicazioni diverse, tra cui:

  • Addestramento di modelli ML che prevedono l'impatto del meteo su diversi fenomeni
  • Addestramento e valutazione di modelli ML che prevedono il meteo
  • Calcolo dei climatologie, delle condizioni meteorologiche medie di una regione in un determinato periodo di tempo
  • Visualizzare e studiare eventi meteorologici storici, come l'uragano Sandy.

Grazie alle norme sui dati aperti dei servizi di monitoraggio dei cambiamenti climatici e dell'atmosfera di Copernicus e dell'ECMWF, questo set di dati è disponibile gratuitamente nell'ambito del programma per set di dati pubblici di Google Cloud. Di seguito sono riportate informazioni sulla licenza.

Struttura del set di dati

Il set di dati ERA5 è archiviato in tre sottodirectory principali: raw/, co/ e ar/. raw/ contiene dati di origine importati da ECMWF. co/ contiene una versione "ottimizzata per il cloud": si tratta di dati convertiti direttamente in un formato ottimizzato per il cloud (Zarr) nella sua griglia nativa senza ulteriori elaborazioni. ar/, o "analysis-ready", contiene un set di dati pronto per ML. Questa versione del corpus si trova su una normale griglia di latitudine/longitudine e unifica i dati di superficie e atmosferici in un singolo Zarr.

Dati ottimizzati per il cloud

Il nostro corpus ottimizzato per il cloud include cinque set di dati Zarr separati, che si trovano nel bucket Cloud Storage gcp-public-data-arco-era5:

  • Umidità a livello di modello: le variabili relative all'umidità e il rapporto di miscelazione dell'ozono sui livelli del modello.
  • Vento a livello di modello: divergenza, vorticità, temperatura e velocità verticale a livello di modello.
  • Superficie a livello singolo: il geopotenziale e il logaritmo della pressione superficiale alla superficie del modello.
  • Previsione a livello singolo: 21 variabili relative alla radiazione solare/a onde lunghe sulla superficie, alla quantità e al tipo di precipitazioni, alla profondità delle nevicate e al contenuto d'acqua.
  • Rianalisi a livello singolo: 38 variabili relative a umidità/temperatura del suolo, venti in prossimità della superficie, temperatura e umidità in prossimità della superficie, vapore acqueo totale e condensa delle nuvole, copertura nuvolosa totale e pressione del livello del mare.

Per ulteriori informazioni su quali variabili sono incluse in ogni set di dati, consulta i blocchi note Jupyter di esempio nel repository GitHub.

Dati pronti per l'analisi

Il corpus pronto per l'analisi di Google Cloud è un corpus di Zarr che copre gli anni 1959-2022. La versione più recente dei dati è disponibile nel bucket Cloud Storage gcp-public-data-arco-era5:

  • 1959-2022, livelli di pressione completi: 31 variabili di superficie e livello di pressione (per tutti e 37 i livelli di pressione) con una risoluzione di latitudine/longitudine di 0,25°/0,25°, organizzate in porzioni di un'ora.

Accesso ai dati

Il seguente snippet di codice carica il set di dati pronto per l'analisi e mostra un riepilogo del set di dati:

import xarray
era5 = xarray.open_zarr(
    "gs://gcp-public-data-arco-era5/ar/1959-2022-full_37-1h-0p25deg-chunk-1.zarr-v2",
    chunks={'time': 48},
    consolidated=True,
)
era5

Per altri esempi di utilizzo dei dati ARCO-ERA5 in Python, consulta i blocchi note Jupyter di esempio.

Informazioni sul set di dati

Fonte del set di dati: ECMWF, generata utilizzando le informazioni sul Climate Data Store di Copernicus Climate Change Service (C3S).

Categoria: Scienze atmosferiche, Assimilazione dei dati, Clima, Ottimizzato per le nuvole, Meteorologia, Rianalisi, Meteo, Scienza e ricerca.

Utilizzo: l'utilizzo dei dati ERA5 è senza costi, a livello mondiale, non esclusivo, esente da royalty e perpetuo. Tutti gli utenti dei Prodotti Copernicus devono fornire un'attribuzione chiara e visibile al programma Copernicus. Né la Commissione europea né l'ECMWF sono responsabili dell'eventuale utilizzo delle informazioni o dei dati di Copernicus in essi contenuti. Per informazioni complete sull'utilizzo, consulta la Licenza di utilizzo dei prodotti Copernicus.

Frequenza di aggiornamento: il set di dati ERA5 non è attualmente aggiornato nel programma per i set di dati pubblici di Google Cloud. Il programma fornisce dati ERA5 dal 1940 a maggio 2023.

Formato: i file non elaborati sono in formato .grib e NetCDF, mentre i file elaborati sono in .zarr.

Località di Cloud Storage: i dati vengono archiviati nel bucket gcp-public-data-arco-era5, che si trova nella regione us-central1.

Roadmap del set di dati: i piani di sviluppo per questo set di dati Google Cloud sono disponibili nel repository EERA5.