Dati ERA5

ERA5 (ARCO, Analysis-Ready, Cloud Optimized) è la quinta generazione del progetto di reanalisi atmosferica del Centro europeo per le previsioni meteorologiche a medio termine (ECMWF), che fornisce stime orarie di un gran numero di variabili climatiche atmosferiche, terrestri e oceaniche. Il pubblico di Google Cloud Il programma per set di dati ospita dati ERA5 che vanno dal 1940 al Maggio 2023, che copre la Terra su una griglia di 30 km e risolve l'atmosfera con 137 livelli dalla superficie fino a un'altezza di 80 km.

Una nuova analisi è il "quadro più completo attualmente possibile del clima e del meteo passati". Le ricognizioni sono create dall'assimilazione di un'ampia gamma di dati tramite modelli di previsione meteorologica numerica. Le variabili di valore meteorologico per terra e atmosfera sono state importate e convertite da dati grib a Zarr (senza altre modifiche) per mostrare una versione ottimizzata per il cloud di ERA5. Inoltre, viene fornita una base di codice open source per mostrare la provenienza dei dati e dimostrare i flussi di lavoro di ricerca comuni. Questo set di dati include sia i file non elaborati (grib) sia quelli ottimizzati per il cloud (zarr).

Casi d'uso

I dati ERA5 possono essere utilizzati in molte applicazioni diverse, tra cui:

  • Addestramento di modelli di ML che prevedono l'impatto del meteo su diversi fenomeni
  • Addestramento e valutazione di modelli ML che prevedono il meteo
  • Calcolo delle climatologie, la media delle condizioni meteorologiche di una regione in un determinato periodo del tempo
  • Visualizzazione e studio di eventi meteorologici storici, come l'uragano Sandy

Grazie alle norme relative ai dati aperti dei Servizi di monitoraggio dell'atmosfera e dei cambiamenti climatici di Copernicus e del Centro europeo per le previsioni meteorologiche a medio termine (ECMWF), questo set di dati è disponibile gratuitamente nell'ambito del Programma per i set di dati pubblici di Google Cloud. Vedi sotto per informazioni sulla licenza.

Struttura del set di dati

Il set di dati ERA5 è archiviato in tre sottodirectory principali: raw/, co/ e ar/. raw/ contiene dati di origine importati da ECMWF. co/ contiene una versione "ottimizzata per il cloud": si tratta di dati convertiti direttamente in un formato ottimizzato per il cloud (Zarr) nella griglia nativa senza ulteriore elaborazione. ar/, o "analysis-ready", contiene un set di dati pronto per l'ML. Questa versione del corpus è in una griglia lat/long regolare e unifica i dati di superficie e atmosferici in un unico Zarr.

Dati ottimizzati per il cloud

Il nostro corpus ottimizzato per il cloud include cinque set di dati Zarr separati, che si trovano Bucket Cloud Storage gcp-public-data-arco-era5:

  • Umidità a livello di modello: le variabili correlate all'umidità e la miscelazione di ozono rapporto a livello di modello.
  • Vento a livello di modello: divergenza, vorticità, temperatura e velocità verticale a livello di modello.
  • Superficie a un livello: il geopotenziale e il logaritmo della pressione superficiale sulla superficie del modello.
  • Previsione a un livello: 21 variabili relative alla radiazione solare/a onde lunghe sulla superficie, alla quantità e al tipo di precipitazioni, alla profondità della neve e al contenuto di acqua.
  • Rianalisi su singolo livello: 38 variabili relative al suolo umidità/temperatura, venti vicino alla superficie, temperatura e umidità nelle vicinanze la superficie, colonna totale di vapore acqueo e condensa di nuvole, nuvola totale copertura e pressione a livello del mare.

Per ulteriori informazioni sulle variabili incluse in ogni set di dati, consulta i notebook Jupyter di esempio nel repository GitHub.

Dati pronti per l'analisi

Il corpus di Google Cloud pronto per l'analisi è uno Zarr che copre gli anni 1959-2022. La versione più recente dei dati si trova nel bucket Cloud Storage gcp-public-data-arco-era5:

  • 1959-2022, livelli di pressione completi: 31 variabili di livello di pressione e della superficie (per tutti i 37 livelli di pressione) con una risoluzione di latitudine/longitudine di 0,25°/0,25°, organizzate in blocchi di 1 ora.

Accesso ai dati

Il seguente snippet di codice carica il set di dati pronto per l'analisi e ne mostra un riepilogo:

import xarray
era5 = xarray.open_zarr(
    "gs://gcp-public-data-arco-era5/ar/1959-2022-full_37-1h-0p25deg-chunk-1.zarr-v2",
    chunks={'time': 48},
    consolidated=True,
)
era5

Per altri esempi di utilizzo dei dati ARCO-ERA5 in Python, consulta i blocchi note Jupyter di esempio.

Informazioni sul set di dati

Origine del set di dati: ECMWF. Generata utilizzando Informazioni sul Climate Data Store di Copernicus Climate Change Service (C3S).

Categoria: Scienze atmosferiche, Assimilazione dei dati, Clima, Ottimizzato per il cloud, Meteorologia, rianalisi, meteo, scienza e Ricerca.

Utilizzo: l'utilizzo dei dati ERA5 è gratuito, mondiale, non esclusivo, esente da royalty e perpetuo. Tutti gli utenti dei prodotti Copernicus devono fornire un'attribuzione chiara e visibile al programma Copernicus. Né l'Europa La Commissione o l'ECMWF sono responsabili di qualsiasi uso che possa essere fatto dei Informazioni su Copernico o dati che contiene. Per informazioni dettagliate sull'utilizzo, consulta la Licenza per l'utilizzo dei prodotti Copernicus.

Frequenza di aggiornamento: il set di dati ERA5 non è attualmente aggiornato nel programma per set di dati pubblici di Google Cloud. Il programma fornisce dati ERA5 dal 1940 a maggio 2023.

Formato: i file non elaborati sono in formato .grib e NetCDF, mentre i file elaborati sono in formato .zarr.

Località Cloud Storage: i dati sono archiviati nel bucket gcp-public-data-arco-era5, che si trova nella regione us-central1.

Roadmap del set di dati: i piani di sviluppo per questo set di dati Google Cloud disponibili nel repository ErA5.